Está en la página 1de 14

MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG

Metodología Para Definir los Algoritmos en Los Circuitos de Molienda con el Aprendizaje
Automático (Machine Learning) Para Predecir y Reducir los Consumos de Energía
Ing. Pedro Armando Meraz Vinaja
Consultor Sr. En Procesamiento de Minerales

1. INTRODUCCION
La eficiencia energética en la minería es parte del programa de energías renovables y el objetivo es por supuesto acelerar
el conocimiento intercambiar experiencias desarrollar mayor innovación y por supuesto acercar el conocimiento a la
industria de la minería y quizás ver como otros están desarrollando
proyectos muy interesantes. Tener una mejor eficiencia energética
y una mayor innovación tecnológica en las empresas mineras y
desarrolladores de productos que tienen que ver con la minería.
Machine Learning podría ser la herramienta de los sistemas de
predicción de la eficiencia en el consumo específico de energía en el
procesamiento de minerales, así como en el monitoreo remoto
industrial y también en el desarrollo de modelos machine Learning
aplicado los procesos. Como reducir el consumo específico de
energía en los molinos SAG anticipándose así a paros repentinos
mediante la aplicación de técnicas de machine learning,
disminuyendo con ello el consumo específico de energía y
aumentando la disponibilidad.

2. EL APRENDIZAJE AUTOMATICO EN LOS CIRCUITOS DE MOLIENDA


La predicción del aumento del consumo específico de energía en los molinos SAG, utilizando técnicas de machine learning.
Se puede reducir los eventos de alto consumo específico de energía anticipándonos a estos eventos y utilizando sistemas
predictivos que fueron entrenados mediante técnicas de machine learning. El objetivo por el procesamiento de minerales,
es contribuir a un desarrollo sustentable a través de la optimización del consumo de energía de sus procesos, con
herramientas innovadoras que permitan incrementar la productividad. Con el aprendizaje automático podemos abstraer
el problema de eficientar el consumo de energía, con los datos que tenemos y qué tan importante es realizar la selección
de los datos correctos con un pre procesamiento y determinar los modelos de comportamiento y poder definir las métricas
que nos permitan evaluar el desempeño de los modelos y analizar los resultados de tal manera que podamos descubrir
oportunidades de ahorro de energía mediante estas técnicas de machine learning.

Cyclone
El procesamiento de minerales inicia con la extracción del mineral,
con una planeación de barrenación adecuada y tumbe con explosivo,
para luego llevarlo hasta la etapa de trituración primaria, para
Pebble
Crusher uniformizar el tamaño de la roca de los distintos tamaños que llegan
Stock
de la mina hasta un tamaño aproximado entre ½ a 7 pulgadas,
Primary
Crusher Pile
Screen
dependiendo del tipo de material. Los circuitos de molienda operan
B.allMill
con dos tipos de procesos: Para minerales oxidados con distintos
procesos de hidrometalurgia y para minerales sulfurados con
procesos de flotación ambos tipos de procesos combinados con otras
tecnologías con gravimetría y flash flotación.

Después de la trituración primaria el mineral se deposita en un stock pile, para mantener una capacidad uniforme al molino
SAG en circuito abierto o cerrado con molino de bolas. El objetivo del circuito de molienda es reducir esos tamaños de
alimentación hasta fracciones de milímetro. Posteriormente a los circuitos de molienda tenemos los procesos de
concentración de los cuales se obtienen ya producto, posteriormente a esto podemos seguir con una etapa de fundición.

pág. 1
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG

3. ABSTRACCIÓN DEL PROBLEMA


En la operación de los circuitos de molienda SAG: un bajo o alto % de sólidos, una abertura y área abierta de parrilla
incorrecta, un bajo nivel de llenado de carga, bajo nivel de llenado de bolas, una configuración de liners inadecuada y una
incorrecta filosofía de operación. Impacta en muy bajas eficiencias de molienda y altos consumos de energía, en limitación
de capacidades, en excesivo desgaste de liners, en alto consumo de cuerpos moledores y piscinas en la operación de los
molinos. La dureza del mineral aumenta con la profundidad de tajo abierto y el rendimiento del molino SAG tiende a
comúnmente a convertirse en el factor limitante y surgen las oportunidades de revisar el diseño y la operación:

• Sistema de enlainado, altura y distancia entre las barras (elevadores) ángulos de molinos SAG
• Perforación y rotura significativas de los componentes del revestimiento del molino SAG.
• Altos volúmenes de pulpa en el molino SAG
• Producto de recirculación grueso de la trituradora de pebbles
• Un aspecto de dureza del mineral bimodal en el circuito de molienda de bolas.

Los cambios en el perfil de los enlainado para eliminar el empaquetamiento entre los levantadores y reducir el impacto
de la carga de la bola sobre los revestimientos. La formación de piscinas en el molino SAG exige una revisión de la
capacidad de bombeo del molino SAG. El exceso de pulpa por el bajo % de solidos inhibe la molienda y provocó un
consumo innecesario de energía en el molino con la pulpa de recirculación interna. El rediseño de los cajones o
levantadores de pulpa que transportan la pulpa desde las rejillas de descarga al trommel de descarga del molino. El uso
de elevadores de pulpa radiales o con un diseño adecuado aumenta la eficiencia del bombeo interno del molino SAG. El
tamaño, forma y distribución de las aberturas de la parrilla del molino SAG impactan en la retención de pulpa, bloqueos
con bola y pebble contribuyen a la sobrecarga del molino y la capacidad de alimentación.

El proceso de molienda más eficiente energéticamente es aquel en el que las partículas abandonan el campo de rotura
tan pronto como alcanzan el tamaño del producto, la eficiencia energética del molino depende esencialmente de las
características del mineral y la velocidad de descarga de las partículas quebradas, que a su vez depende de la eficiencia de
la bomba de descarga (elevadores de rejillas y pulpa). La función esencial de un levantador de pulpa es transportar el
material molido que paso por la rejilla fuera del molino. Por lo tanto, la optimización del diseño de los elevadores de pulpa
impacta no solo la eficiencia energética y el rendimiento de los molinos SAG, sino que también aporta otros beneficios del
proceso, como una vida útil mejorada y un molino estable y amigable para el operador en la operación. El proceso de
conminución es típicamente una combinación de aspectos de rotura y clasificación, el transporte de material en los
molinos es horizontal y, por lo tanto, requiere una disposición adecuada para eliminar el producto, donde las partículas
se ven forzadas a múltiples eventos de rotura incluso después de que alcanzan el tamaño del producto debido a un sistema
de transporte de material ineficiente.

Se han intentado diferentes diseños de mecanismos de descarga, para descargar rápidamente las partículas del tamaño
del producto y aumentar significativamente la capacidad y la eficiencia energética. Sin embargo, el aumento en el tamaño
de los molinos SAG, ha impuesto restricciones mecánicas, en el desarrollo de sistemas de descarga eficientes
energéticamente. Los efectos de cada uno de estos factores son: Flujo de retorno y eficiencia energética.

pág. 2
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG
El flujo de retorno es el fenómeno inevitable asociado con los diseños convencionales de levantadores de pulpa: radial y
curvado, aplicable a fase de pulpa/pebbles. El flujo de retorno de pulpa es predominantemente en molinos SAG. La
geometría de los elevadores de pulpa radiales y curvados permite que la pulpa esté siempre en contacto con la parrilla
hasta que se descargue por completo, lo que hace inevitable el proceso de "flujo de retorno".

Como se ilustra en la Figura anterior, mientras que el gradiente a través de la rejilla es desde la cámara de molienda hacia
el levantador de pulpa, entre el dedo del pie y el hombro de la carga del molino, el gradiente se invierte desde el levantador
de pulpa hacia la cámara de molienda, una vez que el levantador de pulpa cruza la posición del hombro de carga. Cuando
la pulpa y los pebbles fluyen hacia abajo a través de las ranuras de la rejilla, tienen la misma oportunidad de volver al
molino. El retorno de la pulpa conduce a la formación de la piscina, el retorno de los pebbles aumenta la cantidad de
material de tamaño crítico en el molino. La cantidad de pebbles que pasan a través de la parrilla aumenta con el ángulo
de la parrilla. Los impactos del flujo de retorno de pulpa y pebble al molino se resumen en:

• La cantidad de energía gastada en las partículas de un tamaño igual al producto que fluyen de retorno, después
de pasar a través de la parrilla, contribuye al desperdicio de energía, así como a la trituración y generación de
partículas finas no deseadas.
• El consumo excesivo de energía del molino debido a las mayores cargas del molino causadas por el retorno de los
pebbles contribuye al desperdicio de energía.
• El flujo de retorno de los pebbles gruesos también aumenta la cantidad de partículas de tamaño crítico e impacta
el nivel de energía disponible para la rotura de partículas gruesas.
• La capacidad de la planta se puede reducir en la medida del flujo de retorno, que se ha observado que oscila entre
el diez y el 40 por ciento según la escala piloto y los datos de algunos molinos SAG.
• La fracción de la pulpa que se devuelve a la cámara de molienda conduce finalmente a la formación de una piscina
cerca del dedo del pie de la carga, la formación de la piscina absorbe una fracción significativa de la energía de
impacto, lo que causa un mal rotura de partículas gruesas. La presencia de ll piscina conduce a una acción de
mayor desgaste, ya que la probabilidad de que las partículas drenen con el flujo de pulpa aumenta debido a la
fuerza de arrastre, lo que provoca una mala rotura de partículas finas. Tanto el impacto deficiente como el
desgaste provocan tasas de rotura más bajas en general y por lo tanto, limitan la capacidad del molino.

Una relación de roca y bola inadecuada operando en un bajo nivel de llenado, incrementa el impacto de las bolas sobre
los liners. Sobrecargas de sólidos en los molinos de bolas es un problema común en la operación, debido a sobrecargas en
los molinos SAG, las ineficiencias en la clasificación también tienen un impacto en la sobrecarga de los molinos de bolas,
el cual puede ser identificado con la medición de la carga circulante o con la caída del consumo de energía cuando la
alimentación es incrementada, o un incremento en el consumo de energía cuando la alimentación es disminuida. La
definitiva técnica de inspección es la parada repentina de los circuitos de molienda, incluyendo bombas y periféricos, la
carga y niveles de carga y bola, no debe de ser mayor al 40 % en los molinos de bolas y en los molinos SAG variable de
acuerdo a las condiciones operativas.

pág. 3
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG

4. EL CONTEXTO DEL ALGORITMO PARA MOLINO SAG


Hasta la fecha son escasas las técnicas para monitorear directamente la carga volumétrica del molino SAG, es necesario
inferir esto de otras mediciones. Aunque se han empleado varios enfoques, todos dependen en cierta medida de una
medición directa o indirecta del peso del molino, es decir, la suma de los pesos del molino, revestimientos, bolas, agua y
roca. El método más común es controlar la contrapresión en la línea de lubricación de alta presión, que alimenta los
cojinetes del muñón del molino, siendo esta presión una función de la carga en el molino. En un molino SAG,
independientemente del instrumento empleado, la tendencia de la señal de carga junto, con la tendencia de la señal de
potencia, se puede utilizar para determinar la ubicación del molino en la curva de potencia / carga y permitir que el
operador o el sistema de control tomen decisiones sobre el ajuste de La tasa de alimentación.

Un poco de contexto de lo que es un molino SAG, en promedio existen distintos tamaños, los más grandes entre 11 y 12
metros, tienen una capacidad de producción entre 2000 a 3000 t/h y consumen una potencia de alrededor de 15 a 20
MW, el consumo específico de energía de estos molinos se mueve entre 5 a 8 kW hr/t, esto quiere decir la cantidad de
energía que se requiere para moler una tonelada de mineral.

Sí entramos un poco más en detalle en el funcionamiento del molino SAG, tenemos las variables que el operador puede
manejar y las variables que denominamos externas, entre las variables controlables está por ejemplo la cantidad de
mineral que ingresa molino, la densidad de alimentación que se controla a través de la cantidad de agua que se agrega al
molino, también existe una carga de bolas de acero para facilitar la molienda y en algunos molinos se puede controlar
también la velocidad de giro. Como variables externas al molino tenemos la granulometría y la dureza del mineral, que va
a depender desde donde se está extrayendo la
roca y desde dónde está llegando el mineral.

Todas estas variables ya sea controlables o no,


generan distintas condiciones operacionales en
los molinos y algunas son adversas, como las que
vemos en el listado. Primero tenemos una
condición operacional, que se denomina volumen
de llenado, que es cuando el molino opera con
demasiada o con muy poca carga, otra condición
adversa es el empaquetamiento, es cuando estas
aletas internas del molino se llenan de mineral o
de bolas, existe otra condición llamada el lavado
del molino que cuando estamos operando la con
un exceso de agua y otra condición operacional
denominada el aumento de carga circulante que
esto afecta al circuito completo del molino SAG,
molino de bolas hay mucho material que se está
re circulando y hay poco que está pasando hacia
la etapa de flotación.

Todas estas condiciones operacionales tienen impactos en las variables del molino, podemos resumir que el molino SAG
es uno de los equipos de mayor consumo en energía eléctrica en la planta de beneficio, por lo que resulta indispensable
hacer una operación eficiente del molino SAG, esto depende del adecuado conocimiento y manejo de las variables de
control que lo gobiernan, sin embargo la gran cantidad de variables y de condiciones operacionales que pueden afectar el
consumo específico de energía del molino, resulta en una gran dificultad para determinar si la tendencia de algunas de
estas variables, podría o no influir directamente en el aumento del consumo específico de energía.

Con el objetivo entonces de evitar los eventos de alto consumo específico de energía del molino, tal que éstos no
sobrepasan un límite, es conveniente desarrollar un sistema predictivo que pueda anticipar el comportamiento del
consumo específico, dada las condiciones de operación del molino.

pág. 4
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG

5. EL DESAFIO MACHINE LEARNING Y LA ABSTRACCION DEL PROBLEMA


Esto requiere entonces modelar correctamente una compleja interacción, entre cada una de las variables de operación y
el efecto que pueda tener en el consumo específico de energía, para esto es apropiado el enfoque de machín learning. Es
importante destacar que hoy en día existen muchos sistemas expertos, que ya optimizan la operación del molino. Sin
embargo, dada la dinámica compleja que ocurre dentro de este equipo, consideramos que todos los sistemas expertos
son perfectibles y que una herramienta para ello pueden ser las técnicas de machine learning.

Que es machine learning: Es una estrategia matemática para resolver


problemas y que se puede implementar mediante software y distintas
herramientas, a los sistemas de control que ya existen para darle una
intuición. Ya que su enfoque es aprender reglas desde los datos, es
decir, que si yo le entrego a un algoritmo los datos del sistema de
molienda, para hacer una detección oportuna del consumo específico
de energía y poder entregarle una alerta al personal de operaciones,
para que ellos puedan actuar. Entonces en el molino SAG, me interesa
poder saber si el consumo específico de energía se va a mantener
dentro del límite establecido, o si éste se va a disparar, el enfoque de machine learning ayuda entonces de la siguiente
forma, yo puedo tener muchos datos del molino SAG, toda su data histórica y a partir de ellos identificar condiciones
operacionales, en donde el consumo específico de energía se mantiene ok y también voy a encontrar otras condiciones
operacionales, en donde el consumo específico energía se disparó. Si entregamos todos estos datos a un algoritmo, éste
deberá entregarme las reglas que permiten definir este fenómeno que ocurre dentro del molino.

Hipótesis
donde se sustenta todo este trabajo, es que durante un tiempo previo a que el consumo específico se incremente, ocurre
algún fenómeno físico dentro del molino SAG, que se refleja en los datos de operación que nosotros estamos capturando
del molino y que entonces un algoritmo deberá ser capaz de aislar y caracterizar.

Abstracción. Abstrayendo un poco esta idea.

Modelar es sencillamente decirle a un algoritmo, oye quiero que aprendas a identificar un fenómeno, en nuestro caso:
Fenómeno es, que les pasa a las variables del SAG en un tiempo desconocido, un tiempo x antes de que este consumo
específico de energía se dispare.

X Tiempo y este tiempo desconocido, es otra incógnita que representa el tiempo en que ese fenómeno se manifiesta de
mejor manera, si es que este fenómeno que ocurre dentro del SAG, ocurre un minuto antes de que el consumo específico
se dispare o si empieza a ocurrir una hora o antes es una incógnita también de la modelación.

Si observamos los datos que vamos a tener del molino SAG,


deberíamos tener una especie de tabla, donde tenemos muchas
variables del molino, desde las más importantes como la potencia,
las toneladas y otras variables más y obtener o calcular el consumo
específico de energía, luego debería tener otra variable, que me
permita saber si ese número es aceptable o no, si el consumo
específico es alto marcarlo por ejemplo con un número 1. Como se
alarga si nosotros graficamos este consumo específico de energía
alto, en un gráfico temporal, debiéramos ver algo como lo que está
en el gráfico, en donde el consumo específico energía normal se
mantiene en cero, es decir el consumo específico de energía está
bajo el límite que me interesa mantenerlo y de repente voy a tener
unos saltos que significa, que el consumo específico sobrepasó mi
límite en esos instantes de tiempo.

pág. 5
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG
El objetivo es que el algoritmo pueda adelantarse a
estos consumos específicos de energía altos, es decir
que pueda determinar el fenómeno que ocurre antes
de estos saltos, lo que se puede hacer es crear una
nueva variable que sea una especie de marcador y
que le indica al algoritmo, que tiene que buscar el
fenómeno en el tiempo previo antes que el consumo
específico de energía se dispare, entonces si se tiene
la data histórica del molino, lo primero que se tiene
que hacer para trabajar, es dividir estos datos en dos
categorías: unos datos que voy a ocupar para
entrenar el modelo y otros datos que voy a reservar
para validar sus resultados, saber que ese modelo
realmente es llevarle a otras situaciones con los datos de entrenamiento voy a generar esta variable marcador y le voy a
entregar esto a mi algoritmo de machine learning, de donde deberá obtener un modelo que me permita identificar este
fenómeno que ocurre antes de que el consumo específico de rigidez se dispare.

Este modelo lo aplico sobre mis datos de validación, por lo que voy a poder saber si este modelo fue capaz de generalizar
o no lo que estaba ocurriendo en el molino, si tengo suerte y sigo graficando las predicciones de salida de mis modelos,
encima de los datos reales del consumo específico de energía, debiera haber un gráfico como el trabajo en el eje a la
derecha, en donde se nota con esos puntos negros las predicciones del modelo, fue realizada algunos momentos antes de
que el consumo específico energía se disparara, cuál es la gracia de esta predicción en el fondo es la alerta que le permite
a los operadores tomar alguna acción y evitar que ese consumo específico de energía alto realmente ocurra.

Los datos que tenemos, para hacer este


trabajo y todo parte con cerca de un gigabyte
de información, que son datos obtenidos
desde el PID del sistema de control del molino
SAG y la primera tarea corresponde a
entender la información, a filtrarla, a
formatearla, evaluarla y a poder consolidarla,
dentro de una forma de datos que vamos a
trabajar con él.

Después de hacer este trabajo se obtuvieron,


230 variables y 55,000 mil registros, cada uno
de ellos en cada minuto, estas 230 variables corresponden a toda la planta de molienda, es decir a datos que son del
molino SAG como de sus equipos auxiliares y otros equipos como el molino de bolas, bombas, ciclones, bandas
transportadoras etcétera.

La primera pregunta entonces es, si son realmente útiles


estas 230 variables y donde realizamos un procedimiento de
limpieza y de procesamiento, lo primero que debemos hacer
al tener muchas variables es tratar de hacer una inspección
visual al menos de las más importantes, por ejemplo acá
tenemos la distribución de valores, que tiene tanto la
potencia del molino SAG como el tonelaje de la banda
transportadora de alimentación del molino, para el caso de
la potencia vemos que la mayoría de los valores, más del 50%
se mantienen dentro de 4500 y 6000 Kw y en el caso de la
banda transportadora podemos ver que la mayoría de los
valores se concentran entre 650 a 950 t/h.

pág. 6
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG
La inspección visual también permite identificar variables,
que tienen un solo valor todo el tiempo y de repente algunos
saltos a un número específico, todas estas variables, no nos
sirven a priori y podemos eliminarlas, para bajar un poco la
carga de la siguiente etapa de procesamiento, en este caso
se pasó de 230 a 200 variables, mediante esta técnica de
inspección visual, posteriormente ver si hay datos nulos, es
decir que de repente un sensor puede enviar datos fuera de
rango, que se originan en los arranques o paradas de planta,
o cuando se tienen problemas operativos y esto genera que
en el registro de datos se tengan datos que no son válidos y
que aparecen como valores numéricos pues así que es
necesario identificar y poder limpiar.

Con un algoritmo automático, podemos disminuir así de


55,000 a 46,000 mil registros, que realmente tienen
números y que nos sirven, para el siguiente paso, entonces
cuando ya tenemos un poco más limpio este set de datos es
suavizar, porque son datos que provienen desde sensores,
usualmente estos datos vienen con algo de ruido y este
ruido puede complicar un poco la modelación del algoritmo
más adelante.

Después viene el cálculo del consumo específico energía, en este caso no es


una variable directamente del proceso, pero como sabemos se calcula con la
potencia consumida por el molino y las t/h alimentadas al SAG, este consumo
específico se comporta según lo esperado, por ejemplo en el primer caso hay
encerrado con un cuadro verde, podemos ver que si la potencia se mantiene
más o menos constante, las toneladas de ingreso al molino de repente
disminuyen, si el consumo específico de energía aumenta, las tonelada de
ingreso al SAG se mantienen constantes, pero la potencia aumenta, tenemos
que el consumo específico de energía también va aumentar.

Si observamos la distribución entre qué valores se mueve


generalmente este consumo específico de energía, la mayoría de
ellos cerca el 50% que lo representa esta caja azul en el gráfico de la
derecha, se mantiene entre valores de 5 y 8 que son los límites
recomendados digamos para un molino SAG, sin embargo, hay una
gran cantidad de valores que sobrepasan este valor de 8 y llega
incluso a valores como 17, por algunas condiciones de
funcionamiento muy específicas.

Entonces si nosotros graficamos el consumo específico de energía en el eje


de Y y la alimentación del SAG en eje X, podemos ver que efectivamente el
consumo específico de energía, tiende a disminuir a medida que somos
capaces de tratar más minerales en nuestro molino SAG lo que obviamente
es el comportamiento esperado,

pág. 7
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG
Sin embargo, en este otro gráfico tenemos el consumo específico de
energía, pero está graficado contra la potencia del SAG y lo que
debiéramos esperar ver, es una línea mucho más clara como en el caso
anterior, pero sin embargo vemos una alta dispersión del consumo
específico de energía, para distintas potencias de funcionamiento del SAG,
esto quiere decir mucho, ya que, para una misma potencia, el trabajo se
hizo algunas veces de forma muy eficiente y otra vez de forma muy
ineficiente. Este gráfico también se observa, que la alta dispersión del
consumo específico hace difícil poder implementar un enfoque analítico,
para poder saber qué va a pasar con el consumo específico, cobra un poco
más de fuerza en usar técnica de machine learning, que es capaz de hacer
un enfoque más matemático, por último, teníamos 200 variables y hay que
determinar cuáles realmente nos pueden servir para ingresarla al modelo.

Se aplica un análisis a través de la correlación de Pearson, con el objetivo no


de buscar las variables más relacionadas con el consumo específico de
energía, sino de descartar las que realmente están muy poco o nada
correlacionadas, vemos un coeficiente 0.3 de correlación entre dos variables
es bastante bajo y todas las variables que están por debajo de este valor
fueron descartadas para el proceso siguiente de modelación de esta forma
pasamos de 230 a 19 variables.

Por último, cuando ya tenemos nuestras variables finales 19


variable del SAG, calculamos la tendencia que cada una de ellas
tiene a través del tiempo, esto con el objetivo de poder obtener
más información de variables del molino, por ejemplo para el caso
de la potencia, se tendría entonces sus valores minuto a minuto y
además tendría su tendencia, es decir saber si éste valor está
tendiendo a subir o a bajar, el objetivo de esto es sacar el doble de
información de la información disponible que se tiene del molino y
así nutrir con más datos el proceso de modelación que viene ahora.

Resumiendo, entonces la limpieza y procesamiento de los datos, se partió con una


cantidad de datos que tenían cerca de 230 variables y 55 mil registros, realizamos
una limpieza nos quedamos con 200 variables y 46 mil registros y después de un pre
procesamiento que nos deja con 19 variables y con sus 19 tendencias, al final 38
variables para trabajar y 46 mil registros de datos minuto a minuto, entramos
entonces ahora la modelación.

6. MODELACION Y METRICAS DE DESEMPEÑO


Para modelar con machine learning, primero seleccionar un
algoritmo o varios, que sean acorde al problema que queremos
resolver, luego hacemos la división de los datos, entre los de
entrenamiento y los de validación. Entonces de estos 46 mil
registros de datos, que corresponden alredor de 32 días de datos de
operación del molino, hacemos una división y nos quedamos con 25
días de estos datos para hacer el entrenamiento del modelo y nos
reservamos 7 días, estos datos que nunca los ve el algoritmo, para
posteriormente evaluar el desempeño de mi modelo.

pág. 8
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG
Para poder definir las métricas que permitan decir,
si este modelo es bueno o no, para esto se utilizan
dos métricas la precisión y el recall, la precisión tiene
que ver con el algoritmo trata de no equivocarse, es
decir de que cada predicción que haga sea correcta
y el recall es tratar de abarcarlo todo, es decir que
ojalá mis predicciones sean, cuando realmente mi
consumo especifico de energía se va a disparar, parecen métricas muy parecidas pero no lo son les voy a mostrar el
siguiente ejemplo.
Cuando se tiene un algoritmo 100% preciso, es decir que cada vez que hace una
predicción es correcta, la capacidad de tratar de abarcarlo todo es muy baja y lo
contrario, un algoritmo que tiene el 100% de recall es decir que es capaz de abarcar
todos estos puntos, donde el fenómeno real ocurrió, sin embargo, fue muy poco preciso,
porque lanzó alertas a cada instante, para tratar de encontrar cuando ocurrió este
fenómeno. Ahí la importancia de tener un modelo balanceado entre estas dos métricas.

7. ALGORITMO DE MODELACION
Con respecto al algoritmo de modelación, este se llama Random Forest y es
un algoritmo que combina otro tipo de algoritmos, que se llaman árboles de
decisión, un árbol de decisión es algo bastante sencillo, por ejemplo, para
este caso el árbol de decisión toma dos o tres variables del molino, por
ejemplo, A, B y C e ir haciendo algunas aseveraciones simples sobre estas
variables. Por ejemplo, si la potencia está sobre cierto valor considerar que el
consumo específico de energía se va a disparar, si por otro lado la presión de
los descansos está bajo un valor, voy a considerar que el consumo específico
se mantiene ok. Los árboles de decisión hacen esto con algunas de las 38
variables que tenemos y hacen estas diferencias simples, la gracia del Random Forest es; que, al combinar centenas de
estos árboles, puede promediar lo que cada uno de ellos predice y de esta forma obtener una predicción que es bastante
acertada. El Random Forest es un algoritmo de los primeros que surgen con machine learning, es muy antiguo, sin
embargo, es un algoritmo que es muy robusto y que incluso hoy en día se sigue utilizando para modelaciones.

8. RESULTADOS DEL ALGORITMO DE MODELACION


La primera incógnita es el tiempo en el que podemos
anticiparnos antes que el consumo específico de energía se
dispare, se realizan varias modelaciones. Si observamos el
caso uno busca el fenómeno muy encima del consumo
específico, son los cinco minutos antes y en general los
resultado es que la precisión fue muy alta pero su recall fue
muy bajo, si recuerdan la métrica este algoritmo hacia muy
pocas predicciones, pero eran buenas, si nos pasamos al
caso 2, donde se busca el fenómeno 15 minutos antes de
que el consumo específico se dispare, aquí es donde se
obtienen a priori las métricas más parejas entre precisión
y recall y por último si este fenómeno se busca en un
espacio tiempo muy amplio, a cada 30 minutos, la
precisión tiende a bajar mucho y el recall tiende a ser un
poco más alto, caso contrario al caso 1. Por lo tanto, esto
nos indica que, si buscamos este fenómeno de anticiparnos
al alto consumo específico de energía, del molino SAG, el
tiempo ideal para hacerlo es 15 minutos antes.

pág. 9
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG

9. VALIDACION DEL ALGORITMO DE MODELACION


Revisado entonces las predicciones con un modelo ya optimizado para esta
condición, vamos a validar el modelo. Siete días de datos de funcionamiento
del molino SAG, en donde se tuvieron 29 eventos reales del consumo
específico de energía alto, es decir, en estos 7 días, 29 veces el molino se
disparó por sobre un límite, que se consideraba una meta, entonces con estos
datos vamos a ocupar el modelo que entregó el algoritmo de machine learning
y vamos a graficar las predicciones encima de los datos, para verificar.

Lo que arroja directamente el programa en todas las situaciones, en


cada uno de estos puntos anaranjados, son las predicciones que va
haciendo el algoritmo y en azul tenemos el comportamiento real del
consumo específico de energía alto, cuando realmente superó un
límite, para el primer caso de la izquierda lo que hacemos es entregar
minuto a minuto un registro de datos al algoritmo, simulando una
operación en tiempo y en algún momento el algoritmo levanta su
alerta, genera una predicción, uno de estos círculos anaranjados con
un valor de 1, esto quiere decir que el algoritmo nos está diciendo
que va a pasar algo, esto lo hace en el primer caso, de 5 o 6 minutos
antes que el consumo específico de energía se dispare. En el caso de
la derecha la misma lógica, pero 13 minutos antes.

Para realizar las métricas generales e introducir un par de conceptos,


donde en morado tenemos el consumo específico de energía real del
molino alto y las predicciones se ven en azul, acá tenemos tres casos
primero que una predicción se dé de manera correcta, lo que está
marcada en verde y se llama un verdadero positivo, luego puede ser
que una predicción sea incorrecta, lo que está marcado en rojo, en
donde el algoritmo dice va a pasar algo, pero en realidad no hubo
ningún aumento en el consumo específico de energía, eso es un falso
positivo y por último está un caso en donde el consumo específico
realmente ocurre por nuestro algoritmo no dice nada esto es un falso
negativo, si realizamos entonces el resumen para esta semana de
datos, podemos ver, que los eventos de consumo específico altos fueron 29, que el algoritmo hizo 33 predicciones en este
mismo intervalo de tiempo y que de ellas 24 fueron bien hechas, 9 fueron falsos positivos y 5 falsos negativos o sea 5 en
que el algoritmo no levantó un alertamiento, con estos resultados nuestras métricas de precisión es del 73 por ciento y
nuestra métrica del recall es de un 83 por ciento.

Si tratamos de ver dentro de la caja negra, si podemos tener alguna


información de estos algoritmos de machine learning. Como, por
ejemplo, la importancia que dio el algoritmo a cada una de las
variables reales de operación del molino, mostrando solamente las
diez primeras de las 38, algunas de esas variables son su valor y otra
es la tendencia, o sea si estaba subiendo o bajando.

Dentro de las principales variables, tenemos el tonelaje de la banda que alimenta al molino, la presión de los descansos,
el consumo de energía, el mismo valor del consumo específico de energía y la tendencia, por supuesto aparece la potencia
y lo interesante es que aparecen variables, que son de los equipos que están alrededor del molino SAG, por ejemplo,
aparece la corriente de la bomba y la densidad de alimentación del ciclón, más abajo entre las variables que no vemos,
aparecen también variables relativos al molino de bolas, y la banda transportadora de pebbles.

pág. 10
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG
Como nuestro algoritmo fue capaz de adelantarse a estos eventos
de alto consumó especifico de energía y evitar que el molino se
dispare, podemos estimar los beneficios que tendría, si el operador
actúa y es capaz de evitar que todos esos eventos ocurren, para el
caso de un molino de 20 MW. Significa un ahorro por costo de
energía de cerca de $ 3,774 dólares por evento y si esto lo
proyectamos a un año, podríamos tener un ahorro de cerca de casi
doscientos mil dólares y esto solo disminuyendo o detectando
estos altos consumos específicos de energía, en cerca de un 1,6 %
con un valor de la energía eléctrica con un próximo económico de
$ 80 dólares por MWh.

10.VALIDACION DEL ALGORITMO DE MODELACION


El siguiente paso es implementarlo en producción, la arquitectura
muy general de cómo hacerlo: el primer paso es obtener las
variables de proceso del molino SAG, capturar esta data y enviarla a
un modelo que esté funcionando en línea, que esté constantemente
recibiendo esta información, esto permite entonces que el modelo
pueda desplegar al operador una alerta, de cuando el consumo
específico va a sobrepasar un límite definido en los próximos
minutos, incluso podría sugerirle alguna acción. Entonces nuestros
datos finalmente nos muestran alertas en línea y en tiempo real y
actuales, con sugerencias de que se puede hacer para evitar que
este alto consumo específico de energía ocurra.

Bueno pasando ya otras aplicaciones que podemos hacer con esta


herramienta de machine learning, lo primero seguramente que nos
interesaría es poder evaluar, cómo saber si esta herramienta realmente
me sirve para implementarla en el proceso y para eso nosotros
proponemos una metodología, obtener algunos datos de este proceso
y hacer una evaluación de potencial inicial como un poquito más detalle,
pero con un mes de datos podemos hacer un estudio del proceso y con
este mes de datos hacer un análisis como el vimos y poder determinar
si es que existen un beneficio potencial o no de aplicar esta herramienta
ya en producción.

11.OTRAS APLICACIONES
Las otras áreas en que nos puede ayudar no es solamente energía, sino que también podemos utilizarla para predecir
ineficiencias, comportamientos anómalos o fallas antes de que ocurran en el proceso de un equipo, también podemos
simular la respuesta de procesos complejos, ante variaciones en las variables de entrada de estos procesos, hacer un
análisis analítico y finalmente utilizar esta herramienta para hacer entrenamiento de personal.

Con respecto a este modelo predictivo de consumo específico de energía alto, nos permite producir ahorros reales al
optimizar la operación del molino. Y en general los modelos de proceso mediante machine learning son una potente
herramienta de apoyo para la toma de decisiones y para la mejora de la gestión operativa. Estos modelos son aplicables
incluso en etapas tempranas del proyecto, cuando queremos descubrir y cuantificar eventuales oportunidades de ahorro
y también poseen un amplio rango de aplicaciones.

pág. 11
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG
En minería es práctico usar un modelo teórico o fenomenológico como punto de partida, para el machine learning, una
de esta forma es a través de modelos matemáticos, conocer las ecuaciones que rigen el comportamiento de un proceso.
Poder aprender a entender los procesos desde sus datos. Lo más importante se necesita un algoritmo son datos, eso es
lo que permite al algoritmo, poder realizar o poder encontrar por él mismo las ecuaciones que terminan definiendo el
proceso, es importante conocer la física, importante conocer realmente cómo funciona este modelo, para ello saber si los
resultados que me entrega este algoritmo son correcto o no, porque en realidad si yo no conozco nada del fenómeno si
no conozco nada de las ecuaciones básicas que lo rigen, se podría obtener un resultado y ser un poco inconsciente si eso
es correcto si tiene lógica o si no la tiene, así que es importante poder balancear, poder conocer los fenómenos y por otro
lado dejar que el machine learning aprenda a partir de los datos de ese fenómeno de ese proceso productivo específico.

Un siguiente paso, es poder agregar variables que miden desgastes, por ejemplo, el desgaste de la bola o el desgaste de
los revestimientos dentro del molino en general, no existen muchos sensores que puedan medir en tiempo real, el
desgaste interno del revestimiento, es algo que se hace en general de forma puntual cuando se detiene el molino y se
hace una revisión interna de cómo está y eso impide obviamente tener una variable en línea que me pueda ir diciendo
cómo se van desgastando los liners del molino. Por eso todas estas técnicas de machine learning van de la mano con ir
sensorizando cada vez más las plantas, ya que tener más sensores es tener más datos y obviamente tener un mejor input
para el molino, lo que podría generar mejores resultados.

Machine learning es una herramienta más, dentro de todo el set de herramientas y de conocimientos y de expertise, que
hoy día tienen las personas que trabajan operando estos modelos, la idea de tener una herramienta más, que nos dé una
alerta que permite un poco ganar tiempo al final, para que los operadores puedan actuar no es algo que esté pensado
para reemplazar personas o para reemplazar sistemas que hoy día existen, en ningún caso es un complemento a lo que
ya existe y que al final permite ganar tiempo valioso para los operadores.

La granulometría y la dureza no están dentro de estas 38 variables ya que no había un sensor que media dureza, pero sí
como un cálculo que se hace mediante otras variables por lo tanto estas dos, variables están incorporadas.

Cuando nosotros aprendemos el fenómeno a partir de los datos, se toman muchos datos y tratar de obtener las reglas de
este proceso, esas reglas son para ese equipo en específico, la ecuación el modelo obtenido es para ese molino, por lo
tanto, si yo quisiera aplicar esto en otro molino, lo correcto sería puede obtener los datos de ese molino y hacer
modelación. Lo importante hay que entender que hay una metodología que ya está estandarizada, de cómo hacerlo y hay
un know-how de cómo partir desde cero entre comillas con cada equipo, pero no desde cero desde el punto de vista de
cómo hacer estos modelos.

Como introducir esta tecnología en la minería en los procesos, si tú quieres introducir una tecnología en producción debes
de ser capaz de poder explicarla de una forma sencilla y que la otra persona la entienda, el algoritmo Random Forest es
muy sencillo de entender, en cambio si nosotros entráramos a producción con algoritmos mucho más complejos, mucho
más difíciles tanto de explicar cómo de entender, esto puede generar de repente una resistencia de adoptar estas
tecnologías y la idea es poder entrar y para eso yo considero, que es mejor partir con un enfoque claro y lo más lógico
posibles y sencillos y después podemos ir complicando la cosa.

La modelación que ya es optimizar para hacer las predicciones El caso de la dureza de un mineral, se podría estar
trabajando varias semanas o meses, un mineral que tiene una dureza y quizá al otro mes cambiamos a otro mineral de
otra parte de la mina, que tiene una dureza distinta y por lo tanto cambia un poco cómo funciona este modelo, hay que
entender que la gracia de un modelo de machine learning, es que esta implementado en terreno y que ésta siempre
alimentándose en línea con nuevos datos, el modelo esté constantemente haciendo optimización de sí mismo, está
actualizándose constantemente, para poder incluir este cambio en variables, que nunca sabemos cuándo va a cambiar
por una variable que podría mantenerse muchos meses fija y cambiarles por otro valor y la forma de combatir eso es
haciendo una optimización una mejora constante del modelo.

Que tiene que ver el machine learning con las redes neuronales, es lo mismo o hay alguna diferencia. Las redes neuronales
son un tipo de algoritmos, existe una multitud de algoritmos de Machine learning que nos pueden apoyar para distintos

pág. 12
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG
objetivos, uno de ellos efectivamente son las redes neuronales, que para tratar de hacer una explicación sencilla tiene que
ver con poder ir entrelazando distintos modelos y poder hacer este entrelazamiento de un montón de modelos, en
distintas capas. Al final toda esta complejidad matemática permite tener una un modelo, una caja negra que es tan robusta
y que es capaz de capturar muchas características, de un modelo que nosotros queramos implementar

Para hacer un poco la diferencia con el árbol de decisiones, en este trabajo se hizo un enfoque de clasificación es decir de
poder decir va a ocurrir el consumo específico alto sí o no y otro lo que está al frente de esta vereda la clasificación es la
regresión que tiene que ver con poder predecir números propiamente tal por ejemplo el consumo específico va a ser 5,8.
esa diferencia es importante para este caso de clasificación el Random Forest es uno de los modelos que obtuvo mejores
métricas y un modelo para intentar hacer lo otro que es regresión y ahí si no estamos mirando ya las redes neuronales ya
que en general tiene muy buenos resultados para este tipo de situaciones

Una de las cuestiones es que no se contrasta todo esto con el impacto de detener la molienda, o esas acciones tiempo
perdido, lograr por ejemplo el tamaño del producto deseado, puede ser que el costo de detener o dilatar el tiempo de
molienda sea finalmente mucho más costoso sería interesante se pueden realizar el contraste o la diferencia entre estas
dos observaciones que de repente son dos mundos que cuesta conjugar sí si conviene o no de tener un proceso para poder
hacerlo más eficiente

Cuando hablamos de mejorar la eficiencia energética de aplicar el machine learning, da lo mismo de donde venga la
energía no hay alguna que sea más eficiente que la otra, para los sistemas de molienda. Cualquier tipo de energía tiene
un costo asociado a su producción, a su transporte, a su utilización etcétera y por lo tanto si se logra en el proceso disminuir
su consumo, o hacer que la producción sea más eficiente, que cada tonelada producida en este caso con un poco menos
de energía, siempre va a ser un impacto positivo, independiente del origen que tenga esta energía. Para el caso de la
minería hoy en día hay muchas iniciativas, que están haciendo las propias empresas, de poder implementar energía limpia,
energía renovable en su proceso y esto obviamente es mucho mejor, porque podemos por un lado minimizar el consumo
energía y por otro lado podemos hacer que tenga una forma más limpia es una doble Canadá-.

Al momento de limpiar los datos y descartar los que tenían menor correlación se analizó la importancia de los descartados
desde el punto de vista mecánico o de los procesos, de alguna manera se escarbó en aquello que nos servía, qué nos podía
ayudar, todo este procesamiento matemático o los modelos que no puede implementar ecuaciones, lo que sea tiene que
ir necesariamente de la mano, con una mirada con conocimiento del proceso, o sea yo no puedo tirarme a la piscina de
los datos sin entender sobre lo que estoy trabajando.

No es 100% seguro que se llegue a las ecuaciones finales, existe un valor un mínimo de datos para asegurar que el
algoritmo encuentre las ecuaciones que definen un determinado proceso o no. El machine learning se nutre de datos y
mientras más datos se tengan, obviamente el modelo tiende a ser más representativo. Sin embargo, si existe un mínimo
y el mínimo tiene que ver con varios factores, el primero tiene que ver con la periodicidad es importante poder tener un
ciclo completo del funcionamiento del molino o de la mayoría de sus variables, para poder capturar digamos todos los
comportamientos que pueda tener en ese tiempo.

A pesar de que se pueda tener gran cantidad de datos, puede que no se encuentra un modelo adecuado, adoptar una
hipótesis y tratar de obtener un resultado que pueda responder a lo que estamos buscando, está entre las posibilidades
que no se encuentre un modelo, pero en general siempre si se tienen las variables y datos del sistema y el ciclo de
funcionamiento del proceso, se va a poder obtener algo con un mayor o menor grado de buenos resultados. Dado que se
hizo el filtro de los datos, se tiene la muestra adecuada y representativa por minutos para poder predecir estos eventos
de alguna manera, es posible que el filtro finalmente produzca un sesgo en toda la muestra, es evidentemente cuando
uno filtra datos está introduciendo manipulación y generar otro tipo de problemas desde el punto de vista estadístico.

Cuál es la forma de saber si ese filtro está bien. Con los resultados obtenidos hacer mucha modelación y comparar los con
los datos del proceso los distintos modelos que se obtengan, esa es la forma al final de decir si está bien o mal la
preselección de estas variables que se hacen mediante la correlación y respecto a las alertas en línea que hemos estado
hablando. Profusamente de aquello que hace referencia a la disposición en tiempo real en mi equipo o la data, se envía

pág. 13
MACHINE LEARNING EN LOS CIRCUITOS DE MOLIENDA SAG
un servidor y luego se envía la información como esta ese proceso. Cuando una implementa esto en plantas en producción
efectivamente es muy importante poder tener una infraestructura informática, que te permita cumplir el objetivo. Cuál
es el objetivo en este caso es puedes tomar los datos en tiempos real y poder enviarlos a donde el modelo esté corriendo
en tiempo real eso puede ser en la misma planta o puede ser en la nube.

También y en tiempo real también es que el algoritmo está haciendo estos cálculos y determinando, si tengo que levantar
o no una alerta. El tiempo de modelación es lo que toma más tiempo, pero una vez que este modelo ya está hecho en un
modelo matemático realmente relativamente sencillo de resolver con una potencia de cálculo baja, no necesito un
computador de la nasa para poder tener este modelo corriendo constantemente sino que una vez que este trabajo está
hecho puedes tenerlo en tiempo real ,no requiere una infraestructura tecnológica muy difícil, lo que es importante es el
poder ir retroalimentando este modelo y es ahí donde se necesita una potencia de cálculo que es a ojo no necesita ser en
tiempo real podría hacer una actualización diaria o cosas así. Para un molino SAG o de bolas, empezar a ver una forma de
poder aprovechar la energía que no está aprovechando el molino haciendo un sistema de acopio externo.

pág. 14

También podría gustarte