Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Por: Pedro Castellares Torres, Machine "no estamos seguros de que esto realmente va
Learning en el Massachusetts Institute a funcionar" y el otro es que "va a funcionar
Technology. perfectamente".
6 MINERÍA / JUNIO 2022 / EDICIÓN 537 MINERÍA la mejor puerta de acceso al sector minero
so es diferente, donde tenemos unos datos para ceso de flotación, es posible aplicar el Algoritmo
analizar y que se requiere realizar una explora- de Árbol de Decisión por Regresión mediante un
ción profunda de esa data. En ese sentido, no Aprendizaje Supervisado, ya que es una forma
es uno el que decide cuál es el algoritmo a usar, de representación sencilla para encontrar gru-
sino que son los datos los que determinan el al- pos homogéneos según una cierta variable de
goritmo que produce los resultados basados en respuesta.
los datos que existen.
Esta técnica permite representar de forma grá-
Para la estimación de la dosificación de reacti- fica una serie de reglas sobre la decisión que
vos y mejorar la recuperación en cualquier pro- se debe tomar en función a una característica
Abstract
The greatest value a company can obtain gorithm that produces the results based on the
by using data mining or using deeper in- existing data.
formation analysis is related to predicting
certain scenarios with greater accuracy, To estimate the reagent dosage and improve
but one of the most common mistakes for recovery in any flotation process, it is possible
organizations that contemplate implemen- to apply the Regression Decision Tree Algorithm
ting Machine Learning or Data Mining, by Supervised Learning, since it is a simple way
has to do with two extremes. One involves of representation to find homogeneous groups
thinking that: “We're not sure if this is rea- according to a certain response variable.
lly going to work” and the other that “it is
going to work perfectly.” This technique allows to represent graphically
a series of rules about the decision to be taken
We must keep in mind that the world of Ma- according to a main characteristic defined
chine Learning is probabilistic, not determinis- by the algorithm (primary node) and can be
tic. So, it is important to understand that we applied for the following variables in a flota-
are changing from a paradigm F(Xi) = C+aXi tion process, such as:
+ bXi + ... +zXi, to another where an algori- Primary collector dosage.
thm is trained. In other words, Machine Lear- Secondary collector dosage.
ning focuses on looking for patterns in order to Dosage of primary foaming agent.
make predictions. Dosage of secondary foaming agent.
Lime dosage.
The algorithms used depend largely on the Dispersant dosage.
type of data being analyzed and the result Solids % in Ro Scv pulp.
we are trying to predict or analyze. Therefo- P80 to the flotation circuit.
re, each process is different, where we have Ore type, etc.
some data to analyze and a deep exploration
of that data is required. In that sense, you are This algorithm can be applied in different sof-
not the one who decides which algorithm to tware, such as Python, Studio R, MatLab, C/
use, but it is the data that determines the al- C++, Cart Regression, Xlstat, etc.
MINERÍA la mejor puerta de acceso al sector minero MINERÍA / JUNIO 2022 / EDICIÓN 537 7
principal definida por el algoritmo (nodo pri- Objetivo
mario) y puede aplicarse para las siguientes Estimar las dosificaciones adecuadas de reacti-
variables en un proceso de flotación, como vos para mejorar la recuperación de cualquier
son: proceso de flotación, mediante la aplicación del
Dosificación del colector primario. Algoritmo de Árbol de Decisión por Regresión
Dosificación de colector secundario. de Aprendizaje Supervisado Machine Learning.
Dosificación de espumante primario.
Dosificación de espumante secundario. Desarrollo del algoritmo
Dosificación de cal. Sistema de gestión de datos
Dosificación de dispersantes. El sistema de gestión de datos es la herramienta
%sólidos en la pulpa Ro Scv. básica que da soporte a todas las tareas relacio-
P80 al circuito de flotación. nadas con el aprendizaje automático (Machine
Tipo de mineral, etc. Learning). Gracias a este, podemos obtener los
datos que constituyen el punto de partida de esta
Este algoritmo puede ser aplicado en diferentes disciplina, y solo a través de él podemos lograr
software, como Python, Studio R, MatLab, C/ los objetivos propuestos y tomar decisiones ba-
C++, Cart Regresión, Xlstat, etc. sándonos en los datos. La Figura 1 muestra los
Figura 2. Visualización de datos originales de cuatro variables de 12. Se usó un formato condicional
de valor estadístico para identificar valores fuera de control y de especificación, así como residuos
grandes.
8 MINERÍA / JUNIO 2022 / EDICIÓN 537 MINERÍA la mejor puerta de acceso al sector minero
tres elementos básicos de un sistema de gestión Visualización de datos
de datos que deben ser considerados de suma En la Figura 2 se muestra la visualización de da-
importancia por las actuales empresas. tos originales, donde se puede usar un formato
condicional de valor estadístico para identificar
Hoy, sin embargo, la mayoría de los datos no valores fuera de control y de especificación, así
cumplen los criterios básicos de los denomina- como residuos grandes. Teniendo como premisa
dos "datos correctos". Las razones incluyen no principal el conocimiento de cualquier proceso
conocer el origen, equipos de medición mal ca- de flotación, se debe realizar en primer lugar la
librados, procedimientos demasiado complejos limpieza y segmentación de datos, la cual debe
y errores humanos como el desconocimiento del ser definido en un periodo y estableciendo las
proceso a estudiar. Como compensación, el in- condiciones de estudio y alcance del proceso.
geniero de proceso debe limpiar la información
antes de entrenar el modelo predictivo. Este es Para este modelo de aplicación de Machine
un trabajo tedioso y arduo que ocupa el 80% Learning en un proceso de flotación, podemos
del tiempo total de la evaluación. considerar las variables que afectan comúnmen-
Figura 3. Primera división del Algoritmo del Árbol de Decisión por Regresión
(determinación del nodo primario = %magnesio contenido en el mineral).
MINERÍA la mejor puerta de acceso al sector minero MINERÍA / JUNIO 2022 / EDICIÓN 537 9
te a un circuito de cobre, como por ejemplo, es el uso del Algoritmo de Árbol de Decisión
pueden ser las empresas mineras del sur del Perú por Regresión Aprendizaje Supervisado Machi-
como Antapaccay, Cerro Verde, Hudbay, Las ne Learning.
Bambas, etc., de las cuales debemos definir las
condiciones de tonelajes, rango de oxidación Algoritmo de Árbol de Decisión
de mineral (%tox), rango de %Cu, granulome- La construcción del Árbol de Decisión por Re-
trías, rango de pH y demás variables que de- gresión Aprendizaje Supervisado Machine
penderán del objetivo a analizar en un proceso Learning sigue un enfoque de división binaria
de flotación. recursiva y analiza la mejor variable para la
ramificación solo en el proceso de división ac-
Todo esto permitirá reducir el número de regis- tual.
tros iniciales, por ejemplo, para esta aplicación,
se pudo reducir de 6,594 a 1,780 registros que Utilizando el CART Regresión, del total de da-
realmente tienen la denominación de “datos co- tos (1,780 registros y 12 variables) se tomó de
rrectos” y que sirven para el siguiente paso, que manera aleatoria un porcentaje para el entrena-
Figura 4. Predicción de la dosificación del co- Figura 5. Predicción de la dosificación del co-
lector primario para un mineral con contenido lector primario para un mineral con contenido
de magnesio menor a ~1.5% (máximo hasta de magnesio mayor a ~1.5% (máximo hasta
~29.8g/t). ~39.3g/t).
10 MINERÍA / JUNIO 2022 / EDICIÓN 537 MINERÍA la mejor puerta de acceso al sector minero
miento del algoritmo, obteniéndose el siguiente Podemos realizar las evaluaciones estableciendo
resultado para el caso general planteado de la las condiciones generales de estabilidad (ver Tabla
recuperación de cobre (ver Figura 3): 1) que debe tener un proceso de flotación de cobre.
El algoritmo definió como nodo primario de
división, al contenido de magnesio, el que Resultados
correlaciona con el análisis de arcillas presen- Dosificación del colector primario
te en el mineral con un valor entre 1.4625% La dosificación del reactivo colector primario
y 1.535% (%Mg ~1.5%.). para mejorar la recuperación de cobre mediante
el Algoritmo de Árbol de Decisión, para la con-
A partir de este primer nodo, podemos estimar dición de mineral con contenido de magnesio
las dosificaciones de reactivos por ejemplo para: menor a ~1.5% debería ser hasta un máximo de
Dosificación del colector primario. ~29.8g/t (ver Figura 4).
Dosificación de colector secundario.
Dosificación de espumante primario. Para la condición de mineral con contenido
Dosificación de espumante secundario. de magnesio mayor a ~1.5%, el algoritmo
Figura 6. Predicción de la dosificación del co- Figura 7. Predicción de la dosificación del colec-
lector secundario para un mineral con conteni- tor secundario para un mineral con contenido de
do de magnesio menor a ~1.5% (máximo hasta magnesio mayor a ~1.5% (mayor a ~8.8g/t).
~4.5g/t).
MINERÍA la mejor puerta de acceso al sector minero MINERÍA / JUNIO 2022 / EDICIÓN 537 11
ha estimado una dosificación de colector Dosificación de espumante primario
primario hasta un máximo de ~39.3g/t (ver La dosificación del reactivo espumante primario
Figura 5). para mejorar la recuperación de cobre mediante
el Algoritmo de Árbol de Decisión, para la con-
Dosificación de colector secundario dición de mineral con contenido de magnesio
La dosificación del reactivo colector secundario menor a ~1.5% debería ser mayor a ~37.2g/t
para mejorar la recuperación de cobre mediante (ver Figura 8).
el Algoritmo de Árbol de Decisión, para la con-
dición de mineral con contenido de magnesio Para la condición de mineral con contenido de
menor a ~1.5% debería ser hasta un máximo de magnesio mayor a ~1.5%, el algoritmo ha esti-
~4.5g/t (ver Figura 6). mado una dosificación de espumante primario
mayor a ~31.6g/t (ver Figura 9).
Para la condición de mineral con contenido de
magnesio mayor a ~1.5%, el algoritmo ha esti- Dosificación de espumante secundario
mado una dosificación de colector secundario La dosificación del reactivo espumante secunda-
mayor a ~8.8g/t (ver Figura 7). rio para mejorar la recuperación de cobre me-
Figura 8. Predicción de la dosificación del espu- Figura 9. Predicción de la dosificación del espu-
mante primario para un mineral con contenido de mante primario para un mineral con contenido de
magnesio menor a ~1.5% (mayor a ~37.2g/t). magnesio mayor a ~1.5% (mayor a ~31.6g/t).
12 MINERÍA / JUNIO 2022 / EDICIÓN 537 MINERÍA la mejor puerta de acceso al sector minero
diante el Algoritmo de Árbol de Decisión, para realizar consultas, segmentar y visualizar los
la condición de mineral con contenido de mag- datos. En estas tareas de aprendizaje auto-
nesio menor a ~1.5% debería ser hasta un máxi- mático, debemos enfatizar la importancia de
mo de ~2.9g/t (ver Figura 10). la visualización de la data. En esencia, los
humanos no tienen la facilidad de asimilar da-
Para la condición de mineral con contenido de tos numéricos como las máquinas. Más bien,
magnesio mayor a ~1.5%, el algoritmo ha esti- entendemos la información presentada visual-
mado una dosificación de espumante secunda- mente de manera más natural. Por lo tanto, re-
rio hasta un máximo de ~3.2g/t (ver Figura 11). presentar datos complejos es un desafío para
los expertos en aprendizaje automático. Este
Conclusiones es un trabajo que ocupa el 80% del tiempo
1. El paso más importante en el uso de algoritmos total de evaluación.
de aprendizaje automático es comprender la
información contenida en los datos. Además, 2. Los Árboles de Decisión por Regresión son
tenemos la tarea de conocer bien el proceso, uno de los algoritmos clasificadores más
Figura 10. Predicción de la dosificación del espu- Figura 11. Predicción de la dosificación del espu-
mante secundario para un mineral con contenido mante secundario para un mineral con contenido
de magnesio menor a ~1.5% (máximo hasta a de magnesio mayor a ~1.5% (máximo hasta a
~2.9g/t). ~3.2g/t).
MINERÍA la mejor puerta de acceso al sector minero MINERÍA / JUNIO 2022 / EDICIÓN 537 13
Tabla 2. Resultados
CONDICIONES
conocidos y usados en las tareas de Data datos y posibilite encontrar detalles ocultos e
Mining Machine Learning, ya que son una ir mejorando su grado de predicción.
forma de representación sencilla para en-
contrar grupos homogéneos según una cierta 4. Una vez validado el grado de predicción del
variable de respuesta. Esta técnica permitió modelo, también permitirá establecer rangos
representar de forma gráfica una serie de re- de dosificación de reactivos claros y preci-
glas sobre la decisión que se debe tomar sos para poder maximizar la recuperación de
en la dosificación de reactivos en un pro- cualquier proceso de flotación (en este caso
ceso de flotación, tal como se aplicó para de aplicación fue el de cobre), lo que posibili-
este ejemplo, la cual podría incrementar la taría establecer estrategias operativas para el
recuperación de cobre en función al nodo proceso de flotación, lo que daría como resul-
primario estimado por el algoritmo, el cual tado una reducción en la variabilidad causa-
fue el magnesio contenido en el mineral pro- da por las distintas formas de operar entre los
cesado. Los resultados de esta aplicación diferentes grupos de trabajo y además una
redondeando los valores fueron los que se posible reducción en costos por consumos de
muestran en la Tabla 2. reactivos.
14 MINERÍA / JUNIO 2022 / EDICIÓN 537 MINERÍA la mejor puerta de acceso al sector minero