Está en la página 1de 4

OLOGI C

GE A
D

DE
SOC I E DA

C HILE
un

F
da 6

2
la serena octubre 2015 d a e n 19

CART (Classification and Regression Tree) applied in


Intrusive Rocks at Teck Carmen de Andacollo
+ ᶺ
Cristián Jeraldo*, Ricardo Schmidt y Víctor Araya
Superintendencia de Geología. Compañía Minera Teck Carmen de Andacollo
+ ᶺ
Emails: *cristian.jeraldo@teck.com, ricardo.schmidt@teck.com, victor.araya@teck.com
no se dispone de mapeo geológico estándar, ni de los
testigos para su remapeo. De esta forma, tramos de
Abstract. Carmen de Andacollo is a Cretaceous pórfido en la Base de Datos aparecen codificados como
porphyry copper, located near Andacollo town. Geology “Indiferenciado” (PFIND), es decir, no utilizables
consists of a sequence of volcano-sedimentary units, part
durante el modelamiento. Los tramos de pórfido
of the Quebrada Marquesa Formation. These units are
intruded by several sub volcanic like-dyke porphyries, Indiferenciado suman alrededor de 3,000 muestras,
classified as intra mineral (PFMIN) and post mineral equivalente a 21% del total codificado en la Base de
(PFPOST). Twenty one percent of the intervals of Datos de Pórfidos.
porphyries in the database are classified as
"Undifferentiated", because of that they correspond to old
samples, not availables for relogging. To address this
issue is used Classification and Regression Tree (CART),
a Data Mining tool. In this manner, it is possible to classify
types of porphyries into PFMIN or PFPOST based on
chemical analysis of seven elements: Ag, As, Au, Cu, Hg,
Mo y Sb. As a result of this classification methodology, the
Project has now 90% of the porphyry database classified
as PFMIN or PFPOST and they are available for use in
modelling and estimation.

Key words: Data mining, CART, Modelling

1 Introducción
Carmen de Andacollo (CDA) es un depósito tipo pórfido
de cobre de edad cretácica (Oyarzún et al., 1996),
ubicado en la Región de Coquimbo. Litológicamente, las
rocas que componen el área corresponden a una
secuencia volcánica de la Formación Quebrada Marquesa
compuesta por lavas y brechas andesíticas que subyacen Figura 1. A.- Pórfido Mineral (PFMIN). B.- Pórfido Post
a un paquete piroclástico (tobas vítreas, cristalinas y Mineral (PFPOST).
líticas) de composición predominantemente dacítica con
pequeñas intercalaciones de lavas traquíticas y niveles Con el objeto de incrementar la data para la estimación
volcanoclásticos. Sobrepuesta a este paquete, se ha de recursos, se inició la exploración de alternativas
descrito una zona de brechas de características variadas, tendientes a identificar a qué tipo de pórfido correspondía
con evidencias de fuerte hidrotermalismo y tectonismo cada muestra de PFIND. Para ello, se buscaron
sobreimpuesto, dispuesto en forma concordante con la herramientas de Minería de Datos, utilizándose en
secuencia volcánica subyacente. Toda la secuencia es definitiva un Árbol de Clasificación y Regresión
cortada por dos sets de pórfidos sub-volcánicos, uno (CART). Éste básicamente consiste en una secuencia de
temprano, relacionado directamente con los eventos de particiones binarias de datos sobre un Conjunto de
mineralización de Cu-Au-Mo, de dirección preferencial Entrenamiento, las que permiten definir la mejor
NW (diques de Pórfido Dacítico Grueso y Pórfido clasificación posible, medida en base a un algoritmo de
Dacítico Medio) y otro set tardío que corta al anterior, de error estándar.
dirección preferencial NS (Pórfido Riolítico y diques de
Pórfido Andesítico), (Araya et al., 2012). 2 Árbol de Clasificación
Durante el proceso de modelamiento geológico destinado
a establecer los controles de la distribución del Cobre, los Se basa en una estructura en forma de árbol, en el cual las
dos sets de pórfidos fueron clasificados como Pórfido ramas representan decisiones, las que generan reglas para
Mineral (PFMIN) y Pórfido Post Mineral (PFPOST), la clasificación de un conjunto de datos en subgrupos.
(Figura 1). Sin embargo, para una parte de los sondajes, Las ramificaciones se producen de manera recursiva

299
ST 7 GEOMETALURGIA

hasta que criterios de parada son alcanzados. Las hojas o


nodos terminales corresponden a variables categóricas, La división mostrada en la Figura 3 puede ser expresada
para el caso de este trabajo, tipos de pórfido. El árbol de mediante el Árbol de Clasificación de la Figura 4.
clasificación corresponde a un algoritmo supervisado,
dado que es necesario el aprendizaje en base a un
Conjunto de Entrenamiento.

El algoritmo específico utilizado es Classification And


Regression Tree o CART (Breiman et al., 1984). Una de
las características distintivas de CART es su enfoque en
la poda, con escasa limitación al crecimiento del árbol.
La poda se desarrolla mediante una estrategia de costo-
complejidad que permite minimizar los errores en la
clasificación. El software mediante el cual se desarrolla
CART es Statistica®. Figura 4. Árbol de clasificación correspondiente a las
particiones de la Figura 3.
A modo de ejemplo, en el espacio R2 de la Figura 2, se
despliegan 27 objetos de dos clases, a saber: Clase 1
(C1), círculos; Clase 2 (C2), estrellas. Para determinar la magnitud del error se utiliza el Índice
de Gini (Hastie et al., 2009).

Donde p(j|t) = probabilidad de pertenecer a la clase “j”


estando en el nodo t. Para el ejemplo, a continuación se
determina el Índice de Gini (IG) para cada nodo del
Árbol de la Figura 4:

Figura 2. Distribución de objetos de dos clases en un espacio


R2.

El objetivo es dividir el conjunto total de datos según


particiones que permitan generar subconjuntos de datos
más homogéneos (Figura 3).
Finalmente, el IG total para el árbol de la Figura 4,
corresponde a la suma ponderada de los IG de cada uno
de los nodos:

El resultado del Árbol de Clasificación del ejemplo es un


mejor ajuste respecto del escenario original sin
particiones, el que presenta un IG=0.483.

3 CART como clasificador de pórfidos en


CDA

El objetivo es construir un algoritmo de clasificación


automática de Pórfidos, utilizando predictores
Figura 3. Partición de los objetos de la Figura 2 según disponibles en aquellos sondajes no accesibles para
subconjuntos de la data original.

300
AT 2 geología económica y recursos naturales

remapeo. Estos corresponden a las 7 leyes siguientes: Ag, Los primeros nodos del árbol de clasificación generado
As, Au, Cu, Hg, Mo y Sb. se muestran en la Figura 7.

Identificadas las leyes (predictores) disponibles, se


genera una Base de Datos de sondajes que cuenta tanto
con mapeo geológico como con las 7 leyes señaladas. La
relación entre cada una de estas leyes y los tipos de
pórfido se muestra en el gráfico de importancia de
predictores de la Figura 5. Este se basa en un test 2 de
independencia de Pearson, siendo la Hipótesis Nula (H0):
“ley es independiente de tipo de pórfido”. A mayor valor
de 2 (largo de barra), menos verosímil resulta que H0 sea
correcta. De acuerdo al gráfico, las leyes que más
explican (más dependientes) de los tipos de pórfido son
Cu, Sb, As y Hg.

Figura 7. Primeros nodos del árbol de clasificación generado


en este trabajo.

4 Validación del Árbol de Clasificación

Para determinar la capacidad predictiva del CART


generado, se procede con la clasificación de tipos de
pórfido en el Conjunto de Test, constituido por 926
muestras (20% del total). Posteriormente, se compara el
resultado de la clasificación con el mapeo
correspondiente a cada tramo (Figura 8).

Figura 5. Gráfico de importancia de predictores para tipos de


pórfido (PFMIN y PFPOST).

Posteriormente, la Base de Datos de 4,608 muestras


(soporte 2,5 m) es dividida mediante muestreo aleatorio
simple en un Conjunto de Entrenamiento (80%) y un
Conjunto de Test (20%). Utilizando el Conjunto de
Entrenamiento, se genera el modelo según el esquema de
la Figura 6.
Figura 8. Porción del resultado de clasificación de tipo de
pórfido sobre Conjunto de Test.

El resultado de la clasificación en el Conjunto de Test se


muestra en la Figura 9. El error global de clasificación es
12%, considerado apropiado para la aplicación requerida.

Figura 6. Concepto de modelo utilizado en este trabajo.

301
ST 7 GEOMETALURGIA

Conclusiones

Usando algoritmo de minería de datos CART, es posible


determinar mediante leyes los tipos de pórfido en
muestras antiguas no disponibles para remapeo. Lo
anterior se consigue con un bajo nivel de error (12%).
Esto significó reducir desde 21% a 10% los tramos sin
información de tipo de pórfido.

Finalmente, existe una oportunidad respecto del uso de


esta herramienta como un eventual apoyo al Control y
Aseguramiento de Calidad de los datos obtenidos desde
mapeo geológico.

Agradecimientos

Los autores desean agradecer a los profesionales de la


Figura 9. Resultado de clasificación de tipos de pórfidos en Gerencia de Planificación y Desarrollo de Minera Teck
Conjunto de Test. CDA y en general a todos los estamentos de nuestra
compañía por todo su apoyo.

5 Aplicación en Modelo Geológico


Referencias
Durante la construcción del modelo del año 2013, no se
disponía de la clasificación (CART), con tramos en Araya, V., Maldonado, A., Astudillo, J. 2012. Geology of Carmen
sondajes codificados como Pórfido Indiferenciado. Así, de Andacollo Deposit. Congreso Geológico Chileno, 13,
la interpretación se realizaba con otros criterios (Figura Antofagasta, Chile, 05-09 Agosto, 2012, pp.25-27.
10A). Utilizando la clasificación (CART), Pórfidos
Indiferenciados son asignados a los tipos de pórfidos Breiman, L., Friedman, J.H., Olshen, R., and Stone, C.J. 1984.
Classification and Regression Tree. Wadsworth & Brooks/Cole
modelados, generando con una mayor certeza los límites Advanced Books & Software.
de estos cuerpos intrusivos. A partir del año 2014, zonas
del modelo como la de la Figura 10A fueron mejoradas. Hastie, T., Tibshirani, R., Friedman, J. 2009. The Elements of
La Figura 10B define un cuerpo de PFPOST en base a la Statistical Learning: Data Mining, Inference, and Prediction,
nueva asignación. Second Edition (Springer Series in Statistics). Springer
Science+Business Media, LLC 2009.

Oyarzún, R., Ortega, L., Sierra, J., Lunar, R. 1996. The Manto-Type
gold deposit of Andacollo (Chile) revisited: A model beed on
fluid inclusion and geologic evidence. Economic Geology. Vol.
91, pp. 1298-1309.

Figura 10. A.- Modelo del año 2013 sin clasificación de


Pórfidos, con cuerpo de PFMIN y otro de PFPOST. B.- Modelo
del año 2014 usando clasificación, con solo PFPOST (Existe
también actualización del cuerpo de gravas).

302

También podría gustarte