Está en la página 1de 4

Evaluación de algoritmos de clasificación aplicados a la identificación de tipos de roca a

partir de los registros Gamma Ray, Porosidad y Densidad, en pozos ubicados en la Cuenca
de los Llanos Orientales, Colombia.
Aceros, S. y Gómez, V.

Universidad Nacional de Colombia

Hall, B. realizó una caracterización de facies utilizando


RESUMEN Aprendizaje de Máquina; Martin K. Dubois, Geoffrey C.
Con el objetivo de clasificar en 5 clases de tipos de roca Bohling, Swapan Chakrabarti, realizaron una
(lutita, limolita arcillosa, limolita, arenisca arcillosa y comparación de cuatro enfoques para el problema de
arenisca) a partir de registros (Gamma Ray, Densidad clasificación de facies; G.C. Bohling y M.K. Dubois,
y Porosidad Efectiva) de pozos ubicados en la Cuenca realizaron la aplicación de las técnicas de redes
de los Llanos Orientales, se identificó el logaritmo de neuronales y cadena de Markov para la predicción de
clasificación PART como el más preciso, entre un litofacies a partir de registros de pozos; estos son
conjunto de algoritmos probados, tales como J48, RF, algunos de los autores que han influido a la presente
PART y SVM en el software WEKA. investigación a partir de su introducción del aprendizaje
de máquinas para la caracterización geológica de
Inicialmente, se realizó una etapa de entrenamiento del manera más ágil y precisa.
algoritmo con los datos registros del pozo T116 y
posteriormente, se aplicó el algoritmo con mayor De acuerdo con los trabajos realizados previamente,
precisión al pozo T90. concluyen que la precisión de los algoritmos puede
mejorar si se tienen atributos o parámetros cuantitativos
Al comprobar el algoritmo con los datos de prueba, se que permitan una agrupación o clasificación de los
obtuvo una clasificación correcta de los tipos de roca datos bien definida, según el caso.
del 65%. De acuerdo con la matriz de confusión, el
algoritmo presentó clasificación incorrecta El interés de la presente investigación se enfocó en
principalmente para las litologías Limolita y Arenisca usar información de registros de pozo que comúnmente
Arcillosa. los profesionales tienen a la mano y a partir de ello,
identificar los criterios más predominantes para la
Los resultados obtenidos permiten concluir que, para clasificación de tipo de roca, a partir de registros de
obtener un mejor resultado en la clasificación, es pozo.
necesario contar con información litológica adicional, tal
como PEF Y Gamma Ray Espectral, y así podrá Para la obtención de esta identificación, se requirió
delimitar de mejor manera los rangos para las litologías contar con un software de licencia libre que permitiera
Limolitas y Areniscas Arcillosas. hacer minería de datos y así poder ajustar parámetros
de evaluación.
PALABRAS CLAVE
Registros de pozo, Clasificación, Tipos de roca, PART, Al adquirir la distribución de los datos de entrada, se
Litología, Cuenca de los Llanos Orientales. obtuvo que el problema planteado es desbalanceado,
lo cual dificultó la precisión del algoritmo al clasificar los
INTRODUCCION tipos de roca con menos densidad de datos.
La identificación rápida del tipo de roca perforada en También se observó que el mejor parámetro para la
pozos de petróleo permite la optimización de tiempo y clasificación en este caso fue el Gamma Ray y que los
recursos, además de conocer con precisión las registros de densidad y porosidad no influyeron
características geológicas del yacimiento. También es notoriamente.
utilizado para la toma eficiente de decisiones en la
etapa de completamiento, con el fin maximizar la Es por ello que, para futuros trabajos se propone el uso
producción de petróleo y minimizar problemas de otros registros que aporten información cuantitativa
asociados a arenamientos. de la litología, que conlleven a una mejor clasificación
por parte del algoritmo.
Generalmente este tipo de clasificación demanda
análisis de laboratorios de difícil acceso en campo que Este estudio fue desarrollado para implementar
requieren de un tiempo considerable para su obtención. algoritmos de aprendizaje de máquina para la
caracterización litológica de las Cuencas Colombianas,
Debido a esta necesidad, en los últimos años, los para este caso Cuenca de los Llanos Orientales; a partir
profesionales vinculados a las geociencias y el sector de registros de pozo típicamente adquiridos por las
de hidrocarburos se han interesado por desarrollar compañías operadoras.
herramientas y conocimientos que permitan dar
celeridad a la caracterización geológica a partir de Se evidencia la oportunidad de aplicar y mejorar esta
información básica como registros eléctricos. metodología dependiendo de la información disponible
según el ambiente de depositación, para lograr obtener
plasmada la caracterización geológica desarrollada por es 550 y el número de atributos es 4. (4=3 más la clase
un profesional en un modelo cuantitativo. que es tipo de roca).

METODOLOGÍA Los atributos son las propiedades petrofísicas de la


A partir de un conjunto de datos obtenidos de 2 pozos sección litológica perforada en el T116 y son porosidad
de la Cuenca de los Llanos Orientales, tales como (efectiva), densidad y Gamma Ray. El software también
porcentaje de arcilla, modelo de permeabilidad, permitió visualizar la predominancia de cada atributo en
densidad, porosidad, resistividad, rayos Gamma y la clasificación, como se evidencia en la siguiente
neutrón; se determinó que solo se tomaría la imagen.
información relacionada a
registro Gamma Ray, densidad
y porosidad, al ser registros
típicamente obtenidos durante
la perforación de un pozo y por
su relación directa con la
litología perforada.

Posteriormente, se realizó la
limpieza de los datos,
eliminando aquellos que no
tienen un valor válido, con el fin
de que el análisis no se vea
afectado en su proceso de
clasificación.

Sin embargo, para la definición


de los tipos de roca, se utilizó el Imagen 1. Distribución de clases por atributo.
modelo petrofísico previamente establecido a partir de
pruebas de laboratorio de los pozos. El atributo GR es el que mejor separa los datos del tipo
de roca “5-Lutita”: si el GR >63 el dato pertenece sin
La clasificación de tipos de roca establecida es la duda alguna al tipo de roca “5-Lutita” (clase azul), si el
siguiente: 48<GR<63 el dato pertenece al tipo de roca “4-Limolita
Arcillosa” (clase roja); sin embargo, si el GR<48 ya se
observan no muy buenas separaciones.

Así mismo, se puede evidenciar que los demás


atributos no son muy buenos separadores.

En la distribución de los datos de tipo de roca, se tienen


5 clases y cada una con un valor diferente: 75 datos
corresponden al tipo de roca “1-Arenisca”, 92 datos a
“2-Arenisca Arcillosa”, 36 datos a “3-Limolita”, 77 datos
a “4-Limolita Arcillosa” y finalmente 234 datos
corresponden al tipo de roca “5-Lutita”; es decir, es un
problema desbalanceado.

Teniendo en cuenta lo anterior, el algoritmo tiende a


generalizar, presentando una muy buena clasificación
para la clase con mayor cantidad de datos y una no muy
Tabla 1. Clasificación de los tipos de roca
buena clasificación para la clase con menor cantidad de
datos.
Esta clasificación fue aplicada a los datos de registros
previamente depurados. RESULTADOS
El software muestra los resultados de la correcta o
Una vez establecidos los archivos a analizar, se incorrecta clasificación efectuada por cada algoritmo,
procedió a ingresar al software WEKA el archivo .CSV los cuales se resumen en la siguiente tabla.
que contenía los datos de los registros antes
seleccionados para el pozo T116.

El software permitió realizar un análisis inicial de la


distribución de los datos, es decir la cantidad de datos
por atributos (registros de pozo), a partir del cual se
estableció que la cantidad de datos totales o instancias
Imagen 2. Matrices de confusión de los algoritmos en etapa de
entrenamiento y validación.

Tabla 2. Porcentajes de clasificación correcta e incorrecta por DISCUSIÓN


algoritmo. De la Tabla 2. Porcentajes de clasificación correcta e
incorrecta por algoritmo. se resaltan los casos
Así mismo, al aplicar los algoritmos, WEKA arroja la
clasificados correctamente, evidenciando que, para
exactitud de la clasificación por clase, dando
este caso, no hay un clasificador predominante pues
información en columnas como el verdadero positivo,
ambos arrojan los dos algoritmos presentan los mismos
falso positivo, precisión, y ROC área (Receiver
valores.
Operator Character).
Posteriormente, al analizar los resultados obtenidos de
ROC, y partiendo del entendido que es el porcentaje de
veces que clasificará correctamente cada clase; se
observa que la prueba con los datos del pozo “T90” en
los algoritmos de clasificación J48 y PART, existe un
mejor comportamiento para los tipos de roca Arenisca
Arcillosa y Limolita aplicando el algoritmo PART, de
Tabla 3. Estadística del resultado del algoritmo PART usando acuerdo con la siguiente gráfica.
validación cruzada al pozo T116.

Tabla 4. Estadística del resultado del algoritmo PART al pozo T90.

Gráfica 1. Comparación del ROC, algoritmo PART vs J48.

Teniendo en cuenta lo anterior, se seleccionó el


Tabla 5. Estadística del resultado del algoritmo J48 usando algoritmo PART como el mejor clasificador probado,
validación cruzada al pozo T116.
para los tipos de roca del presente trabajo. Por lo cual,
para se procedió a analizar su matriz de confusión.

Tabla 6. Estadística del resultado del algoritmo J48 al pozo T90.


Imagen 3. Matriz de confusión algoritmo PART pozo T90.
Finalmente, cada algoritmo dio como resultado una
matriz de confusión, donde se puede analizar con El clasificador indica que no presenta claridad en la
mayor detalle los aciertos en la clasificación y en qué clasificación de los tipos de roca Limolita y Arenisca
clase presentó mayor dificultad. Arcillosa, dado que para la limolita únicamente clasifica
2 casos de manera correcta, confundiendo entonces 41
casos con Limolita Arcillosa. Con respecto a la Arenisca
Arcillosa, el clasificador presenta aún más
inconvenientes pues no clasifica ni un solo caso de
manera correcta, confundiendo los datos con los tipos presentaron los registros utilizados para el
de roca Limolita Arcillosa y Limolita. entrenamiento del algoritmo, las reglas
generadas por el Software WEKA para el
A continuación, y con el fin de profundizar en lo algoritmo PART no son lo suficientemente
anteriormente expuesto, se presentan las reglas precisas.
usadas por el algoritmo.
• Se recomienda que, para obtener un mejor
clasificador, se evalúe nuevamente este y otros
algoritmos con otros registros litológicos,
teniendo en cuenta las características
geológicas de la zona.

• Los registros evaluados corresponden a un


ambiente de depositación fluvial, con altas
heterogeneidades en los tipos de roca, lo cual
se interpreta generó la dificultad para la
clasificación del algoritmo.

REFERENCIAS
Duda, R. O., Hart, P. E., y Stork, D. G., 2001, Patrones
de Clasificación, Segunda Edición: John Wiley & Sons,
Inc., Nueva York, 654.

Delfiner, P., Peyret, O., Serra, O., 1987. Determinación


Imagen 4. Reglas del algoritmo PART pozo T90, Software WEKA. automática de litología a partir de registros de pozo.
Society of Petroleum Engineers Formation Evaluation
Como se observa, las reglas no son claras en la
2, 303–310.
clasificación de Limolita y Arenisca Arcillosa, puesto
que realiza sobreposición de las mismas, resultando Hall, B., 2016. Clasificación de facies usando
que el algoritmo no refleja precisión en dichas clases. aprendizaje de máquina.
Los resultados obtenidos se asocian a la similitud que G.C. Bohling y M.K. Dubois., 2003. Aplicación integrada
existe entre estas litologías en cuanto a valores de de las técnicas de redes neuronales y cadena de
Gamma Ray, porosidad efectiva y densidad; por lo cual, Markov para la predicción de litofacies a partir de
se hace necesario utilizar otro registro litológico para el registros de pozo. Kansas Geological Survey.,
entrenamiento del algoritmo. Algunos registros Lawrence, Kansas, USA.
litológicos recomendados son Gamma Ray espectral y
PEF (factor fotoeléctrico), sin embargo, esto debe ser Martin K. Dubois, Geoffrey C. Bohling, Swapan
evaluado teniendo en cuenta las características Chakrabarti., 2006. Comparación de cuatro enfoques
geológicas de la zona de donde provienen los registros. para el problema de clasificación de facies. Kansas
Geological Survey, University of Kansas, Lawrence,
KS, USA. Computers & Geosciences 33 (2007), 599–
617.
CONCLUSIONES
• El software WEKA permitió evaluar diferentes Rogers, S.J., Fang, J.H., Karr, C.L., Stanley, D.A.,
algoritmos y su precisión para la clasificación 1992. Determinación de litología a partir de registros de
de los tipos de roca planteados inicialmente en pozo usando redes neuronales. American Association
este artículo. of Petroleum Geologists Bulletin 76, 731–739

Saggaf, M.M., Nebrija, E.L., 2000. Estimación de


• El ROC fue la principal variable para el análisis
litologías y facies deposicionales a partir de registros
de resultados de los algoritmos y también
wireline. American Association of Petroleum Geologists
permitió seleccionar el algoritmo PART como el
Bulletin 84, 1633–1646.
mejor de los probados, identificando las
litologías que presentaron menor precisión.

• De acuerdo con los resultados obtenidos, los


registros Gamma Ray, porosidad efectiva y
densidad, no fueron lo suficientemente útiles
para que el algoritmo logre una eficiente
clasificación.

• Como consecuencia de la no posible


delimitación de los tipos de roca que

También podría gustarte