Está en la página 1de 21

Centro de Investigación e Innovación en Tecnologías de la Información y

Comunicación

Desarrollo de enfoques computacionales


para la selección de biomarcadores útiles en el pronóstico de
neoplasias hepáticas

TESIS

Para obtener el grado de

Doctor

en Ciencias de Ciencia de Datos

Autor: José Ricardo Hernández Morales

Comité Tutorial.

Dr. Dagoberto Armenta Medina Director


Dr. Luis Guillermo Ruiz Velázquez Codirector
Capítulo 1

Introducción:

1.1 Motivación de esta tesis


De un tiempo acá en México ha comenzado una revolución por entender los
fenómenos de interés para el ser humano, esto con la intención de comprenderlos
mejorarlos y/o tratar de encontrar estrategias para lograr evitar gran parte de
estos.
Uno de los fenómenos qué más importancia se ha tenido en la actualidad es
precisamente las enfermedades crónico degenerativa y apoyados por el
crecimiento de la tecnología muchos investigadores han encontrado en ella a un
aliado fundamental para esta tarea, de igual manera las ciencias exactas y las
ciencias computacionales han logrado formar parte en esta línea de investigación
por eso esta iniciativa que poco a poco ha ido tomando fuerza de la mano del
poder computacional y el uso de ciertos modelos matemáticos o estructuras
matemáticas han dado pie a generar conocimiento nuevo sobre esta enfermedad, y
es que, en años atrás era imposible analizar tanta información pero el día de hoy
no solamente podemos analizar números o datos recolectados sino imágenes que
solo los especialistas pueden interpretar con años de experiencia y dedicación,
increíblemente hoy mediante el uso de la tecnología computacional y la
matemática se pueden crear modelos e interpretaciones que son un coadyuvante
para la atención médica.
Esta tesis se preocupa por tratar de mejorar las posibilidades de atención médica
para pacientes con problemas hepáticos exclusivamente con cáncer hepático, la
intención es utilizar una herramienta matemática desarrollada en los años 70´s
por Benoit Mandelbrot llamada geometría fractal y poder categorizar la estructura
hepática con un número real que nos pueda dar pie para detectar un biomarcador
físico útil en el pronóstico temprano de esta patología, el concretar este objetivo
puedes dar lugar a un estudio más profundo de esta forma de medir los objetos y
quizás sentar un precedente para el futuro.

1.2 Estado del Arte


En la actualidad existe una creciente corriente en el campo de la ciencia de datos, conocida
como el análisis de imágenes, pero ¿Por qué el aumento de algoritmos para imágenes
médicas ahora?
Es difícil dotar de una respuesta concreta para esta pregunta, pero podemos puntualizar
que la última década ha logrado grandes avances en cuatro áreas el conocimiento que la
ciencia ha recogido. el auge académico ha logrado avances teóricos robustos, Y de la mano
con la divulgación de estos se han propagado nuevas líneas de investigación basadas en
esas teorías (Goodfellow I, 2016), Por otro lado la fuerza tecnológica y el desarrollo
gigantesco deja hardware cada vez más potente, es una situación palpable y se ha
documentado en un sinfín de publicaciones a lo largo del mundo (Patterson, 2018), de
igual manera el acceso a la tecnología adoptado hola como le hacen atender disponibles
cantidades masivas de información grandes cúmulos de datos hoy por hoy se le conoce
como el big data (Marcelo E. Andía, 2019), por último pero no menos importante las líneas
de generación de conocimiento han ido evolucionando ya no sólo se tienen ciencias
exactas o sociales sino que ha habido una mezcla importante para desarrollar nuevos
campos de la ciencia uno de ellos es la ciencia de datos pero en el tema de las imágenes
tenemos a la radiónica que engloba a la extracción el análisis y la cuantificación de
descriptores matemáticos de la textura la forma el tamaño o la dimensión y otras tantas
cualidades de las imágenes, y qué pueden lograr una correlación con múltiples hallazgos
histopatológicos y reportes clínicos como la sobrevida de los pacientes o los periodos de
remisión de la enfermedad (Marius E. Mayerhoefer, 2020) y también a la radiogenómica
que coadyuva con la radiómica correlacionando los fenotipos de imagen, es decir las
características de imagen con presencia de cáncer respecto al tejido adyacente en estado
saludable con datos genómicos propios de la estructura tumoral, o lo que es llamado el
subtipo molecular de la lesión (Lars J. Grimm, 2020), ambas crecientes ciencias hoy por
hoy se han mostrado muy prometedoras (Pieter Kelchtermans, 2014)

Casi podríamos asegurar que en cualquier portal de publicaciones científicas al realizar


una consulta tendremos como resultado una enorme listado de aplicaciones médicas
impulsadas por el aprendizaje profundo o ya comúnmente llamado Deep Learning,
Modelos que automatizan el análisis de distintos tipos de imágenes médicas incluidas las
resonancias magnéticas, las tomografías computarizadas, el ultrasonido, los rayos x
incluso las imágenes histopatológicas pudiendo realizar diagnósticos de ellas
(Muralikrishna Puttagunta, 2021). Lo anterior descrito ha dado lugar a una adopción y
uso de modelos matemáticos, estadísticos y algoritmos refinados utilizados por los
mismos profesionales de la salud en su día a día esto con la finalidad de poder evaluar de
forma muy rigurosa y robusta la capacidad de predicción confiable de estos, que es un
tema fundamental y de gran importancia en este tipo de aplicaciones de índole clínicas, y
es que el uso de una predicción automatizada no supervisada adecuadamente tiene un
impacto directo en la atención del paciente, en ese sentido la gran problemática que ha
habido con estas herramientas tecnológica ha sido su peculiar estado de lo que se llama
caja negra, y es que precisamente la ausencia de reglas de decisión clara que dan lugar a la
construcción y al empleo en estos algoritmos así como las inexistes métricas que puedan
dejar registro de su calibración para su uso diagnóstico ha sido sólo una de las
complicaciones para lograr una mejor adopción de estas herramientas (Chuan Guo, 2017).

Dada toda esta serie de situaciones con relación al análisis de imágenes nos encontramos
en la actualidad con una cantidad amplia de modelos y técnicas que ofrecen diferentes
enfoques para el descubrimiento de información de las imágenes en general que pueden
de una u otra forma aplicarse y/o adaptarse al análisis especifico de imágenes médicas;
como el procesamiento digital de imágenes se pueden describir tres etapas consecutivas:
umbralización que se realiza seleccionando los rangos de intensidad y manipulando los
valores del histograma de cada capa,, limpieza en la cual se obtienen formas definidas
aplicándoles diferentes operaciones morfológicas para eliminar el ruido y los elementos
innecesarios y filtrado; (Carlos G.Berrocal, 2016), en la actualidad se ha documentado que
muchos de los métodos tradicionales han tenido problemas de sensibilidad precisamente
porque al momento de la captura de la imagen la luz llega a provocar interferencia con la
nitidez y el contraste, los trabajos sobre esto en la actualidad se han apoyado de técnicas
de inteligencia artificial para mejorar o resolver este problema (Hyun-Seok Yoo, 2016)

1.3 Estudio de imágenes Médicas y la ciencia de Datos

La ciencia médica en la actualidad puede afirmar Que el diagnóstico y el tratamiento


desarrollado ho implementado en las personas que han llegado a tener algún
desequilibrio en su salud, no podría existir como se conoce sin el uso de la imagenología
como un auxiliar en esta tarea, estudios clínicos como el ultrasonido, la resonancia
magnética, la tomografía computarizada simple o multicapa, la tomografía computarizada
por emisión de positrones y la tomografía computarizada por emisión de fotones simples
se han vuelto estudios del cuadro básico para el diagnóstico de ciertas enfermedades en
los centros de atención clínica. (Huérfano, 2016), lo anterior se ha dado derivado del
creciente avance tecnológico que al día de hoy se tiene, en ese contexto determinar
razones para buscar comprender el papel que juega la tecnología y específicamente la
inteligencia artificial en la sociedad de hoy es una tarea muy sencilla. (Adriana Milena
Machacado-Rojas, 2021), y más aún tomar esas tecnologías para generar conocimiento ha
sido una línea la investigación creciente, así pues el propósito del análisis de imágenes
médicas es precisamente analizar la información y extraer lo más valioso de estas
mediante el uso de modelos o algoritmos que puedan ayudar a los profesionales de la
salud a realizar diagnósticos más precisos y más confiables por lo que esta actividad
podría englobarse o clasificarse con tareas específicas de procesamiento clásico que
podemos citar como; la clasificación, la segmentación, el registro y el reconocimiento del
análisis de esa información. (Hu, 2022)

La atención médica es una carga de trabajo inmensa y poco a poco ha venido a sobrepasar
al cuerpo médico, ha dejado de manifiesto que la actividad tradicional manual De la
interpretación de imágenes médicas hoy por hoy es ineficiente, sumado a eso la
generación de datos de imágenes médicas a aumentado considerablemente y es un
fenómeno que no tiene precedentes, pero que se ha perfilado como un factor para las
complicaciones a la hora de desarrollar los tratamientos a los pacientes de hoy en día,
tales situaciones han dado paso al nacimiento de colaboraciones dónde se reúnen las
imágenes médicas y el aprendizaje automático con resultados aceptables en muchos de
sus casos (Dinggang Shen, 2017)
Podemos enunciar que en las últimas décadas las técnicas para el procesamiento de
imágenes más utilizadas son las redes neuronales artificiales, los algoritmos evolutivos y
los sistemas difusos por mencionar algunos (Yu, Yuan, Dong, & Ríha, 2016)
En general en la mayoría de las investigaciones relacionadas con el análisis de imágenes
podemos observar que la finalidad es mejorar el reconocimiento de la imagen clínica para
determinadas patologías que pueden estar para un grupo específicos de pacientes o para
una patología en la población en general, su enfoque busca siempre superar las
limitaciones tradicionales del profesional de salud a la hora de la interpretación.

Aquí ponemos en manifiesto algunas investigaciones actuales enfocadas al análisis de


imágenes médicas con la implementación de algún método o técnica de IA.

Literatura Modalidad Aplicación Método/Técnica Precisión


(Fos Guarinos, RX Radiografías de CNN AlexNet. 87%
tórax.
2016)
(MI Campo, 2018) TAC Porcentaje de en- Cuantificación basada en 90,73%
fisema. una CNN.
(Lee, 2020) RX Fractura de fé- GoogLeNet y Bi-LSTM. 86,78%
mur.
(Chen, 2020) RX Radiografía de tó- CNN: Dense Net o ResNet 92,47%
rax. y arquitectura YOLOv3.
(Nguyen DT, USG Nódulos tiroideos CNN ResNet50. 82.412%
malignos.
2020)
(Gopal S. Tandel, RM Clasificación de CNN, AlexNet. 99,20%
tumores cerebra-
2020) les.
(Battineni G, 2020) RM Enfermedad de Conjunto o híbrido de 96,12%
Alzheimer (EA) cuatro modelos predicti-
vos NB, ANN,KNN y SVM.
(Francisco F.X. TAC TC del cerebro. Adaptive ABTD. 98.13%

Vasconcelos,
2020)
(Khadidos A, TAC infecciones por modelo híbrido de 90%
COVID-19 de los aprendizaje profundo
2020) pulmones CNN y RNN (DeepSense)

(Sarhan, 2020) RM Clasificación de CAD, (SVM). 99,3%


tumores cerebra-
les
(Sharma S, 2020) RX Detección de Neu- CNN 98.0%
monía.
(Hao J, 2021) TAC Diagnóstico de en- Unión de CNN, ConvLS- 95.2%
fermedades pul- TM, SLP-Net
monares.
(Zhang Z, 2021) RM predicción tem- Regresión logística múl- 92.3%
prana de la res- tiple,
puesta a la quimio Model-Joint
radioterapia en
pacientes con glio-
mas cerebrales
(Zhao Y-F, 2021) RM / Mamogra- Diagnóstico de SVM 72% (RM) / 78.9%
fía cáncer de mama. (Mamografía)
(Guo Y, 2021) Tomografía Clasificación y CNN (ResNet-18) 96.6%
computarizada diagnóstico de te-
por emisión de jido tiroideo resi-
fotón único dual
(SPECT)
(Guo S, 2022) RM clasificación de DNN, Dense Net 87.8%
subtipos de glio-
ma
(Samantha C imágenes clíni- lesiones cutáneas CNN 71,31 %
cas y dermatos-
Wong, 2022) copias

De estos últimos trabajos podemos destacar que la corriente en el análisis de imágenes se


tiende hacia la resonancia magnética esto puede ser quizás por qué es un estudio cada vez
más común en los centros hospitalarios, por otro lado las técnicas te predomina en la
actualidad para hacer el desarrollo de la extracción de información en estas imágenes
médicas son las 6:00 de la tarde podemos ver muy poco el modelos clásicos como la
regresión logística o la regresión múltiple, es importante destacar qué investigaciones qué
están usando ciertos tipos de redes neuronales como lo es la llamada ResNet, qué es una
red neuronal residual y aunque está basada en modelos tradicionales de redes neuronales
su diferenciador es precisamente la creación de saltos entre las capas que se están
analizando de las imágenes, de igual manera las redes de DenseNet, que también dan
saltos múltiples pero que se enfocan exclusivamente en saltos paralelos buscan evitar los
gradientes que se desvanece como el gradiente se retropropaga a las capas anteriores,
iterando este proceso se puede hacer que el gradiente sea extremadamente pequeño y con
ello se busca que los saltos pueden llegar a eliminar las complicaciones de la red
haciéndola quizás más simple usando menos capas durante el entrenamiento inicial y
acelerando el aprendizaje de la misma, estas nuevas redes neuronales nacieron como una
innovación a la red famosa ganadora en la competición de clasificación del 2012 AlexNet y
es que ResNet permite entrenar cientos sino miles de capas mientras se logra un
rendimiento bastante bueno.

Hay que mencionar también que pese a la aceptable precisión de estos modelos ninguno
determina una característica única de las imágenes que analizan, se enfoques meramente
la predicción de la patología. Además, gran parte de los datos utilizados en algunas
publicaciones que se han mencionado con datos libres han sido difíciles de localizar y
extraer al día de hoy se ha hecho una búsqueda bastante amplia con la finalidad de
obtener dichas imágenes

1.4 Fractales y el cáncer

La geometría fractal tiene décadas adquiriendo cada vez más protagonismo en las
publicaciones científicas enfocadas precisamente la caracterización de objetos, se puede
decir qué esto es debido a las excelentes propiedades que proporciona del análisis de sus
objetos. Actualmente la dimensión fractal ha ido ganando terreno y ha comenzado a tener
un rol importante; sobre todo analizando objetos complejos de la naturaleza que por
ningún motivo pueden ser modelados o caracterizados por las formas descritas en la
geometría euclidiana. La dimensión fractal es un aspecto englobado en la geometría fractal
desarrollada en los años 70´s por Benoit Mandelbrot y es que esta dimensión proporciona
una característica indicativa para los objetos en distintas áreas de la ciencia y en
diferentes tipos de investigación incluido el procesamiento de imágenes, el
reconocimiento de patrones y los gráficos por computadora, es de gran utilidad porque
técnicamente puede caracterizar la textura, la aspereza y/o la suavidad de los objetos que
se analizan y ha dejado evidencia sustancial de lograr caracterización de manera
prominente estas características. (Soumya Ranjan Nayak, 2019). Ahora bien para ligar el
uso del análisis de imágenes, la geometría fractal y el estudio de las neoplasias hay que
establecer lo que es la carcinogénesis, dicho proceso puede definirse como, por decirlo de
alguna manera la modificación del control de la propagación celular y la capacidad de
invadir tejidos, por tanto, el desarrollo de las neoplasias usualmente hoy se desarrolla
modificando la estructura natural del tejido deformándolo y alterando su relación con los
tejidos sanos libres de esta patología (Lucas Glaucio da Silva, 2021)

En investigaciones anteriores se ha documentado la posibilidad de identificar las etapas


primarias información de tumores utilizando técnicas de geometría fractal, Lo que hacen
es asociar los cambios de irregularidad que se producen en las células, tejidos y redes
vasculares durante el desarrollo de esta patología, así pues se ha logrado reducir la
probabilidad de diagnósticos erróneos o de ambigüedades diagnósticas, alcanzando a
categorizar el grado de lesión producido el tejido primario (Dokukin ME, 2015). Esta
forma de analizar los objetos y de extraer características físicas en conjunto con las
técnicas sofisticadas de la ciencia de datos han generado evidencia positiva para la
usabilidad de la geometría fractal, y es que posterior a construir modelos de machine
learning alimentados con la extracción de características de imágenes ha dado mejores
resultados frente al simple uso de CNN, esto debido a que el uso de la dimensión fractal
recoge las características morfológicas de forma más eficiente para su clasificación.
(Xinxin Feng, 2021). También se tiene evidencia del uso de la dimensión fractal en la
clasificación de imágenes cancerosas, imágenes que destacan por su estructura
morfológica irregular y compleja, pero pese a ello y comparada con su contraparte clásica
de modelación ML y DL ha logrado una mejor precisión en esta tarea (Muhammed Ali Pala,
2022). Estas investigaciones han dejado en manifiesto el enorme potencial que presenta
el análisis fractal para encontrar biomarcadores cuantitativos confiables en tumores de
distintas naturalezas. (Pashayar P.Lookian, 2022)

Al momento de comenzar a desarrollar esta investigación nos dimos cuenta de que


existían desafíos técnicos previous al análisis de dimensión Fractal, y es que en realidad la
segmentación del órgano como tal qué es objeto de estudio en esta tesis sigue siendo un
desafío, principalmente por las variaciones que existe en el contraste entre la lesión el
órgano y el fondo de las imágenes que se pretenden analizar.
así pues nos dimos a la tarea de revisar trabajos anteriores y actuales sobre modelos o
algoritmos de segmentación automatizada siendo el más importante el “The Liver Tumor
Segmentation Benchmark (LiTS)” un informe que recoge los resultados del simposio
internacional IEE imágenes biomédicas (ISBI) del 2017 y las conferencias internacionales
sobre computación de imágenes médicas y Computer-Assisted Intervention (MICCAI) del
2017 y 2018 respectivamente, informe escribe los resultados de análisis de imágenes
diversas qué contienen tumores primarios y secundarios con tamaños y apariencias muy
variadas incluso con niveles de lesiones o fondo diferente detalla su creación en
colaboración con 7 hospitales institutos de investigación hoy y además de la descripción
de los resultados de 65 algoritmos de segmentación de tumores de hígado entrenados con
131 volúmenes de tomografía computarizada.

La siguiente tabla detalla lo publicado.

Dataset Institution Li- Tumor Segmentation #Volumes Modality


ver

TCGA-LIHC (Erickson et al., 2016) TCIA ✓ ✓ 1688 CT, MR,


PT

MIDAS (Cleary, 2017) IMAR ✓ ✓ 4 CT

3Dircadb-01 and 3Dircadb-02 (Soler et al., IRCAD ✓ ✓ ✓ 22 CT


2010)

SLIVER’07 (Heimann et al., 2009) DKFZ ✓ ✓ 30 CT

LTSC’08 (Heimann et al., 2009) Siemens ✓ ✓ 30 CT

ImageCLEF’15 () Bogazici Uni. ✓ ✓ 30 CT

VISCERAL’16 (Jimenez-del Toro et al., Uni. of Geneva ✓ ✓ 60/60 CT/MRI


2016)

CHAOS’19 (Kavur et al., 2021) Dokuz Eylul ✓ ✓ 40/120 CT/MRI


Uni.

LiTS TUM ✓ ✓ ✓ 201 CT

Es sencillo de ver el artículo del 2016 de Erickson cuenta con la mayor cantidad de
volúmenes analizados de tomografía además de qué menciona que ese set de datos
contiene imágenes del hígado con presencia de tumoración Pero no se cuenta con la
segmentación necesidad de datos, en ese rubro sólo se tienen 2 investigaciones que en
teoría dentro de su centro de datos tienen imágenes de hígado cuánto población y con la
segmentación del órgano estas son “LiTS” y “3Dircadb-01 and 3Dircadb-02”,
desafortunadamente ha sido imposible obtener estos sets de datos para utilizarlos en esta
investigación se ha tenido incluso que recurrir a contactar a los autores sin una respuesta
satisfactoria
Capítulo 2

Generalidades.

Es innegable que lo que se conoce comúnmente como cáncer tiene evidencia de existencia
por lo menos desde hace unos 5000 años, como lo pone en manifiesto el papiro de Smith y
Ebers, este último perdido en la segunda guerra mundial, sin embargo el griego Hipócrates
da vestigios en su teoría de los cuatro humores de presencia de flema, sangre, bilis amarilla
y bilis negra mismas que describe en Corpus Hipocraticum, dando como recomendación en
tratamiento de tumores el aceite de rosas y la extirpación quirúrgica. El mismo Hipócrates
fue quien creo el término “Cáncer” que significa cangrejo para determinar los crecimientos
malignos (Graña, 2015), por su pate la organización mundial de la salud define el cáncer
como aquel tumor maligno que se caracteriza por un crecimiento anormal y desordenado
de las células y que además tiene la capacidad de invadir los tejidos adyacentes y generar
metástasis en puntos de distantes del organismo (OMS, 2023).
Según cifras de la Organización Mundial de la Salud (OMS) el cáncer es la segunda causa de
muerte en el mundo, en el 2015, ocasionó 8.8 millones de defunciones, siendo el cáncer
hepático responsable de 788 mil defunciones, primordialmente debidas a la falta de
diagnóstico y tratamiento que llevan a su detección en fases avanzadas. Si un paciente es
diagnosticado en etapas tempranas tiene acceso a medicamentos más eficaces y a una
mejor clasificación de los distintos tipos de neoplasias, con lo que podría aumentar su
sobrevida e inclusive alcanzar la recuperación total de su estado de salud (Mashaal, y
otros, 2016). El impacto económico del cáncer es sustancial y va en aumento. Según las
estimaciones, el costo total atribuible a la enfermedad en 2010 ascendió a US$ 1,16
billones. En el 2017, solo el 26% de los países de ingresos bajos informaron de que la
sanidad pública contaba con servicios de patología para atender a la población en general.
Más del 90% de los países de ingresos altos ofrecen tratamiento a los enfermos
oncológicos, mientras que en los países de ingresos bajos este porcentaje es inferior al
30%. (OMS, Organizacion Mundial de la Salud, 2022)
Es por tal motivo que sigue siendo un problema de investigación relevante encontrar
técnicas novedosas basadas en biomarcadores que puedan auxiliar en el diagnóstico
oportuno de este padecimiento, biomarcadores no solo basados en el análisis clínico de
química sanguínea, sino que usen las imágenes de las lesiones hepáticas que aparecen en
etapas muy tempranas de la enfermedad (Chaiteerakij, Addissie, & Roberts , 2015)

2.1 Lesiones Hepáticas


El hígado es un órgano situado en el hipocondrio derecho y además es la visera más grande
del ser humano como tal también se sabe que sufre de múltiples patologías tanto locales
como sistemáticas el lugar donde se ubica causa gran dificultad al momento de su
valoración por lo su diagnóstico está basado mayormente en el análisis clínico y analítico
sin embargo, esa ubicación cercana a la pared abdominal y dureza también es la razón por
la cual la ecografía funciona tan bien para observar y diferenciar las patologías de su
anatomía normal, así bien uniendo ambas técnicas es posible dar un diagnóstico. (Pérez,
2003)

Sin embargo, también existes otro tipo de estudios de imagen que ayudan a mejorar el
análisis del estado del hígado, como lo es la tomografía, esta permite amplia resolución y
reconstrucción a detalle de la zona de importancia, en general dado a que sus costos
moderados y el acceso casi garantizado en nuestro país es el estudio principal para la
evaluación del hígado.
Antes de mencionar como tal las patologías focales es de suma importancia definir lo que
es una lesión ocupante de espacio, que es precisamente un nódulo dentro del parénquima
que desplaza formaciones junto a él, alterando el contorno y en ocasiones el tamaño del
hígado (Pérez, 2003). Así pues, tenemos entonces como definición que las lesiones
hepáticas focales son una estructura ajena a la anatomía normal del órgano, pueden ser de
formación solida o liquida, son de naturaleza muy variada y pueden o no causar
anormalidad estructural y funcional del sistema hepatobiliar; su tamaño varía y pueden ser
benignas o malignas. (Fonte , Emma , Misas Menéndez, & González Santana, 2014)
Como tal el hígado puede tener múltiples lesiones tanto benignas como malignas como
antes fue mencionado, es precisamente la diferenciación de estas el objetivo de las
distintas técnicas de imagen. La mayoría de estas lesiones, resultan ser benignas; entre las
más frecuentes se describen el hemangioma, el quiste simple y la hiperplasia nodular focal.
(Horta, y otros, 2015) Sin embargo, dentro las lesiones malignas el Carcinoma
Hepatocelular es la sexta neoplasia más frecuente a nivel mundial y la tercera causa de
muerte por cáncer, en México del año 2000 a 2006 se informó de un incremento del 14%
de la mortalidad a causa de este padecimiento (Illescas-Cárdenas , Rodríguez-Nava , &
Dena-Espinoza , 2017), así como la enfermedad metastásica que constituye la neoplasia
hepática de mayor hallazgo en los estudios de imagen (Granda, 2016). En México es más
común la tomografía debido a su amplia resolución y que permite la reconstrucción a
detalle de la zona lesionada, además de sus costos moderados y el acceso casi garantizado
en los hospitales de nuestro país.

2.2 Biomarcadores y el Cáncer.

La carcinogénesis humana es en realidad un proceso complejo de interacciones entre


agentes externos y procesos internos, este puede definirse como el efecto de los cambios
irreversibles de la fisiología celular, que dan como resultado la transformación celular y
proliferación descontrolada de las células. En la actualidad se sabe que la exposición a
factores ambientales es una fuerte evidencia y determina el 50% del riesgo del desarrollo
de cáncer, es por este motivo que la identificación de la relación de factores ambientales y
genéticos cancerígenos puede ser determinada a través del estudio de biomarcadores.
(Plant, 2008), (Kyrtopoulos, 2006).
Las concentraciones de carcinógenos o sus metabolitos capaces de interactuar con macro
moléculas celulares y pueden ser evaluados en tejidos o fluidos biológicos y representan el
riesgo potencial del desarrollo de la enfermedad, razón por la cual son considerados
biomarcadores cancerígenos, así como también los procesos biológicos como: metabolismo
de xenobióticos, reparación del ADN, proliferación celular, apoptosis o respuesta inmune.
(Plant, 2008), (Dhama K, 2019)
Michael A. Tainsky, da una presentación y análisis de las distintas sustancias biológicas y
bioquímicas que pueden ser utilizadas como biomarcador para detectar la presencia del
Cancer, su progresión e incluso su monitoreo durante los tratamientos, dichos
biomarcadores están presenten en los distintos tipos de fluidos del paciente e incluso en
sus tejidos (Dhama K, 2019)

2.3 Dimensión Fractal

En matemáticas, la dimensión de Hausdorff es una medida de rugosidad, o más


específicamente, dimensión fractal, que fue introducida por primera vez en 1918 por el
matemático Felix Hausdorff. Por ejemplo, la dimensión de Hausdorff de un solo punto es
cero, de un segmento de línea es 1, de un cuadrado es 2 y de un cubo es 3. Es decir, para
conjuntos de puntos que definen una forma suave o una forma que tiene un pequeño
número de esquinas (las formas de la geometría y la ciencia tradicionales) la dimensión de
Hausdorff es un número entero de acuerdo con el sentido habitual de dimensión, también
conocida como dimensión topológica. Sin embargo, también se han desarrollado fórmulas
que permiten el cálculo de la dimensión de otros objetos menos simples, donde,
únicamente en base a sus propiedades de escala y auto semejanza, se llega a la conclusión
de que los objetos particulares, incluidos los fractales, no tienen -Dimensiones de
Hausdorff enteras. Debido a los importantes avances técnicos realizados por Abram
Samoilovitch Besicovitch que permiten el cálculo de dimensiones para conjuntos muy
irregulares o "rugosos", esta dimensión también se conoce comúnmente como la
dimensión de Hausdorff-Besicovitch (Gneiting, Ševčíková, & Percival, 2016).
La dimensión fractal se ha tomado una importancia relevante para optar como
característica en los objetos, su importancia radica en la estrecha relación que tiene con la
complejidad de la superficie del objeto estudiado. Para esto el método más popular hoy en
día es el método de conteo de cajas (Box-counting). Este método se basa en el conteo del
número de cajas N(ε) de tamaño ε que son necesarias para cubrir la totalidad del objeto en
la imagen. Cuanto mayor sea el valor de ε, menor será el número de cajas necesarias para
cubrir el objeto. La dimensión fractal se obtiene calculando la pendiente de la línea de
mejor ajuste a partir de un gráfico de log(N(ε)) por log(1/ε). A pesar de su simplicidad,
este método tiene muchos inconvenientes, como la posición inicial del objeto en la imagen,
el rango de los tamaños de las cajas, el tipo de incremento utilizado en el tamaño de las
cajas, etc., que pueden cambiar el valor de la dimensión calculada. La Dimensión Fractal
también se puede calcular mediante el método de Bouligand-Minkowski. En este método,
cada punto que pertenece al contorno del objeto es cubierto con discos de radio ε,
formando tiras o bandas conocidas como salchichas de Minkowski, las cuales tienen un
( ε ) ∝ ε ( 2−D ), donde D es el valor de la Dimensión Fractal, por lo tanto, esta se puede obtener
calculando 2 – la pendiente de la línea de mejor ajuste a partir de un gráfico de log ( A ( ε ))
por log ( ε ) (Luppe, 2015)
Esta técnica se ha venido usando en diferentes estudios y distintos lugares del mundo
como en Bogotá Colombia, donde un grupo de investigadores desarrollaron una
metodología diagnóstica de alteraciones celulares preneoplásicas en citologías cervicales, a
partir de fotografías digitales de ocho células; cuatro normales (tres superficiales y una
intermedia), dos ASCUS y dos L-SIL diagnosticadas, según los parámetros convencionales.
Se calcularon las dimensiones fractales con el método de Box Counting, de tres objetos: el
núcleo, el citoplasma sin núcleo y totalidad, estimando la variabilidad y la Armonía
Matemática Intrínseca celular de las dimensiones fractales. Se diferenciaron células
normales de L-SIL, evidenciándose que las ASCUS pueden tener valores asociados a
normalidad o de L-SIL (Velásquez, 2011). En el año 2015 un equipo de físicos y biólogos ha
observado la emergencia de estas estructuras auto semejantes en la superficie de las
células «inmortales», aquellas que están a punto de transformarse en cancerosas.
analizaron la geometría de células cervicales humanas antes, durante y después de su
transición a la fase cancerosa. Con ayuda de un microscopio de fuerzas atómicas, los
investigadores consiguieron cartografiar la superficie de las células individuales con una
precisión de pocos nanómetros, aquí mostraron una emergente geometría fractal, en la
superficie de las células premalignas. Sin embargo, dicha geometría no se observó en las
células sanas ni, contrariamente a lo esperado, en las enfermas (M E Dokukin, 2015)
Anexos

El siguiente código es el que se ha desarrollado para este trabajo.

#Se carga el Drive


from google.colab import drive
drive.mount('/content/drive')

#from fastai.basics import *


#from fastai.vision.all import *
#from fastai.data.transforms import *
import nibabel as nib
import matplotlib.pyplot as plt
import numpy as np
import torch

path = '/content/drive/MyDrive/'
vol_name = "volume-0.nii"
mask_name = "segmentation-0.nii"

def read_nii(filepath):
'''
Reads .nii file and returns pixel array
'''
ct_scan = nib.load(filepath)
array = ct_scan.get_fdata()
array = np.rot90(np.array(array))
return(array)

def read_nii(filepath):
'''
Reads .nii file and returns pixel array
'''
ct_scan = nib.load(filepath)
array = ct_scan.get_fdata()
array = np.rot90(np.array(array))
return(array)

sample_ct = read_nii(path + vol_name)


sample_mask = read_nii(path + mask_name)
sample_ct.shape, sample_mask.shape

plt.imshow(sample_ct[..., 60])
plt.show()
plt.imshow(sample_mask[..., 60])
plt.show()

dicom_windows = {
"brain":(80,40),
"subdural":(54,100),
"stroke":(8,32),
"brain_bone":(200,600),
"brain_soft":(35,40),
"lungs":(150,-600),
"mediastinum":(350,50),
"abdomen_soft":(400,50),
"liver":(150,30),
"spine_soft":(250,50),
"spine_bone":(1800,400),
"custom": (20,60)
}

##@patch
def windowed(T, w, l):
px = T.clone().detach()
px_min = l - w//2
px_max = l + w//2
px[px<px_min] = px_min
px[px>px_max] = px_max
return (px-px_min) / (px_max-px_min)

idx = 60
plt.figure(figsize=(8, 6), dpi=100)
img = windowed(torch.tensor(sample_ct[..., idx].astype(np.float32)),
*dicom_windows["liver"])
plt.subplot(1,2,1)
plt.imshow(img, cmap=plt.cm.bone)

plt.subplot(1,2,2)
plt.imshow(img, cmap=plt.cm.bone)
plt.imshow(sample_mask[..., idx], alpha=0.6)
plt.show()

np.unique(sample_mask[..., idx])
from PIL import Image
def freqhist_bins(T, n_bins=100):
"A function to split the range of pixel values into groups, such
that each group has around the same number of pixels"
imsd = T.view(-1).sort()[0]
t = torch.cat([torch.tensor([0.001]),
torch.arange(n_bins).float()/n_bins+(1/2/n_bins),
torch.tensor([0.999])])
t = (len(imsd)*t).long()
return imsd[t].unique()

##@patch
def hist_scaled(T, brks=None):
"Scales a tensor using `freqhist_bins` to values between 0 and 1"
if brks is None: brks = freqhist_bins(T)
ys = np.linspace(0., 1., len(brks))
x = T.numpy().flatten()
x = np.interp(x, brks.numpy(), ys)
return torch.tensor(x).reshape(T.shape).clamp(0.,1.)

##@patch
def to_nchan(T, wins, bins=None):
res = [windowed(T, *win) for win in wins]
if not isinstance(bins,int) or bins!=0: res.append(hist_scaled(T,
bins).clamp(0,1))
dim = [0,1][T.dim()==3]
return torch.stack(res, dim=dim)

##@patch
def save_jpg(T, fn, wins, bins=None, quality=120):
T = (to_nchan(T, wins, bins)*255).byte()
im = Image.fromarray(T.permute(1,2,0).numpy(), mode=['RGB','CMYK']
[T.shape[0]==4])
im.save(fn, quality=quality)
return im

T = torch.tensor(sample_ct[..., idx].astype(np.float64))
wins = [dicom_windows["liver"], dicom_windows["custom"]]

img = save_jpg(T, path + "imagen.jpg", wins)

img_mask = img * sample_mask[..., 60:61]


plt.imshow(img_mask)

# A qui comienza el calculo de la dimension Fractal con el metodo de


# Box Counting

#Se cargan aqui las librerias


import scipy.misc
import numpy as np
import matplotlib.image as img
import matplotlib.pyplot as plt
from skimage import io
import pylab as pl
import cv2

#cargamos la imagen
# read an image
#imageMat = io.imread('drive/MyDrive/Colab Notebooks/Triángulo de
Sierpinski.png')
imageMat = img_mask
print("Image shape:", imageMat.shape)
plt.imshow(imageMat)
plt.show()

#con este comando sabemos que la imagen es un arreglo


type(imageMat)

#podemos ver la estructura del arreglo


imageMat.shape, imageMat.dtype

#si tenemos una imagen a color buscamos redimensionar el arreglo para


trabajarlo en 2d
#basicamente elimina la dimension donde estan los colores
if(imageMat.shape[2] == 3):

#Redimensionamos en arreglo de una matriz 3d a una 2d


#reshape it from 3D matrice to 2D matrice

imageMat_reshape = imageMat.reshape(imageMat.shape[0],-1)
print("Reshaping to 2D array:",
imageMat_reshape.shape)

# aqui solo buscamos que si tenemos una imagen en escala en grises


esta no se afecte
#if image is grayscale not action not aplicate that instruction
else:
# dejar tal cual esta #remain as it is
imageMat_reshape = imageMat

plt.imshow(imageMat_reshape)
plt.show()

#Informacion de la imagen tratada


imageMat_reshape.shape, imageMat_reshape.dtype

#aqui creamos la funcion para calcular la dimension fractal


def fractal_dimension(Z, threshold=0.9):

# declaramos que la dimension sea 2d


assert(len(Z.shape) == 2)

#definimos la funcion del conteo de cajas


def boxcount(Z, k):
#agregar malla y realiza una reducción (local) con sectores
especificados sobre un solo eje
S = np.add.reduceat(
np.add.reduceat(Z, np.arange(0, Z.shape[0], k), axis=0),
np.arange(0, Z.shape[1], k), axis=1)

# cuenta cajas no vacias (0) y cajas no llenas (k*k)


#
return len(np.where((S > 0) & (S < k*k))[0])

# Transformar Z en una matriz


Z = (Z < threshold)

#Dimension minima de la imagen


p = min(Z.shape)

# se usa la formula de Haussdorf (potencia de 2 menor o igual que


p)
n = 2**np.floor(np.log(p)/np.log(2))

# Aqui es donde se extrae el exponente


n = int(np.log(n)/np.log(2))
Ns=[]

# aqui es donde se crean las cajas de tamaños sucesivos (desde


2**n hasta 2**1), se inicia de mayor a menor
sizes = 2**np.arange(n, 1, -1)

# Recuento de cajas con tamaño decreciente


counts = []
for size in sizes:
counts.append(boxcount(Z, size))

# en esta parte es donde se ajusta la recta a los puntos formados


por los log(sizes) con log (counts)
coeffs = np.polyfit(np.log(sizes), np.log(counts), 1)
return -coeffs[0]

print("Minkowski–Bouligand dimension (computed): ", fractal_dimen-


sion(imageMat_reshape,threshold=0.2))

#cargamos la imagen
# read an image
imageMat1 = io.imread('drive/MyDrive/Colab Notebooks/Triángulo de
Sierpinski.png')
imageMat2 = io.imread('drive/MyDrive/Colab Notebooks/CurvadeKoch.png')
imageMat3 = io.imread('drive/MyDrive/Colab Notebooks/Pentágono de
Sierpinski.png')
print("Image shape:", imageMat.shape)

plt.imshow(imageMat1)

plt.show()

#si tenemos una imagen a color buscamos redimensionar el arreglo para


trabajarlo en 2d
#basicamente elimina la dimension donde estan los colores
if(imageMat1.shape[2] == 3):

#Redimensionamos en arreglo de una matriz 3d a una 2d


#reshape it from 3D matrice to 2D matrice

imageMat_reshape = imageMat.reshape(imageMat.shape[0],-1)
print("Reshaping to 2D array:",
imageMat_reshape.shape)

# aqui solo buscamos que si tenemos una imagen en escala en grises


esta no se afecte
#if image is grayscale not action not aplicate that instruction
else:
# dejar tal cual esta #remain as it is
imageMat_reshape = imageMat

print("Minkowski–Bouligand dimension (computed): ", fractal_dimen-


sion(imageMat_reshape,threshold=0.2))
#Esta linea siguiente es la dimension teorica, se busca aproximar con
el codigo esta dimension
print("Haussdorf dimension (theoretical): ", (np.log(3)/np.-
log(2))) #Triangulo de Sierpinski
#print("Haussdorf dimension (theoretical): ", (np.log(8)/np.-
log(3))) #Alfombra de Sierpinski
#print("Haussdorf dimension (theoretical): ", (np.log(4)/np.-
log(3))) # Curva de Koch
#print("Haussdorf dimension (theoretical): ", (np.log(2)/np.-
log(2**0.5))) # Dragón de Heighway
#print("Haussdorf dimension (theoretical): ", (np.log(5)/np.-
log(2/(3-5**0.5)))) # Pentágono de Sierpinski
#print("Haussdorf dimension (theoretical): ", (np.log(5)/np.-
log(3))) # Fractal de Vicsek
Referencias
Adriana Milena Machacado-Rojas, L. E.-P. (2021). Artificial intelligence techniques applied to the
analysis of diagnostic images. Eco Matemático, 100–111.
Battineni G, C. N. (2020). Comprehensive Machine-Learning Model Applied to Magnetic Resonance
Imaging (MRI) to Predict Alzheimer's Disease (AD) in Older Subjects. J Clin Med.
Carlos G.Berrocal, I. L. (2016). Characterisation of bending cracks in R/FRC using image analysis.
Cement and Concrete Research, 104-116.
Chen, K.-C. &.-R.-S.-C.-C.-H.-H.-Y.-K.-A.-M. (2020). Diagnosis of common pulmonary diseases in
children by X-ray images and deep learning. Scientific Reports.
Chuan Guo, G. P. (2017). On Calibration of Modern Neural Networks. International Conference on
Machine Learning, (págs. 1321-1330). Sydney NSW Australia: JMLR.org.
Dinggang Shen, G. W.-I. (2017). Deep Learning in Medical Image Analysis. Annual Review of
Biomedical Engineering, 221-248.
Dokukin ME, G. N. (2015). Emerging of fractal geometry on surface of human cervical epithelial
cells during progression towards cancer. New J Phys.
Fos Guarinos, B. (2016). Diseño de técnicas de inteligencia artificial aplicadas a imágenes médicas
de rayos X para la detección de estructuras anatómicas de los pulmones y sus alteraciones.
Valencia: RuiNet.
Francisco F.X. Vasconcelos, R. M. (2020). Artificial intelligence techniques empowered edge-cloud
architecture for brain CT image analysis. Engineering Applications of Artificial Intelligence,
Volume 91.
Goodfellow I, B. Y. (2016). Deep Learning. Cambridge: MIT Press.
Gopal S. Tandel, A. B. (2020). Multiclass magnetic resonance imaging brain tumor classification
using artificial intelligence paradigm,. Computers in Biology and Medicine, Volume 122.
Guo S, W. L. (2022). Multimodal MRI Image Decision Fusion-Based Network for Glioma
Classification. Frontiers in oncology, Vol 12.
Guo Y, X. J. (2021). Classification and Diagnosis of Residual Thyroid Tissue in SPECT Images Based
on Fine-Tuning Deep Convolutional Neural Network. . Frontiers in Oncology.
Hao J, X. J. (2021). Automatic Sequence-Based Network for Lung Diseases Detection in Chest CT.
frontiers in oncology.
Hu, M. &. (28 de jun de 2022). Reinforcement Learning in Medical Image Analysis: Concepts,
Applications, Challenges, and Future Directions. Obtenido de arXiv.org:
https://arxiv.org/abs/2206.14302
Huérfano, Y. V.-V.-R.-D. (2016). Imagenología médica: Fundamentos y alcance. Archivos
Venezolanos de Farmacología y Terapéutica, 71-76.
Hyun-Seok Yoo, Y.-S. K. (2016). Development of a crack recognition algorithm from non-routed
pavement images using artificial neural network and binary logistic regression. KSCE
Journal of Civil Engineering volume, 1151–1162.
Khadidos A, K. A. (2020). Analysis of COVID-19 Infections on a CT Image Using DeepSense Model.
Public Health, frontiersin.org.
Lars J. Grimm, M. A. (2020). Breast Cancer Radiogenomics: Current Status and Future Directions.
Academy Radiology, 39-46.
Lee, C. J. (2020). Classification of femur fracture in pelvic X-ray images using meta-learned deep
neural network. Sci Rep.
Lucas Glaucio da Silva, W. R. (2021). Fractal dimension analysis as an easy computational
approach to improve breast cancer histopathological diagnosis. Applied Microscopy
volume.
Marcelo E. Andía, C. A. (2019). A conceptual guide to use and understand Big Data in clinical
research. Revista Médica Clínica Las Condes, 83-94.
Marius E. Mayerhoefer, A. M. (2020). Introduction to Radiomics. THE JOURNAL OF NUCLEAR
MEDICINE, 488-495.
MI Campo, J. P. (2018). Emphysema quantification on simulated X-rays through deep learning
techniques. IEEE 15th International Symposium on Biomedical Imaging (págs. 273-276,).
Washington, DC: IEEE.
Muhammed Ali Pala, M. E. (2022). Fractal dimension-based viability analysis of cancer cell lines in
lens-free holographic microscopy via machine learning. The European Physical Journal
Special Topics, 1023–1034.
Muralikrishna Puttagunta, S. R. (2021). Medical image analysis based on deep learning approach.
Multimed Tools Appl, 24365-24398.
Nguyen DT, K. J. (2020). Ultrasound Image-Based Diagnosis of Malignant Thyroid Nodule Using
Artificial Intelligence. Sensors (Basel).
Pashayar P.Lookian, E. X. (2022). The Association of Fractal Dimension with Vascularity and
Clinical Outcomes in Glioblastoma. World Neurosurgery, e44-e51.
Patterson, D. (2018). 50 Years of computer architecture: From the mainframe CPU to the domain-
specific tpu and the open RISC-V instruction set. IEEE International Solid - State Circuits
Conference : ISSCC 2018.
Pieter Kelchtermans, W. B. (2014). Machine learning applications in proteomics research: how the
past can boost the future. Proteomics, 353-66.
Samantha C Wong, W. R. (2022). Use of convolutional neural networks in skin lesion analysis using
real world image and non-image data. Med. frontiersin.org.
Sarhan, A. (2020). rain Tumor Classification in Magnetic Resonance Images Using Deep Learning
and Wavelet Transform. Journal of Biomedical Science and Engineering, 102-112.
Sharma S, G. S. (2020). Performance Evaluation of the Deep Learning Based Convolutional Neural
Network Approach for the Recognition of Chest X-Ray Images. frontiersin in oncology, vol
12.
Soumya Ranjan Nayak, J. M. (2019). Analysing roughness of surface through fractal dimension: A
review. Image and Vision Computing, Vol 89.
Xinxin Feng, X. L. (2021). Multi-scale fractal residual network for image super-resolution. Applied
Intelligence .
Yu, X., Yuan, X., Dong, E., & Ríha, K. (2016). Target extraction of banded blurred infrared images by
immune dynamical algorithm with two-dimensional minimum distance immune field.
Infrared Physics and Technology, 94-99.
Zhang Z, H. K. (2021). Multiparametric MRI Radiomics for the Early Prediction of Response to
Chemoradiotherapy in Patients With Postoperative Residual Gliomas: An Initial Study.
Frontiers in Oncology.
Zhao Y-F, C. Z.-H.-Y. (2021). Diagnosis of Breast Cancer Using Radiomics Models Built Based on
Dynamic Contrast Enhanced MRI Combined With Mammography. Frontiers in Oncology.

También podría gustarte