Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tesis de Maestría
Magister
Bogotá, Colombia
2022
Universidad Central
Esta es la
contraportada
Tesis de Maestría
Director (a)
Bogotá, Colombia
2021
3
Aprobación
________________________________ ________________________________
Firma Firma
[Nombres Completos] [Nombres Completos]
[Títulos] [Títulos]
Jurados de la Tesis
Jurado Jurado
________________________________ ________________________________
Firma Firma
[Nombres Completos] [Nombres Completos]
[Títulos] [Títulos]
Jurado
________________________________
Firma
[Nombres Completos]
[Títulos]
[Fecha de sustentación]
4
Agradecimientos
Al dar por finalizado este trabajo de grado de maestría, queremos expresar los más
sinceros agradecimientos a los docentes de la maestría en Analítica de Datos y
directivas, porque nos brindaron su apoyo y conocimientos en el trascurso del
postgrado.
Esta tesis se la dedico a Dios, a mis queridos padres, a mi familia, en especial a mi madre FLOR
OYOLA, mi hermana ANDREA CAROLINA LÓPEZ y mi esposa SANDRA LORENA MENESES, que con
su amor, apoyo y comprensión incondicional estuvieron siempre a lo largo de esta etapa; a ellas que
siempre tuvieron una palabra de aliento en los momentos difíciles, para lograr culminar uno de mis
objetivos.
JOHN EDUARDO LÓPEZ HILARIÓN.
Son muchas las personas especiales a las que nos gustaría agradecer su amistad, apoyo, ánimo y
compañía en las diferentes etapas de nuestras vidas. Algunas están aquí con nosotros y otras en nuestros
recuerdos y en nuestro corazón. Sin importar en donde estén o si alguna vez llegan a leer estas
dedicatorias queremos darle las gracias por formar parte de nosotros, por todo lo que nos han brindado
y por todas sus bendiciones.
6
contenido
1. Resumen..............................................................................................................................................8
2. Abstract................................................................................................................................................9
3. Índice de tablas..................................................................................................................................11
4. Índice de figuras.................................................................................................................................12
5. Notación.............................................................................................................................................13
6. Introducción.......................................................................................................................................14
7. Planteamiento del problema y justificación.......................................................................................16
8. Conjunto de datos..............................................................................................................................17
8.1. Módulo de análisis de saturación...............................................................................................19
8.2. Módulo de ensamble de las carpetas de Entrenamiento, Testeo y Validación..........................20
9. Objetivos............................................................................................................................................21
9.1. Objetivo general.........................................................................................................................21
9.2. Objetivos específicos..................................................................................................................21
10. Antecedentes.................................................................................................................................21
11. Glosario y definiciones...................................................................................................................25
11.1. Deep Learning........................................................................................................................25
11.2. Red neuronal computacional.................................................................................................26
11.3. Las redes neuronales convolucionales...................................................................................26
11.4. ReLU.......................................................................................................................................28
11.5. Arquitectura básica de redes neuronales convolucionales....................................................28
11.5.1. Capa convolucional............................................................................................................29
11.5.2. Pooling...............................................................................................................................29
11.5.3. Max-Pooling.......................................................................................................................30
11.5.4. Average-Pooling.................................................................................................................30
11.5.5. Capa fully connected:.........................................................................................................31
11.5.6. Visualización de redes neuronales convolucionales:..........................................................32
12. Prevención del sobreajuste............................................................................................................33
12.1. Aumento de datos..................................................................................................................33
7
1. Resumen
La presencia del cáncer de piel ha crecido en las últimas décadas a nivel mundial. La
información del tema en Colombia es muy escasa, sin embargo, las instituciones de
cáncer ofrecen información sobre la frecuencia y la distribución en instituciones de
referencia. Por ejemplo, los diagnósticos nuevos de cáncer de piel, con relación al
periodo de 1996-2010 en el Instituto Nacional de Cancerología, centro de referencia en
cáncer a nivel nacional, evidencia un crecimiento progresivo de la frecuencia de casos
nuevos, acompañado de una mayor frecuencia en personas mayores a 75 años. Los
tipos más comunes son: el carcinoma basocelular (52,7 %), el escamocelular (22,6 %) y
el melanoma (16,1 %). Adicionalmente, la presencia estimada del melanoma maligno
en Colombia corresponde a 4,6 por 100.000 en mujeres y 4,4 por 100.000 en hombres.
Es por ello, la importancia del cáncer de piel como prioridad en la salud pública.
2. Abstract
The presence of skin cancer has grown in recent decades worldwide. Information on the
subject in Colombia is very scarce, however, cancer institutions offer information on the
frequency and distribution in reference institutions. For example, new diagnoses of skin
cancer, in relation to the period 1996-2010 at the National Cancer Institute, a reference
center for cancer at the national level, shows a progressive growth in the frequency of
new cases, accompanied by a greater common in people older than 75 years. The most
common types are: basal cell carcinoma (52.7%), squamous cell carcinoma (22.6%)
and melanoma (16.1%). Additionally, the estimated presence of malignant melanoma in
Colombia corresponds to 4.6 per 100,000 in women and 4.4 per 100,000 in men. That is
why the importance of skin cancer as a priority in public health.
Melanoma is a very dangerous type of skin cancer. The non-diagnosis or the incorrect
diagnosis of a melanoma (false negative) can affect a patient's quality of life by not
seeking the required care in time, causing the cancer to spread. On the other hand, a
false positive leads to the affectation of the patient from the psychological point of view,
causing necessary surgical procedures. The standard and most certified procedure for
the identification of a malignant melanoma consists of a histological study collecting a
tissue sample through a biopsy, however, the implementation of machine learning
techniques as diagnostic support would be of great importance, to sift through a level of
risk this type of pathologies, and with this direct more effectively patients in the health
system.
11
12
3. Índice de tablas
13
4. Índice de figuras
5. Notación
14
15
6. Introducción
Las lesiones pigmentadas de la piel son manchas con o sin relieve, que pueden ser
neoplasias melanocíticas o de origen no melanocítico. A su vez, estas lesiones pueden
ser neoplasias benignas o malignas.
El melanoma cutáneo representa un tipo de cáncer de gran letalidad entre los tumores
de piel. Este tipo de patología ha tenido un ligero incremento en los últimos años lo
cual ha ocasionado que este tipo de patología se convierta en una prioridad para la
salud pública a nivel nacional. Según la Organización Mundial de la Salud (OMS)
Colombia ocupa el cuarto puesto como país con mayor incidencia.
Imagen 1. Dermatoscopio portátil adaptable a celular, comercializado en la Página de Amazon cotización realizada
el 7 de octubre de 2021.
Una posible alternativa tecnológica para mejorar esta problemática consiste en aplicar
una red neuronal convolucional que permita extraer progresivamente representaciones
de nivel cada vez más alto del contenido de cualquier imagen, para este caso,
imágenes de melanomas. Adicionalmente, una CNN toma solo los datos de píxeles sin
procesar de la imagen como entrada y "aprende" cómo extraer estas características y,
en última instancia, inferir qué objeto constituyen.
La presencia del cáncer de piel ha crecido en las últimas décadas a nivel mundial. La
información del tema en Colombia es muy escasa, sin embargo, las instituciones de
cáncer ofrecen información sobre la frecuencia y la distribución en instituciones de
referencia. Por ejemplo, los diagnósticos nuevos de cáncer de piel, con relación al periodo
de 1996-2010 en el Instituto Nacional de Cancerología, centro de referencia en cáncer a
nivel nacional, evidencia un crecimiento progresivo de la frecuencia de casos nuevos,
acompañado de una mayor frecuencia en personas mayores a 75 años. Los tipos más
comunes son: el carcinoma basocelular (52,7 %), el escamocelular (22,6 %) y el
melanoma (16,1 %). Adicionalmente, la presencia estimada del melanoma maligno en
Colombia corresponde a 4,6 por 100.000 en mujeres y 4,4 por 100.000 en hombres. Es
por ello, la importancia del cáncer de piel como prioridad en la salud pública.
A pesar de que hoy en día hay varias herramientas opensource para la detección
temprana de cáncer de piel (melanoma), aún están lejos de ser implementadas por los
profesionales de la salud que están en pie de lucha ayudando a la población vulnerable.
Por esto, con este trabajo se realizó un acercamiento a otras alternativas de diagnóstico
para el cáncer de piel.
18
8. Conjunto de datos
Para abordar nuestro problema, usamos el conjunto de datos disponible a través del
desafío Big– bd – melanome de la plataforma Kaggle
(https://www.kaggle.com/dorianea/bigbdmelanome). El conjunto de datos contiene
exactamente 73622 imágenes RGB (red, green, blue) que tiene valores de 0 a 255, de
las cuales teníamos para entrenamiento un total de 51532 imágenes, 11051 imágenes
de prueba y 11039 imágenes de validación. Todas las imágenes tenían un formato jpg,
tamaño 600 x 450 píxeles y un peso promedio por imagen 300 kB. Las imágenes se
redimensionan a 150 x 150 píxeles antes del entrenamiento, con la finalidad de que
fuera más fácil de procesar por nuestra red neuronal convolucional.
2. DF dermatofibroma - benigno
Cantidad de 1 2 3 4 5 6 7 Total
imágenes
El histograma es un gráfico que muestra la frecuencia con que aparecen los distintos
niveles de intensidad de una imagen a escala de grises. Los niveles definidos para
cada píxel se codifican con 8 bits, dando lugar a un rango que va de 0 a 255, definiendo
el 0 como el color negro y el 255 como color blanco.
Una vez se obtuvo el histograma de la imagen se calculó el área bajo la curva para la
parte central del histograma que va de la intensidad 21 a 220 y la suma de las áreas de
los extremos, que va de 0 a 21 y de 221 a 256. La relación entre estas dos áreas,
tomando como numerador el área central y denominador el área de los extremos dio
como resultado un factor que permitió discriminar las imágenes con buena exposición.
Con esto, las imágenes con un factor inferior a 1, fueron discriminadas.
Debido a que las CNN requieren una elevada capacidad de cómputo, fue necesario
realizar los experimentos con muestras del set total de las imágenes disponibles.
Mediante el módulo fue posible crear las carpetas con la estructura que se muestra en
el diagrama 1.
Tabla 3.
9. Objetivos
9.1. Objetivo general
Comparar el desempeño de una Red Neuronal Convolucional entrenada con un
conjunto de datos públicos, versus una Red Neuronal Convolucional pre-entrenada
aplicando transfer learning para la clasificación de imágenes de melanomas.
10. Antecedentes
El melanoma es un tipo de cáncer de piel muy peligroso. El no diagnóstico o el incorrecto
diagnóstico de un melanoma (falso negativo) puede afectar la calidad de vida de un
paciente al no buscar a tiempo la atención requerida, causando que el cáncer se
disemine. Por otra parte, un falso positivo, conlleva a la afectación del paciente desde el
punto de vista psicológico, pudiendo causar procedimientos quirúrgicos innecesarios. El
procedimiento estándar y más acertado para la identificación de un melanoma maligno
consiste en un estudio histológico recolectando una muestra de tejido mediante una
biopsia, sin embargo, resultaría de gran importancia la implementación de técnicas de
23
machine learning como apoyo diagnóstico, para tamizar mediante un nivel de riesgo este
tipo de patologías, y con esto direccionar de forma más efectiva a los pacientes en el
sistema de salud. El crecimiento de la literatura médica con relación a las técnicas de
machine learning, ha demostrado ser útil para el análisis de datos biomédico a gran
escala, por ejemplo: la biología de redes (Zhou et al. 2014), la priorización de genes
(Aertset al. 2006), entre otros.
Uno de los modelos computacionales usados para el apoyo del diagnóstico en medicina
en el análisis de imágenes, son las redes neuronales artificiales, las cuales son modelos
matemáticos que se entrenan para aprender relaciones no lineales entre un conjunto de
datos de entrada y un conjunto de datos de salida, estos modelos tienen una gran
habilidad como clasificador de patrones, característica importante para la aplicación
médica. La medicina al disponer de un modelo bien entrenado, permite al
Según Delgado (1998) asegura “las redes neuronales tienen una alta capacidad de
clasificador, demostrado teóricamente y prácticamente con múltiples aplicaciones”
(p.221), muchas de esas aplicaciones sobre el campo médico; resonancia magnética,
medicina nuclear y radiología, detección de enfermedades de la piel, enfermedades
coronarias, deficiencias en el sistema inmune, enfermedades oculares, entre otros.
Transfer learning tiene como objetivo realizar una tarea en un conjunto de datos 'objetivo'
utilizando el conocimiento aprendido de un conjunto de datos 'fuente' ( Li, 2012 ; Pan y
Yang, 2010 ; Weiss et al. , 2016 ),
24
Las aplicaciones de este tipo de redes neuronales está enfocada al apoyo diagnóstico de
ciertos tipos de cáncer de piel, actualmente están disponibles al público en general dos
tipos de apps, la primera categoriza la fotografía de una lesión cutánea o lunar en una
escala de riesgo, que aconseja a la persona si debería o no consultar a un especialista y
la segunda, además de hacer una clasificación previa de la lesión cutánea, la envía a
revisión a un equipo de expertos en dermatología para obtener una clasificación en riesgo
más acertada.
imágenes, por lo cual era posible que no se realizara una buena segmentación
disminuyendo la clasificación del melanoma. En el 2016 se rediseño la metodología en el
campo de las técnicas clasificación de lesiones cutáneas, los enfoques presentados a el
International Symposium on Biomedical Imaging (ISBI) resalta esta transición, en el cual
no se utilizaron técnicas de machine learning como se venía realizando , si no que se
utilizaron metodologías de deep learning con Redes Neuronales Convolucionales (RNC o
CNN).
área bajo la curva, y en el conjunto de datos ISIC Archive se obtuvo un resultado del 93%
de precisión y un 99% bajo la curva. Con esto se puede visualizar un papel prometedor
para el diagnóstico práctico, efectivo y rápido, incluso en tiempo real para ayudar a los
médicos en la detección de estas enfermedades cutáneas.
Las redes neuronales del deep learning como su nombre lo indica están basadas en
sistemas nerviosos biológicos con un comportamiento muy similar a las redes neuronales
humanas, en donde la información es procesada de forma muy similar compuesto por
distintos nodos interconectados entre sí, en donde toda la información de los datos es
recibida como señales (inputs), y es enviada la información a su vez a otras neuronas
(nodos) los cuales procesan toda la información y generan una salida de esta información
con las funciones y cálculos realizados durante su procesamiento (outputs). Gracias a los
algoritmos de aprendizaje profundo se puede llevar a cabo el aprendizaje de patrones
ocultos dentro de los datos, para realizar predicciones.
27
Función de convolución;
∞
(f∗g)(t)¿=∫ f ( η ) g (t−η)dη
−∞
Una convolución extrae mosaicos del mapa de características de entrada y les aplica
filtros para calcular nuevas características, produciendo un mapa de características de
salida o una característica convolucionada (que puede tener un tamaño y una
profundidad diferentes que el mapa de características de entrada). Las circunvoluciones
se definen mediante dos parámetros:
Imagen 5. Una convolución de 3x3 de profundidad 1 realizada sobre un mapa de características de entrada de 5x5, también de
profundidad 1.
Para cada par de filtro-mosaico, la CNN realiza una multiplicación por elementos de la
matriz de filtro y la matriz de mosaico, y luego suma todos los elementos de la matriz
resultante para obtener un valor único. Luego, cada uno de estos valores resultantes
para cada par de mosaicos de filtro se genera en la matriz de características
convolucionadas (Imágenes 5 y 6).
Imagen 6. (izquierda) mapa de características de entrada de 5x5 (profundidad 1). Imagen 7. (Derecha) una convolución de 3x3
(profundidad 1).
29
Imagen 8. (Izquierda) la convolución de 3x3 se realiza en el mapa de características de entrada de 5x5. Imagen 9. (Derecha)
característica convolucionada resultante.
Durante el entrenamiento, la CNN "aprende" los valores óptimos para las matrices de
filtro que le permiten extraer características significativas (texturas, bordes, formas) del
mapa de características de entrada. A medida que aumenta la cantidad de filtros
(profundidad del mapa de características de salida) aplicados a la entrada, también
aumenta la cantidad de características que la CNN puede extraer. Sin embargo, la
contrapartida es que los filtros componen la mayoría de los recursos gastados por la
CNN, por lo que el tiempo de capacitación también aumenta a medida que se agregan
más filtros. Además, cada filtro agregado a la red proporciona menos valor incremental
que el anterior, por lo que los ingenieros pretenden construir redes que utilicen la
cantidad mínima de filtros necesarios para extraer las características necesarias para
una clasificación precisa de las imágenes.
11.4. ReLU
Después de cada operación de convolución, la CNN aplica una transformación de
Unidad lineal rectificada (ReLU) a la característica convolucionada, para introducir la no
linealidad en el modelo. La función ReLU, F ( x )=max (0 , x), devuelve x para todos los
valores de x >0y devuelve 0 para todos los valores de x ≤ 0 .
Imagen 9. Operación ReLu. Nota: U. Walkarn.2016. Una explicación intuitiva de las redes neuronales convolucionales
sofmax
Esta arquitectura la componen las capas convolucionales, las capas de pooling y las
capas conectadas,
30
11.5.2. Pooling
Posterior a la convolución, se hace la disminución del volumen de datos realizando una
submuestra de cada resultado generado en las capas convolucionales haciendo
31
11.5.3. Max-Pooling.
Dada una matriz Aaxa podemos definir el proceso de Max-Pooling con una amplitud k y
un stride p como la matriz P(i, j) tal que:
Si fueran necesarias más filas o columnas para el desarrollo del algoritmo se pueden
incluir más filas y columnas mediante el método de zero-padding. El algoritmo de Max-
Pooling usualmente utilizado es aquel con una amplitud y stride 2.
11.5.4. Average-Pooling
1
P (i , j)= ∑ A [ ( i−1 ) p+ m, ( j−1 ) p+n]
k 2 n ,m=1 , …, k
32
estas son todas las capas de la red totalmente conectadas aplicando una capa
convolucional y una capa de pooling, realizando esto repetitivamente hasta obtener un
conjunto de matrices, es necesario contar con una capa de flattering la cual permite
ajustar toda la información en un vector y una última capa la cual es la encargada de
realizar la clasificación, que determinará a qué clase depende la imagen de entrada
Imagen 13. Funciones aprendidas de una red convolucional. Nota: U. Walkarn.2016. Una explicación intuitiva de las redes
neuronales convolucionales
Imagen 14. Visualización de una ConvNet entrenada en dígitos escritos a mano. Nota: U. Walkarn.2016. Una explicación intuitiva
de las redes neuronales convolucionales.
34
Imagen 13. (Izquierda) imagen original del perro del conjunto de entrenamiento. (Derecha) nueve imágenes nuevas generadas a
partir de la imagen original mediante transformaciones aleatorias.
35
Imagen 15. VGG 16- Convolutional Network for Classification and Detection» [En línea] Available:
https://neurohive.io/en/popularnetworks/vgg16/?fbclid=IwAR1_8qTXKK2Jo4_WpXdoGnbK46g2NpiUorJeFUf5BxezUVt3AhfF4F-
FTuY/.
Imagen 16. VGG 16- Convolutional Network for Classification and Detection» [En línea] Available:
https://neurohive.io/en/popularnetworks/vgg16/?fbclid=IwAR1_8qTXKK2Jo4_WpXdoGnbK46g2NpiUorJeFUf5BxezUVt3AhfF4F-
FTuY/.
38
El ajuste fino solo debe intentarse después de haber entrenado el clasificador de nivel
superior con el modelo preentrenado establecido en no entrenable. Si agrega un
clasificador inicializado aleatoriamente encima de un modelo preentrenado e intenta
entrenar todas las capas juntas, la magnitud de las actualizaciones de gradiente será
demasiado grande (debido a los pesos aleatorios del clasificador) y su modelo
preentrenado simplemente olvidará todo lo aprendido. Además, ajustamos con
precisión solo las capas superiores del modelo preentrenado en lugar de todas las
capas del modelo preentrenado porque, en una convnet, cuanto más alta es una capa,
más especializada es. Las primeras capas en una convnet aprenden características
muy simples y genéricas, que se generalizan a casi todos los tipos de imágenes. Pero a
medida que avanza, las funciones son cada vez más específicas para el conjunto de
datos en el que se entrena el modelo. El objetivo del ajuste fino es adaptar estas
características especializadas para que funcionen con el nuevo conjunto de datos. Todo
lo que tenemos que hacer para implementar el ajuste fino es configurar las capas
superiores para que se puedan entrenar, volver a compilar el modelo (necesario para
que estos cambios surtan efecto) y reanudar el entrenamiento.
para alcanzar nuestro objetivo, así mismo, las distintas tecnologías y herramientas
utilizadas para el desarrollo del proyecto.
15. METODOLOGIA
1. Se realizó la extracción del total de las imágenes del conjunto de datos del
repositorio de la plataforma Kaggle (https://www.kaggle.com/dorianea/bigbdmelanome),
el cual contiene un total de 73622 imágenes RGB (red, green, blue).
Para las redes neuronales convolucionales, se usó las imágenes procesadas como
anteriormente se mencionó. Implementamos y comparamos el rendimiento de dos
CNN: una construida y entrenada desde cero, utilizando nuestra propia arquitectura y
otros modelos bien conocidos preentrenados con arquitecturas predefinidas, a las
cuales se les aplico la técnica de transferencia de conocimiento. La descripción de cada
uno de ellos, se describe a continuación:
CNN personalizada.
Nuestro mapa de características de entrada es de (150 x150 x 3): 150 x 150 para los
píxeles de la imagen y 3 para los tres canales de color: R, G y B. La primera
45
Para realizar una validación cruzada keras, utilizaremos los contenedores para la API
de Scikit-Learn. Proporcionan una manera de usar modelos Sequential Keras (solo de
entrada única) como parte de su flujo de trabajo de Scikit-Learn.
Por otro lado, se implementó la técnica de ajuste fino, ajustando algunas de las últimas
capas (block5_conv1, block5_conv2 y block5_conv3) de la arquitectura existente
VGG16 previamente entrenada en el conjunto de datos de ImageNet. Para la tarea de
clasificación detallada, realizamos un aumento de datos para abordar el problema de la
escasez de datos y lograr la generalización.
La arquitectura es la siguiente: capa de entrada de (150 x 150 x 3): 150 x 150 para los
píxeles de la imagen y 3 para los tres canales de color: R, G y B, 16 capas
47
MobileNet se centra en una arquitectura que optimiza la latencia, la red está constituida
principalmente por convoluciones separables profundas, que es un tipo de
convoluciones factorizadas, realizando un proceso de descomposición que puede
reducir en gran medida la cantidad de cálculo y el tamaño del modelo, se puede utilizar
para el reconocimiento de patrones de animales, geolocalización, detección de objetos,
atributos faciales entre otras categorías.
La arquitectura de MobilNet es la siguiente:
1. Capa de entrada de (150 x 150 x 3): 150 x 150 para los píxeles de la imagen y 3
para los tres canales de color: R, G y B.
2. Una capa convolucional sencilla.
3. Trece capas convolucionales Depthwise convolution (convolucional en
profundidad), este tipo de capa es un tipo de convolución en la que cada canal
de entrada se convoluciona con un kernel diferente.
4. Una capa convolucional con Batch Normalization.
5. Trece capas convolucional Depthwise convolution con Batch Normalization.
6. Trece capas convolucional Depthwise convolution con funcion de activación
RELU.
7. Trece capas convolucionales Pointwise convolution el cual hace una convolución
en puntos que mezcla los canales de salidas resultantes de el Depthwise
convolution.
8. Trece capas convolucionales Pointwise con Batch Normalization.
9. Trece capas convolucionales Pointwise con función de activación RELU.
10. Cuatro capas convolucionales padding.
11. Presenta un total de 3,228,864 parámetros entrenables.
Arquitectura InceptionV3:
51
16. Localización
● 1 terabyte de almacenamiento.
● 8 vCPUs de procesamiento.
● 16 Gigas de Ram.
53
Dado que existen distintas arquitecturas de redes neuronales , para este proyecto el
cual busca clasificar melanomas en la piel, se optó por utilizar una arquitectura de red
neuronal convolucional porque es un algoritmo que está diseñado para trabajar con el
procesamiento de imágenes.
54
17. Resultados
● VGG16
● VGG19
● MobileNet
● InceptionV3
56
VGG16:
Los resultados obtenidos realizando transfer learning con la red VGG16 fueron :
57
VGG19:
58
Es una variante de la red neuronal VGG19 la cual contiene más capas de cálculo (19
capas profundas )siendo así más pesada para almacenar en memoria y requiere un
poco más de requerimiento de computo.
Arquitectura VGG19:
● Capa de entrada de 150 x 150 x 3: 150 x 150 para los píxeles de la imagen y 3
para los tres canales de color: R, G y B.
● 16 capas convolucionales.
● 5 capas max pooling.
● Total de 20,024,384 de parametros entrenables
59
Como se puede observar en la gráfica anterior se obtuvo una precisión del 98.50 % en
la clasificación en los datos de entrenamiento y del 88.70% en los datos de validación.
MobileNet:
Arquitectura MobilNet:
● Capa de entrada de 150 x 150 x 3: 150 x 150 para los píxeles de la imagen y 3
para los tres canales de color: R, G y B.
● 1 capa convolucional sencilla.
● 13 capas convolucionales Depthwise convolution (convolucional en
profundidad), este tipo de capa es un tipo de convolución en la que cada canal
de entrada se convoluciona con un kernel diferente.
● 1 capa convolucional con Batch Normalization
● 13 capa convolucional Depthwise convolution con Batch Normalization
● 13 capa convolucional Depthwise convolution con funcion de activacion RELU
● 13 capas convolucionales Pointwise convolution el cual hace una convolución en
puntos que mezcla los canales de salidas resultantes de el Depthwise
convolution.
● 13 capas convolucionales Pointwise con Batch Normalization
● 13 capas convolucionales Pointwise con funcion de activacion RELU
● 4 capas convolucionales padding
● Total de 3,228,864 de parametros entrenables
61
62
63
Como se puede observar en la gráfica anterior se obtuvo una precisión del 100 % en la
clasificación en los datos de entrenamiento y del 87.90% en los datos de validación.
InceptionV3:
Arquitectura InceptionV3:
● Uso del optimizador RMSprop.
● Normalización por lotes en la capa totalmente conectada del clasificador auxiliar.
● Uso de convolución factorizada 7 × 7
● Regularización de suavizado de etiquetas: es un método para regularizar el
clasificador al estimar el efecto de la caída de la etiqueta durante el
64
Tomado de https://www.geeksforgeeks.org/inception-v2-and-v3-inception-network-
versions/
65
Como se puede observar en la gráfica anterior se obtuvo una precisión del 96.05 % en
la clasificación en los datos de entrenamiento y del 84% en los datos de validación.
aumentar el número de épocas se podría tener una mayor precisión dado que a
medida que se recorría cada época la métrica mejoraba.
● Adicionalmente resaltamos que los resultados obtenidos y presentados
corresponden a varias purbas que realizo el equipo de trabajo, sobre el conjunto
de datos de entrenamiento con el objetivo de buscar el mejor modelo de
clasificación binaria, manteniéndose siempre la alta calidad de las estadísticas
obtenidas.
● Uno de los desafíos fue no contar con las herramientas óptimas para el
procesamiento de las distintas arquitecturas implementadas, dado que no se
contaba con un equipo de cómputo de alto desempeño para poder generar
arquitecturas más robustas y realizar otro tipo de validaciones para los hiper
parámetros , como lo es la validación cruzada
Observaciones generales
Hace falta toda la parte de búsqueda de hiper parámetros en todas las redes
La escritura debe revisarse: distintos tiempos verbales y los párrafos no son
consistentes unos con otros.
La sección de metodología esta desordenada.
Como falta hacer la búsqueda de hiper parámetros los resultados mostrados no tienen
ninguna validez.
En la metodología deben explicarse detalladamente todos los detalles de los
procedimientos realizados.
El resumen parece mas una introducción.
Todas las imágenes deben estar referenciadas y las formulas deben estar escritas y no
ser imágenes.
68
En este trabajo utilizamos varias redes neuronales convolucionales para clasificar imágenes de
Debido a los retos que se tuvieron que afrontar, se tuvo que emplear objetividad para reducir el
modelos con el uso de la técnica de transferencia de conocimiento y se observó que los datos
esto ocurre en el modelo VGG19 en comparación con los demás modelos . Presentamos un
modelo que logra una precisión de más del 98% en nuestro conjunto de datos de entrenamiento
seguir ajustando nuestro modelo durante más épocas y probablemente podría llegar a mejorar.
Recomendaciones:
Este trabajo de grado no tendrá una aplicación directa en el campo de la medicina, sin embargo
se puede utilizar como base para la construcción de modelos más robustos de clasificación que
herramientas de cómputo de alto desempeño, que permitan llegar a generar modelos mucho
[2]
03/2019.
[3]
[4]
[5]
Paradigma, RaMa. Autores: Raquel Flórez López, José Miguel Fernández Fernández.
[2] Flavia Carolina, Álvaro Acosta y Juan Castillo. Cáncer de piel en Colombia: cifras del
[3] Chuchu N, Takwoingi Y, Smartphone applications for triaging adults with skin lesions
that are suspicious for melanoma. Cochrane Database of Systematic Reviews, 2018.
[4] https://www.kaggle.com/dorianea/bigbdmelanome.
Semestre I- 2021
[6] N. N. Sultana and N. B. Puhan, ‘‘Recent deep learning methods for melanoma detection:
S. Ahmed, ‘‘Computer- aided diagnosis of skin diseases using deep neural networks,’’ ,
Anexos