Documentos de Académico
Documentos de Profesional
Documentos de Cultura
B. Preprocesamiento de dataset
Fig. 15. Histograma de una imagen luego de ser pasado a escala de grises
con valores de 0 a 1
Debido a que las imagenes del dataset solo estaban agrupado
en carpetas como normal y neumonı́a, se requerı́a realizar C. Creación del modelo
un preprocesamiento para etiquetar las imagenes. Por ello,
Para la creación de la arquitectura de la red neuronal con-
se elaboró un algoritmo en python para llevar a cabó la
volucional se tomó como referencia la elaborada por el autor
clasificación, que consiste en recorrer el dataset y etiquetar
[4], porque en su trabajo de investigación publicado en Scopus
con 0 las imagenes que se encuentran en la carpeta normal y
comparo su modelo CNN con otros como ResNet18, AlexNet,
con 1 las imagenes que se encuentra en la carpeta neumonı́a
DenseNet201, obtuviendo buenos resultados de acuerdo a
para almacenarlo en un N array. Posteriormente, se graficó la
las métricas para la predicción neumonı́a. A continuación se
cantidad de etiquetas destinadas para el entrenamiento, verif-
detallará cada fase de la arquitectura.
icando que coincida con la cantidad de imagenes destinadas
• Entrada de la red: Se ingresa una imagen previamente
para el entrenamiento, como se puede observar en la Figura
preprocesada de rayos x del torax de 150x150 px en
13.
escala de grises y con etiqueta de ’normal’ o ’neumonia’.
• Capa de convolución: Se usó 5 capas de convolución
con distintos filtros de 3x3, con la función de activación
RELU.
• Max Pooling: Se aplicó 5 max pooling después de cada
capa de convolución, utilizando un filtró de 2x2.
• Capa densa: Esta capa recibe 256 entradas que son las
caracterı́sticas extraidas en la ultima capa de convlución
y max pooling, previamente aplanadas por realizarse el
flatening.
• Capa densa de salida: Esta capa densa, consta de 2 neu-
ronas con la función de activación Softmax para obtener
Fig. 13. Distribución de etiqueta 0 y 1 de las imagenes de entrenamiento
la salida de valores donde se indique la probabilidad de
que la imagen es una con neumonı́a o sin neumonı́a, con
la finalidad de que el valor mayor sea la predicción de la
Luego de completar satisfactoriamente el etiquetado se llevó red neuronal convolucional.
a cabo el redimensionamiento de las imagenes, reduciendo su
tamaño a 150px de altura y 150px de ancho, como se puede
observar en la Figura 14. Cabe destacar, que esta medida se
realizó tomando como referencia el trabajo de investigación
del autor [4]. Asimismo, el color de estas imagenes se cambió
a escala de grises con valores de 0 a 1, en vez de 0 a 255,
como se puede observar en la Figura 15. con la finalidad de
facilitar la entrada a la red neuronal convolucional.
A. Matriz de confusión
R EFERENCES
[1] MINSA, Boletı́n epidemiológico del Perú, vol 21, 2020.
[2] A. Saraiva, D. Santos, N. Costa, J. Sousa, N. Fonseca , A. Valente and
Fig. 21. Accuracy del entrenamiento vs validación
S. Soares, “Models of learning to classify X-ray images for the detection
of pneumonia using neural networks“, BIOSTEC, 2019, pp.76-83.
C. Comparación de Loss [3] K. Heewon, H. Hyunsoo, C. Hyuna, S. Kiwon “Detección de neumonı́a
en un conjunto de votación ponderado de modelos de CNN”, Congreso
En la Figura 22 se muestran los valores obtenidos del loss internacional de Inteligencia Artificial Big Data, 2019, pp. 306-310.
durante la el entrenamiento, representado por la linea roja; y [4] K. Raheja and U.Goel “Detección de la infección pulmonar por neu-
validación, representado por la linea verde. monı́a a partir de imágenes de rayos X con aprendizaje profundo”
in International Conference on Mecatronics and Artificial Intelligence
(ICMAI),India,Gurgaon,2021, pp. 1-8.
[5] M. Talo, “Pneumonia Detection from Radiography Images using Con-
volutional Neural Networks,“ 2019 27th Signal Processing and Com-
munications Applications Conference (SIU), 2019, pp. 1-4.
[6] Y. LeCun, Y. Bengio, G. Hinton, Deep learning. Nature 521, 2019
436–444. https://doi.org/10.1038/nature14539
[7] C. Harris, K. Millman, S. Van der Walt, Array programming with
NumPy, Nature 585, 2020, pp. 357–362. https://doi.org/10.1038/s41586-
020-2649-2
[8] H. Coy, K. Hsieh, K. Wu, Deep learning and radiomics: the utility
of Google TensorFlow™ Inception in classifying clear cell renal cell
carcinoma and oncocytoma on multiphasic CT, Abdom Radiol 44, 2019.
https://doi.org/10.1007/s00261-019-01929-0
VI. CONCLUSIONES
• La creación del modelo de una Red Neuronal Convoolu-
cional mostrado en el presente trabajo utilizando 5 capas
de convolución y pooling, tomando como referencia la
arquitectura encontrada en una investigación de nuestro
estado del arte permitió la clasificación de imagenes de
rayos X del tórax indicando si el paciente presente o no
neumonı́a con un 89% de precisión.
• Gráficar la mátriz de confusión permitió que se pueda
comprobar de forma manual el accuracy respecto a los
resultados obtenidos usando Python.