Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Retinopatía Diabética.
por
en el
Tonantzintla, Puebla
Supervisada por:
©INAOE 2014
Derechos Reservados
El autor otorga al INAOE el permiso de reproducir y distribuir
copias de esta tesis en su totalidad o en partes.
I
Agradecimientos
de mi vida. Por estar siempre a mi lado pidiéndome que no desmaye porque Él está para ayu-
A mis padres, Amadeo Hernández y Socorro Capistrán por alentarme a siempre seguir
adelante guiándome siempre por los caminos de Dios. Gracias por estar siempre ahí incondicio-
nalmente.
A todos mis familiares que han estado siempre ahí apoyándome en todo y dándome áni-
Al Dr. Jorge Martinez Carballido por la valiosa ayuda y apoyo, que me ha brindado du-
Al Instituto Nacional de Astrofísica Óptica y Electrónica (INAOE) por darme los recur-
II
Toda la honra y la gloria
sean para Dios.
III
Abstract
Diabetes increases the risk of developing any deterioration in the blood vessels that
supply the retina, an ailment known as Diabetic Retinopathy (DR). Since this disease is
asymptomatic, it can only be diagnosed by an ophthalmologist. However, the growth of
the number of ophthalmologists is lower than the growth of the population with diabetes
so that preventive and early diagnosis is difficult due to the lack of opportunity in terms
of time and cost. Preliminary, affordable and accessible ophthalmological diagnosis will
give the opportunity to perform routine preventive examinations, indicating the need to
consult an ophthalmologist during a stage of not proliferation. During this stage there is
a lesion on the retina known as microaneurysm (MA), which is one of the first clinically
observable lesions that indicate the disease. In recent years different image processing
algorithms, which allow the detection of the DR, have been developed; however, the is-
sue is still open since acceptable levels of sensitivity and specificity have not yet been
reached, preventing its use as a pre-diagnostic tool. Consequently, this work proposes a
new approach for MA detection based on reduction of non-uniform illumination, mor-
phologic processing, principal component analysis (PCA), and Radon transform. The
proposed approach is tested on the public databases DiaretDB1 and Retinopathy Online
Challenge (ROC) competition. Theory, results, challenges and performance related to
the proposed MA detecting method are presented.
IV
Resumen
La diabetes puede aumentar el riesgo de contraer alguna complicación ocular,
como es el deterioro de los vasos sanguíneos que irrigan la retina. A este tipo de daños se
le conoce como retinopatía diabética (RD). La retinopatía diabética es causada por daño
a los vasos sanguíneos de la retina, la capa de tejido en la parte posterior del interior del
ojo. La retina es la encargada de transformar la luz que entra en el ojo en señales nervio-
sas que son enviadas al cerebro. Existen dos etapas en la RD, la no proliferativa y la
proliferativa, siendo esta última la más grave y con menos probabilidad de curación. Mu-
chas personas con RD no proliferativa no presentan algún tipo de síntoma hasta que
ocurre un sangrado mayor en el ojo. En la etapa no proliferativa puede llegar a observar,
en la parte interna del ojo, lesiones como microaneurismas (dilataciones de pequeños
vasos), hemorragias y exudados. Las hemorragias y microaneurismas (se les suele llamar
lesiones rojas) son las primeras lesiones clínicamente observables que indican una retino-
patía diabética no proliferativa. Para la detección y evaluación de este tipo de lesiones se
utilizan técnicas como la retinografía, en la cual se toman fotos en color de la retina del
ojo. Se estima que para el 2030, a nivel mundial, 3 millones de personas necesitarán ser
evaluadas cada día (35 exámenes por segundo). Asimismo, se espera que para el 2030 el
número de oftalmólogos crezca solo el 2 % mientras que el incremento de la población
con diabetes sea del 54 %. Por esta razón es necesario el desarrollo de un sistema de
diagnóstico automático, económico y de detección temprana.
V
Contenido
2.2 Histograma............................................................................................. 19
Bibliografía ........................................................................... 58
VII
Lista de figuras
Figura 4. Comparación entre: a) una imagen con los tres canales de colores RGB y b)
imagen con solo los canales RG, siendo el tercer canal nulo. .......................................... 12
Figura 5. Comparación entre los tres canales de colores individuales; a) canal rojo, b)
[24] ................................................................................................................................. 16
Figura 9. Ejemplo de curva FROC, para un error medio de 2 falsos positivos por imagen,
Figura 11. Cuatro tipos básicos de imágenes obscuro, luz suave, bajo contraste y alto
Figura 13. Convolución discreta. El pixel central del kernel y el pixel objetivo en la
imagen son indicados de color gris oscuro. Una vez realizado la suma de los pesos, este
Figura 16. Se muestran algunas de las imágenes que contiene la base de datos
DIARETDB1. ................................................................................................................ 27
Figura 17. Imagen con iluminación no uniforme debido tanto al ángulo con que se incide
Las dos imágenes por columna representan la misma categoría. (a) Sutiles. (b)
Figura 21. Se muestra la parte de una vena en donde existe variación de intensidad de
Figura 23. Imagen (plano G) utilizada para la demostración del uso de distintos espacios
(superior izquierda). Donde “L” es la imagen superior derecha, “a” la inferior izquierda y
Figura 25. Se muestra el espacio de color HSV en sus diferentes planos H (matiz,
IX
Figura 26. Plano de proporción (izquierda) creado a partir de la división de los valores
pixel a pixel del plano G entre el plano R. Así mismo a modo de comparación se muestra
el plano G (derecha). Cada uno de estos planos con sus respectivos histogramas. ......... 35
Figura 27. Espacio de color diseñado a partir del plano L, plano G/R y un plano nulo. 36
Figura 28. Comparación entre el espacio de color RGB (izquierda) y la unión de los
Figura 29. Imágenes de prueba donde se remueve parte del ruido utilizando dos tipos de
filtros. filtro Gausiano (Wiener), imagen sin filtrar y filtro de mediana. ........................ 37
Figura 30. Comparación entre el uso del filtro de mediana (izquierda) y sin utilizar el
ruido, el cual se encuentra principalmente en los valores altos y bajos de la imagen. ..... 37
Figura 31. Segmentación de la imagen de fondo de ojo utilizando el método del valor
umbral. .......................................................................................................................... 39
Figura 32. Resultado de aplicar el método de valor umbral por ventana a una imagen de
Figura 33. Generación de múltiples capas basados en el método del valor umbral. ........ 41
valor umbral (derecha) y después de aplicar (izquierda). Este segmento fue clasificado
como candidato a microaneurisma debido a que su excentricidad fue menor a 0.6. ....... 42
Figura 37. Generación de una recta a partir del histograma acumulado (derecha) de un
Figura 38. El resultado del entrenamiento de SVM utilizando un kernel lineal. ............. 45
X
Figura 39. Figura que ilustra la diferencia que existe en el conteo de objetos resultantes
Figura 40. Entrenamiento de SVM utilizando un kernel con función gaussiana ............. 46
microaneurismas. ........................................................................................................... 47
Figura 42. Muestra las regiones candidato indicadas en la base de datos. ..................... 49
Figura 44. Marcas de expertos para la misma imágenes (los colores decodifican el nivel
Figura 45. Eliminación de niveles de confianza con valores menores a 147. ................... 51
Figura 47. Imagen de fondo de ojo perteneciente a un paciente tratado con cirugía láser
Figura 48. Imagen de candidatos sobre una imagen de fondo ojo (izquierda) y como
Figura 49. Curva FROC generada a partir de 81 imágenes de fondo de ojo. ................. 53
XI
Capítulo 1. Introducción.
El principio de la sabiduría es el temor al Señor;
Los necios desprecian la sabiduría y la enseñanza.
Proverbios 1:7
1
que existen 23 países que cuentan con menos de un oftalmólogo por cada millón de habi-
tantes; 30 con menos de cuatro; 48 países con menos de 25 para cada millón de personas;
74 con menos de 100 y sólo 18 países tienen más de 100 oftalmólogos por cada millón de
ciudadanos. Estos datos son importantes en dos vertientes: en la de los países subdesarro-
llados porque el nivel económico sigue siendo una desventaja que evita que exista y se for-
men pocos o ningún profesional de este ramo. En cuanto a los países desarrollados, el nivel
de crecimiento de la población que supera los 60 años dobla a la tasa de profesionales que
surgen cada año. Además, se espera que para el 2030 el número de oftalmólogos crezca
solo el 2 % mientras que el incremento de la población con diabetes sea del 54
% [2]. De igual manera, de acuerdo a [7] en 2012 se identificaron a 6.4 millones de adul-
tos mexicanos con diabetes, es decir, 9.2% de los adultos en México han recibido ya un
diagnóstico de diabetes. El total de personas adultas con diabetes podría ser incluso el do-
ble, de acuerdo a la evidencia previa sobre el porcentaje de diabéticos que no conocen su
condición. Del total de personas que se identificaron como diabéticas el 16% (poco
más de un millón) son del grupo que reportan no contar con protección en
salud. Asimismo, 14.2% (poco más de 900 mil), dijeron no haber acudido al
médico para el control de la diabetes en los 12 meses previos a la entrevista, es decir, se
puede considerar que no se encuentran en tratamiento y por lo tanto están retrasando
acciones de prevención de complicaciones. Por lo que se refiere a las complicaciones
más frecuentes relacionadas con la diabetes, del total de individuos que reportan
diagnóstico previo, 47.6% (3 millones) reportaron visión disminuida, 38% (2.4 mi-
llones) ardor, dolor o pérdida de sensibilidad en los pies, 13.9% (889 mil) daños en la
retina. Por gravedad, 2% (128 mil) reportaron amputaciones, 1.4% (89 mil) diálisis, 2.8%
(182 mil) infartos, esto se puede observar en la Figura 1.
Extracción de candidatos
Clasificación
Para tener una base de comparación, en los últimos años se han utilizado gráficas
ROC (acrónimo de Receiver Operating Characteristic, o Característica Operativa del Re-
ceptor), con pequeñas modificaciones.
4
De manera de resumen en la Tabla 1 se muestran los objetivos, resultados y desven-
tajas de los artículos más referenciados en esta área. Hay que mencionar que algunos ar-
tículos solo hacen mención de los resultados que se obtuvieron más no de las fallas de los
mismos, incluso algunos no reportan la sensibilidad o especificidad de los algoritmos. Tam-
bién, es importante señalar que aún no existe una base de datos estándar que funcione co-
mo base de comparación. No obstante, en los últimos se han desarrollados bases de datos
que pueden ser utilizadas para estandarizar los resultados. Aun así, no todos los artículos
que se mencionan a continuación utilizan alguna de estas bases de datos.
Una de las principales dificultades y limitaciones que se presentan para realizar una
apropiada detección en este tipo de imágenes, es debido a las propiedades originales de la
imagen como son: contraste, iluminación, color de la región de interés, etc. Estos efectos no
deseados se deben a los distintos tipos de equipos con que se realiza la toma, así como el
ambiente o contexto en que se realiza la toma de la imagen. También, las dificultades que
se encuentran en las imágenes de fondo de ojo se deben a distintos factores como son: la
fuerte correlación entre la pigmentación de la piel y el color de iris, lo que provoca que el
color del fondo de ojo no sea único; poco contraste; los niveles de iluminación disminuyen
conforme se aleja del disco óptico, etc. De lo anterior, se pretende que el sistema sea tole-
rante a diversos contextos de la toma de la imagen de fondo de ojo. Mejorar la dependencia
de los diferentes contextos de toma de la imagen se pueden lograr al utilizar por lo menos
dos canales de colores para el análisis. Del trabajo preliminar realizado y de las distintas
referencias consultadas, se observa que los canales rojo (R) y verde (G) contiene la mayor
10
parte de la información de la imagen, esto se debe a la naturaleza de la imágenes ya que el
rango de colores es pobre en tonos azules. En la Figura 3, se muestra la representación es-
quemática de la estructura interna del ojo. Después de que entra a través de la córnea, la
luz atraviesa la zona intra-ocular media que consiste del cristalino y el humor vítreo. La
absorción en esta capa ocurre primeramente debido a los pigmentos del cristalino [23] la
cual absorbe mayormente en la región azul del espectro visible. La luz pasa de la zona in-
tra-ocular media a las capa de receptores a través de la membrana interna limitadora
(ILM). Después de pasar la capa de receptores, la luz entra en el fondo posterior. Esta
comprende tres capas: el epitelio pigmentario retiniano (RPE), las coroides y la esclerótica.
La reflexión y absorción de la luz depende particularmente de los pigmento melanina y
hemoglobina. De acuerdo a esto, los coeficientes de absorción de la melanina y hemoglobina
son más altos para la luz azul que para otras longitudes de onda. Además, la luz azul es
reflejada con menor intensidad en las coroides y en el pigmento epitelial retiniano. Asimis-
mo, la luz verde es mayormente reflejada por el pigmento epitelial retiniano y las coroides,
aunque no es reflejada tanto como la luz roja. Esta es la razón por la cual las imágenes de
fondo de ojo aparecen rojizas. Esto se puede observar mejor en las imágenes de las Figura
4 y Figura 5
11
a) b)
Figura 4. Comparación entre: a) una imagen con los tres canales de colores RGB y b)
imagen con solo los canales RG, siendo el tercer canal nulo.
a) b)
c)
Figura 5. Comparación entre los tres canales de colores individuales; a) canal rojo, b) ca-
nal verde, c) canal azul.
12
1.3.1 Curvas ROC
13
Figura 6. Distribución de probabilidad de los pacientes con y sin enfermedad, en función
del resultado del test.
=
( + )
=
( + )
Un test muy sensible será aquel que detecta con una alta probabilidad a todos los
pacientes enfermos, aunque sea a costa de cometer más errores de falsos positivos. Por tan-
to, cuanto más bajo sea el umbral, más sensible será nuestro test. Por contra, un test será
más específico cuantos más pacientes sanos detecte, aunque sea a costa de cometer más
14
errores de falsos negativos. Dicho de otro modo, cuanto más alto sea el umbral, más especí-
fico será nuestro test.
Las curvas ROC se desarrollaron en los años cincuenta como herramientas para el
estudio de detección e interpretación de señales de radar. El objetivo de los operadores de
radar era distinguir las verdaderas señales del ruido de fondo. Si se observa la pantalla de
un receptor de radar Figura 7 puede verse cómo al variar la amplitud de la señal definida
para considerar un pico como misil, varían la sensibilidad y la especificidad del sistema de
recepción. Si I, II y III son señales emitidas por misiles, al situar la amplitud A como punto
de corte detectaremos los 3 misiles (sensibilidad 100 %), pero también consideraremos misi-
les señales que no lo son. Al cambiar el nivel de decisión a la amplitud B no consideraremos
misil ninguna señal de ruido (especificidad 100 %) pero no habremos detectado el misil lI,
por lo que la sensibilidad desciende. De la misma forma que en el receptor de radar se pro-
duce un solapamiento entre las verdaderas señales y el ruido, al realizar pruebas diagnósti-
cas existe un solapamiento entre los resultados de los pacientes con una condición particu-
lar y los de aquellos que no la tienen. Por este motivo, las aplicaciones de las curvas ROC
se extendieron a múltiples sistemas diagnósticos, incluidas las técnicas radiológicas y las
pruebas de laboratorio.
Una curva FROC (Free Response Operating Characteristic) muestra la relación en-
tre sensibilidad (fracción de verdaderos positivos) y la tasa media de falsos positivos por
imagen, para distintos valores del parámetro D. Cada valor de D produce un punto de ope-
ración del sistema que se representa en la curva. Este es un método muy apropiado para
medir el rendimiento del sistema y encontrar un compromiso entre la tasa de aciertos y la
de fallos. En la Figura 9 se muestra un ejemplo de una curva FROC. En este caso puede
observarse que, cometiendo una media de 2 falsos positivos por imagen, se lograría detectar
correctamente el 80% de los objetos buscados.
16
Figura 9. Ejemplo de curva FROC, para un error medio de 2 falsos positivos por imagen,
a una sensibilidad del 80%.
17
Capítulo 2. Conceptos de procesamiento de
imágenes.
Si alguno de ustedes requiere de sabiduría,
pídasela a Dios, y él se la dará, pues
Dios se la da a todos en abundancia
y sin hacer ningún reproche.
Santiago 1:5
Este tipo de filtro pertenece a la categoría de filtros espaciales no lineales. Está ba-
sado en el ordenamiento de los pixeles contenidos en una área de la imagen abarcada por el
filtro, y entonces reemplazando el valor del pixel del centro con la mediana del conjunto de
valores de intensidad de los pixeles vecinos de dicho pixel, incluyendo el centro. El filtro de
mediana es popular porque, para ciertos tipos de ruidos, produce una excelente reducción
de ruido, con considerablemente menos desenfoque que los filtros lineales de tamaño simi-
lar. Los filtros de mediana son particularmente efectivos en la presencia de ruido impulso,
también llamado ruido de sal y pimienta porque estos aparecen como puntos blancos y
negros superpuestos sobre una imagen.
( , )= { ( − , − ), ( , ) }
Al calcular la mediana, se puede observar que el valor del pixel central 255 será
remplazado por un cero (mediana).
2.2 Histograma
El histograma de una imagen digital con valores de gris dentro del rango [0, − 1]
es una función discreta ℎ( ) = , donde es el k-ésimo nivel de gris y es el número
de pixeles de la imagen que tienen el nivel de gris Es práctica común normalizar el his-
tograma dividiendo cada uno de sus valores por el número total de pixeles en la imagen,
denotado como n, como sigue: ( ) = / . En términos generales, ( ) es un estimado
de la probabilidad de ocurrencia del nivel de gris . La suma de todos los componentes de
un histograma normalizado es = 1.
Figura 11. Cuatro tipos básicos de imágenes obscuro, luz suave, bajo contraste y alto
contraste y su correspondiente histograma [26]
20
Existen dos operaciones morfológicas básicas, erosión y dilatación [27]. Suponga
un objeto y el elemento estructural que son representados como un conjunto en un
espacio Euclidiano de dos dimensiones. Sea que denota la translación de tal que el
origen está localizado en . Entonces la erosión de por está definido por el conjunto de
todos los puntos tal que está incluido en , esto es,
ó : ⊝ ≜{ : ⊂ }
ó : ⨁ ≜{ : ∩ ≠ }
De estas dos transformaciones se derivan otras como son: opening, closing y hit-
miss. Esta última, prueba si la estructura pertenece o no a y pertenece a ,
donde denota el complemento de ; el conjunto de pixeles en que pertenecen al
21
objeto deseado; son el conjunto del fondo. Un ejemplo del uso de esta transformada se
muestra en la Figura 12.
[ ]∗ [ ]= [ ] [ − ]
( , )= ( , ) ( − + 1, − + 1)
22
Figura 13. Convolución discreta. El pixel central del kernel y el pixel objetivo en la ima-
gen son indicados de color gris oscuro. Una vez realizado la suma de los pesos, este valor es utili-
zado como filtro del pixel objetivo 35. [28]
Figura 14. La frontera de decisión debe estar tan lejos de los datos de ambas clases como
sea posible [29].
23
Maximizar el margen m es un problema de programación cuadrática (QP) y puede
ser resuelto por su problema dual introduciendo multiplicadores de LaGrange. Sin ningún
conocimiento del mapeo, la SVM encuentra el hiperplano óptimo utilizando el producto
punto con funciones en el espacio de características que son llamadas kernels. La solución
del hiperplano óptimo puede ser escrita como la combinación de unos pocos puntos de en-
trada que son llamados vectores de soporte. Existen dos casos, linealmente separables y no
linealmente separables.
Supongamos que nos han dado un conjunto S de puntos etiquetados para entre-
namiento como se aprecia en la Figura 15.
( , ), . . . , ( , ) (1)
∙ + =0
Definido por el par (w, b), tal que podamos separar el punto de acuerdo a la fun-
ción
1 =1
( )= ( ∙ + )=
−1 = −1
( ∙ + )≥1 =1
= 1,2,3, … , .
( ∙ + ) ≥ −1 = −1
25
Capítulo 3. Antecedentes
Porque el Señor da la sabiduría; conocimiento y ciencia brotan de sus labios.
Proverbios 2:6
El banco de imágenes que se utilizó en este trabajo proviene de una base de datos
pública: Diabetic Retinopathy Database, DIARETDB1. Asimismo, esta base contiene imá-
genes de evaluación de varios expertos: Ground Truth (GT). Durante este capítulo solo
trataremos sobre las imágenes de prueba de fondo de ojo. En el capítulo 5 se explicará con
más detalle sobre las imágenes de evaluación.
Algunos ejemplos de las imágenes de prueba se muestran en la Figura 16. Las imá-
genes de la base de datos se encuentran en el espacio RGB (Red, Green, Blue). Aunque, se
debe mencionar que en la mayoría de la imágenes, el plano B contiene muy poca informa-
ción. Por esta razón, en la mayor parte de la literatura este canal se descarta. La ausencia
de información en el plano B se explicó con en el Capítulo 1.
26
Figura 16. Se muestran algunas de las imágenes que contiene la base de datos DIA-
RETDB1.
Como se puede observar en las imágenes que se muestran en la Figura 16, uno de
los problemas es la poca uniformidad de las imágenes. Es decir que las imágenes fueron
capturadas con diferentes condiciones. Por ejemplo, en algunas imágenes se observan pro-
blemas de iluminación debido a la difusión no uniforme de la luz en la retina. Uno de los
problemas con respecto a la iluminación se debe a la forma de la retina, la cual es muy
cercana a la de una esfera, lo que produce que la luz emitida sobre la retina no se refleje
uniformemente. Otro problema común con respecto a la iluminación se relaciona al ángulo
con el cual se incide luz sobre la retina, ya que este ángulo cambiará la manera en que se
difumina la luz sobre la retina. Un ejemplo de una imagen con problemas de iluminación se
muestra en la Figura 17.
Figura 17. Imagen con iluminación no uniforme debido tanto al ángulo con que se incide
como a la forma esférica de la retina.
3.2. Microaneurismas
28
Figura 19. (Superior) Estas preparaciones muestran daños capilares y microaneurismas.
(Superior izquierda) Hay pequeñas áreas de pérdida de capilaridad, muchos de los capilares son
acelulares; pequeños microaneurismas se pueden observar y más hipercélulas capilares. (Superior
derecha) microaneurismas de manera más marcada. (Inferior) Inyección de tinta Indian mostran-
do bucles capilares y microaneurismas. [32]
Otro problema que se presenta en este tipo de imágenes es el ruido, ya que suele
confundirse con microaneurismas. Asimismo, en algunos casos la vena puede tener zonas de
29
alto contraste y zonas de bajo contraste, como se muestra en la Figura 21. Esto provoca,
nuevamente, una semejanza con microaneurismas.
Figura 21. Se muestra la parte de una vena en donde existe variación de intensidad de
los valores de los pixeles.
El mayor número de errores se presenta en las zonas cercanas a los vasos sanguíneos
que irrigan la retina. Esto es debido a que los vasos sanguíneos tienen tonos similares a los
microaneurismas. Además las terminaciones de estos suelen tener un tamaño similar a los
microaneurismas. Asimismo, el tono a lo largo de los vasos sanguíneos no es constante. Por
esto, se han desarrollado distintos métodos para la segmentación de los vasos sanguíneos
[30]. Algunos de estos métodos incluyen al algoritmo de seguimiento de vasos sanguíneos o
venas. Comúnmente, este algoritmo necesita la intervención del usuario, el cual indica la
posición inicial y la posición final de la vena. Este tipo de algoritmos es muy susceptible a
las bifurcaciones y los cruces de vasos. Sin embargo, este tipo de algoritmo tiene la ventaja
principal de identificar con mayor precisión el ancho de los vasos sanguíneos y provee in-
formación de vasos individuales que usualmente no está disponible usando otros métodos.
Algunos otros métodos de segmentación de vasos son:”Matched filter”, análisis morfológico,
PCA, transformada Watershed entre otros. Su ventaja radica en ser autónomo, es decir que
no necesita la intervención del usuario. La desventaja principal con este tipo de algoritmo
es su precisión para identificar correctamente tanto el ancho de los vasos como todas sus
ramificaciones. El problema anterior provoca en algunas zonas la eliminación de candida-
tos, ya que son segmentados junto con los vasos debido a su cercanía. Otro problema surge
en la segmentación parcial de los vasos, lo cual resulta en porciones aisladas de vasos san-
guíneos sin segmentar. Esto último provoca la identificación de estas porciones de vasos
como candidatos a microaneurismas.
Dado los problemas relacionados con los vasos sanguíneos de la retina antes men-
cionada, se decidió evitar la segmentación de los mismos. De tal manera que el algoritmo
que se presenta en este trabajo, se enfoca principalmente en la detección, por tamaño, for-
ma y tonalidad, de los microaneurismas.
30
Capítulo 4. Desarrollo.
En cambio, la sabiduría que desciende del cielo es ante todo
pura, y además pacífica, bondadosa, dócil, llena de compasión
y de buenos frutos, imparcial y sincera.
Santiago 3:17.
Imagen de fondo
de ojo
Preprocesamiento
de imágenes
Extracción de
candidatos
Clasificación de
lesiones
31
4.2. Preprocesamiento de imágenes
Figura 23. Imagen (plano G) utilizada para la demostración del uso de distintos espacios
de color para el mejoramiento del contraste y la iluminación de las imágenes.
32
Figura 24. Transformación de la imagen de la Figura 23 al espacio de color L*a*b (superior iz-
quierda). Donde “L” es la imagen superior derecha, “a” la inferior izquierda y “b” inferior dere-
cha.
Otro espacio de color que se probó fue el espacio HSV. Los planos de este espacio
no nos ayudan significativamente en la detección de microaneurismas dado que, como se
muestra en la Figura 25, los planos no aportan el contraste e iluminación adecuados para
distinguir a simple vista los microaneurismas. Sin embargo, este espacio aporta información
relevante con respecto a las propiedades de las imágenes. El plano H indica que el rango de
valores se encuentra principalmente entre rojo y amarillo con algunos valores de verde. El
canal S nos indica que los valores son mayormente colores primarios y del plano H se dedu-
ce que son rojo y amarillo. Por último, el canal V nos indica las zonas de mayor ilumina-
ción como el disco óptico.
33
Figura 25. Se muestra el espacio de color HSV en sus diferentes planos H (matiz, supe-
rior derecha), S (saturación, inferior izquierda), V (Color, inferior derecha).
También, se probaron otros espacios de color como XYZ, YUV, etc. Pero se obtu-
vieron resultados similares a los aportados por los espacios de color que se mostraron ante-
riormente.
Del análisis de estos espacios de color y de las propiedades de las imágenes se dedu-
jo el plano G/R. Este plano es una división pixel a pixel entre el plano G y el plano R en el
rango de valores de 0 a 255. El valor del pixel resultante de la división, en la mayoría de los
casos, se encuentra en el rango de valores de 0 a 1. Esto se debe a que en la mayoría de los
casos el valor del plano R es mayor que el valor del plano G. También, se observa que en el
espacio de color RGB los tonos de color predominantes son rojizos y amarillentos, lo cual
indica valores altos en el plano R y no nulos. Este plano de proporción permite el aumento
del contraste en la imagen además de uniformizar la luminosidad de la imagen. Un ejemplo
de este plano se muestra en la Figura 26. Si se compara con los espacios antes mencionados
y con el plano G, se puede observar una mejora en el contraste y en la iluminación de la
imagen. Este plano de proporción es el que se utilizará a lo largo de este trabajo para reali-
zar la detección de microaneurismas. Sin embargo, este plano por sí mismo no es de gran
ayuda para un oftalmólogo al momento de identificar visualmente un microaneurismas, ya
que se encuentra en escala de grises lo que dificulta la identificación. Por esta razón, se
implementó la unión de 3 diferentes planos. El primer plano pertenece a la luminancia del
espacio RGB, el segundo plano es el plano de proporción antes mencionado y el tercer
34
plano es nulo. La unión de estos tres planos se muestra en la Figura 27. Esta unión de pla-
nos fue mostrada a un oftalmólogo, el cual indicó que la imagen facilitaba la detección vi-
sual de microaneurismas y otras lesiones. Asimismo, en la Figura 28 se muestra una compa-
ración de una zona que contiene microaneurismas y algunos segmentos de venas. De la
misma manera, se muestra el histograma de cada zona lo cual demuestra que el rango de
valores de la unión de los planos es más amplia comparado con el del espacio RGB. Este
aumento en la distribución se ve reflejado en el incremento del contraste y la luminancia, lo
que favorece la detección de microaneurismas.
4 4
x 10 x 10
5 5
4 4
Cantidad de pixeles
Cantidad de pixeles
3 3
2 2
1
1
0
0
Figura 26. Plano de proporción (izquierda) creado a partir de la división de los valores
pixel a pixel del plano G entre el plano R. Así mismo a modo de comparación se muestra el
plano G (derecha). Cada uno de estos planos con sus respectivos histogramas.
35
Figura 27. Espacio de color diseñado a partir del plano L, plano G/R y un plano nulo.
500
450 700
400
600
350
500
Cantidad de pixeles
Cantidad de pixeles
300
250 400
200 300
150
200
100
100
50
0 0
Figura 28. Comparación entre el espacio de color RGB (izquierda) y la unión de los pla-
nos L, proporción y plano nulo (derecha).
36
tenida con el filtro Wiener. Para este caso en particular se desea un alto contraste por esa
razón se decidió utilizar el filtro de mediana en vez del filtro Wiener.
Figura 29. Imágenes de prueba donde se remueve parte del ruido utilizando dos tipos de filtros.
filtro Gausiano (Wiener), imagen sin filtrar y filtro de mediana.
100
90
90
80
80
70
70
Cantidad de pixeles
Cantidad de pixeles
60
60
50
50
40
40
30
30
20
20
10
10
Figura 30. Comparación entre el uso del filtro de mediana (izquierda) y sin utilizar el
mismo (derecha). Asimismo se muestra el histograma para demostrar la disminución de ruido, el
cual se encuentra principalmente en los valores altos y bajos de la imagen.
37
imágenes. Asimismo, se presenta el seudocódigo utilizado para la etapa designada como
preprocesamiento.
Se utilizan los planos rojo (R) y verde (G) de la imagen RGB para generar una imagen
en escala de grises.
= plano R
= plano G
for cada columna de do
for cada renglón de do
if planoR(renglon,columna)=0 then
I(renglón, columna)=0
else
I(renglón, columna)=planoG(renglón, columna)/planoR(renglón, columna)
I(renglón, columna) = redondear (I(renglón, columna)*255)
end if
end for
end for
Figura 31. Segmentación de la imagen de fondo de ojo utilizando el método del valor
umbral.
Dado que no es conveniente aplicar una segmentación global esta puede ser aplicada
por ventanas. En cada ventana se genera un valor de umbral diferente, basado en la moda
del histograma de cada ventana. El resultado de aplicar este algoritmo se muestra en la
Figura 32. Se puede notar que en la imagen que se muestra en la Figura 32 se ha eliminado
gran parte del fondo aunque también existen ciertas zonas del fondo no deseadas. Este mé-
todo también está basado en el algoritmo Quadtree.
39
Figura 32. Resultado de aplicar el método de valor umbral por ventana a una imagen de
fondo de ojo.
Algunos problemas que se observa en la imagen de la Figura 32 son los vasos san-
guíneos y algunas zonas del fondo que son mayormente ruido. Una de las dificultades más
importantes son los vasos sanguíneos ya que estos tienden a parecerse en tono de color a los
microaneurismas, esto es debido a que los dos proceden de la misma naturaleza. Una mane-
ra sencilla de diferenciar entre microaneurismas y vasos sanguíneos es por forma y tamaño.
Esto se explicará con más detalle en la sección de clasificación.
También se desarrolló otra modificación al método del valor umbral. En esta se di-
vide la imagen en una serie de capas o planos que están dentro de un rango. Esto se puede
expresar al utilizar las siguientes expresiones.
≤ ≤ +
+ < ≤2 +
.
.
.
( − 1) + < ≤ +
40
tir de la moda. Por experimentación se encontró que un valor adecuado para es 7. En la
Figura 33, se representa la formación de 5 capas a partir del plano de proporción. El uso de
esta técnica facilita la distinción entre venas, fondo y microaneurismas. Esta distinción se
debe a las tonalidades oscuras representativas de los microaneurismas. También, dado que
siempre existe contraste entre el fondo y los microaneurismas se debe poder aislar a los
microaneurismas en un cierto rango. Esta técnica comprueba los diferentes tonos de micro-
aneurismas. Para este trabajo se han clasificado en tonos oscuros, medios y claros. En par-
ticular, con esta técnica, los microaneurismas claros son los más difíciles de distinguir debi-
do a que tiende a aparecer en las capas en donde el rango comprende parte del fondo.
Figura 33. Generación de múltiples capas basados en el método del valor umbral.
41
surge una gran cantidad de errores debido a que no todos los microaneurismas cumplen con
la forma deseada circular.
Una solución propuesta fue utilizando la excentricidad de una elipse, la cual se defi-
ne como
√ −
=
De tal manera que se busca que ≈ 0 lo cual representaría que = , lo que indi-
caría una forma circular. De varias pruebas realizadas, se encontró que un valor por debajo
de 0.6 representa a un microaneurisma. Sin embargo, también se encontraron algunos seg-
mentos de vasos capilares que cumplen con esta condición. Un ejemplo de un segmento de
vaso sanguíneo de este tipo se muestra en la Figura 35. Así mismo, existen algunos microa-
neurismas con una excentricidad mayor a 0.6 los cuales no fueron clasificados como candi-
datos.
Figura 36. En la imagen de la derecha se muestra un segmento de un vaso sanguíneo que de-
muestra la variabilidad de tonos que existen. En la izquierda se muestra parte del segmento que
comprende una ventana de 15 X 15.
4.4. Clasificación
=
−
Figura 37. Generación de una recta a partir del histograma acumulado (derecha) de un microa-
neurisma (izquierda).
44
Para el conteo de objetos primero se realizó la segmentación de la imagen tal como
se describió en secciones anteriores. De la segmentación aplicada, en el caso de los vasos
sanguíneos, el número de objetos resultantes es regularmente mayor a uno. Como se explicó
anteriormente, esto se debe a las variaciones de tonalidad presentes en los vasos sanguíneos.
Estos dos parámetros son utilizados para la construcción del SVM. Se utilizaron un total de
92 imágenes correspondientes a microaneurismas y 92 correspondientes a no microaneuris-
mas. Además se utilizó un kernel de primer orden.
45
Figura 39. Figura que ilustra la diferencia que existe en el conteo de objetos resultantes
de aplicar el valor umbral.
46
cuando existen 2 o 3 objetos y una pendiente entre 1 y 15. En esta zona se observa que
algunos microaneurismas fueron clasificados incorrectamente (NoMAs classified). Este error
se discutirá en el siguiente capítulo. A continuación se presenta el pseudocódigo para la
etapa de clasificación.
48
Capítulo 5. Resultados.
A ti, Dios de mis padres,
te alabo y te doy gracias.
Me has dado sabiduría y poder,
me has dado a conocer lo que te pedimos,
¡me has dado a conocer el sueño del rey!
Daniel 2:23
49
Figura 43. Imagen promedio de 4 expertos correspondiendo el valor de intensidad más
alto a la concordancia de más expertos
Figura 44. Marcas de expertos para la misma imágenes (los colores decodifican el nivel
de confianza del GT) a) original b) experto 1 c) experto 2 d) experto 3 e) experto 4 y f) prome-
dio de todos los expertos. [33]
La base de datos Ground Truth (GT) [33], cuenta con 4 niveles de experto la ima-
gen resultante es la suma de los mismos. En la Figura 43, se muestra un ejemplo de esta
suma, en donde un mayor nivel de intensidad indica un nivel de certeza mayor. Este nivel
de certeza o confianza depende a su vez del nivel de confianza de cada experto. Cada ex-
perto tiene 3 niveles de confianza, indicados en la Figura 44 por colores. Por ejemplo en la
Figura 44 (d) se exponen las lesiones marcadas por un solo experto y cada color indica el
50
nivel de confianza de ese experto. Siendo el rojo oscuro un alto nivel, amarillo medio nivel y
azul claro bajo nivel de confianza. En dicha figura se presenta también un ejemplo de la
identificación de lesiones correspondiente a los 4 expertos y el promedio de estos 4, Figura
44 (f). De tal manera que, entre mayor sea el valor del pixel indicará una coincidencia ma-
yor entre expertos y/o niveles de confianza de cada experto. De pruebas realizadas, se en-
contró, en imágenes de 8 bits, que la suma de nivel de confianza mayor a 147 es donde se
localizan los microaneurismas puntualmente y no por zonas. En un ejemplo en donde se
eliminan todos los valores por debajo del umbral de 147 se muestra en la Figura 45. Se
puede observar en esta imagen que el resultado de aplicar este umbral son zonas pequeñas
de lesiones, comparadas con el promedio de expertos. Esto permite realizar una compara-
ción más sencilla entre el GT y los candidatos, utilizando solo una operación AND (dado
que tanto el GT como los candidatos son imágenes binarias).
51
Figura 46. Desplazamiento del GT con respecto a un microaneurisma.
Figura 47. Imagen de fondo de ojo perteneciente a un paciente tratado con cirugía láser
(manchas negras) debido al algún tipo de lesión.
Figura 48. Imagen de candidatos sobre una imagen de fondo ojo (izquierda) y como ima-
gen binaria (derecha).
52
De tal manera que el número total de imágenes utilizadas para la obtención de re-
sultado fue de 81 de 89. De estas imágenes se elaboró la curva FROC, tal como se mencio-
nó en el Capítulo 1. Esta gráfica se muestra en la Figura 49.
También se muestra en la Figura 48, un ejemplo de los candidatos obtenidos del al-
goritmo desarrollado. Se muestra tanto la imagen binaria, así como las zonas que se identi-
ficó en la imagen de fondo de ojo correspondiente.
También se realizó una comparación del desempeño del algoritmo diseñado, utili-
zando el plano verde (G) y el plano de proporción (P), tal como se muestra en la Tabla 2.
53
VP1 plano P VP plano G FP2 plano P FP plano G FN3 plano P FN plano G
0 0 191 67 1 1
1 1 129 63 0 0
7 2 188 38 0 5
8 1 181 53 0 6
1 0 171 55 0 1
4 3 147 97 0 0
11 0 314 38 0 10
1 0 178 54 0 1
1 1 220 30 0 0
3 2 225 57 0 1
7 5 281 91 2 4
0 0 105 71 0 0
1 2 195 73 2 1
4 2 219 52 1 3
13 5 177 79 0 8
Tabla 2. Comparación del uso del plano G y el plano P en el desempeño del algoritmo.
1
Verdaderos Positivos
2
Falsos Positivos
3
Falsos Negativos
54
[17] 0.85 0.13 Normalización 71 con MAs; 165
de color, creci- sin ningún MA.
miento de la
región, “Top
Hat”, exclusión
de vasos.
[19] 0.83 No se menciona Correlación con 32
una plantilla
generada con la
transformada
Wavelet.
[20] 0.94 0.13 Transformada 89
digital Curvelet.
Conversión al
espacio Luv.
Tabla 3. Comparación de los resultados obtenidos con algunos artículos.
55
Capítulo 6. Conclusiones.
Que nadie se engañe. Si alguno de ustedes se cree
sabio según las normas de esta época, hágase ignorante
para así llegar a ser sabio.
1 Corintios 3:18
56
previamente diagnosticados, por consiguiente dichas imágenes no pueden ser utilizadas para
un sistema de pre diagnóstico. Además, se encontraron algunos “puntos negros” que apare-
cen en la misma posición en varias imágenes. Estos “puntos negros” a pesar de encontrarse
dentro de la clasificación de no pertenecer a microaneurismas, cumplen con todas las carac-
terísticas de estos. Con respecto al GT, se mencionó las dificultades que se encontraron
como es la posición y el exceso de área marcada como microaneurisma. Asimismo, existen
varios candidatos que cumplen con las características de microaneurisma pero no fueron
señalados como tal en el GT.
Desarrollar una base de datos, con su respectivo GT, que solo incluya imá-
genes que puedan ser utilizadas para el pre diagnóstico. Así como un algo-
ritmo estándar que permita la comparación entre el GT y los candidatos.
57
Bibliografía
[1] International Diabetes Federation. (2011) The Global Burden. [Online].
http://www.idf.org/diabetesatlas/5e/the-global-burden
[2] The International Agency for the Prevention of Blindness (IAPB). Diabetic
Retinopathy. [Online]. http://www.iapb.org/vision-2020/what-is-avoidable-
blindness/diabetic-retinopathy
[3] World Health Organisation (WHO). (2005) Prevention of Blindness from Diabetes
Mellitus. [Online].
http://www.who.int/blindness/Prevention%20of%20Blindness%20from%20Diabetes%2
0Mellitus-with-cover-small.pdf.
[5] William Felch, Tina-Marie Gauthier, Bruce Spivey Serge Resnikoff, "The number of
ophthalmologists in practice and training worldwide: a growing gap despite more than
200 000 practitioners," British Journal of Ophthalmology , vol. 96, pp. 783-787, 2012.
[7] Mauricio Hernández Ávila and Juan Pablo Gutiérrez, "Diabetes mellitus: la urgencia
de reforzar la respuesta en políticas públicas para su prevención y control," Instituto
Nacional de Salud Pública, México, Encuesta Nacional de Salud 2012.
[8] Pakinee Aimmanee, Buyarit Uyyanonvara Parisut Jitpakdee, "A survey on hemorrhage
detection in diabetic retinopathy retinal images," in International Conference on
Electrical Engineering/Electronics, Computer, Telecommunications and Information
Technology (ECTI-CON), 2012 9th International Conference on, Phetchaburi, 2012,
pp. 24 - 29.
[9] Agrawal Ankita, Bhatnagar Charul, and Anand Singh Jalal, "A Survey on Automated
Microaneurysm Detection in Diabetic Retinopathy Retinal Images," in International
Conference on Information Systems and Computer Networks, Mathura, 2013, pp. 24 -
58
29.
[17] A.D. Fleming, S. Philip, K.A. Goatman, J.A. Olson, and P.F. Sharp, "Automated
microaneurysm detection using local contrast normalization and local vessel
detection," IEEE Transactions on Medical Imaging, vol. 25, pp. 1223 - 1232, August
2006.
[19] Gwénolé Quellec et al., "Optimal Wavelet Transform for the Detection of," IEEE
Transactions on Medical Imaging, vol. 27, no. 9, pp. 1230-1241, September 2008.
[20] Mahdad Esmaeili, Hossein Rabbani, Alireza Mehri Dehnavi, and Alireza Dehghani,
"New Curvelet Transform Based Method for Extraction of Red Lesions in Digital
Color Retinal Images," in 17th International Conference on Image Processing, Hong
Kong, 2010, pp. 4093-4096.
59
[21] Jang Pyo Bae et al., "A Study on Hemorrhage Detection Using Hybrid Method in
Fundus Images," Journal of Digital Imaging, vol. 24, pp. 394-404, June 2011.
[22] I Lazar and A. Hajdu, "Retinal Microaneurysm Detection Through Local Rotating
Cross-Section Profile Analysis," IEEE Transactions on Medical Imaging, vol. 32, pp.
400 - 407, November 2012.
[23] S J Preece and E Claridge, "Monte Carlo modelling of the spectral reflectance of the
human eye," Physics in medicine and biology, vol. 47, pp. 2863-2877, July 2002.
[24] M.J. Burgueñoa, J.L. García-Bastosb, and y J.M. González-Buitrago, "Las curvas
ROC en la evaluación de las pruebas diagnósticas," Med Clin (Barc), vol. 104, pp. 661-
670, 1995.
[25] Luis Enrique Jose Jaime, Fundamentos para el procesamiento de imágenes. Baja
California, México, 2005.
[26] Li Tan, Digital Signal Processing. Fundamentals and Applications. Decatur, Georgi:
Elsevier, 2008.
[28] Chris solomon and Toby Breckon, Fundamentals of digital image processing.: Wiley
Blackwell, 2011.
[29] C. Burges, A tutorial on support vector machines for pattern recognition. Data mining
and Knowledge, Segunda ed.: Discovery, 1998.
[30] R.J. Winder, P.J. Morrow, I.N. McRitchie, J.R. Bailie, and P.M. Hart, "Algorithms for
digital image processing in diabetic retinopathy," Computerized Medical Imaging and
Graphics, vol. 33, pp. 608–622, June 2009.
[31] Bram van Ginneken, Michael J. Cree, Atsushi Mizutani, Gwénolé Quellec, Clara I.
Sánchez, Bob Zhang,Mathieu Lamard, Chisako Muramatsu, Xiangqian Wu, Meindert
Niemeijer*, "Retinopathy Online Challenge: Automatic Detection of Microaneurysms
in Digital Color Fundus Photographs," IEEE Transactions on medical imaging., vol.
29, no. 1, pp. 185-195, Enero 2010.
[32] Paul Hunter, Roger Hitchings David Spalton, Atlas of clinical ophthalmology, Tercera
ed.: Elzevier Mosby.
[34] J. L. Peterson, "Petri Nets," ACM Computing Surveys, vol. 9, no. 3, pp. 223-252,
September 1977.
60
[35] R. Fehling, "A concept of hierarchical Petri nets with building blocks," Lecture Notes
in Computer Science, vol. 674, pp. 148-168, 1993.
[37] D. Taubner, "Finite representations of CCS and TCSP programs by automata and
Petri nets," Lecture Notes In Computer Science, vol. 369, p. 168, 1989.
61