Hernandez CJ

Procesamiento de imágenes de fondo de ojo
para la detección de microaneurismas en la
Retinopatía Diabética.
por
Jonathan Hernández Capistrán
Tesis sometida como requisito parcial

para obtener el grado de
MAESTRO EN CIENCIAS EN LA ESPECIALIDAD DE

ELECTRÓNICA
en el
Instituto Nacional de Astrofísica,

Óptica y Electrónica
Tonantzintla, Puebla
Diciembre del 2014
Supervisada por:
Dr. Jorge Francisco Martínez Carballido
©INAOE 2014
Derechos Reservados
El autor otorga al INAOE el permiso de reproducir y distribuir
copias de esta tesis en su totalidad o en partes.
I
Agradecimientos
A Dios por darme la sabiduría, el conocimiento y la oportunidad de terminar esta etapa
de mi vida. Por estar siempre a mi lado pidiéndome que no desmaye porque Él está para ayu-
darme. Sin Él nada de esto sería posible.
A mis padres, Amadeo Hernández y Socorro Capistrán por alentarme a siempre seguir
adelante guiándome siempre por los caminos de Dios. Gracias por estar siempre ahí incondicio-
nalmente.
A mi hermano Roberto Hernández por ayudarme a tomar buenas decisiones y a buscar
mejores oportunidades en la vida.
A todos mis familiares que han estado siempre ahí apoyándome en todo y dándome áni-
mos para seguir siempre adelante.
Al Dr. Jorge Martinez Carballido por la valiosa ayuda y apoyo, que me ha brindado du-
rante el transcurso de estos años en mi formación académica.
A mis colegas y amigos con los que compartí esta etapa.
Al Instituto Nacional de Astrofísica Óptica y Electrónica (INAOE) por darme los recur-
sos y la infraestructura necesaria para el desarrollo profesional y personal.
Al Consejo Nacional de Ciencia y Tecnología (CONACyT) por aportarme la beca necesa-
ria que me permitió terminar con éxito esta etapa.
II
Toda la honra y la gloria
sean para Dios.
III
Abstract
Diabetes increases the risk of developing any deterioration in the blood vessels that
supply the retina, an ailment known as Diabetic Retinopathy (DR). Since this disease is
asymptomatic, it can only be diagnosed by an ophthalmologist. However, the growth of
the number of ophthalmologists is lower than the growth of the population with diabetes
so that preventive and early diagnosis is difficult due to the lack of opportunity in terms
of time and cost. Preliminary, affordable and accessible ophthalmological diagnosis will
give the opportunity to perform routine preventive examinations, indicating the need to
consult an ophthalmologist during a stage of not proliferation. During this stage there is
a lesion on the retina known as microaneurysm (MA), which is one of the first clinically
observable lesions that indicate the disease. In recent years different image processing
algorithms, which allow the detection of the DR, have been developed; however, the is-
sue is still open since acceptable levels of sensitivity and specificity have not yet been
reached, preventing its use as a pre-diagnostic tool. Consequently, this work proposes a
new approach for MA detection based on reduction of non-uniform illumination, mor-
phologic processing, principal component analysis (PCA), and Radon transform. The
proposed approach is tested on the public databases DiaretDB1 and Retinopathy Online
Challenge (ROC) competition. Theory, results, challenges and performance related to
the proposed MA detecting method are presented.
IV
Resumen
La diabetes puede aumentar el riesgo de contraer alguna complicación ocular,
como es el deterioro de los vasos sanguíneos que irrigan la retina. A este tipo de daños se
le conoce como retinopatía diabética (RD). La retinopatía diabética es causada por daño
a los vasos sanguíneos de la retina, la capa de tejido en la parte posterior del interior del
ojo. La retina es la encargada de transformar la luz que entra en el ojo en señales nervio-
sas que son enviadas al cerebro. Existen dos etapas en la RD, la no proliferativa y la
proliferativa, siendo esta última la más grave y con menos probabilidad de curación. Mu-
chas personas con RD no proliferativa no presentan algún tipo de síntoma hasta que
ocurre un sangrado mayor en el ojo. En la etapa no proliferativa puede llegar a observar,
en la parte interna del ojo, lesiones como microaneurismas (dilataciones de pequeños
vasos), hemorragias y exudados. Las hemorragias y microaneurismas (se les suele llamar
lesiones rojas) son las primeras lesiones clínicamente observables que indican una retino-
patía diabética no proliferativa. Para la detección y evaluación de este tipo de lesiones se
utilizan técnicas como la retinografía, en la cual se toman fotos en color de la retina del
ojo. Se estima que para el 2030, a nivel mundial, 3 millones de personas necesitarán ser
evaluadas cada día (35 exámenes por segundo). Asimismo, se espera que para el 2030 el
número de oftalmólogos crezca solo el 2 % mientras que el incremento de la población
con diabetes sea del 54 %. Por esta razón es necesario el desarrollo de un sistema de
diagnóstico automático, económico y de detección temprana.
V
Contenido
Capítulo 1. Introducción. ....................................................... 1
1.1. Marco teórico. .......................................................................................... 1
1.2. Enunciado del problema ........................................................................... 3
1.3. Revisión del Estado del arte..................................................................... 3
1.3.1 Curvas ROC ...................................................................................... 13
Capítulo 2. Conceptos de procesamiento de imágenes. ....... 18
2.1. Filtro de mediana ................................................................................... 18
2.2 Histograma............................................................................................. 19
2.3 Operaciones morfológicas ....................................................................... 20
2.4 Convolución espacial. ............................................................................. 22
2.5. Máquina de soporte vectorial ................................................................. 23
2.5.1. Caso linealmente separable ................................................................. 24
Capítulo 3. Antecedentes ..................................................... 26
3.1. Base de datos DIARETDB1. ................................................................. 27
3.2. Microaneurismas .................................................................................... 28
Capítulo 4. Desarrollo. ......................................................... 31

VI
4.1. Diagrama de bloques.............................................................................. 31
4.2. Preprocesamiento de imágenes ............................................................... 32
4.3. Extracción de candidatos. ...................................................................... 38
4.4. Clasificación ........................................................................................... 44
Capítulo 5. Resultados. ........................................................ 49
5.1. Base de datos Ground Truth .................................................................. 49
5.2. Resultados Obtenidos............................................................................. 51
Capítulo 6. Conclusiones. ..................................................... 56
6.1. Trabajos futuros. .................................................................................... 57
Bibliografía ........................................................................... 58
VII
Lista de figuras
Figura 1.Complicaciones reportadas por diabéticos. México, [7]. ..................................... 2
Figura 2. Proceso de detección de lesiones rojas .............................................................. 4
Figura 3. Trayectoria de la luz que es remitida por el fondo ocular. [23]........................ 11
Figura 4. Comparación entre: a) una imagen con los tres canales de colores RGB y b)
imagen con solo los canales RG, siendo el tercer canal nulo. .......................................... 12
Figura 5. Comparación entre los tres canales de colores individuales; a) canal rojo, b)
canal verde, c) canal azul. .............................................................................................. 12
Figura 6. Distribución de probabilidad de los pacientes con y sin enfermedad, en función
del resultado del test. ..................................................................................................... 14
Figura 7. Señales registradas en un receptor de radar; I, II y III corresponden a misiles.
[24] ................................................................................................................................. 16
Figura 8. Curva ROC [24] .............................................................................................. 16
Figura 9. Ejemplo de curva FROC, para un error medio de 2 falsos positivos por imagen,
a una sensibilidad del 80%. ............................................................................................ 17
Figura 10. Vecindad de a y obtención de la mediana. [25]. ............................................ 19
Figura 11. Cuatro tipos básicos de imágenes obscuro, luz suave, bajo contraste y alto
contraste y su correspondiente histograma [26] .............................................................. 20
Figura 12. Ejemplo de algunas operaciones morfológicas [27]......................................... 21
Figura 13. Convolución discreta. El pixel central del kernel y el pixel objetivo en la
imagen son indicados de color gris oscuro. Una vez realizado la suma de los pesos, este
valor es utilizado como filtro del pixel objetivo 35. [28].................................................. 23

VIII
Figura 14. La frontera de decisión debe estar tan lejos de los datos de ambas clases como
sea posible [29]. .............................................................................................................. 23
Figura 15. Caso linealmente separable [29]. ................................................................... 24
Figura 16. Se muestran algunas de las imágenes que contiene la base de datos
DIARETDB1. ................................................................................................................ 27
Figura 17. Imagen con iluminación no uniforme debido tanto al ángulo con que se incide
como a la forma esférica de la retina.............................................................................. 27
Figura 18. Imagen desenfocada lo cual dificultad el procesamiento de la misma............ 28
Figura 19. (Superior) Estas preparaciones muestran daños capilares y microaneurismas.
(Superior izquierda) Hay pequeñas áreas de pérdida de capilaridad, muchos de los
capilares son acelulares; pequeños microaneurismas se pueden observar y más
hipercélulas capilares. (Superior derecha) microaneurismas de manera más marcada.
(Inferior) Inyección de tinta Indian mostrando bucles capilares y microaneurismas. [32] 29
Figura 20. Ejemplos de diferentes categorías de microaneurismas indicadas por expertos.
Las dos imágenes por columna representan la misma categoría. (a) Sutiles. (b)
Regulares. (c) Obvios. (d) Cercanos a las venas [31]. ..................................................... 29
Figura 21. Se muestra la parte de una vena en donde existe variación de intensidad de
los valores de los pixeles. ................................................................................................ 30
Figura 22. Proceso de detección de microaneurismas ..................................................... 31
Figura 23. Imagen (plano G) utilizada para la demostración del uso de distintos espacios
de color para el mejoramiento del contraste y la iluminación de las imágenes. .............. 32
Figura 24. Transformación de la imagen de la Figura 23 al espacio de color L*a*b
(superior izquierda). Donde “L” es la imagen superior derecha, “a” la inferior izquierda y
“b” inferior derecha. ....................................................................................................... 33
Figura 25. Se muestra el espacio de color HSV en sus diferentes planos H (matiz,
superior derecha), S (saturación, inferior izquierda), V (Color, inferior derecha). .......... 34
IX
Figura 26. Plano de proporción (izquierda) creado a partir de la división de los valores
pixel a pixel del plano G entre el plano R. Así mismo a modo de comparación se muestra
el plano G (derecha). Cada uno de estos planos con sus respectivos histogramas. ......... 35
Figura 27. Espacio de color diseñado a partir del plano L, plano G/R y un plano nulo. 36
Figura 28. Comparación entre el espacio de color RGB (izquierda) y la unión de los
planos L, proporción y plano nulo (derecha). ................................................................. 36
Figura 29. Imágenes de prueba donde se remueve parte del ruido utilizando dos tipos de
filtros. filtro Gausiano (Wiener), imagen sin filtrar y filtro de mediana. ........................ 37
Figura 30. Comparación entre el uso del filtro de mediana (izquierda) y sin utilizar el
mismo (derecha). Asimismo se muestra el histograma para demostrar la disminución de
ruido, el cual se encuentra principalmente en los valores altos y bajos de la imagen. ..... 37
Figura 31. Segmentación de la imagen de fondo de ojo utilizando el método del valor
umbral. .......................................................................................................................... 39
Figura 32. Resultado de aplicar el método de valor umbral por ventana a una imagen de
fondo de ojo. .................................................................................................................. 40
Figura 33. Generación de múltiples capas basados en el método del valor umbral. ........ 41
Figura 34. Representación geométrica de una elipse. ..................................................... 42
Figura 35. En la imagen se muestra a un segmento de un vaso sanguíneo antes de aplicar
valor umbral (derecha) y después de aplicar (izquierda). Este segmento fue clasificado
como candidato a microaneurisma debido a que su excentricidad fue menor a 0.6. ....... 42
Figura 36. En la imagen de la derecha se muestra un segmento de un vaso sanguíneo que
demuestra la variabilidad de tonos que existen. En la izquierda se muestra parte del
segmento que comprende una ventana de 15 X 15. ........................................................ 43
Figura 37. Generación de una recta a partir del histograma acumulado (derecha) de un
microaneurisma (izquierda). ........................................................................................... 44
Figura 38. El resultado del entrenamiento de SVM utilizando un kernel lineal. ............. 45
X
Figura 39. Figura que ilustra la diferencia que existe en el conteo de objetos resultantes
de aplicar el valor umbral. ............................................................................................. 46
Figura 40. Entrenamiento de SVM utilizando un kernel con función gaussiana ............. 46
Figura 41. Prueba del clasificador utilizados un conjunto de imágenes de
microaneurismas. ........................................................................................................... 47
Figura 42. Muestra las regiones candidato indicadas en la base de datos. ..................... 49
Figura 43. Imagen promedio de 4 expertos correspondiendo el valor de intensidad más
alto a la concordancia de más expertos .......................................................................... 50
Figura 44. Marcas de expertos para la misma imágenes (los colores decodifican el nivel
de confianza del GT) a) original b) experto 1 c) experto 2 d) experto 3 e) experto 4 y f)
promedio de todos los expertos. [33] .............................................................................. 50
Figura 45. Eliminación de niveles de confianza con valores menores a 147. ................... 51
Figura 46. Desplazamiento del GT con respecto a un microaneurisma. ......................... 52
Figura 47. Imagen de fondo de ojo perteneciente a un paciente tratado con cirugía láser
(manchas negras) debido al algún tipo de lesión. ........................................................... 52
Figura 48. Imagen de candidatos sobre una imagen de fondo ojo (izquierda) y como
imagen binaria (derecha). .............................................................................................. 52
Figura 49. Curva FROC generada a partir de 81 imágenes de fondo de ojo. ................. 53
XI
Capítulo 1. Introducción.
El principio de la sabiduría es el temor al Señor;
Los necios desprecian la sabiduría y la enseñanza.
Proverbios 1:7
1.1. Marco teórico.
De acuerdo a la Federación Internacional de Diabetes (FDI), en 2011, 366 millones

de personas fueron diagnosticadas con diabetes; para el 2030 se espera que el número in-
cremente a 522 millones. El 80 % de las personas con diabetes viven en países de bajo y
mediano ingreso. Además, 183 millones de personas (50 %) con diabetes no son diagnosti-
cadas [1]. La diabetes puede aumentar el riesgo de contraer algún tipo de enfermedad de
los ojos; en particular la causa principal de la ceguera es la retinopatía diabética (RD) [2].
La RD provoca daños en los vasos sanguíneos dentro de la retina. Comúnmente,

afecta ambos ojos y puede llevar a la pérdida de visión progresiva si no es tratada. Más del
75 % de las personas que han tenido diabetes por más de 20 años tendrán alguna forma de
RD [3]. La gran mayoría de pacientes que desarrollan RD no tienen síntomas hasta la úl-
tima etapa de la enfermedad, en donde podría ser muy tarde realizar un tratamiento efecti-
vo. Por lo tanto, la detección e intervención médica temprana es crítica.
Para diagnosticar la RD se realiza una retinografía, que consiste en la captura de

imágenes de la parte interna del ojo (retina); esta puede ser sin dilatar la pupila (no mi-
driáticos) o dilatando la pupila (midriáticos). Usualmente, los oftalmólogos reconocen la
retinopatía diabética basándose en características, tales como las áreas de los vasos sanguí-
neos, exudados, microaneurismas, hemorragias y textura [4]. Las hemorragias y microaneu-
rismas son las primeras lesiones observables que indican una retinopatía diabética y se les
conoce como lesiones rojas.
Debido al prolífico incremento en la diabetes, basándose en las actuales estimacio-

nes, un mínimo de 3 millones de personas necesitarán ser evaluadas cada día para el 2030
(35 exámenes por segundo). Sin embargo, de acuerdo al estudio realizado y publicado en
[5] y [6] de los 205,000 oftalmólogos que existen a nivel mundial la mitad se en-
cuentran en seis países (China, EEUU, Rusia, Japón, Brasil e India). También, se menciona
1
que existen 23 países que cuentan con menos de un oftalmólogo por cada millón de habi-
tantes; 30 con menos de cuatro; 48 países con menos de 25 para cada millón de personas;
74 con menos de 100 y sólo 18 países tienen más de 100 oftalmólogos por cada millón de
ciudadanos. Estos datos son importantes en dos vertientes: en la de los países subdesarro-
llados porque el nivel económico sigue siendo una desventaja que evita que exista y se for-
men pocos o ningún profesional de este ramo. En cuanto a los países desarrollados, el nivel
de crecimiento de la población que supera los 60 años dobla a la tasa de profesionales que
surgen cada año. Además, se espera que para el 2030 el número de oftalmólogos crezca
solo el 2 % mientras que el incremento de la población con diabetes sea del 54
% [2]. De igual manera, de acuerdo a [7] en 2012 se identificaron a 6.4 millones de adul-
tos mexicanos con diabetes, es decir, 9.2% de los adultos en México han recibido ya un
diagnóstico de diabetes. El total de personas adultas con diabetes podría ser incluso el do-
ble, de acuerdo a la evidencia previa sobre el porcentaje de diabéticos que no conocen su
condición. Del total de personas que se identificaron como diabéticas el 16% (poco
más de un millón) son del grupo que reportan no contar con protección en
salud. Asimismo, 14.2% (poco más de 900 mil), dijeron no haber acudido al
médico para el control de la diabetes en los 12 meses previos a la entrevista, es decir, se
puede considerar que no se encuentran en tratamiento y por lo tanto están retrasando
acciones de prevención de complicaciones. Por lo que se refiere a las complicaciones
más frecuentes relacionadas con la diabetes, del total de individuos que reportan
diagnóstico previo, 47.6% (3 millones) reportaron visión disminuida, 38% (2.4 mi-
llones) ardor, dolor o pérdida de sensibilidad en los pies, 13.9% (889 mil) daños en la
retina. Por gravedad, 2% (128 mil) reportaron amputaciones, 1.4% (89 mil) diálisis, 2.8%
(182 mil) infartos, esto se puede observar en la Figura 1.
Figura 1.Complicaciones reportadas por diabéticos. México, [7].
En la gráfica de la Figura 1, se puede observar que las complicaciones más frecuen-

tes son las oculares; visión disminuida, daño en la retina y pérdida de la vista. Estas com-
plicaciones son prevenibles si se realizan exámenes de prevención oportunamente. Sin
2
embargo, el número de oftalmólogos en México es solo de 3,500, es decir, 31 oftalmólogos
por millón de personas. Aún más, el examen puede ser tardado, entre 30 a 45 minutos por
ojo, además de molesto por la necesidad de la dilatación de pupila que aún se realiza en la
mayoría de las instituciones públicas.
Por esta razón es necesario el desarrollo de un sistema automático de pre-

diagnóstico, el cual realice una evaluación rápida de la retina. Indicando de esta manera si
existe o no algún tipo de lesión de importancia que deba ser tratada por un especialista.
Además, el algoritmo de detección y clasificación de lesiones deberá ser sencillo para facili-
tar su posterior masificación. Por lo que la simplificación del pre-diagnóstico, diagnóstico
preliminar y temprano se beneficiará de algoritmos que demanden menos recursos compu-
tacionales.
1.2. Enunciado del problema
En resumen, la única forma de diagnosticar la retinopatía diabética no proliferativa

es el estudio de imágenes de fondo ojo. Además, el crecimiento en el número de oftalmólo-
gos es mucho menor que el crecimiento de diabéticos. Por tal motivo, el presente trabajo se
enfoca en el desarrollo de un algoritmo, que sea capaz de detectar microaneurismas que
sean visibles en imágenes de fondo ojo. También, el algoritmo estará basado en técnicas de
procesamiento en color buscando el uso de operaciones sencillas en los bloques de proce-
samiento. Contrastando con la mayoría de los algoritmos existentes que utilizan procesa-
miento en escala de grises y con un considerable número de operaciones no aritméticas en
sus bloques del proceso. Lo anterior, favorece la futura implementación en dispositivos de
pre diagnostico autónomos que ayudarán a reducir el número de personas que acuden a un
oftalmólogo sin retinopatía diabética aparente. Ayudando así, tanto al oftalmólogo, redu-
ciendo el número de personas que acuden a él, como a al paciente en la facilidad de reali-
zarse exámenes para la prevención de complicaciones oculares causadas por la diabetes.
1.3. Revisión del Estado del arte.
De acuerdo a [8] y [9], la detección de lesiones en imágenes de fondo de ojo en color

se realiza en dos grandes etapas:
 Extracción de candidatos
 Clasificación
La mayor parte de los algoritmos actuales realizan el procesamiento utilizando solo

el canal verde de la imagen RGB. La primera etapa requiere de un preprocesamiento para
reducir el ruido y mejorar el contraste. Después, el área roja de la imagen es extraída y
segmentada para ser los candidatos a lesiones rojas. Entonces, se aplica un algoritmo de
3
segmentación para la extracción de los vasos sanguíneos para reducir el número de falsos
positivos que pueden aparecer en el pre-procesamiento. Luego, se utiliza un análisis de ca-
racterísticas en el cual la extracción y selección de características es desempeñado en la
detección de lesiones rojas. En la segunda etapa, un algoritmo de clasificación es aplicado
para categorizar estas características dentro de candidatos a lesiones rojas (anormal) y no
candidatos a lesiones rojas (normal). La probabilidad es estimada para cada candidato
usando un clasificador y un conjunto de características específicas para representar las le-
siones rojas. En general el proceso de detección de lesiones rojas se muestra en la Figura 2.
Frecuentemente, para el preprocesamiento de la imágenes, se suelen utilizar técnicas

como CLAHE (Contrast-Limited Adaptive Histogram Equalization), corrección de ilumina-
ción y brillo, normalización, corrección de sombras, etc. En la extracción de candidatos se
suele ocupar técnicas de procesamiento morfológico, algoritmos de crecimiento de la región,
transformada Ondoleta (Wavelet), transformada de Radón, transformada Curvoleta (Cur-
velet), entre otras. Todas estas técnicas aplicadas comúnmente a imágenes en escala de
grises. Sin embargo, se ha observado que las lesiones pueden distinguirse por color, tamaño
y forma.
Para tener una base de comparación, en los últimos años se han utilizado gráficas
ROC (acrónimo de Receiver Operating Characteristic, o Característica Operativa del Re-
ceptor), con pequeñas modificaciones.
Figura 2. Proceso de detección de lesiones rojas
4
De manera de resumen en la Tabla 1 se muestran los objetivos, resultados y desven-
tajas de los artículos más referenciados en esta área. Hay que mencionar que algunos ar-
tículos solo hacen mención de los resultados que se obtuvieron más no de las fallas de los
mismos, incluso algunos no reportan la sensibilidad o especificidad de los algoritmos. Tam-
bién, es importante señalar que aún no existe una base de datos estándar que funcione co-
mo base de comparación. No obstante, en los últimos se han desarrollados bases de datos
que pueden ser utilizadas para estandarizar los resultados. Aun así, no todos los artículos
que se mencionan a continuación utilizan alguna de estas bases de datos.
Año Ref. Objetivos Resultados Desventajas

Especificadas
1984 [10] Detección de microaneu- Los resultados obtenidos Uso de fluorangiografía.
rismas en imágenes de en la detección de forma Pocas imágenes.
fluorangiografía utili- automática, son similares El tiempo de procesa-
zando métodos morfoló- a los obtenidos de forma miento es muy lento, 15
gicos. manual. El coeficiente de minutos
correlación entre estas dos
formas se encuentra entre
0.687 y 0.725. No se pre-
senta ningún factor de
sensibilidad.
1992 [11] Detección y cuantifica- Con respecto al anterior Uso de fluorangiografía.
ción en imágenes digita- artículo, mejora el tiempo Para mejores resultados,
les de fluorangiografía de procesamiento. Se ob- es necesario obtener una
utilizando filtros adapta- tuvieron mejores resulta- imagen amplifica por lo
tivos. dos al utilizar una imagen menos 4 veces.
amplificada 4 veces. Se
presenta una gráfica de
sensibilidad contra número
de falsos positivos.
1996 [12] Detección y delineado de Se alcanzó un nivel de Uso de fluorangiografía.
microaneurismas en sensibilidad de 82 %. Esto Existe un conflicto con
imágenes digitales de indica que no se lograron los niveles de umbral;
fluorangiografía. Se di- detectar 13 microaneuris- bajo umbral alta sensibi-
vide en tres etapas, pre- mas del total de 13 imá- lidad (verdaderos positi-
procesamiento, extrac- genes. 4 microaneurismas vos) y alto umbral alta
ción de candidatos y se perdieron al mezclarse especificidad (falsos posi-
conteo. Para la primera con lesiones adyacentes; 4 tivos).
5
etapa se utiliza la co- eran demasiado grandes y Consumo de recursos
rrección de iluminación difusos. Una conglomera- computacionales
y corrección de tonos. ción de 3 era demasiado
En la segunda etapa, se grande para ser detectado;
utiliza filtros adaptati- y una conglomeración de
vos, transformación “top dos era demasiado linear
hat” bilineal, nivel de para segmentar.
grises con umbral, un
algoritmo de crecimien-
to. Por último, en la
tercera etapa, se realiza
un análisis de los candi-
datos.
1997 [13] La detección de microa- El valor de sensibilidad es Uso de fluorangiografía.
neurismas se hizo de de 82 %. La mejora que se Existe un conflicto con
forma similar al artículo obtuvo fue en velocidad y los niveles de umbral;
anterior pero modifican- en no requerir la interven- bajo umbral alta sensibi-
do los parámetros de ción humana. lidad (verdaderos positi-
intensidad. vos) y alto umbral alta
especificidad (falsos posi-
tivos).
2000 [14] Candidatos a microa- El programa obtuvo un El nivel de sensibilidad

neurismas son extraídos, porcentaje de sensibilidad es demasiado bajo para
después de que la ima- del 81 % y una especifici- ser implementado como
gen ha sido modificada dad del 93 % para la de- herramienta de diagnós-
para remover variaciones tección de imágenes que tico al igual que la es-
en la intensidad del fon- contienen microaneuris- pecificidad.
do, por un algoritmo mas. El programa obtuvo
que mejora las caracte- una sensibilidad del 85 %
rísticas redondas. En- y una especificidad del 76
tonces, cada candidato % para la detección de
es clasificado de acuerdo pacientes con cualquier
a su intensidad y tama- tipo de retinopatía.
ño por la aplicación del
conjunto de reglas deri-
vadas de un conjunto de
entrenamiento de 102
imágenes.
6
2002 [15] Preprocesamiento de El algoritmo para la de- No especificadas
imágenes a color. Siste- tección de exudados duros
ma automático en la fue aplicado a 30 imágenes
detección de lugares de retina de las cuales solo
destacados (disco óptico, 21 contenían exudados. La
vasos sanguíneos y fó- sensibilidad y la especifi-
vea). Algoritmos de cidad para la detección de
segmentación recursiva exudados fue del 88.5 % y
del crecimiento de la 99.7 %, respectivamente,
región combinada con la comparado con la de un
técnica “Moat Opera- oftalmológico. Para la
tor” detección de hemorragias
y microaneurismas se uti-
lizaron 14 imágenes. El
algoritmo obtuvo una
sensibilidad de 77.5 % y
una especificidad del 88.7
%.
2005 [16] Se divide en tres etapas: Se obtuvo una sensibilidad Lesiones grandes no son
preprocesamiento, donde del 100 % por imagen con siempre segmentadas por
se utilizan las técnicas una especificidad del 87 el algoritmo de creci-
vistas en Spencer y %. El sistema hibrido fue miento de la región. El
Frame pero con peque- el que mejores resultados tiempo de análisis es de
ñas modificaciones. Ex- obtuvo, ya que logró ex- aproximadamente 15
tracción de candidatos, traer 14906 candidatos minutos por imagen.
de la misma manera se faltando de extraer 33 Esto es utilizando un
utilizaron las técnicas de (9.48%) lesiones. procesador Pentium IV.
extracción que presenta El mayor tiempo se con-
Spencer y Frame. En la sume en la clasificación
clasificación, se utilizó la de pixeles.
técnica de clasificación
por pixeles.
2006 [17] Al igual que los anterio- Se obtuvo una sensibilidad El tiempo de ejecución
res se dividen en tres del 85.4 % y una especifi- es lento. La sensibilidad
etapas principales, pre- cidad del 83.1 %. El tiem- y la especificidad son
procesamiento, detec- po de ejecución fue entre bajos para ser utilizados
ción de candidatos y de 58 y 100 s. como herramientas de
clasificación. El prepro- diagnóstico.
cesamiento involucra la
7
normalización de con-
traste. En la etapa de
detección de candidatos,
se utilizan las técnicas
de crecimiento de la
región, operación de top-
hat, normalización de
contraste de las caracte-
rísticas, y la exclusión
de los vasos.
2007 [18] El propósito de este Se menciona la importan- Detección exclusiva de
artículo es la detección cia de establecer una base microaneurismas, al me-
de microaneurismas. de datos estándar, que nos se requiere identifi-
Para la detección se contenga anotación. Tam- car una lesión más para
utilizaron 4 etapas: pre- bién, se indica que han ser clínicamente acepta-
procesamiento, detección observado que la sensibili- ble.
de candidatos, extrac- dad decrece cuando exis-
ción de características y ten más de 20 microaneu-
clasificación de candida- rismas. Se obtuvo una
tos. Se desarrolló un sensibilidad del 89% y un
segundo algoritmo don- promedio de 2.92 falsos
de se agregó una etapa positivos por imagen. Al
de pos procesamiento agregar la etapa de pos
durante la clasificación. procesamiento se obtuvo
Este pos procesamiento una sensibilidad del 88.47
realiza la segmentación % con un promedio de
de los vasos sanguíneos. 2.17 falsos positivos.
2008 [19] Detección de microaneu- Para imágenes a color se Detección exclusiva de
rismas por la coinciden- obtuvo una sensibilidad de microaneurismas, al me-
cia de una plantilla de 83.62% para una base de nos se requiere identifi-
una lesión con las sub datos de aprendizaje de 3 car una lesión más para
bandas obtenidas al imágenes con 39 lesiones. ser clínicamente acepta-
aplicar la transformada Además, se obtuvo una ble.
wavelet a la imagen sensibilidad del 82.94 %
para una base de datos de
validación con 32 imáge-
nes y con 761 lesiones.
2010 [20] Detección de lesiones Se experimentó con un Consumo de tiempo alto,
rojas. Para evitar que la total de 89 imágenes y aproximadamente 3 mi-
8
fóvea sea considerada solo se reporta que se ob- nutos por imagen.
como una lesión roja se tuvo una sensibilidad de
aplica una ecualización 94 % y una especificidad
de iluminación y es apli- del 87 %.
cada al canal verde de la
imagen. En la siguiente
etapa, se aplica la trans-
formada digital Curvelet
para producir una mejo-
ra en la imagen y modi-
ficando los coeficientes
de la transformada se
logra separar los objetos
rojos. Entonces, se sepa-
ran estas lesiones como
candidatos. Finalmente,
se extrae la estructura
de los vasos sanguíneos
y los falsos positivos son
eliminados substrayendo
la estructura de los va-
sos sanguíneos de la
imagen de candidatos.
2011 [21] Detección de hemorra- Se reporta una sensibili- Solo se detecta un tipo
gias. Primero se aplica dad de 85 % y un prome- de lesión. El número de
un pre procesamiento, dio de 4 falsos positivos falsos positivos por ima-
corrección de brillo y por imagen. gen no es bajo.
contraste. Después, se
utiliza un plantilla de
coincidencia con una
correlacion de coinciden-
cia. Entonces, se extraen
los candidatos a hemo-
rragias. También, se
realiza el crecimiento de
la región para recons-
truir la forma de la he-
morragia y calcular el
tamaño de la lesión. Se
9
utilizaron técnicas para
la reducción de falsos
positivos como, filtros
para la fóvea.
2012 [22] Detección de microaneu- No se especifica No especificadas
rismas a través del perfil
de rotación local de la
sección transversal cen-
trada en el máximo local
de pixeles del pre proce-
samiento. La detección
de picos es aplicada a
cada perfil y un conjun-
to de atributos como
tamaño, altura y forma
del pico son calculados.
Las medidas estadísticas
de estos atributos así
como los cambios de
orientación de la sección
transversal constituyen
el conjunto de caracte-
rísticas para el clasifica-
dor bayesiano.
Tabla 1. Resumen general del estado del arte en orden cronológico.
Una de las principales dificultades y limitaciones que se presentan para realizar una
apropiada detección en este tipo de imágenes, es debido a las propiedades originales de la
imagen como son: contraste, iluminación, color de la región de interés, etc. Estos efectos no
deseados se deben a los distintos tipos de equipos con que se realiza la toma, así como el
ambiente o contexto en que se realiza la toma de la imagen. También, las dificultades que
se encuentran en las imágenes de fondo de ojo se deben a distintos factores como son: la
fuerte correlación entre la pigmentación de la piel y el color de iris, lo que provoca que el
color del fondo de ojo no sea único; poco contraste; los niveles de iluminación disminuyen
conforme se aleja del disco óptico, etc. De lo anterior, se pretende que el sistema sea tole-
rante a diversos contextos de la toma de la imagen de fondo de ojo. Mejorar la dependencia
de los diferentes contextos de toma de la imagen se pueden lograr al utilizar por lo menos
dos canales de colores para el análisis. Del trabajo preliminar realizado y de las distintas
referencias consultadas, se observa que los canales rojo (R) y verde (G) contiene la mayor
10
parte de la información de la imagen, esto se debe a la naturaleza de la imágenes ya que el
rango de colores es pobre en tonos azules. En la Figura 3, se muestra la representación es-
quemática de la estructura interna del ojo. Después de que entra a través de la córnea, la
luz atraviesa la zona intra-ocular media que consiste del cristalino y el humor vítreo. La
absorción en esta capa ocurre primeramente debido a los pigmentos del cristalino [23] la
cual absorbe mayormente en la región azul del espectro visible. La luz pasa de la zona in-
tra-ocular media a las capa de receptores a través de la membrana interna limitadora
(ILM). Después de pasar la capa de receptores, la luz entra en el fondo posterior. Esta
comprende tres capas: el epitelio pigmentario retiniano (RPE), las coroides y la esclerótica.
La reflexión y absorción de la luz depende particularmente de los pigmento melanina y
hemoglobina. De acuerdo a esto, los coeficientes de absorción de la melanina y hemoglobina
son más altos para la luz azul que para otras longitudes de onda. Además, la luz azul es
reflejada con menor intensidad en las coroides y en el pigmento epitelial retiniano. Asimis-
mo, la luz verde es mayormente reflejada por el pigmento epitelial retiniano y las coroides,
aunque no es reflejada tanto como la luz roja. Esta es la razón por la cual las imágenes de
fondo de ojo aparecen rojizas. Esto se puede observar mejor en las imágenes de las Figura
4 y Figura 5
Figura 3. Trayectoria de la luz que es remitida por el fondo ocular. [23].
11
a) b)
Figura 4. Comparación entre: a) una imagen con los tres canales de colores RGB y b)
imagen con solo los canales RG, siendo el tercer canal nulo.
a) b)
c)
Figura 5. Comparación entre los tres canales de colores individuales; a) canal rojo, b) ca-
nal verde, c) canal azul.
12
1.3.1 Curvas ROC
Siempre que una cuestión clínica y el resultado de la prueba diagnóstica encamina-

da a resolverla puedan plantearse en términos de dicotomía (presencia o ausencia de enfer-
medad; positivo o negativo), la exactitud de la prueba puede definirse en función de su
sensibilidad y especificidad diagnósticas. Sin embargo, con mucha frecuencia los resultados
de las pruebas diagnósticas están distribuidos en una escala continua, por lo que es necesa-
rio seleccionar un punto de corte o valor límite adecuado que permita resumir estos resul-
tados en dos categorías: positivo y negativo.
Las curvas ROC (Receiver Operating Characteristic) aportan notables ventajas

frente al error de clasificación, por lo que su uso está ampliamente extendido en problemas
de clasificación binarios. Un caso particular son las aplicaciones médicas. En dichas aplica-
ciones es habitual que, a partir del resultado de cierta prueba, se deba emitir un diagnósti-
co que será, de forma genérica “paciente sano” o “paciente enfermo”.
Supongamos que en lugar de tener un resultado categórico, tenemos una estimación

de que el resultado sea “paciente sano” o “paciente enfermo”. En nuestro caso, el valor es el
resultado de la función de clasificación (cuanto más elevado, mayor probabilidad de clasifi-
cación correcta). En otros casos este valor puede ser el resultado de un test, o incluso po-
dría ser (para el caso humano) un valor no numérico, en términos de sospecha.
Cuando consideramos los resultados de un test en particular sobre dos poblaciones,

una con cierta enfermedad y otra sana, raramente se observa una separación perfecta entre
ambos grupos. La distribución de los resultados, tendrá habitualmente un solapamiento. En
la Figura 6 se muestra una hipotética distribución de probabilidad de las clases “sano” y
“enfermo” respecto al umbral de confianza de un determinado test. Debido al solapamiento
existente entre la distribución de ambas poblaciones, se producirán inevitablemente errores
de clasificación cuando emitamos un diagnóstico. En este caso, dado un umbral, la salida de
nuestro clasificador será paciente sano o enfermo en función de la puntuación del valor del
discriminante. En base a dicha clasificación, se definen los siguientes conceptos:
Verdadero Positivo (V P): Paciente enfermo diagnosticado como enfermo.
Falso Positivo (FP): Paciente sano diagnosticado como enfermo.
Verdadero Negativo (V N): Paciente sano diagnosticado como sano.
Falso Negativo (FN): Paciente enfermo diagnosticado como sano.
13
Figura 6. Distribución de probabilidad de los pacientes con y sin enfermedad, en función
del resultado del test.
Si desplazamos el umbral de confianza (línea vertical) hacia la derecha (valores ma-

yores del discriminante) disminuyen los falsos positivos, pero aumentan los falsos negativos,
o lo que es lo mismo, disminuyen los VP. Por el contrario, si se desplaza hacia la izquierda,
aumentarán los falsos positivos al tiempo que disminuyen los falsos negativos y aumentan
también los VP.
Habitualmente para hablar del rendimiento de un clasificador se emplean los térmi-

nos sensibilidad y especificidad.
Sensibilidad para referirse a la fracción de verdaderos positivos (FVP), esto es, la

probabilidad de clasificar correctamente a un individuo enfermo. La sensibilidad, por tanto,
mide la capacidad del test para detectar la enfermedad.
La sensibilidad se puede calcular a partir de la siguiente relación:
=
( + )
Especificidad para referirse a la fracción de verdaderos negativos (FVN), esto es,

la probabilidad de clasificar correctamente a un individuo sano. La especificidad, por tan-
to, mide la capacidad del test para detectar los pacientes sanos.
=
( + )
Un test muy sensible será aquel que detecta con una alta probabilidad a todos los
pacientes enfermos, aunque sea a costa de cometer más errores de falsos positivos. Por tan-
to, cuanto más bajo sea el umbral, más sensible será nuestro test. Por contra, un test será
más específico cuantos más pacientes sanos detecte, aunque sea a costa de cometer más
14
errores de falsos negativos. Dicho de otro modo, cuanto más alto sea el umbral, más especí-
fico será nuestro test.
Las curvas ROC se desarrollaron en los años cincuenta como herramientas para el
estudio de detección e interpretación de señales de radar. El objetivo de los operadores de
radar era distinguir las verdaderas señales del ruido de fondo. Si se observa la pantalla de
un receptor de radar Figura 7 puede verse cómo al variar la amplitud de la señal definida
para considerar un pico como misil, varían la sensibilidad y la especificidad del sistema de
recepción. Si I, II y III son señales emitidas por misiles, al situar la amplitud A como punto
de corte detectaremos los 3 misiles (sensibilidad 100 %), pero también consideraremos misi-
les señales que no lo son. Al cambiar el nivel de decisión a la amplitud B no consideraremos
misil ninguna señal de ruido (especificidad 100 %) pero no habremos detectado el misil lI,
por lo que la sensibilidad desciende. De la misma forma que en el receptor de radar se pro-
duce un solapamiento entre las verdaderas señales y el ruido, al realizar pruebas diagnósti-
cas existe un solapamiento entre los resultados de los pacientes con una condición particu-
lar y los de aquellos que no la tienen. Por este motivo, las aplicaciones de las curvas ROC
se extendieron a múltiples sistemas diagnósticos, incluidas las técnicas radiológicas y las
pruebas de laboratorio.
La curva ROC es un gráfico en el que se observan todos los pares sensibili-

dad/especificidad resultantes de la variación continua de los puntos de corte en todo el
rango de resultados observados. En el eje y de coordenadas se sitúa la sensibilidad o frac-
ción de verdaderos positivos. En el eje x se sitúa la fracción de falsos positivos o 1-
especificidad, definida como FP/VN + FP y calculada en el subgrupo no afectado. Algunos
autores sitúan en el eje x la especificidad, pero es lo menos frecuente.
El uso de las curvas ROC es adecuado para evaluar el rendimiento de clasificadores

binarios. Sin embargo, si el problema al que nos enfrentamos no es puramente de clasifica-
ción, sino de detección, entonces las curvas ROC no serán de utilidad. En este caso no se
trata simplemente de clasificar la imagen en su globalidad como negativa o positiva, sino
que hay que detectar, y localizar, si las hay, un número desconocido de anomalías. Si en un
problema de estas características consideramos que las muestras a clasificar son cada uno
de los píxeles que forman las imágenes de test y no las imágenes en sí, entonces nos encon-
traríamos ante un problema de clasificación binario, en el que cada píxel debería clasificarse
como negativo o positivo. De este modo sería posible (aunque no conveniente) evaluar el
rendimiento del clasificador mediante curvas ROC. El inconveniente de utilizar las curvas
ROC en este caso esta, como ya se ha comentado, en calcular el número VN que además es
en comparación con VP enorme.
Un método alternativo para evaluar el rendimiento de un sistema de detección de

objetos en imágenes, consiste en determinar el número de falsos positivos (FP) que se pro-
15
ducen en cada imagen (relacionado con VN). Normalmente, el clasificador tendrá algún
parámetro que permita variar la sensibilidad del mismo, de modo que podremos aumentar
o disminuir la tasa de FP variando dicho parámetro (a consta, claro está, de aumentar o
disminuir la tasa de verdaderos positivos).
Figura 7. Señales registradas en un receptor de radar; I, II y III corresponden a misiles.

[24]
Figura 8. Curva ROC [24]
Una curva FROC (Free Response Operating Characteristic) muestra la relación en-
tre sensibilidad (fracción de verdaderos positivos) y la tasa media de falsos positivos por
imagen, para distintos valores del parámetro D. Cada valor de D produce un punto de ope-
ración del sistema que se representa en la curva. Este es un método muy apropiado para
medir el rendimiento del sistema y encontrar un compromiso entre la tasa de aciertos y la
de fallos. En la Figura 9 se muestra un ejemplo de una curva FROC. En este caso puede
observarse que, cometiendo una media de 2 falsos positivos por imagen, se lograría detectar
correctamente el 80% de los objetos buscados.
16
Figura 9. Ejemplo de curva FROC, para un error medio de 2 falsos positivos por imagen,
a una sensibilidad del 80%.
17
Capítulo 2. Conceptos de procesamiento de
imágenes.
Si alguno de ustedes requiere de sabiduría,
pídasela a Dios, y él se la dará, pues
Dios se la da a todos en abundancia
y sin hacer ningún reproche.
Santiago 1:5
2.1. Filtro de mediana
Este tipo de filtro pertenece a la categoría de filtros espaciales no lineales. Está ba-
sado en el ordenamiento de los pixeles contenidos en una área de la imagen abarcada por el
filtro, y entonces reemplazando el valor del pixel del centro con la mediana del conjunto de
valores de intensidad de los pixeles vecinos de dicho pixel, incluyendo el centro. El filtro de
mediana es popular porque, para ciertos tipos de ruidos, produce una excelente reducción
de ruido, con considerablemente menos desenfoque que los filtros lineales de tamaño simi-
lar. Los filtros de mediana son particularmente efectivos en la presencia de ruido impulso,
también llamado ruido de sal y pimienta porque estos aparecen como puntos blancos y
negros superpuestos sobre una imagen.
El filtro de mediana es análogo al promediado espacial, pero en vez de realizar el

promediado de los pixeles de la ventana, se calcula la mediana. La mediana se obtiene or-
denando los valores contenidos en la ventana (ordenación natural) y escogiendo el valor
central. En el caso en que el número de pixeles contenidos en la ventana sea par, se realiza
la media entre los dos valores centrales. De tal manera que se define como
( , )= { ( − , − ), ( , ) }
Donde W es una ventana apropiada. En una secuencia de números , ,… la

mediana es aquel valor que cumple que (N-1)/2 elementos tienen un valor menor o igual a
ella, y que (N-1)/2 tiene un valor mayor o menor que la mediana. La mediana se obtiene
ordenando las intensidades de los pixeles de menor a mayor, y el píxel que se encuentra en
(N-1)/2 es la mediana, tal como se aprecia en la Figura 10. A continuación se muestra
cómo el filtrado por la mediana puede eliminar un valor.
18
= [0,0,0,0,255,0,0,0,0]
Al calcular la mediana, se puede observar que el valor del pixel central 255 será
remplazado por un cero (mediana).
Figura 10. Vecindad de a y obtención de la mediana. [25].
2.2 Histograma
El histograma de una imagen es la representación del número de pixeles que posee

un determinado nivel de gris, para todos los niveles de gris posibles de la imagen. Las fun-
ciones de mejora basadas en el histograma son principalmente la ecualización y la especifi-
cación del histograma. [25]
En la ecualización del histograma, el objetivo es obtener en la imagen de salida un

histograma uniforme, mientras que en la especificación del histograma se fuerza a la imagen
de salida a tener un determinado histograma. Otra aplicación del histograma es como he-
rramienta de análisis de imágenes.
El histograma de una imagen digital con valores de gris dentro del rango [0, − 1]
es una función discreta ℎ( ) = , donde es el k-ésimo nivel de gris y es el número
de pixeles de la imagen que tienen el nivel de gris Es práctica común normalizar el his-
tograma dividiendo cada uno de sus valores por el número total de pixeles en la imagen,
denotado como n, como sigue: ( ) = / . En términos generales, ( ) es un estimado
de la probabilidad de ocurrencia del nivel de gris . La suma de todos los componentes de
un histograma normalizado es = 1.
El histograma es la base de numerosas técnicas de procesamiento de la imagen en el

dominio espacial. La manipulación del histograma puede utilizarse eficazmente para el real-
ce de la imagen, como se mostrará aquí. Además, veremos más adelante que la información
inherente en el histograma también puede ser utilizada en otras aplicaciones útiles como
compresión de imágenes y segmentación. Los histogramas son muy fáciles de calcular por lo
que es una herramienta candidata a ser calculada en tiempo-real.
19
En la Figura 11, se muestra una imagen con diferentes histogramas. Al lado derecho
de cada imagen se muestra su histograma. El eje horizontal corresponde a los valores de
niveles de gris . El eje vertical corresponde a los valores de ℎ( ) = o bien, ( ) =
/ si los valores están normalizados.
Figura 11. Cuatro tipos básicos de imágenes obscuro, luz suave, bajo contraste y alto
contraste y su correspondiente histograma [26]
2.3 Operaciones morfológicas
Morfología, en el contexto de procesamiento de imágenes, significa el estudio de la

topología o estructura de objetos de la imagen. El procesamiento morfológico se refiere a
ciertas operaciones donde un objeto es afectado con un elemento estructural y de eso modo
se reduce a una forma más reveladora.
20
Existen dos operaciones morfológicas básicas, erosión y dilatación [27]. Suponga
un objeto y el elemento estructural que son representados como un conjunto en un
espacio Euclidiano de dos dimensiones. Sea que denota la translación de tal que el
origen está localizado en . Entonces la erosión de por está definido por el conjunto de
todos los puntos tal que está incluido en , esto es,
ó : ⊝ ≜{ : ⊂ }
Similarmente, la dilatación de por es definida como el conjunto de todos los

puntos tal que afecta a , esto es, que no tienen una intersección vacía:
ó : ⨁ ≜{ : ∩ ≠ }
La Figura 12 muestra ejemplos de la erosión y dilatación. Claramente, la erosión es

una operación de reducción, mientras que la dilatación es una operación de expasión. Tam-
bién, la erosión de un objeto está acompañada por la expansión o dilatación del fondo.
Figura 12. Ejemplo de algunas operaciones morfológicas [27].
De estas dos transformaciones se derivan otras como son: opening, closing y hit-
miss. Esta última, prueba si la estructura pertenece o no a y pertenece a ,
donde denota el complemento de ; el conjunto de pixeles en que pertenecen al
21
objeto deseado; son el conjunto del fondo. Un ejemplo del uso de esta transformada se
muestra en la Figura 12.
2.4 Convolución espacial.
La convolución en el procesamiento de imágenes es de suma importancia por dos

principales razones:
1. Un gran número del proceso de formación de imágenes (y, de hecho, procedimientos

de medición en general) son descritos por el proceso de convolución. De hecho, si un
sistema es tanto lineal como invariante al cambio, entonces la formación de la ima-
gen es necesariamente descrita por convolución.
2. El teorema de convolución permite visualizar y entender el proceso de convolución
en el dominio espacial de frecuencia. Esta formulación del dominio de frecuencia
equivalente provee un poderoso marco matemático para entender profundamente
tanto la formación como el procesamiento de la imagen. [28]
En el procesamiento de imágenes digitales, las señales son discretas y no conti-

nuas. Bajo estas condiciones, la convolución de dos funciones se alcanza discretizando la
integral de convolución. En el caso simple 1-D, esto se convierte en
[ ]∗ [ ]= [ ] [ − ]
En dos dimensiones, la convolución se puede describir de la siguiente manera
( , )= ( , ) ( − + 1, − + 1)
Donde = + − 1 y se ha asumido que F y H son cero fuera del rango de

sus índices. La función de convolución o filtrado está dada por la combinación de los
pesos de todos los pixeles que cae dentro de la matriz filtro (filter kernel). Un ejemplo
del uso del uso de la convolución se muestra en
22
Figura 13. Convolución discreta. El pixel central del kernel y el pixel objetivo en la ima-
gen son indicados de color gris oscuro. Una vez realizado la suma de los pesos, este valor es utili-
zado como filtro del pixel objetivo 35. [28]
2.5. Máquina de soporte vectorial
La teoría de las Máquinas de Soporte Vectorial (SVM por su nombre en inglés

Support Vector Machines) es una técnica de clasificación y ha tomado mucha atención en
años recientes. En muchas aplicaciones, las SVM han mostrado tener gran desempeño, más
que las máquinas de aprendizaje tradicional como las redes neuronales [29] y han sido in-
troducidas como herramientas para resolver problemas de clasificación.
Una SVM primero mapea los puntos de entrada a un espacio de características de

una dimensión mayor (i.e.: si los puntos de entrada están en ℜ entonces son mapeados por
la SVM a ℜ ) y encuentra un hiperplano que los separe y maximice el márgen m entre las
clases en este espacio tal como se aprecia en la Figura 14.
Figura 14. La frontera de decisión debe estar tan lejos de los datos de ambas clases como
sea posible [29].
23
Maximizar el margen m es un problema de programación cuadrática (QP) y puede
ser resuelto por su problema dual introduciendo multiplicadores de LaGrange. Sin ningún
conocimiento del mapeo, la SVM encuentra el hiperplano óptimo utilizando el producto
punto con funciones en el espacio de características que son llamadas kernels. La solución
del hiperplano óptimo puede ser escrita como la combinación de unos pocos puntos de en-
trada que son llamados vectores de soporte. Existen dos casos, linealmente separables y no
linealmente separables.
2.5.1. Caso linealmente separable
Supongamos que nos han dado un conjunto S de puntos etiquetados para entre-
namiento como se aprecia en la Figura 15.
( , ), . . . , ( , ) (1)
Figura 15. Caso linealmente separable [29].
Cada punto de entrenamiento ℜ pertenece a alguna de dos clases y se le ha

dado una etiqueta {−1,1} para = 1,2,3, … , . En la mayoría de los casos, la búsqueda
de un hiperplano adecuado en un espacio de entrada es demasiado restrictivo para ser de
uso práctico. Una solución a esta situación es mapear el espacio de entrada en un espacio
de características de una dimensión mayor y buscar el hiperplano óptimo. Sea = ( ) la
notación del correspondiente vector en el espacio de características con un mapeo ℜ
a un espacio de características Z. Deseamos encontrar el hiperplano.
∙ + =0
Definido por el par (w, b), tal que podamos separar el punto de acuerdo a la fun-
ción
1 =1
( )= ( ∙ + )=
−1 = −1
Donde y ℜ. Más precisamente, el conjunto S se dice que es linealmente separable

si existe (w, b) tal que las inecuaciones sean válidas para todos los elementos del conjunto
24
S. Para el caso linealmente separable de S, podemos encontrar un único hiperplano óptimo,
para el cual, el margen entre las proyecciones de los puntos de entrenamiento de dos dife-
rentes clases es maximizado.
( ∙ + )≥1 =1
= 1,2,3, … , .
( ∙ + ) ≥ −1 = −1
25
Capítulo 3. Antecedentes
Porque el Señor da la sabiduría; conocimiento y ciencia brotan de sus labios.
Proverbios 2:6
El banco de imágenes que se utilizó en este trabajo proviene de una base de datos
pública: Diabetic Retinopathy Database, DIARETDB1. Asimismo, esta base contiene imá-
genes de evaluación de varios expertos: Ground Truth (GT). Durante este capítulo solo
trataremos sobre las imágenes de prueba de fondo de ojo. En el capítulo 5 se explicará con
más detalle sobre las imágenes de evaluación.
Algunos ejemplos de las imágenes de prueba se muestran en la Figura 16. Las imá-
genes de la base de datos se encuentran en el espacio RGB (Red, Green, Blue). Aunque, se
debe mencionar que en la mayoría de la imágenes, el plano B contiene muy poca informa-
ción. Por esta razón, en la mayor parte de la literatura este canal se descarta. La ausencia
de información en el plano B se explicó con en el Capítulo 1.
26
Figura 16. Se muestran algunas de las imágenes que contiene la base de datos DIA-
RETDB1.
3.1. Base de datos DIARETDB1.
Como se puede observar en las imágenes que se muestran en la Figura 16, uno de
los problemas es la poca uniformidad de las imágenes. Es decir que las imágenes fueron
capturadas con diferentes condiciones. Por ejemplo, en algunas imágenes se observan pro-
blemas de iluminación debido a la difusión no uniforme de la luz en la retina. Uno de los
problemas con respecto a la iluminación se debe a la forma de la retina, la cual es muy
cercana a la de una esfera, lo que produce que la luz emitida sobre la retina no se refleje
uniformemente. Otro problema común con respecto a la iluminación se relaciona al ángulo
con el cual se incide luz sobre la retina, ya que este ángulo cambiará la manera en que se
difumina la luz sobre la retina. Un ejemplo de una imagen con problemas de iluminación se
muestra en la Figura 17.
Figura 17. Imagen con iluminación no uniforme debido tanto al ángulo con que se incide
como a la forma esférica de la retina.
Asimismo, se observa que el ángulo con el cual se tomó la imagen no siempre es el

mismo, esto se comprueba al observar el nervio óptico el cual no mantiene una posición
específica en toda la base de datos. Otro problema relacionado con la toma de la imagen
tiene que ver con el enfoque, en algunos casos la imagen puede estar fuera de foco como se
muestra en la Figura 18. Además, en algunos casos no todas las imágenes fueron tomadas
con la misma resolución y cámara. También, existe el problema de la pigmentación que
refleja el iris, ya que no siempre es la misma. Cómo se explicará más adelante es este capí-
tulo, estos problemas se intentan resolver en la etapa de preprocesamiento. Por esta razón
27
es que es necesaria una etapa de preprocesamiento en donde se corrijan en lo posible la
mayor cantidad de problemas. De acuerdo a [30], la mayor cantidad de literatura utiliza
algoritmos relacionados con el mejoramiento de contraste local y el menor número utiliza
análisis de histograma.
Un problema importante que dificulta la detección de los microaneurismas está re-

lacionado con la forma de los mismos. Comenzaremos explicando las características de un
microaneurisma. Idealmente un microaneurisma tiene un tamaño entre 10 y 100 micróme-
tros. En la Figura 19 se muestra la formación de microaneurismas a nivel microscópico. Se
pueden observar pequeños sacos de sangre que se forman debido a que las paredes de los
vasos sanguíneos se han debilitado por el exceso de presión de sangre. También, se observa
la forma característica de un microaneurismas.
Figura 18. Imagen desenfocada lo cual dificultad el procesamiento de la misma.
3.2. Microaneurismas
A nivel microscópico los microaneurismas pueden ser observados claramente pero

esto no sucede en una imagen de fondo de ojo, ya que en esta los microaneurismas suelen
ser muy pequeños y además la forma no suele ser regular. En la Figura 20 se muestran 8
diferentes microaneurismas. Los microaneurismas pueden ser clasificados en 4 grandes ti-
pos; sutiles, regulares, obvios y cercanos a las venas. Como es de esperar, en la literatura se
menciona que los microaneurismas más difíciles de identificar son los sutiles y los cercanos
a la vena [31]. En estos últimos el problema radica en la semejanza que puede llegar a te-
ner la vena con un microaneurismas tal como se aprecia en la Figura 20.
28
Figura 19. (Superior) Estas preparaciones muestran daños capilares y microaneurismas.
(Superior izquierda) Hay pequeñas áreas de pérdida de capilaridad, muchos de los capilares son
acelulares; pequeños microaneurismas se pueden observar y más hipercélulas capilares. (Superior
derecha) microaneurismas de manera más marcada. (Inferior) Inyección de tinta Indian mostran-
do bucles capilares y microaneurismas. [32]
Figura 20. Ejemplos de diferentes categorías de microaneurismas indicadas por expertos.

Las dos imágenes por columna representan la misma categoría. (a) Sutiles. (b) Regulares. (c)
Obvios. (d) Cercanos a las venas [31].
Otro problema que se presenta en este tipo de imágenes es el ruido, ya que suele
confundirse con microaneurismas. Asimismo, en algunos casos la vena puede tener zonas de
29
alto contraste y zonas de bajo contraste, como se muestra en la Figura 21. Esto provoca,
nuevamente, una semejanza con microaneurismas.
Figura 21. Se muestra la parte de una vena en donde existe variación de intensidad de
los valores de los pixeles.
El mayor número de errores se presenta en las zonas cercanas a los vasos sanguíneos
que irrigan la retina. Esto es debido a que los vasos sanguíneos tienen tonos similares a los
microaneurismas. Además las terminaciones de estos suelen tener un tamaño similar a los
microaneurismas. Asimismo, el tono a lo largo de los vasos sanguíneos no es constante. Por
esto, se han desarrollado distintos métodos para la segmentación de los vasos sanguíneos
[30]. Algunos de estos métodos incluyen al algoritmo de seguimiento de vasos sanguíneos o
venas. Comúnmente, este algoritmo necesita la intervención del usuario, el cual indica la
posición inicial y la posición final de la vena. Este tipo de algoritmos es muy susceptible a
las bifurcaciones y los cruces de vasos. Sin embargo, este tipo de algoritmo tiene la ventaja
principal de identificar con mayor precisión el ancho de los vasos sanguíneos y provee in-
formación de vasos individuales que usualmente no está disponible usando otros métodos.
Algunos otros métodos de segmentación de vasos son:”Matched filter”, análisis morfológico,
PCA, transformada Watershed entre otros. Su ventaja radica en ser autónomo, es decir que
no necesita la intervención del usuario. La desventaja principal con este tipo de algoritmo
es su precisión para identificar correctamente tanto el ancho de los vasos como todas sus
ramificaciones. El problema anterior provoca en algunas zonas la eliminación de candida-
tos, ya que son segmentados junto con los vasos debido a su cercanía. Otro problema surge
en la segmentación parcial de los vasos, lo cual resulta en porciones aisladas de vasos san-
guíneos sin segmentar. Esto último provoca la identificación de estas porciones de vasos
como candidatos a microaneurismas.
Dado los problemas relacionados con los vasos sanguíneos de la retina antes men-
cionada, se decidió evitar la segmentación de los mismos. De tal manera que el algoritmo
que se presenta en este trabajo, se enfoca principalmente en la detección, por tamaño, for-
ma y tonalidad, de los microaneurismas.
30
Capítulo 4. Desarrollo.
En cambio, la sabiduría que desciende del cielo es ante todo
pura, y además pacífica, bondadosa, dócil, llena de compasión
y de buenos frutos, imparcial y sincera.
Santiago 3:17.
4.1. Diagrama de bloques
En la Figura 22 se muestra el diagrama de bloques a desarrollar. Como entrada se tiene la

imagen en el espacio RGB. Después se realiza un preprocesamiento a la imagen. En segui-
da, de la imagen preprocesada se obtienen los candidatos a microaneurismas (MAs). Una
vez que se tienen los candidatos estos pasan a la etapa de clasificación, en donde se decide
si es o no un MA. Por último se evalúan los resultados obtenidos de haber aplicado los pro-
cesos anteriormente mencionados. A continuación se explica con más detalle cada una de
estas etapas.
Imagen de fondo
de ojo
Preprocesamiento
de imágenes
Extracción de
candidatos
Clasificación de
lesiones
Figura 22. Proceso de detección de microaneurismas
31
4.2. Preprocesamiento de imágenes
De acuerdo a la literatura esta parte es esencial para la detección de microaneuris-

mas debido a que la eficiencia de la etapa de extracción de candidatos tiene una gran de-
pendencia de las propiedades de la imagen. El propósito principal de esta etapa es
mejorar las características de la imagen para la posterior extracción de candi-
datos a microaneurismas. Como se mencionó en el Capítulo 1, en la mayoría de los ca-
sos se toma solo el plano G (verde) para procesar. Algunos artículos reportan un preproce-
samiento a este plano, corrección de iluminación no uniforme, normalización de color, mejo-
ra de contraste, etc. [30]. El propósito principal de las técnicas de preprocesamiento es re-
ducir las variaciones en las imágenes. Estas diferencias pueden ser causadas por factores
que incluyen la diferencia entre cámaras, iluminación, ángulo de adquisición y la pigmenta-
ción de la retina. En este trabajo se sugiere un método diferente de preprocesamiento.
Algunos autores sugieren el uso de un espacio de color diferente. A continuación se

expondrá la transformación de las imágenes a otros espacios de color comunes. En la Figura
23, se presenta la imagen que se utiliza para ilustrar el uso de distintos espacios de color. Se
decide utilizar esta imagen debido a su poca iluminación y un contraste bajo en algunas
zonas con microaneurismas.
Figura 23. Imagen (plano G) utilizada para la demostración del uso de distintos espacios
de color para el mejoramiento del contraste y la iluminación de las imágenes.
32
Figura 24. Transformación de la imagen de la Figura 23 al espacio de color L*a*b (superior iz-
quierda). Donde “L” es la imagen superior derecha, “a” la inferior izquierda y “b” inferior dere-
cha.
En la Figura 24 se muestra la transformación del espacio RGB al espacio de color

L*a*b. De este espacio de color, se nota que el plano L uniformiza la iluminación de la
imagen aumentando la intensidad de los pixeles que tenían un valor bajo. Los demás planos
de este espacio no proporcionan información relevante o que ayuden para la detección de
microaneurismas.
Otro espacio de color que se probó fue el espacio HSV. Los planos de este espacio
no nos ayudan significativamente en la detección de microaneurismas dado que, como se
muestra en la Figura 25, los planos no aportan el contraste e iluminación adecuados para
distinguir a simple vista los microaneurismas. Sin embargo, este espacio aporta información
relevante con respecto a las propiedades de las imágenes. El plano H indica que el rango de
valores se encuentra principalmente entre rojo y amarillo con algunos valores de verde. El
canal S nos indica que los valores son mayormente colores primarios y del plano H se dedu-
ce que son rojo y amarillo. Por último, el canal V nos indica las zonas de mayor ilumina-
ción como el disco óptico.
33
Figura 25. Se muestra el espacio de color HSV en sus diferentes planos H (matiz, supe-
rior derecha), S (saturación, inferior izquierda), V (Color, inferior derecha).
También, se probaron otros espacios de color como XYZ, YUV, etc. Pero se obtu-
vieron resultados similares a los aportados por los espacios de color que se mostraron ante-
riormente.
Del análisis de estos espacios de color y de las propiedades de las imágenes se dedu-
jo el plano G/R. Este plano es una división pixel a pixel entre el plano G y el plano R en el
rango de valores de 0 a 255. El valor del pixel resultante de la división, en la mayoría de los
casos, se encuentra en el rango de valores de 0 a 1. Esto se debe a que en la mayoría de los
casos el valor del plano R es mayor que el valor del plano G. También, se observa que en el
espacio de color RGB los tonos de color predominantes son rojizos y amarillentos, lo cual
indica valores altos en el plano R y no nulos. Este plano de proporción permite el aumento
del contraste en la imagen además de uniformizar la luminosidad de la imagen. Un ejemplo
de este plano se muestra en la Figura 26. Si se compara con los espacios antes mencionados
y con el plano G, se puede observar una mejora en el contraste y en la iluminación de la
imagen. Este plano de proporción es el que se utilizará a lo largo de este trabajo para reali-
zar la detección de microaneurismas. Sin embargo, este plano por sí mismo no es de gran
ayuda para un oftalmólogo al momento de identificar visualmente un microaneurismas, ya
que se encuentra en escala de grises lo que dificulta la identificación. Por esta razón, se
implementó la unión de 3 diferentes planos. El primer plano pertenece a la luminancia del
espacio RGB, el segundo plano es el plano de proporción antes mencionado y el tercer
34
plano es nulo. La unión de estos tres planos se muestra en la Figura 27. Esta unión de pla-
nos fue mostrada a un oftalmólogo, el cual indicó que la imagen facilitaba la detección vi-
sual de microaneurismas y otras lesiones. Asimismo, en la Figura 28 se muestra una compa-
ración de una zona que contiene microaneurismas y algunos segmentos de venas. De la
misma manera, se muestra el histograma de cada zona lo cual demuestra que el rango de
valores de la unión de los planos es más amplia comparado con el del espacio RGB. Este
aumento en la distribución se ve reflejado en el incremento del contraste y la luminancia, lo
que favorece la detección de microaneurismas.
4 4
x 10 x 10
5 5
4 4
Cantidad de pixeles
Cantidad de pixeles
3 3
2 2
1
1
0
0
0 50 100 150 200 250

0 50 100 150 200 250
Figura 26. Plano de proporción (izquierda) creado a partir de la división de los valores
pixel a pixel del plano G entre el plano R. Así mismo a modo de comparación se muestra el
plano G (derecha). Cada uno de estos planos con sus respectivos histogramas.
35
Figura 27. Espacio de color diseñado a partir del plano L, plano G/R y un plano nulo.
500
450 700
400
600
350
500
Cantidad de pixeles
Cantidad de pixeles
300
250 400
200 300
150
200
100
100
50
0 0
0 50 100 150 200 250 0 50 100 150 200 250
Figura 28. Comparación entre el espacio de color RGB (izquierda) y la unión de los pla-
nos L, proporción y plano nulo (derecha).
Otra parte muy importante en la etapa de preprocesamiento es el uso de filtros. De

las observaciones y dificultades que se describieron en la sección anterior, se deduce que el
ruido en la mayoría de las imágenes es del tipo gaussiano. En la Figura 29, se muestran dos
ejemplos del uso de dos tipos de filtros para la reducción del ruido. El filtro Wiener, aunque
en algunos casos disminuyó el ruido de la imagen de manera significativa también disminu-
yo el contraste, lo cual es algo no deseado. Por el contrario el filtro de mediana demostró
mantener el contraste aunque la disminución del ruido no fue tan significativa como la ob-
36
tenida con el filtro Wiener. Para este caso en particular se desea un alto contraste por esa
razón se decidió utilizar el filtro de mediana en vez del filtro Wiener.
Filtro gaussiano Imagen normal Filtro mediana
Figura 29. Imágenes de prueba donde se remueve parte del ruido utilizando dos tipos de filtros.
filtro Gausiano (Wiener), imagen sin filtrar y filtro de mediana.
100
90
90
80
80
70
70
Cantidad de pixeles
Cantidad de pixeles
60
60
50
50
40
40
30
30
20
20
10
10
50 100 150 200 250 50 100 150 200 250
Figura 30. Comparación entre el uso del filtro de mediana (izquierda) y sin utilizar el
mismo (derecha). Asimismo se muestra el histograma para demostrar la disminución de ruido, el
cual se encuentra principalmente en los valores altos y bajos de la imagen.
De la misma manera en la Figura 30 se muestra la aplicación del filtro a la zona de

microaneurismas que se presenta en la Figura 28. También se expone los histogramas de las
37
imágenes. Asimismo, se presenta el seudocódigo utilizado para la etapa designada como
preprocesamiento.
Pseudocódigo para el preprocesamiento de las imágenes

Input: imagen en RGB (8 bits por canal).
Ouput: Imagen preprocesada (8 bits).
Se utilizan los planos rojo (R) y verde (G) de la imagen RGB para generar una imagen
en escala de grises.
= plano R
= plano G
for cada columna de do
for cada renglón de do
if planoR(renglon,columna)=0 then
I(renglón, columna)=0
else
I(renglón, columna)=planoG(renglón, columna)/planoR(renglón, columna)
I(renglón, columna) = redondear (I(renglón, columna)*255)
end if
end for
end for
Se le aplica un filtro de mediana con un tamaño de kernel de 3 x 3 a la imagen I, para

obtener la imagen
Opcional
Se genera el plano de Luminancia de la imagen RGB L:
N=plano nulo
=( , , )
4.3. Extracción de candidatos.
Una vez que se ha realizado el preprocesamiento de las imágenes como se mencionó

en la sección anterior, se procede a desarrollar un algoritmo que permita la extracción de
candidatos. Para la extracción de candidato se probaron diferentes algoritmos los cuales se
explican a continuación.
El algoritmo más simple implementado para la extracción de candidatos fue el mé-

todo del valor umbral. En este método se utilizó la moda como valor de umbral para la
separación de dos segmentos fondo y venas/lesiones. La segmentación de la imagen utili-
zando este método se muestra en la Figura 31. De la imagen se observa que este método
segmenta correctamente ciertas zonas de la imagen (zona izquierda de la imagen), mientras
que existen zonas en donde no se logra segmentar correctamente el fondo con respecto a las
venas y lesiones. Este problema deriva debido a que la imagen no es completamente uni-
38
forme con respecto a los tonos de color. Por esta razón el método del valor umbral aplicado
a la imagen completa, es decir de manera global, no es recomendable para este tipo de
imágenes con poca uniformidad. Por lo tanto, en este trabajo este método fue modificado
de dos maneras, las cuales se presentan a continuación.
Figura 31. Segmentación de la imagen de fondo de ojo utilizando el método del valor
umbral.
Dado que no es conveniente aplicar una segmentación global esta puede ser aplicada
por ventanas. En cada ventana se genera un valor de umbral diferente, basado en la moda
del histograma de cada ventana. El resultado de aplicar este algoritmo se muestra en la
Figura 32. Se puede notar que en la imagen que se muestra en la Figura 32 se ha eliminado
gran parte del fondo aunque también existen ciertas zonas del fondo no deseadas. Este mé-
todo también está basado en el algoritmo Quadtree.
El tamaño mínimo de ventana se especificó en 15 X 15 pixeles. Este tamaño está

basado en que espera un tamaño típico de microaneurismas de 11 X 11 pixeles en una ima-
gen 1500 X 1152 pixeles, que es el tamaño estándar de la base de datos que se utilizó du-
rante este proyecto.
39
Figura 32. Resultado de aplicar el método de valor umbral por ventana a una imagen de
fondo de ojo.
Algunos problemas que se observa en la imagen de la Figura 32 son los vasos san-
guíneos y algunas zonas del fondo que son mayormente ruido. Una de las dificultades más
importantes son los vasos sanguíneos ya que estos tienden a parecerse en tono de color a los
microaneurismas, esto es debido a que los dos proceden de la misma naturaleza. Una mane-
ra sencilla de diferenciar entre microaneurismas y vasos sanguíneos es por forma y tamaño.
Esto se explicará con más detalle en la sección de clasificación.
También se desarrolló otra modificación al método del valor umbral. En esta se di-
vide la imagen en una serie de capas o planos que están dentro de un rango. Esto se puede
expresar al utilizar las siguientes expresiones.
≤ ≤ +
+ < ≤2 +
.
.
.
( − 1) + < ≤ +
En donde es la imagen resultante de aplicar el valor umbral. Asimismo, repre-

senta el valor de la moda del histograma global. representa los pixeles del plano de pro-
porción. Y representa el valor de umbral, es decir el rango de valores que puede tomar la
imagen. En términos de histograma se trata de dividir a este en pequeñas fracciones a par-
40
tir de la moda. Por experimentación se encontró que un valor adecuado para es 7. En la
Figura 33, se representa la formación de 5 capas a partir del plano de proporción. El uso de
esta técnica facilita la distinción entre venas, fondo y microaneurismas. Esta distinción se
debe a las tonalidades oscuras representativas de los microaneurismas. También, dado que
siempre existe contraste entre el fondo y los microaneurismas se debe poder aislar a los
microaneurismas en un cierto rango. Esta técnica comprueba los diferentes tonos de micro-
aneurismas. Para este trabajo se han clasificado en tonos oscuros, medios y claros. En par-
ticular, con esta técnica, los microaneurismas claros son los más difíciles de distinguir debi-
do a que tiende a aparecer en las capas en donde el rango comprende parte del fondo.
Figura 33. Generación de múltiples capas basados en el método del valor umbral.
Por experimentación se observó y se comparó que la segunda técnica utilizada fue

la que obtuvo mejores resultados. El problema principal que tuvo la primera técnica fue el
exceso de ruido que existía en la mayoría de las imágenes, además de realizar un mayor
número de operaciones comparado con la segunda técnica. Por lo tanto, esta última técnica
fue la que se utilizó para la extracción de candidatos.
La extracción de candidatos se realizó al distinguir entre forma, tamaño y tono de

gris. La distinción por tono se realizó con la técnica explicada anteriormente de separación
por capas. De cual cada capa es una imagen binaria, tal como se muestra en la Figura 33.
Para la distinción por tamaño y forma se utilizó la técnica de ventaneo en la cual cada
ventana representa una región de interés (ROI). Para distinguir por tamaño el candidato no
deberá ser mayor a un tamaño de 15 X 15, ni menor 3 X 3 pixeles. Esta definición nos
permite reducir significativamente el número de candidatos. Por último, es necesario distin-
guir por la forma ideal de un microaneurisma que es circular. Es en esta etapa es donde
41
surge una gran cantidad de errores debido a que no todos los microaneurismas cumplen con
la forma deseada circular.
Una solución propuesta fue utilizando la excentricidad de una elipse, la cual se defi-
ne como
√ −
=
Donde es el semieje mayor, el término √ − es la semidistancia focal y es el

semieje menor. Los términos antes mencionados son representados en la Figura 34.
Figura 34. Representación geométrica de una elipse.
De tal manera que se busca que ≈ 0 lo cual representaría que = , lo que indi-
caría una forma circular. De varias pruebas realizadas, se encontró que un valor por debajo
de 0.6 representa a un microaneurisma. Sin embargo, también se encontraron algunos seg-
mentos de vasos capilares que cumplen con esta condición. Un ejemplo de un segmento de
vaso sanguíneo de este tipo se muestra en la Figura 35. Así mismo, existen algunos microa-
neurismas con una excentricidad mayor a 0.6 los cuales no fueron clasificados como candi-
datos.
Figura 35. En la imagen se muestra a un segmento de un vaso sanguíneo antes de aplicar

valor umbral (derecha) y después de aplicar (izquierda). Este segmento fue clasificado como can-
didato a microaneurisma debido a que su excentricidad fue menor a 0.6.
42
El problema que presentan los vasos sanguíneos se debe a que la luz que reflejan es-
tos no es uniforme. Esto se presenta frecuentemente en vasos muy delgados y en las termi-
naciones de los mismos. Un ejemplo de este tipo de problemas se ilustra en la Figura 36, la
cual muestra un segmento de un vaso sanguíneo con variaciones de tono, lo que provoca
una segmentación errónea.
Figura 36. En la imagen de la derecha se muestra un segmento de un vaso sanguíneo que de-
muestra la variabilidad de tonos que existen. En la izquierda se muestra parte del segmento que
comprende una ventana de 15 X 15.
De tal manera, se muestra a continuación el pseudocódigo del bloque de extracción

de candidatos.
Pseudocódigo para la extracción de candidatos

Input: imagen preprocesada .
Ouput: Imagen binaria de candidatos con clasificación simple .
Se define el umbral U para la generación de capas o planos ; se clasifican los objetos
resultantes Obj.
U=nivel de umbral especificado L.
U_max= moda del histograma +L.
for U→U_max
for cada renglón do
if (renglón ,columna)>U and (renglón ,columna)≤U+L then
(renglón ,columna)=1
end if
end for
end for
numObj= Se cuenta el número de objetos resultantes.
excentricidad=0.6
for numObj
excObj=Calculo de la excentricidad del objeto
43
if excObj>0.6 then
Se elimina el objeto colocando cada pixel a 0.
end if
end for
U=U+L
end for
4.4. Clasificación
Dado los candidatos obtenidos en la etapa anterior se procede a clasificarlos, para

esto se utilizó el clasificador de máquina de soporte vectorial (SVM, Support Vector Machi-
ne). Se utilizaron dos parámetros en el clasificador: la pendiente del histograma acumulado
y el número de objetos resultantes de aplicar el valor umbral. Además el conjunto de imá-
genes de entrenamiento tiene un tamaño de 21 X 21 (lo que asegura la existencia de al me-
nos un microaneurisma) y se estudia el comportamiento del plano de proporción.
Para encontrar la pendiente en el histograma acumulado se genera una recta que va

desde el primer valor del pixel no cero hasta un máximo número de pixeles establecido en
25. La generación de esta recta se ilustra mejor en la Figura 37. De tal manera que la pen-
diente se encuentra al utilizar la siguiente ecuación.
=
−
En donde es el valor de intensidad con la distancia más cercana a 25 pixeles. De

la misma manera, es el valor de intensidad correspondiente a la primera cantidad de
pixeles no cero. En donde k, es el número de pixeles en la posición en donde se encuentra el
valor de .
Figura 37. Generación de una recta a partir del histograma acumulado (derecha) de un microa-
neurisma (izquierda).
44
Para el conteo de objetos primero se realizó la segmentación de la imagen tal como
se describió en secciones anteriores. De la segmentación aplicada, en el caso de los vasos
sanguíneos, el número de objetos resultantes es regularmente mayor a uno. Como se explicó
anteriormente, esto se debe a las variaciones de tonalidad presentes en los vasos sanguíneos.
Estos dos parámetros son utilizados para la construcción del SVM. Se utilizaron un total de
92 imágenes correspondientes a microaneurismas y 92 correspondientes a no microaneuris-
mas. Además se utilizó un kernel de primer orden.
Figura 38. El resultado del entrenamiento de SVM utilizando un kernel lineal.
En la Figura 38, se muestra el resultado de aplicar las imágenes de entrenamiento

antes mencionadas. Se puede observar que el hiperplano creado logra separar correctamente
la mayor cantidad de microaneurismas, siendo muy pocos de estos los que no se lograron
separar. De la misma manera, en la Figura 39 se muestra los objetos resultantes de aplicar
el umbra a una ventana que contiene un microaneurisma, y una que contiene fondo ma-
yormente. También, se probó el SVM con un kernel gaussiano son sigma igual uno. Los
resultados no tuvieron gran diferencia con respecto a un kernel lineal. Por esta razón se
decidió utilizar el kernel lineal para la clasificación.
También se probó el clasificador utilizando un kernel gaussiano, como se muestra en

la Figura 39. Si se realiza una comparación con un kernel lineal, se puede observar que la
diferencia entre ellos es mínima. Por lo tanto, se decidió utilizar un kernel lineal debido a
que es más sencillo de implementar.
45
Figura 39. Figura que ilustra la diferencia que existe en el conteo de objetos resultantes
de aplicar el valor umbral.
Figura 40. Entrenamiento de SVM utilizando un kernel con función gaussiana
Por último se comprueba el SVM utilizando imágenes de microaneurismas como

prueba. El resultado del clasificador se muestra en la Figura 41. Se puede observar que una
gran cantidad de microaneurismas fueron clasificados correctamente, siendo la zona crítica
46
cuando existen 2 o 3 objetos y una pendiente entre 1 y 15. En esta zona se observa que
algunos microaneurismas fueron clasificados incorrectamente (NoMAs classified). Este error
se discutirá en el siguiente capítulo. A continuación se presenta el pseudocódigo para la
etapa de clasificación.
Figura 41. Prueba del clasificador utilizados un conjunto de imágenes de microaneuris-

mas.
Pseudocódigo para la clasificación de candidatos
Input: imagen binaria con candidatos y la imagen preprocesada
Ouput: Imagen binaria de candidatos clasificada por SVM.

Se clasifican los candidatos generados en la etapa anterior utilizando un clasificador
SVM con dos parámetros.
for cada número de Objetos then

= imagen de tamaño 25 X 25 en escala de grises de . Contiene con un posible
candidato obtenido a partir de .
histA = Histograma acumulado de .
ContPix = Vector de histA que contiene el conteo de pixeles.
ValPix = Vector de histA que contiene el rango de valores de intensidad de los pixeles (0
a 255).
for a = 0 to length(ContPix) then
if ConPix(a) > 0 then
= ValPix(a)
end if
47
end for
VectDif = Valor absoluto de (ContPix – 25).
for a = 0 to length(VectDif) then
Se busca en VectDif la posición con el primer valor más cercano a cero.
if VectDif(a) ≈ 0 or VectDif(a) then
=
k = ContPix(a)
end if
end for
pendiente=k/( − )

for cada renglón do
if (renglón ,columna) ≤ then
(renglón ,columna)=1
end if
end for
end for
numObjts= El número de objetos resultantes.
Se introducen los parámetros pendiente y numObj, al clasificador SVM, el cual decidirá si

pertenece o no a la clase de candidatos
= SVM(pendiente, numObjts)
end for
48
Capítulo 5. Resultados.
A ti, Dios de mis padres,
te alabo y te doy gracias.
Me has dado sabiduría y poder,
me has dado a conocer lo que te pedimos,
¡me has dado a conocer el sueño del rey!
Daniel 2:23
5.1. Base de datos Ground Truth
En este capítulo se explicará cómo se realizó la comparación entre la base de datos

establecida y los resultados obtenidos a partir del algoritmo desarrollado. Al realizar la
comparación con la base de datos se encontraron varios problemas referentes a la base de
datos. El problema principal es la localización de las lesiones indicadas en la base de datos.
Esta localización de lesiones se muestra en la Figura 42. En esta imagen se puede observar
como algunos expertos señalaron zonas completas de microaneurismas y no microaneuris-
mas. Esto dificultad la precisión de la comprobación ya que, como se puede observar las
zonas de localización abarcan un área muy amplia.
Figura 42. Muestra las regiones candidato indicadas en la base de datos.
49
Figura 43. Imagen promedio de 4 expertos correspondiendo el valor de intensidad más
alto a la concordancia de más expertos
Figura 44. Marcas de expertos para la misma imágenes (los colores decodifican el nivel
de confianza del GT) a) original b) experto 1 c) experto 2 d) experto 3 e) experto 4 y f) prome-
dio de todos los expertos. [33]
La base de datos Ground Truth (GT) [33], cuenta con 4 niveles de experto la ima-
gen resultante es la suma de los mismos. En la Figura 43, se muestra un ejemplo de esta
suma, en donde un mayor nivel de intensidad indica un nivel de certeza mayor. Este nivel
de certeza o confianza depende a su vez del nivel de confianza de cada experto. Cada ex-
perto tiene 3 niveles de confianza, indicados en la Figura 44 por colores. Por ejemplo en la
Figura 44 (d) se exponen las lesiones marcadas por un solo experto y cada color indica el
50
nivel de confianza de ese experto. Siendo el rojo oscuro un alto nivel, amarillo medio nivel y
azul claro bajo nivel de confianza. En dicha figura se presenta también un ejemplo de la
identificación de lesiones correspondiente a los 4 expertos y el promedio de estos 4, Figura
44 (f). De tal manera que, entre mayor sea el valor del pixel indicará una coincidencia ma-
yor entre expertos y/o niveles de confianza de cada experto. De pruebas realizadas, se en-
contró, en imágenes de 8 bits, que la suma de nivel de confianza mayor a 147 es donde se
localizan los microaneurismas puntualmente y no por zonas. En un ejemplo en donde se
eliminan todos los valores por debajo del umbral de 147 se muestra en la Figura 45. Se
puede observar en esta imagen que el resultado de aplicar este umbral son zonas pequeñas
de lesiones, comparadas con el promedio de expertos. Esto permite realizar una compara-
ción más sencilla entre el GT y los candidatos, utilizando solo una operación AND (dado
que tanto el GT como los candidatos son imágenes binarias).
Figura 45. Eliminación de niveles de confianza con valores menores a 147.
5.2. Resultados Obtenidos
Asimismo, otra desventaja con respecto al GT es que la localización puntual de los

microaneurismas, en algunos casos, se encuentra desplazada una cierta distancia con res-
pecto al microaneurisma. Esto se puede observar mejor en la Figura 46, en donde se presen-
ta un ejemplo en el cual el GT se encuentra desplazado una pequeña distancia con respecto
al microaneurisma. El problema con este desplazamiento se presenta en la comparación con
los candidatos generados ya que estos últimos suelen estar localizados puntualmente. Esto
provoca, en algunas ocasiones, tanto un falso positivo como un falso negativo. Una posible
solución a este problema es aumentando el área final de los candidatos utilizando operacio-
nes morfológicas. La desventaja al realizar la operación anterior es la posibilidad de unir
dos candidatos que se encuentren cercanos, lo cual se vería reflejado en los falsos positivos.
51
Figura 46. Desplazamiento del GT con respecto a un microaneurisma.
Además, en el GT existen algunas imágenes de fondo de ojo en donde el paciente ya

fue diagnosticado y tratado con algún tipo de lesión. Tal como se observa en la Figura 47,
en esta se muestra la retina de un paciente donde las lesiones fueron cauterizadas utilizando
láser. Dado que, este trabajo se pretende utilizar para el pre diagnóstico de la Retinopatía
Diabética, es decir en donde aún no se aplica un tratamiento al paciente, el uso de estas
imágenes dentro de la base de datos no es apropiado. Por esta razón, se decidió no tomar
en cuenta los resultados obtenidos en este tipo de imágenes.
Figura 47. Imagen de fondo de ojo perteneciente a un paciente tratado con cirugía láser
(manchas negras) debido al algún tipo de lesión.
Figura 48. Imagen de candidatos sobre una imagen de fondo ojo (izquierda) y como ima-
gen binaria (derecha).
52
De tal manera que el número total de imágenes utilizadas para la obtención de re-
sultado fue de 81 de 89. De estas imágenes se elaboró la curva FROC, tal como se mencio-
nó en el Capítulo 1. Esta gráfica se muestra en la Figura 49.
También se muestra en la Figura 48, un ejemplo de los candidatos obtenidos del al-
goritmo desarrollado. Se muestra tanto la imagen binaria, así como las zonas que se identi-
ficó en la imagen de fondo de ojo correspondiente.
Figura 49. Curva FROC generada a partir de 81 imágenes de fondo de ojo.
También se realizó una comparación del desempeño del algoritmo diseñado, utili-
zando el plano verde (G) y el plano de proporción (P), tal como se muestra en la Tabla 2.
De esta tabla se puede observar que el número de VP es mayor utilizando el plano

de proporción. Asimismo se observa que el número de FN es menor en dicho plano. Sin
embargo, el número de FP es mayor en dicho plano. Esto se debe principalmente a que en
el plano G existen lesiones en donde el contraste no es el adecuado para poder clasificarlo
correctamente. Mientras que en el plano P, como se ha mencionado, el contraste en dichas
lesiones es mayor logrando así clasificarlo como lesión.
De la misma manera en la Tabla 3, se presenta la comparación de los resultados ob-

tenidos en este trabajo, con los resultados que se menciona en algunos de los artículos que
se expusieron en el estado del arte.
53
VP1 plano P VP plano G FP2 plano P FP plano G FN3 plano P FN plano G
0 0 191 67 1 1
1 1 129 63 0 0
7 2 188 38 0 5
8 1 181 53 0 6
1 0 171 55 0 1
4 3 147 97 0 0
11 0 314 38 0 10
1 0 178 54 0 1
1 1 220 30 0 0
3 2 225 57 0 1
7 5 281 91 2 4
0 0 105 71 0 0
1 2 195 73 2 1
4 2 219 52 1 3
13 5 177 79 0 8
Tabla 2. Comparación del uso del plano G y el plano P en el desempeño del algoritmo.
Referencia Promedio de VP Promedio de FP Métodos usados imágenes de prueba

Método Pro- 0.8 0.5 Histograma, 81
puesto valor umbral,
SVM, operacio-
nes morfológi-
cas.
[12] 0.82 No se menciona Corrección de 13
iluminación,
filtros adapti-
vos, transfor-
mada “Top hat”
[14] 0.85 0.24 Cambios en 3783
intensidad y
forma, clasifica-
dor. (No se
especifica a
detalle)
[15] 0.77 0.22 Segmentación 14
recursiva, cre-
cimiento de la
región, “Moat
Operator”.
1
Verdaderos Positivos
2
Falsos Positivos
3
Falsos Negativos
54
[17] 0.85 0.13 Normalización 71 con MAs; 165
de color, creci- sin ningún MA.
miento de la
región, “Top
Hat”, exclusión
de vasos.
[19] 0.83 No se menciona Correlación con 32
una plantilla
generada con la
transformada
Wavelet.
[20] 0.94 0.13 Transformada 89
digital Curvelet.
Conversión al
espacio Luv.
Tabla 3. Comparación de los resultados obtenidos con algunos artículos.
55
Capítulo 6. Conclusiones.
Que nadie se engañe. Si alguno de ustedes se cree
sabio según las normas de esta época, hágase ignorante
para así llegar a ser sabio.
1 Corintios 3:18
Se propuso y se validó el desarrollo de un algoritmo autónomo que fuese capaz de

detectar la presencia de microaneurismas en imágenes de fondo de ojo, cumpliendo así el
objetivo principal de esta tesis.
Otro objetivo propuesto fue el uso de técnicas de procesamiento de color. De lo an-

terior, se concluyó en el Capítulo 4, que algunas de estas técnicas no aportan una diferencia
significativa que ayuden en el análisis de las imágenes. Sin embargo, de las pruebas realizas
en esta área, se obtuvo un plano el cual se basa en la proporción G sobre R. Se demostró
que el uso de este plano en el análisis de las imágenes, mejoró significativamente la tasa de
VP comparado con el uso del plano G en el análisis. Aunque, el número de FP también
aumentó se debe mencionar que gran parte de los candidatos marcados como FP cumplen
con las características de un microaneurisma. Por lo tanto los resultados pueden no reflejar
correctamente el porcentaje de eficacia del sistema.
Asimismo, se propuso el desarrollo de un algoritmo que empleara operaciones senci-

llas en los bloques de procesamiento. En general, el algoritmo utiliza operaciones básicas
como suma, resta división y multiplicación. Estas operaciones son empleadas en el desarro-
llo de algoritmos como el valor umbral utilizando histograma, el cálculo de la excentricidad,
cálculo de la pendiente, etc. También, el kernel del clasificador SVM fue de primer orden, lo
cual indica un menor número de operaciones comparado con un kernel de un orden mayor a
uno.
La evaluación del algoritmo se muestra en la Figura 49. En esta gráfica se puede

observar que se alcanza el valor de 0.8 de verdaderos positivos con un valor de 0.55 de fal-
sos positivos. De este modo, al realizar una comparación con los resultados de varios artícu-
los se encontró que estos resultados son similares. Además, se debe mencionar nuevamente
que los candidatos marcados como FP, existe la posibilidad de que se encuentren clasifica-
dos de manera errónea.
Además, se encontraron varios desafíos en el método de evaluación utilizado nor-

malmente, esto debe tanto a la base de datos de las imágenes de fondo de ojo como al GT.
Como se expuso en el Capítulo 3 y 4, la base de datos contiene imágenes con pacientes
56
previamente diagnosticados, por consiguiente dichas imágenes no pueden ser utilizadas para
un sistema de pre diagnóstico. Además, se encontraron algunos “puntos negros” que apare-
cen en la misma posición en varias imágenes. Estos “puntos negros” a pesar de encontrarse
dentro de la clasificación de no pertenecer a microaneurismas, cumplen con todas las carac-
terísticas de estos. Con respecto al GT, se mencionó las dificultades que se encontraron
como es la posición y el exceso de área marcada como microaneurisma. Asimismo, existen
varios candidatos que cumplen con las características de microaneurisma pero no fueron
señalados como tal en el GT.
En general, el algoritmo presentado en esta tesis se propone como modelo para el

desarrollo de un sistema que pueda ser utilizado como herramienta de pre diagnóstico. La
complejidad del sistema utilizando el modelo propuesta, sería menor comparando las opera-
ciones utilizadas comúnmente. El desarrollo de un sistema de pre diagnóstico autónomo en
un futuro, lograría compensar la gran diferencia que existirá entre el número de pacientes
diabéticos y el número de oftalmólogos a nivel mundial. De modo que, evitaría la sobrecar-
ga de trabajo que, relacionado con pacientes diabéticos, se espera tengan que realizar los
oftalmólogos dentro de los próximos 30 años.
6.1. Trabajos futuros.
Existen una gran cantidad de técnicas de procesamiento de imágenes que pueden

ser utilizadas para mejorar el porcentaje de VP y FP. Estas son algunas propuestas que
pueden ser implementadas a futuro.
 Desarrollar una base de datos, con su respectivo GT, que solo incluya imá-
genes que puedan ser utilizadas para el pre diagnóstico. Así como un algo-
ritmo estándar que permita la comparación entre el GT y los candidatos.
 Desarrollar un algoritmo que permita la eliminación de todos los vasos san-

guíneos utilizando el plano de proporción.
 La implementación a nivel hardware del algoritmo presentado en este traba-

jo.
 Aumentar el número de parámetros utilizados en el clasificador SVM pero

cuidado la complejidad del mismo.
57
Bibliografía
[1] International Diabetes Federation. (2011) The Global Burden. [Online].
http://www.idf.org/diabetesatlas/5e/the-global-burden
[2] The International Agency for the Prevention of Blindness (IAPB). Diabetic
Retinopathy. [Online]. http://www.iapb.org/vision-2020/what-is-avoidable-
blindness/diabetic-retinopathy
[3] World Health Organisation (WHO). (2005) Prevention of Blindness from Diabetes
Mellitus. [Online].
http://www.who.int/blindness/Prevention%20of%20Blindness%20from%20Diabetes%2
0Mellitus-with-cover-small.pdf.
[4] (2012, June) National Eye Institute. [Online].

http://www.nei.nih.gov/health/diabetic/retinopathy.asp
[5] William Felch, Tina-Marie Gauthier, Bruce Spivey Serge Resnikoff, "The number of
ophthalmologists in practice and training worldwide: a growing gap despite more than
200 000 practitioners," British Journal of Ophthalmology , vol. 96, pp. 783-787, 2012.
[6] International Council of Ophthalmology. (2010) Number of Ophthalmologists in

Practice and Training Worldwide. [Online]. http://www.icoph.org/ophthalmologists-
worldwide.html
[7] Mauricio Hernández Ávila and Juan Pablo Gutiérrez, "Diabetes mellitus: la urgencia
de reforzar la respuesta en políticas públicas para su prevención y control," Instituto
Nacional de Salud Pública, México, Encuesta Nacional de Salud 2012.
[8] Pakinee Aimmanee, Buyarit Uyyanonvara Parisut Jitpakdee, "A survey on hemorrhage
detection in diabetic retinopathy retinal images," in International Conference on
Electrical Engineering/Electronics, Computer, Telecommunications and Information
Technology (ECTI-CON), 2012 9th International Conference on, Phetchaburi, 2012,
pp. 24 - 29.
[9] Agrawal Ankita, Bhatnagar Charul, and Anand Singh Jalal, "A Survey on Automated
Microaneurysm Detection in Diabetic Retinopathy Retinal Images," in International
Conference on Information Systems and Computer Networks, Mathura, 2013, pp. 24 -
58
29.
[10] C. E. Baudoin, B. J. Lay, and J. C. Klein, "Automatic detection of microaneurysms in

diabetic fluorescein angiographies," Revue D’Épidémiologie et de Sante Publique, vol.
32, pp. 254–261, 1984.
[11] T. Spencer, R. P. Phillips, P. F. Sharp, and J. V. Forrester, "Automated detection and

quantification of microaneurysms in fluorescein angiograms," Graefe’s Arch. Clin. Exp.
Ophthalmol, vol. 230, pp. 36–41, 1992.
[12] T. Spencer, J. A. Olson, K. C. McHardy, P. F. Sharp, and J. V. Forrester, "An

ImageProcessing Strategy for the Segmentation and Quantification of Microa-
neurysms in Fluo-rescein Angiograms," Computers and Biomedical Research, vol. 29,
pp. 284–302, 1996.
[13] M. J. Cree, J. A. Olson, K. C. McHardy, P. F. Sharp, and J. V. Forrester, "A fully

automated comparative microaneurysm digital detection system," Eye, vol. 11, pp.
622–628, 1997.
[14] J. H. Hipwell, F. Strachan, K. C. McHardy J. A. Olson, P. F. Sharp, and J. V.

Forrester, "Automated detection of microaneurysms in digital red-free photographs: a
diabetic screening," Diabetic Medicine, vol. 17, pp. 588 - 594, August 2000.
[15] C. Sinthanayothin et al., "Automated detection of diabetic retinopathy on digital

fundus images," Diabetic Medicine, vol. 19, pp. 105 - 112, February 2002.
[16] M. Niemeijer, B. van Ginneken, J. Staal, M.S.A. Suttorp-Schulten, and M.D.

Abramoff, "Automatic detection of red lesions in digital color fundus photographs,"
IEEE Transactions onMedical Imaging, vol. 24, pp. 584 - 592, May 2005.
[17] A.D. Fleming, S. Philip, K.A. Goatman, J.A. Olson, and P.F. Sharp, "Automated
microaneurysm detection using local contrast normalization and local vessel
detection," IEEE Transactions on Medical Imaging, vol. 25, pp. 1223 - 1232, August
2006.
[18] Walter Thomas et al., "Automatic detection of microaneurysms in color fundus

images," Medical Image Analysis, vol. 11, pp. 555 - 566, 2007.
[19] Gwénolé Quellec et al., "Optimal Wavelet Transform for the Detection of," IEEE
Transactions on Medical Imaging, vol. 27, no. 9, pp. 1230-1241, September 2008.
[20] Mahdad Esmaeili, Hossein Rabbani, Alireza Mehri Dehnavi, and Alireza Dehghani,
"New Curvelet Transform Based Method for Extraction of Red Lesions in Digital
Color Retinal Images," in 17th International Conference on Image Processing, Hong
Kong, 2010, pp. 4093-4096.
59
[21] Jang Pyo Bae et al., "A Study on Hemorrhage Detection Using Hybrid Method in
Fundus Images," Journal of Digital Imaging, vol. 24, pp. 394-404, June 2011.
[22] I Lazar and A. Hajdu, "Retinal Microaneurysm Detection Through Local Rotating
Cross-Section Profile Analysis," IEEE Transactions on Medical Imaging, vol. 32, pp.
400 - 407, November 2012.
[23] S J Preece and E Claridge, "Monte Carlo modelling of the spectral reﬂectance of the
human eye," Physics in medicine and biology, vol. 47, pp. 2863-2877, July 2002.
[24] M.J. Burgueñoa, J.L. García-Bastosb, and y J.M. González-Buitrago, "Las curvas
ROC en la evaluación de las pruebas diagnósticas," Med Clin (Barc), vol. 104, pp. 661-
670, 1995.
[25] Luis Enrique Jose Jaime, Fundamentos para el procesamiento de imágenes. Baja
California, México, 2005.
[26] Li Tan, Digital Signal Processing. Fundamentals and Applications. Decatur, Georgi:
Elsevier, 2008.
[27] Anil k. Jain, Fundamentals of digital image processing.: Prentice Hall.
[28] Chris solomon and Toby Breckon, Fundamentals of digital image processing.: Wiley
Blackwell, 2011.
[29] C. Burges, A tutorial on support vector machines for pattern recognition. Data mining
and Knowledge, Segunda ed.: Discovery, 1998.
[30] R.J. Winder, P.J. Morrow, I.N. McRitchie, J.R. Bailie, and P.M. Hart, "Algorithms for
digital image processing in diabetic retinopathy," Computerized Medical Imaging and
Graphics, vol. 33, pp. 608–622, June 2009.
[31] Bram van Ginneken, Michael J. Cree, Atsushi Mizutani, Gwénolé Quellec, Clara I.
Sánchez, Bob Zhang,Mathieu Lamard, Chisako Muramatsu, Xiangqian Wu, Meindert
Niemeijer*, "Retinopathy Online Challenge: Automatic Detection of Microaneurysms
in Digital Color Fundus Photographs," IEEE Transactions on medical imaging., vol.
29, no. 1, pp. 185-195, Enero 2010.
[32] Paul Hunter, Roger Hitchings David Spalton, Atlas of clinical ophthalmology, Tercera
ed.: Elzevier Mosby.
[33] Valentina Kalesnykiene, Joni-Kristian Kamarainen, Lasse Lensu Tomi Kauppi,

"DIARETDB1 diabetic retinopathy database and evaluation protocol".
[34] J. L. Peterson, "Petri Nets," ACM Computing Surveys, vol. 9, no. 3, pp. 223-252,
September 1977.
60
[35] R. Fehling, "A concept of hierarchical Petri nets with building blocks," Lecture Notes
in Computer Science, vol. 674, pp. 148-168, 1993.
[36] R. Millner, A Calculus of Communicating Systems.: Springer, 1982.
[37] D. Taubner, "Finite representations of CCS and TCSP programs by automata and
Petri nets," Lecture Notes In Computer Science, vol. 369, p. 168, 1989.
[38] J. M. Fernandes, "VHDL generation from hierarchical petri net specifications of

parallel controllers," IEE Proceedings: Computers and Digital Techniques, vol. 144, no.
2, pp. 127-137, March 1997.
[39] M. J. Morley, Modelling British Rail's Interlocking Logic: Geographic Data

Correctness.: LFCS Report Series: ECS-LFCS-91-186, Dept. Computer Science,
University of Edinburgh, November 1991.
[40] Universidad Autónoma de Guadalajara. [Online].

http://kepler.uag.mx/uagwbt/oftav10/anatomia/anatomia.htm
61

Hernandez CJ

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Hernandez CJ

Cargado por

Copyright:

Formatos disponibles

Procesamiento de imágenes de fondo de ojo

para la detección de microaneurismas en la

Jonathan Hernández Capistrán

Tesis sometida como requisito parcial

MAESTRO EN CIENCIAS EN LA ESPECIALIDAD DE

Instituto Nacional de Astrofísica,

Diciembre del 2014

Dr. Jorge Francisco Martínez Carballido

A Dios por darme la sabiduría, el conocimiento y la oportunidad de terminar esta etapa

darme. Sin Él nada de esto sería posible.

A mi hermano Roberto Hernández por ayudarme a tomar buenas decisiones y a buscar

mejores oportunidades en la vida.

mos para seguir siempre adelante.

rante el transcurso de estos años en mi formación académica.

A mis colegas y amigos con los que compartí esta etapa.

sos y la infraestructura necesaria para el desarrollo profesional y personal.

Al Consejo Nacional de Ciencia y Tecnología (CONACyT) por aportarme la beca necesa-

ria que me permitió terminar con éxito esta etapa.

Capítulo 1. Introducción. ....................................................... 1

1.1. Marco teórico. .......................................................................................... 1

1.2. Enunciado del problema ........................................................................... 3

1.3. Revisión del Estado del arte..................................................................... 3

1.3.1 Curvas ROC ...................................................................................... 13

Capítulo 2. Conceptos de procesamiento de imágenes. ....... 18

2.1. Filtro de mediana ................................................................................... 18

2.3 Operaciones morfológicas ....................................................................... 20

2.4 Convolución espacial. ............................................................................. 22

2.5. Máquina de soporte vectorial ................................................................. 23

2.5.1. Caso linealmente separable ................................................................. 24

Capítulo 3. Antecedentes ..................................................... 26

3.1. Base de datos DIARETDB1. ................................................................. 27

3.2. Microaneurismas .................................................................................... 28

Capítulo 4. Desarrollo. ......................................................... 31

4.2. Preprocesamiento de imágenes ............................................................... 32

4.3. Extracción de candidatos. ...................................................................... 38

4.4. Clasificación ........................................................................................... 44

Capítulo 5. Resultados. ........................................................ 49

5.1. Base de datos Ground Truth .................................................................. 49

5.2. Resultados Obtenidos............................................................................. 51

Capítulo 6. Conclusiones. ..................................................... 56

6.1. Trabajos futuros. .................................................................................... 57

Figura 1.Complicaciones reportadas por diabéticos. México, [7]. ..................................... 2

Figura 2. Proceso de detección de lesiones rojas .............................................................. 4

Figura 3. Trayectoria de la luz que es remitida por el fondo ocular. [23]........................ 11

canal verde, c) canal azul. .............................................................................................. 12

Figura 6. Distribución de probabilidad de los pacientes con y sin enfermedad, en función

del resultado del test. ..................................................................................................... 14

Figura 7. Señales registradas en un receptor de radar; I, II y III corresponden a misiles.

Figura 8. Curva ROC [24] .............................................................................................. 16

a una sensibilidad del 80%. ............................................................................................ 17

Figura 10. Vecindad de a y obtención de la mediana. [25]. ............................................ 19

contraste y su correspondiente histograma [26] .............................................................. 20

Figura 12. Ejemplo de algunas operaciones morfológicas [27]......................................... 21

valor es utilizado como filtro del pixel objetivo 35. [28].................................................. 23

sea posible [29]. .............................................................................................................. 23

Figura 15. Caso linealmente separable [29]. ................................................................... 24

como a la forma esférica de la retina.............................................................................. 27

Figura 18. Imagen desenfocada lo cual dificultad el procesamiento de la misma............ 28

Figura 19. (Superior) Estas preparaciones muestran daños capilares y microaneurismas.

(Superior izquierda) Hay pequeñas áreas de pérdida de capilaridad, muchos de los

capilares son acelulares; pequeños microaneurismas se pueden observar y más

hipercélulas capilares. (Superior derecha) microaneurismas de manera más marcada.

(Inferior) Inyección de tinta Indian mostrando bucles capilares y microaneurismas. [32] 29

Figura 24. Transformación de la imagen de la Figura 23 al espacio de color Lab