Está en la página 1de 95

UNIVERSIDAD DE CHILE

FACULTAD DE CIENCIAS FSICAS Y MATEMTICAS


DEPARTAMENTO DE INGENIERA ELCTRICA

SEGMENTACIN DE VASOS SANGUNEOS DE RETINA USANDO SELECCIN DE


CARACTERSTICAS MEDIANTE DISTANCIA DE BHATTACHARYYA Y ALGORITMOS
GENTICOS, PARA UN CLASIFICADOR POR MAXIMIZACIN DE LA ENTROPA

TESIS PARA OPTAR AL GRADO DE MAGSTER EN CIENCIAS DE LA INGENIERA,


MENCIN INGENIERA ELCTRICA
MEMORIA PARA OPTAR AL TTULO DE INGENIERO CIVIL ELCTRICO

SEBASTIN CEPEDA FUENTEALBA

PROFESOR GUA:
CLAUDIO PREZ FLORES

MIEMBROS DE LA COMISIN:
PABLO ESTVEZ VALENCIA
PABLO ZEGERS FERNNDEZ

SANTIAGO DE CHILE
2016
RESUMEN DE LA TESIS PARA OPTAR AL GRADO DE MAGSTER
EN CIENCIAS DE LA INGENIERA, MENCIN INGENIERA ELCTRICA
Y AL TTULO DE INGENIERO CIVIL ELECTRICISTA
POR: SEBASTIN CEPEDA FUENTEALBA
FECHA: 2016
PROF. GUA: CLAUDIO PREZ FLORES

Resumen
La segmentacin de vasos sanguneos en imgenes digitales permite tener un mtodo no
invasivo de diagnosticar enfermedades como diabetes, hipertensin y algunas enfermedades
cardiovasculares. Puede servir en la implementacin de programas para la deteccin temprana de
varias enfermedades de la retina y tambin para la identificacin biomtrica basada en la forma
de los vasos sanguneos. La segmentacin manual de vasos sanguneos de retina es una tarea
que consume mucho tiempo y requiere entrenamiento y habilidad. Los vasos sanguneos en la
retina estn compuestos de arterias y venas que se presentan como lneas oscuras en un fondo
relativamente uniforme. La dificultad de su segmentacin se debe a su forma, tamao y luminosidad
altamente variables, ruido en la imagen, adems de su cruce y bifurcacin.
En los mtodos para la segmentacin automtica de vasos previamente publicados en revistas
internacionales estn aquellos que obtienen un vector de caractersticas por pixel utilizando el
canal verde de la imagen y la respuesta a un filtro gaussiano en 5 escalas que ocupa k-vecinos ms
cercanos (KNN) como clasificador. Otro mtodo crea un vector de 27 caractersticas y usa k-vecinos
ms cercanos como clasificador. Otro mtodo extrae un vector de 5 caractersticas, incluyendo el
canal verde y la respuesta a filtros Gabor en 4 escalas y usa un clasificador bayesiano.
En esta tesis se propone un mtodo de segmentacin automtica de vasos sanguneos de cuatro
etapas. Primero, se extrae el canal verde de la imagen, ya que es donde ms destacan los vasos
sanguneos. A continuacin se efecta una ecualizacin de histograma adaptiva para mejorar el
contraste entre los pixeles del fondo y de los vasos sanguneos. Luego se aplica un banco de
filtros correspondientes a una suma de filtros Gabor, obteniendo como resultado el mximo de
las respuestas al banco de filtros. Finalmente, se segmenta la respuesta al banco de filtros usando
un umbral calculado con la maximizacin de la entropa de la matriz de co-ocurrencia. Para la
optimizacin de los parmetros y evaluacin de resultados se utiliz la base de datos DRIVE ya que
es una base de datos marcada y disponible internacionalmente, que permite comparar los resultados
obtenidos con otros publicados previamente. La optimizacin de los parmetros de la ecualizacin
de histograma adaptiva y la eleccin del canal verde se realiz maximizando la distancia de
Bhattacharyya entre las clases de vasos sanguneos y fondo de las imgenes. Los parmetros
de los filtros fueron optimizados mediante algoritmos genticos, maximizando el accuracy de la
segmentacin. De las 40 imgenes de la base de datos DRIVE se eligieron 10 para el conjunto de
entrenamiento y 10 para el de validacin. El conjunto de prueba usa las 20 imgenes estndares.
Los resultados muestran que la precisin obtenida para el conjunto de prueba fue de 0,9462, lo
que es similar a los resultados obtenidos por las mejores publicaciones en la misma base de datos
y a la obtenida por el segundo experto humano (0,9473). Al comparar con uno de los mtodos
con mejores resultados (precisin de 0,9466), el tiempo de segmentacin disminuy de 120[s]
en el trabajo previo, a 5[s] en el mtodo propuesto. En comparacin con los resultados de una
implementacin de redes neuronales convolucionales, sta tard ms (170[s]) y su precisin fue
menor que con el mtodo propuesto. Por lo tanto el mtodo propuesto muestra una precisin
cercana a la mxima previamente publicada pero con un tiempo de procesamiento mucho menor.
A futuro el mtodo podra paralelizarse para mejorar an ms su tiempo de cmputo.
ii
Abstract
The segmentation of blood vessels in digital images allows to have a noninvasive method
to diagnose diseases such as diabetes, hypertension and cardiovascular diseases. It can be used
in the implementation of programs for early detection of various diseases of the retina and also
for biometric identification based on the shape of the blood vessels. Manual segmentation of
retinal blood vessels is a time consuming task and requires training and skill. The blood vessels
in the retina are composed of arteries and veins that appear as dark lines on a relatively uniform
background. The difficulty of their segmentation is due to its shape, size and brightness highly
variable, noise in the image, in addition to its junction and branching.
Among the methods for automatic segmentation of blood vessels previously published in
international journals, are those who obtain a feature vector by pixel using the green channel of
the image and the response to a Gaussian filter on 5 scales using k-nearest neighbors (KNN) as
the classifier. Another method creates a vector of 27 features and uses k-nearest neighbor classifier.
Another method extracts a vector of 5 features, including the green channel and the response to
Gabor filters in 4 scales and uses a Bayesian classifier.
In this thesis a method of automatic segmentation of blood vessels in four steps is proposed.
First, the green channel of the image is extracted, because it is where the blood vessels more
highlights. Then adaptive histogram equalization is performed to improve the contrast between
the pixels of the background and blood vessels. A filter bank is then applied corresponding to a
sum of Gabor filters, obtaining as a result the maximum responses to the filter bank. Finally, the
response to the filter bank is segmented using a threshold calculated with the maximization of the
entropy of the co-occurrence matrix. For the optimization of parameters and evaluation of results,
the DRIVE database was used because it is a labeled and internationally available database, that
allows to comparing the results with those of previous studies. The optimization of the parameters
of adaptive histogram equalization and the choice of the green channel was made maximizing the
Bhattacharyya distance between classes of blood vessels and background of the images. The filter
parameters were optimized using genetic algorithms, maximizing the accuracy of the segmentation.
Among the 40 images of the DRIVE database, 10 images were chosen for the training set and 10
for the validation set. For the test set, the 20 standard images were used.
The results show that the accuracy obtained for the whole test set was 0.9462, which is similar to the
results obtained by the best publications in the same database and the obtained by the second human
expert (0.9473). When comparing with one of the best performing methods (accuracy 0.9466),
time segmentation decreased from 120[s] in the previous work, to 5[s] in the proposed method.
Compared with the results of an implementation of convolutional neural networks, it took longer
(170[s]) and its accuracy was lower than with the proposed method. Therefore the proposed method
shows a precision close to the maximum previously published but with a much lower processing
time. In the future the method could be parallelized to further improve its computing time.

iii
A mis padres y a toda la gente con que compart en mis aos de Universidad.

iv
Agradecimientos
Quiero agradecer a mi profesor gua, Claudio Prez, por sus consejos, su gua durante ste
proceso, crticas constructivas, su disposicin y su preocupacin por el progreso de ste trabajo.
A todos los amigos y compaeros de la Universidad y toda la gente que conoc durante este tiempo
y que me acompa en diversos momentos.
A mis compaeros del laboratorio, por su amabilidad, momentos alegres y las interesantes
conversaciones que tuvimos.
A mis padres Mara Elena y Bernab por todo su apoyo incondicional, esfuerzo, comprensin y
amor durante toda mi vida y sobretodo en mis aos de estudio.

v
Tabla de contenido

1. Introduccin 9
1.1. Motivacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3. Objetivos Especficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4. Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2. Antecedentes sobre deteccin de vasos sanguneos 15


2.1. Trabajo realizado previamente . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.1. Tcnicas de reconocimiento de patrones . . . . . . . . . . . . . . . . . . . 16
2.1.2. Filtros adaptados (Matched filters) . . . . . . . . . . . . . . . . . . . . . . 17
2.1.3. Seguimiento (Tracking) de vasos sanguneos . . . . . . . . . . . . . . . . 17
2.1.4. Morfologa matemtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.5. Enfoques multiescala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.6. Enfoques basados en modelos . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.7. Resumen de resultados previamente publicados . . . . . . . . . . . . . . . 19

3. Metodologa 21
3.1. Base de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.2. Medidas estadsticas de clasificacin . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2.1. Accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.3. Preprocesamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3.1. Seleccin del canal de color . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3.2. Inversin de la imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1
3.3.3. Extensin del borde del rea de inters . . . . . . . . . . . . . . . . . . . . 25
3.3.4. Ecualizacin de histograma adaptativa . . . . . . . . . . . . . . . . . . . . 29
3.4. Extraccin de caractersticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4.1. Filtros Gabor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4.2. Filtros utilizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4.3. Aplicacin de filtros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.4.4. Optimizacin de parmetros de los filtros utilizados . . . . . . . . . . . . . 35
3.4.5. Algoritmos Genticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.5. Segmentacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5.1. Entropa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.5.2. Segmentacin por umbralizacin usando entropa . . . . . . . . . . . . . . 46

4. Resultados 49
4.1. Resultados del preprocesamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.1.1. Distancia de Bhattacharyya entre clases por canal de color . . . . . . . . . 49
4.1.2. Resultados de generacin de mscara de segmentacin . . . . . . . . . . . 53
4.1.3. Resultados de extensin del borde del rea de inters . . . . . . . . . . . . 54
4.1.4. Resultados de ecualizacin de histograma adaptiva . . . . . . . . . . . . . 55
4.1.5. Distancia de Bhattacharyya por etapa del preprocesamiento . . . . . . . . 58
4.2. Resultados algoritmos genticos . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.2.1. Influencia de la eleccin de conjuntos de entrenamiento y validacin. . . . 58
4.2.2. Optimizacin de parmetros del banco de filtros . . . . . . . . . . . . . . . 61
4.3. Resultados de la aplicacin de filtros . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.4. Obtencin de la matriz de co-ocurrencia . . . . . . . . . . . . . . . . . . . . . . . 67
4.5. Resultados de la segmentacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.6. Tipificacin de errores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.7. Curva ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.8. Resultados de tiempos de ejecucin del sistema . . . . . . . . . . . . . . . . . . . 74
4.9. Comparacin con el mtodo de Soares et al. [45] . . . . . . . . . . . . . . . . . . 74

5. Conclusin 77

2
5.0.1. Contribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.0.2. Trabajos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

Bibliografa 81

A. Parmetros de los filtros obtenidos II

3
ndice de tablas

2.1. Medidas de desempeo calculadas en el conjunto de prueba de la base de datos


DRIVE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.1. Tabla de factores asociados a la conversin de parmetros. . . . . . . . . . . . . . 43

4.1. Distancia de Bhattacharyya promedio y desviacin estndar de las clases por canal
de color del conjunto de entrenamiento de la base de datos DRIVE. . . . . . . . . . 50
4.2. Parmetros ptimos del algoritmo CLAHE, obtenidos con la maximizacin del
promedio de la distancia de Bhattacharyya de las clases de cada imagen. . . . . . . 56
4.3. Mxima distancia de Bhattacharyya promedio en el conjunto de entrenamiento de
la base de datos DRIVE, posterior a la aplicacin del algoritmo CLAHE. . . . . . . 56
4.4. Distancia de Bhattacharyya promedio y desviacin estndar del conjunto de
entrenamiento, en las etapas del preprocesamiento. . . . . . . . . . . . . . . . . . 58
4.5. Conjuntos de entrenamiento y validacin. . . . . . . . . . . . . . . . . . . . . . . 59
4.6. Accuracy de cada prueba en el conjunto de prueba, evaluado en el punto donde se
obtiene el mximo accuracy en el conjunto de validacin. . . . . . . . . . . . . . . 61
4.7. Promedio y desviacin estndar del accuracy de las pruebas de la tabla 4.6. . . . . 61
4.8. Promedio y desviacin estndar del accuracy de la segmentacin en el conjunto de
prueba, con los parmetros ptimos de los filtros obtenidos con el algoritmo gentico. 62
4.9. Promedio y desviacin estndar del accuracy de la segmentacin en el conjunto de
prueba, con los parmetros ptimos de los filtros obtenidos con el algoritmo gentico. 63
4.10. Distancia de Bhattacharyya promedio en el conjunto de entrenamiento de la base
de datos DRIVE, posterior a la aplicacin de los filtros. . . . . . . . . . . . . . . . 65
4.11. rea bajo la curva ROC en el conjunto de prueba. . . . . . . . . . . . . . . . . . . 73
4.12. Tiempo de ejecucin promedio en segundos por imagen del proceso de
segmentacin, en el conjunto de prueba de la base de datos DRIVE. . . . . . . . . 74
4.13. Fraccin de pixeles correcta e incorrectamente clasificados por cada mtodo, en el
conjunto de entrenamiento y validacin de la base de datos DRIVE. . . . . . . . . 75

4
4.14. Fraccin de pixeles correcta e incorrectamente clasificados por cada mtodo, en el
conjunto de prueba de la base de datos DRIVE. . . . . . . . . . . . . . . . . . . . 75

5
ndice de ilustraciones

1.1. Estructuras relevantes del ojo humano. Imagen obtenida de [85]. . . . . . . . . . . 10


1.2. Ventana alrededor de un pixel marcado como vaso sanguneo (en celeste), en la
imagen 40 de la base de datos DRIVE. . . . . . . . . . . . . . . . . . . . . . . . . 12

3.1. Diagrama de bloques de la ejecucin del mtodo propuesto. . . . . . . . . . . . . . 22


3.2. Imagen de fondo, mscara de segmentacin de la zona de inters y ground truth de
la imagen 40 de la base de datos DRIVE. . . . . . . . . . . . . . . . . . . . . . . 23
3.3. Imagen original del fondo de la retina y canales rojo, verde y azul de la imagen 40
de la base de datos DRIVE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4. Histograma normalizado del canal verde y su distribucin acumulada. . . . . . . . 26
3.5. Mscara de segmentacin del rea de inters de la imagen 40 de la base de datos
DRIVE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.6. Borde extendido incompleto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.7. Resultado de la extension de borde. . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.8. Histogramas de vasos sanguneos y fondo del canal verde de la imagen. . . . . . . 30
3.9. Etapas del algoritmo CLAHE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.10. Ejemplos de Filtros Gabor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.11. Ejemplos de filtros generados como suma de 3 filtros Gabor. . . . . . . . . . . . . 34
3.12. Diagrama del funcionamiento de los algoritmos genticos. Obtenido de [43]. . . . . 37
3.13. Seleccin estocstica universal. Basada en [44]. . . . . . . . . . . . . . . . . . . . 40
3.14. Operador de crossover de un punto con codificacin binaria. Las lneas verticales
azules representan los puntos de corte. . . . . . . . . . . . . . . . . . . . . . . . . 41
3.15. Operador de crossover de dos puntos. Las lneas verticales azules representan los
puntos de corte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.16. Ilustracin de la estructura de la codificacin del individuo. . . . . . . . . . . . . . 44

6
3.17. Efecto de la segmentacin del rea de inters. . . . . . . . . . . . . . . . . . . . . 46
3.18. Cuadrantes de la matriz de co-ocurrencia. . . . . . . . . . . . . . . . . . . . . . . 48

4.1. Distancia de Bhattacharyya de las clases por cada canal RGB en cada imagen del
conjunto de entrenamiento de la base de datos DRIVE. Las curvas corresponden al
canal rojo, verde y azul respectivamente. . . . . . . . . . . . . . . . . . . . . . . . 50
4.2. Imgenes de fondo de retina {1, 8, 16, 24, 32, 40} de la base de datos DRIVE. . . . . 51
4.3. Canal verde de las imgenes {1, 8, 16, 24, 32, 40} de la base de datos DRIVE. . . . . 52
4.4. Histogramas del canal verde de las imgenes {1, 8, 16, 24, 32, 40} de la base de datos
DRIVE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.5. Mscaras de segmentacin de la zona de inters generadas para las imgenes
{1, 8, 16, 24, 32, 40} de la base de datos DRIVE. . . . . . . . . . . . . . . . . . . . 54
4.6. Resultado de la extensin del borde de la zona de inters de las imgenes
{1, 8, 16, 24, 32, 40} de la base de datos DRIVE. . . . . . . . . . . . . . . . . . . . 55
4.7. Grfica de la distancia de Bhattacharyya de las clases en funcin de los parmetros
del algoritmo clahe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.8. Resultados
de la aplicacin del algoritmo CLAHE en las imgenes {1, 8, 16, 24, 32, 40} de la
base de datos DRIVE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.9. Histogramas de la imagen posterior a la aplicacin del algoritmo CLAHE para las
imgenes {1, 8, 16, 24, 32, 40} de la base de datos DRIVE. . . . . . . . . . . . . . . 58
4.10. Curvas de accuracy por generacin del algoritmo gentico. . . . . . . . . . . . . . 60
4.11. Izquierda: Curva de accuracy por generacin del algoritmo gentico que obtiene el
mximo accuracy en el conjunto de validacin en la tabla 4.8. Derecha: Valor-p de
por generacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.12. Filtros obtenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.13. Filtros Gabor que al sumarse dan lugar a los filtros utilizados. . . . . . . . . . . . . 64
4.14. Obtencin del mximo de las respuestas al banco de filtros en las imgenes
{1, 8, 16, 24, 32, 40} de la base de datos DRIVE. . . . . . . . . . . . . . . . . . . . 65
4.15. Histogramas de la imagen posterior a la aplicacin de los filtros, para las imgenes
{1, 8, 16, 24, 32, 40} de la base de datos DRIVE. . . . . . . . . . . . . . . . . . . . 66
4.16. Respuesta de los filtros rotados en = {0, 20, 40, 60, 80, 100, 120, 140, 160, 180} . . 66
4.17. Matriz de co-ocurrencia de la imagen posterior a la aplicacin de filtros para las
imgenes {1, 8, 16, 24, 32, 40} de la base de datos DRIVE. . . . . . . . . . . . . . . 67
4.18. Matriz de co-ocurrencia de la imagen posterior a la aplicacin de filtros, para las
imgenes {1, 8, 16, 24, 32, 40} de la base de datos DRIVE, con cdigo de colores. . . 68

7
4.19. Segmentacin de los vasos sanguneos mediante umbral ptimo. Pixeles en blanco
corresponden a vasos sanguneos y en negro a pixeles de fondo. Segmentacin de
las imgenes {1, 8, 16, 24, 32, 40} de la base de datos DRIVE. . . . . . . . . . . . . 69
4.20. Visualizacin de los errores y aciertos de la clasificacin. Segmentacin de las
imgenes {1, 8, 16, 24, 32, 40} de la base de datos DRIVE. . . . . . . . . . . . . . . 70
4.21. Histogramas de accuracy para cada eleccin de conjunto de entrenamiento y
validacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.22. Las dos muestras con menor accuracy en los histogramas de accuracy junto a su
segmentacin realizada con el mtodo propuesto. De arriba a abajo imgenes 25 y
34 de la base de datos DRIVE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.23. Imagen con mayor accuracy en los histogramas de accuracy junto a su
segmentacin realizada con el mtodo propuesto. Imagen 19 de la base de datos
DRIVE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.24. Curva ROC en el conjunto de prueba. . . . . . . . . . . . . . . . . . . . . . . . . 73
4.25. Visualizacin de los errores y aciertos de la clasificacin por ambos mtodos.
Segmentacin de las imgenes {1, 8, 16, 24, 34, 40} de la base de datos DRIVE. . . . 76

8
Captulo 1

Introduccin

En este captulo se presentan la motivacin de este trabajo de tesis, sus objetivos generales y
especficos, y los captulos que forman su estructura.

1.1. Motivacin

En general, la segmentacin de vasos sanguneos en imgenes digitales permite tener un


mtodo no invasivo de diagnosticar diferentes enfermedades como diabetes, hipertensin y algunas
enfermedades cardiovasculares. Puede servir en la implementacin de programas para la deteccin
temprana de varias enfermedades de la retina y tambin para la identificacin biomtrica basada en
la forma de los vasos sanguneos. La segmentacin manual de vasos sanguneos de retina es una
tarea que consume mucho tiempo y requiere entrenamiento y habilidad. Los vasos sanguneos en
la retina estn compuestos de arterias y venas que se presentan como lneas oscuras en un fondo
relativamente uniforme. La dificultad de su segmentacin se debe a su forma, tamao y luminosidad
altamente variables, ruido en la imagen, adems de su cruce y bifurcacin.

La segmentacin de vasos sanguneos de retina y la caracterizacin de sus atributos morfolgicos,


como largo, ancho, tortuosidad y/o patrones de ramificacin y ngulos son utilizados para
el diagnstico, deteccin temprana, y evaluacin de varias enfermedades cardiovasculares y
oftalmolgicas como diabetes, hipertensin, arterioesclerosis y neovascularizacin coroidea [13,
49, 55]. La deteccin automtica y el anlisis de los vasos sanguneos pueden asistir en la
implementacin de programas de deteccin temprana para retinopata diabtica [2], evaluacin
de retinopata en infantes prematuros [1, 12], deteccin de la zona de la fvea [6], estrechamiento
arteriolar [3,18,19], retinopata hipertensiva en relacin a la tortuosidad de los vasos sanguneos [4],
medicin del dimetro de los vasos sanguneos en relacin con el diagnstico de hipertensin
[5], y ciruga lser asistida por computador [22]. La deteccin automtica de lesiones como
microaneurismas, que son los primeros sntomas en aparecer en la retinopata diabtica pueden
depender de la segmentacin de vasos sanguneos de retina [80]. Por otro lado, la segmentacin
manual de vasos sanguneos de retina es una tarea larga y tediosa que adems requiere
entrenamiento y habilidad [49].

9
Tambin es til la segmentacin de vasos para el registro de un nmero de imgenes de retina,
mostrando los cambios de la retina a travs del tiempo, siguiendo los cambios de alguna enfermedad
[9, 10].
La segmentacin de vasos sanguneos puede ser utilizada para identificacin de fvea y el disco
ptico [79]. Adems, el rbol vascular de la retina es nico para cada individuo y puede ser usado
para identificacin biomtrica [7, 8].

El sistema de segmentacin de vasos sanguneos diseado e implementado en este trabajo, es


utilizable en la segmentacin de vasos sanguneos de otras zonas del cuerpo humano, tal como
vasos sanguneos del corazn, cerebro o pulmones, en imgenes 2D.
La fotografa de la retina se realiza con una cmara digital especial para fondo de ojo, capaz de
simultneamente iluminar y fotografiar la retina. Es diseada para observar la superficie interior
del ojo, mostrando la retina, disco ptico, y mcula. Existen tres modos de fotografa: imagen
de los tres canales de color (rojo-verde-azul), imagen sin el canal rojo (red-free) y angiografa,
una tcnica ms invasiva, que corresponde a la fotografa de la retina luego de aplicar una tinta
fluorescente inyectada al flujo sanguneo [49].

En la figura 1.1 se muestran las estructuras relevantes del ojo humano para este trabajo,
especialmente la mcula, retina y los vasos sanguneos de la retina.

Figura 1.1: Estructuras relevantes del ojo humano. Imagen obtenida de [85].

A modo de ejemplo, la segmentacin de vasos sanguneos de la retina puede utilizarse para


detectar signos tempranos de una enfermedad denominada retinopata diabtica y que es una
enfermedad que es la principal causa de ceguera entre la poblacin en edad laboral en pases
desarrollados. Todas las personas con diabetes pueden eventualmente desarrollar esta enfermedad
[20]. Se estima una prevalencia de diabetes del 4.4 % en 2030, correspondiendo a un total de 366
millones de personas en el mundo [21]. La deteccin temprana y tratamiento de esta enfermedad
es considerada un ahorro de costos significativo [11, 17] [14, 20]. La deteccin y localizacin de
los vasos sanguneos puede ser usado como un primer paso para discriminar entre estructuras
normales de vasos y defectos que aparecen como producto de la enfermedad como por ejemplo
microaneurismas y hemorragias [3, 2325].

10
El problema de segmentacin de vasos sanguneos en imgenes de retina ha sido abordado en
mltiples publicaciones. Las categoras en las que se agrupan las publicaciones de segmentacin
de vasos sanguneos, en publicaciones de revisin de mtodos [49, 50], son: tcnicas de
reconocimiento de patrones [45,51,5355,57,58], filtros adaptados (Matched filters) [49,52,61,62],
seguimiento (Tracking) de vasos sanguneos [74], morfologa matemtica [6366], enfoques
multiescala [6769] y enfoques basados en modelos [70, 71, 73].
En la categora de reconocimiento de patrones supervisado, se extrae un vector de caractersticas
(filtros lineales, curvatura, intensidad de la imagen, entre otros) por cada pixel y posteriormente se
aplica un clasificador (K-Nearest Neighbors [53, 54], GMM [45], SVM [55, 56], AdaBoost [57] y
redes neuronales [58]).

En reconocimiento de patrones no supervisado, Villalobos-Castaldi et al. [59] usa un filtro adaptado


(matched filter) para el realce de los vasos sanguneos en la imagen, y posteriormente se maximiza
la entropa de la matriz de co-ocurrencia, obteniendo un umbral para segmentar la imagen.
Kande et al. [60] usa la informacin de los canales rojo y verde para corregir la iluminacin no-
uniforme de la imagen, luego se utilizan filtros adaptados para mejora del contraste, despus utiliza
fuzzy C-means para agrupamiento (clustering), finalizando con etiquetamiento de componentes
conectadas(connected-component labeling).
En la categora de filtros adaptados (Matched filters), se utilizan filtros gaussianos 2D y a
continuacin un umbral para la segmentacin [52, 61, 62].

En seguimiento (Tracking) de vasos, Delibasis et al. [74] usa un algoritmo de seguimiento (tracking)
para la segmentacin de vasos sanguneos, usando un modelo paramtrico de un vaso sanguneo y
una medida de similitud entre una porcin de la imagen y el modelo del vaso sanguneo.
Con respecto a los mtodos que usan morfologa matemtica, se aplican filtros lineales, luego se
emplean operaciones morfolgicas y finalmente un algoritmo de crecimiento de regiones [6466].

En enfoques multiescala, Martinez-Perez et al. [67] usa un filtro gaussiano en diferentes escalas,
luego obtiene el gradiente y la curvatura, y calcula el mximo sobre las escalas, finalmente se
usa un algoritmo de crecimiento de regiones (region growing). Anzalone et al. [68] utiliza el
algoritmo CLAHE de ecualizacin adaptiva de histograma, luego se mide la curvatura mediante
el Hessiano de la convolucin de la imagen con un filtro gaussiano y la segmentacin se realiza
mediante un umbral a la imagen de curvatura. Vlachos et al. [69] usa normalizacin local como
preprocesamiento, luego aplica seguimiento (tracking) de vasos sanguneos usando mltiples
escalas, combinndolos en un mapa de confidencia, y la segmentacin es realizada mediante
un umbral obtenido con cuantizacin y se realiza postprocesamiento mediante operaciones
morfolgicas.

En enfoques basados en modelos, Lam et al. [70] efecta diversas medidas de concavidad que
modelan las secciones transversales de los vasos sanguneos. Espona et al. [71,72] utilizan modelos
de contorno activo (active contour models snakes) en combinacin con propiedades topolgicas
de los vasos sanguneos para su segmentacin. Zhang et al. [73] utiliza proyecciones no lineales
(nonlinear projections) para capturar las caractersticas de los vasos sanguneos y la segmentacin
se realiza utilizando un umbral adaptivo.

La dificultad de la segmentacin de vasos sanguneos en imgenes se debe a que la forma, tamao,


e intensidad de luminosidad de los vasos sanguneos puede variar enormemente. Adems, las

11
caractersticas del fondo de la imagen pueden parecer similares a vasos sanguneos. El cruce y
bifurcacin de los vasos sanguneos puede complicar ms su modelacin. El ruido en la imagen,
iluminacin variable espacialmente y falta de contraste entre vasos sanguneos y fondo pueden ser
desafos significativos para la extraccin de vasos sanguneos. Los vasos sanguneos de retina estn
compuestos de arterias y venas, cuyo ancho en una imagen es variable, dependiendo del ancho real
del vaso sanguneo y de la resolucin de la imagen. Visualmente, se presentan en la imagen de
retina como lneas oscuras sobre un fondo relativamente uniforme.

La mayora de los mtodos utilizados para la segmentacin de vasos sanguneos de retina


consideran implcita o explcitamente una ventana alrededor del pixel que se desea clasificar
como vaso sanguneo o fondo (ver captulo 2). sto implica una clasificacin en un espacio de
alta dimensin para dos clases. La dimensin del espacio de caractersticas original est dado
por las dimensiones de la ventana utilizada (por ejemplo, una ventana de 21 21 pixeles que
corresponde a un espacio de 21 21 = 441 caractersticas). sto dificulta la utilizacin de un
clasificador en el espacio de caractersticas original por varios problemas llamados la maldicin de
la dimensionalidad [97], por lo que en la prctica muchos de los trabajos publicados corresponden
a un mtodo de extraccin de caractersticas para la reduccin de la dimensionalidad y el posterior
uso de un clasificador.

En ste trabajo se busca encontrar una extraccin de caractersticas adecuada, que reduzca la
dimensionalidad del espacio de caractersticas manteniendo la separabilidad entre las clases en
las nuevas caratersticas, con la finalidad de tener un sistema de segmentacin rpido y con buen
desempeo.

En la figura 1.2 se presenta una ventana de aproximadamente 21 21 pixeles alrededor de un


pixel marcado manualmente como vaso sanguneo.

(a) Imagen original (b) Ventana

Figura 1.2: Ventana alrededor de un pixel marcado como vaso sanguneo (en celeste), en la imagen
40 de la base de datos DRIVE.

12
En este trabajo se desarrolla un nuevo mtodo de segmentacin de vasos sanguneos de
retina, usando la base de datos disponible internacionalmente, DRIVE, que permite comparar los
resultados obtenidos con otros publicados previamente en la literatura cientfica.

Se investiga el uso de la distancia de Bhattacharyya [3335] entre histogramas de clases de


pixeles de vasos sanguneos y fondo de la retina, para la eleccin del canal de la imagen con ms
informacin discriminadora entre vasos sanguneos y fondo. Adems, se estudia la optimizacin
de los parmetros de la etapa de preprocesamiento del sistema, consistente en una ecualizacin
adaptiva de histograma [32], para mejorar el contraste entre vasos sanguneos y fondo, usando la
maximizacin de sta medida de estadstica en el conjunto de entrenamiento.

En la etapa de extraccin de caractersticas del sistema, se investiga el efecto de una modificacin a


los filtros Gabor, ampliamente utilizados [37,8991], proponiendo filtros lineales correspondientes
a la suma de tres filtros Gabor. Para la optimizacin de los parmetros de los filtros, se estudia la
utilizacin de un algoritmo gentico [39, 9295], cuya funcin objetivo depende del accuracy de
los resultados de la etapa de segmentacin, en el conjunto de entrenamiento de la base de datos
DRIVE.

Para la etapa de segmentacin, se estudia el uso de un umbral obtenido mediante la maximizacin


de la entropa de la matriz de co-ocurrencia [98100], posterior a la aplicacin de filtros.

1.2. Objetivo General

El objetivo general de este trabajo es el desarrollo de un mtodo que permita la segmentacin


automtica de vasos sanguneos en imgenes digitales de retina, mediante el procesamiento digital
de imgenes.

1.3. Objetivos Especficos

Los objetivos especficos son:

Desarrollo de una etapa de preprocesamiento, que permita enfatizar la presencia de los vasos
en la imagen reduciendo el ruido presente. Para esto se propone la extraccin de un canal de
color de la imagen y la aplicacin de ecualizacin adaptiva de histograma, cuyos parmetros
se optimizarn con la distancia de Bhattacharyya entre los histogramas de pixeles de vasos
sanguneos y pixeles de fondo.

Se propone desarrollar un nuevo mtodo de segmentacin de vasos sanguneos basado en


filtros Gabor cuyos parmetros sern ajustados por un algoritmo gentico.

Aplicar el mtodo de segmentacin de vasos a la base de datos de imgenes DRIVE.

Optimizar los parmetros del banco de filtros mediante algoritmos genticos y el umbral de
segmentacin mediante la maximizacin de la entropa de la matriz de co-ocurrencia.

13
Obtencin de los resultados de la segmentacin medidos a travs del accuracy como medida
de desempeo y la comparacin con resultados publicados en revistas internacionales para la
base de datos DRIVE.

1.4. Estructura de la tesis

La estructura utilizada en este documento para presentar el trabajo realizado es la siguiente:

Captulo 1. Introduccin: Se describe el tema abordado, su importancia, lo que se ha


realizado hasta ahora para resolverlo en publicaciones y se describen los objetivos de la tesis.

Captulo 2. Antecedentes sobre deteccin de vasos sanguneos: Corresponde a la revisin


bibliogrfica o antecedentes. Se comentan las tcnicas empleadas por otros trabajos y
publicaciones en el tema.

Captulo 3. Metodologa: Se detalla la metodologa seguida en el desarrollo de esta


investigacin.

Captulo 4. Resultados: Se detallan las pruebas realizadas junto a los resultados obtenidos.

Captulo 5. Conclusin: Se comentan las conclusiones del trabajo realizado y se proponen


lneas de trabajo a seguir en el futuro.

14
Captulo 2

Antecedentes sobre deteccin de vasos


sanguneos

En este captulo se presentan los mtodos y resultados de publicaciones que realizan


segmentacin de vasos sanguneos en imgenes de retina.

2.1. Trabajo realizado previamente

La definicin de categoras de las publicaciones relacionadas con el tema de sta tesis se realiz
de forma similar a publicaciones de revisin de mtodos de segmentacin de vasos sanguneos [50]
y de segmentacin de vasos sanguneos en imgenes de retina [49]. A continuacin se presentan
las categoras principales.

Tcnicas de reconocimiento de patrones.

Filtros adaptados (Matched filters)

Seguimiento (Tracking) de vasos sanguneos.

Morfologa matemtica.

Enfoques multiescala.

Enfoques basados en modelos.

A continuacin se describen las metodologas ocupadas en las publicaciones relacionadas,


segn las categoras descritas. Slo se toman en cuenta publicaciones con resultados en la base de
datos DRIVE, para que sea posible hacer una comparacin de sus resultados con los de esta tesis.

15
2.1.1. Tcnicas de reconocimiento de patrones

Dentro de las tcnicas de reconocimiento automtico de patrones existen dos categoras;


aprendizaje supervisado y no supervizado. El aprendizaje supervisado cuenta con informacin de
las etiquetas de cada clase para cada pixel de la imagen, mientras que el aprendizaje no supervisado
no cuenta con informacin a priori.

Mtodos supervisados

En los mtodos supervisados es necesario tener un ground truth que identifique la clase
correspondiente para cada pixel. Suelen tener mejores resultados que los mtodos no supervisados,
sin embargo el ground truth no est siempre disponible en aplicaciones reales [49], adems de
existir desacuerdo entre el ground truth realizado por distintos observadores expertos [51]. ste
ltimo argumento se observa en la base de datos DRIVE, ya que el segundo observador experto
obtiene un accuracy de 0.9473 en el conjunto de prueba al compararlo con el primer observador
experto.

Niemeijer et al. [53] extrae un vector de caractersticas para cada pixel que consiste
en el canal verde de la imagen, y las respuestas a un filtro gaussiano con escalas de
{1, 2, 4, 8, 16} pixeles. Posteriormente se ocupa un clasificador k-Vecinos ms cercanos (k-
Nearest Neighbors).

Staal et al. [54] detecta crestas en la imagen, para las cuales se genera un vector de 27
caractersticas. Posteriormente se utiliza un clasificador k-Vecinos ms cercanos (k-Nearest
Neighbors).

Soares et al. [45] extrae un vector de 5 caractersticas para cada pixel de la imagen,
incluyendo el canal verde y la respuesta a 4 filtros Gabor, con una escala diferente por cada
uno. Posteriormente se utiliza un clasificador bayesiano, con un modelo de combinacin
lineal de distribuciones gaussianas.

Ricci y Perfetti [55] extraen un vector de 3 caractersticas para cada pixel, incluyendo el
canal verde y la respuesta mxima a dos filtros: una linea y una cruz de pixeles con diferentes
rotaciones. La clasificacin se realiza utilizando un clasificador SVM.

Xu y Luo [56] realizan un preprocesamiento extrayendo los vasos sanguneos ms gruesos


en la imagen. Se crea un vector de 12 caractersticas en los pixeles restantes que se clasifican
con SVM. Como postprocesamiento, se hace seguimiento (tracking) de los vasos sanguneos
utilizando la matriz Hessiana.

Lupascu et al. [57] utiliza un vector de 41 caractersticas por cada pixel, incluyendo filtros
gaussianos, filtros Gabor, curvatura y diferentes escalas. El clasificador utilizado corresponde
a AdaBoost, usando umbrales para cada caracterstica.

Marin et al. [58] usa un vector de 7 caractersticas por cada pixel basadas en escala de grises
y momentos y una red neuronal como clasificador.

16
Mtodos no supervisados

Los mtodos no supervisados tratan de encontrar patrones inherentes a los vasos sanguneos
en imgenes de retina sin contar con un ground truth [49].

Kande et al. [60] usa la informacin de los canales rojo y verde de la imagen para corregir la
iluminacin no-uniforme de la imagen. Se utilizan filtros adaptados para mejora del contraste.
Posteriormente se utiliza fuzzy C-means para agrupamiento (clustering), finalizando con
etiquetamiento de componentes conectadas(connected-component labeling).

Villalobos-Castaldi et al. [59] usa un filtro adaptado (matched filter) para el realce de los
vasos sanguneos en la imagen. Posteriormente se maximiza la entropa de la matriz de co-
ocurrencia, obteniendo un umbral para segmentar la imagen.

2.1.2. Filtros adaptados (Matched filters)

La aplicacin de filtros adaptados corresponde a la convolucin con filtros 2D con la imagen


de retina. El filtro es diseado para modelar una caracterstica presente en alguna posicin y
orientacin en la imagen, de forma que la respuesta al filtro corresponde al grado de presencia
de esa caracterstica [49].

Chaudhuri et al. [62] propuso un filtro 2D gaussiano diseado para ajustarse al perfil de un
vaso sanguneo. El filtro es rotado en mltiples rotaciones separadas en 15 . Para cada pixel
se obtiene la respuesta mxima a las rotaciones de los filtros, a la cual se le aplica un umbral
para segmentar la imagen.

Al-Rawi et al. [61] mejor el mtodo de Chaudhuri [62] optimizando los parmetros de
tamao del filtro, desviacin estndar y valor del umbral de segmentacin, utilizando el
conjunto de entrenamiento de la base de datos DRIVE.

Zhang et al. [52] utiliza un filtro gaussiano 2D, cuya respuesta es segmentada utilizando un
umbral adaptivo en funcin de la respuesta a la primera derivada del filtro gaussiano 2D
promediada en un vecindario de cada pixel.

2.1.3. Seguimiento (Tracking) de vasos sanguneos

Los algoritmos de seguimiento de vasos sanguneos usan la informacin local (como similitud
con modelos paramtricos) en conjunto con mtodos de seguimiento como el filtro de Kalman.
stos algoritmos han sido utilizados para la segmentacin de vasos sanguneos de retina en [7577].

Delibasis et al. [74] usa un algoritmo de seguimiento (tracking) para la segmentacin de vasos
sanguneos, usando un modelo paramtrico de un vaso sanguneo y una medida de similitud
entre una porcin de la imagen y el modelo del vaso sanguneo.

17
2.1.4. Morfologa matemtica

La morfologa matemtica provee un enfoque al procesamiento digital de imgenes basado


en las formas geomtricas [78]. En el procesamiento de imgenes, los operadores morfolgicos
aplican elementos estructurales a imgenes, tpicamente binarias, pero tambin se han extendido a
imgenes en escala de gris. Las operaciones morfolgicas principales son la erosin y dilatacin
[49].

Zana et al. [63] emplea operaciones morfolgicas y evaluacin de la curvatura.

Mendonca et al. [64] aplica un filtro de derivada de gaussianas a la imagen de retina,


posteriormente se aplican cuatro operaciones morfolgicas en diferentes escalas. La
segmentacin se obtiene con un algoritmo de crecimiento de regiones (region growing).

Fraz et al. [65] aplica la derivada de un filtro gaussiano en cuatro orientaciones.


Posteriormente se usan operaciones morfolgicas para el realce de los vasos sanguneos.
Luego se obtiene la informacin de los 2 bits ms significativos de cada pixel (bit plane
slicing). La segmentacin se obtiene con un algoritmo de crecimiento de regiones (region
growing).

Miri et al. [66] utiliza la transformada curvelet y mltiples operaciones morfolgicas.


La segmentacin se obtiene con etiquetamiento de componentes conectadas(connected-
component labeling).

2.1.5. Enfoques multiescala

La idea detrs de la representacin en mltiples escalas para la extraccin de vasos sanguneos


es separar la informacin relacionada con vasos sanguneos que tengan diferentes anchos [49].

Martinez-Perez et al. [67] obtiene la convolucin de la imagen con un filtro gaussiano


en diferentes escalas. Posteriormente se obtiene el gradiente y la curvatura (mediante la
matriz Hessiana), y se calcula el mximo sobre las escalas. Para la segmentacin se usa
la informacin de gradiente y curvatura en un algoritmo de crecimiento de regiones (region
growing).

Anzalone et al. [68] utiliza el algoritmo CLAHE de ecualizacin adaptiva de histograma


como preprocesamiento. Luego se mide la curvatura mediante el Hessiano de la convolucin
de la imagen con un filtro gaussiano. La segmentacin se realiza mediante un umbral a la
imagen de curvatura. El ajuste de los parmetros de la escala del filtro gaussiano y el umbral
de segmentacin se realiza mediante la optimizacin de algunas medidas de desempeo entre
las que se encuentran el mximo accuracy en el conjunto de entrenamiento.

Vlachos et al. [69] usa normalizacin local como preprocesamiento. Luego aplica
seguimiento (tracking) de vasos sanguneos usando mltiples escalas, combinndolos en
un mapa de confidencia. La segmentacin es realizada mediante un umbral obtenido con
cuantizacin. Se realiza postprocesamiento mediante operaciones morfolgicas.

18
2.1.6. Enfoques basados en modelos

Los enfoques basados en modelos aplican modelos explcitos de los vasos sanguneos para
realizar la segmentacin [49].

Lam et al. [70] efecta diversas medidas de concavidad que modelan las secciones
transversales de los vasos sanguneos.

Espona et al. [71, 72] utilizan modelos de contorno activo (active contour models snakes)
en combinacin con propiedades topolgicas de los vasos sanguneos para su segmentacin.

Zhang et al. [73] utiliza proyecciones no lineales (nonlinear projections) para capturar las
caractersticas de los vasos sanguneos. La segmentacin se realiza utilizando un umbral
adaptivo.

2.1.7. Resumen de resultados previamente publicados

La tabla 2.1 muestra los resultados alcanzados por las publicaciones descritas anterioremente
en la base de datos DRIVE. Adicionalmente, se muestran los resultados obtenidos por el segundo
experto humano, que corresponde a una segunda segmentacin manual realizada en el conjunto
de prueba de la base de datos DRIVE, efectuada por otro experto distinto del que realiz
la segmentacin contra la que se miden los resultados. Esta segunda segmentacin sirve de
comparacin con la del primer experto.

19
Tabla 2.1: Medidas de desempeo calculadas en el conjunto de prueba de la base de datos DRIVE.

Autor(es) Sensitivity Specifity Accuracy AUC


Segundo experto 0.7760 0.9725 0.9473 -
Niemeijer et al. [53] 0.7145 - 0.9416 0.9294
Staal et al. [54] - - 0.9442 0.9520
Soares et al. [45] - - 0.9466 0.9614
Ricci y Perfetti [55] - - 0.9563 0.9558
Lupascu et al. [57] 0.7200 - 0.9597 0.9561
Xu y Luo [56] 0.7760 - 0.9328 -
Marin et al. [58] 0.7067 0.9801 0.9452 0.9588
Kande et al. [60] - - 0.8911 0.9518
Villalobos-Castaldi et al. [59] 0.9648 0.9480 0.9759 -
Chaudhuri et al. [62] - - 0.8773 0.7878
Al-Rawi et al. [61] - - 0.9535 0.9435
Zhang et al. [52] 0.7120 0.9724 0.9382 -
Delibasis et al. [74] 0.7288 0.9505 0.9311 -
Zana et al. [63] 0.6971 - 0.9377 0.8984
Mendonca et al. [64] 0.7344 0.9764 0.9452 -
Fraz et al. [65] 0.7152 0.9769 0.9430 -
Miri et al. [66] 0.7352 0.9795 0.9458 -
Martinez-Perez et al. [67] 0.7246 0.9655 0.9344 -
Anzalone et al. [68] - - 0.9419 -
Vlachos et al. [69] 0.7470 0.9550 0.9290 -
Lam et al. [70] - - 0.9472 0.9614
Espona et al. [72] 0.7436 0.9615 0.9352 -
Zhang et al. [73] - 0.9772 0.9610 -

Es posible que algunos de los resultados mostrados tengan errores en el clculo de las medidas
de desempeo. sto es reportado en algunas publicaciones, especficamente para los resultados de
Ricci y Perfetti [26, 70] y Lupascu et al. [27].

20
Captulo 3

Metodologa

En esta seccin se describe detalladamente la metodologa propuesta.

La etapa de preprocesamiento aplicada comprende la obtencin del canal verde de la imagen


original y luego el uso de una ecualizacin de histograma adaptiva con la finalidad de realzar el
contraste entre los pixeles de vasos sanguneos y fondo. La optimizacin de los parmetros de la
ecualizacin de histograma se hace mediante la maximizacin de la distancia de Bhattacharyya
de los histogramas de las clases de vasos sanguneos y fondo, posterior a la aplicacin de la
ecualizacin.

En la etapa de extraccin de caractersticas se utiliza un banco de filtros lineales, con la finalidad


de obtener una reduccin de la dimensionalidad del problema, tal que las caractersticas sean
separables para cada clase, en pixeles de vasos sanguneos y fondo. La formulacin de los filtros
lineales utilizados corresponde a la suma de tres filtros Gabor 2D. La reduccin de dimensionalidad
entrega una sola caracterstica, correspondiente al mximo de las respuestas al banco de filtros en
cada pixel de la imagen.

Finalmente, la etapa de segmentacin corresponde a la obtencin de un umbral ptimo para la


clasificacin en pixeles de vasos sanguneos y fondo, aplicado a la caracterstica del mximo de las
respuestas al banco de filtros. El valor del umbral ptimo es obtenido mediante la maximizacin
de la entropa de la matriz de co-ocurrencia. El sistema completo es entrenado ajustando los
parmetros de los filtros lineales utilizados, con algoritmos genticos, usando como funcin
objetivo el accuracy promedio de las segmentaciones obtenidas en el conjunto de entrenamiento de
la base de datos DRIVE.

En la figura 3.1 se muestra un diagrama del sistema implementado, mostrando las etapas que son
efectuadas por el sistema durante la segmentacin.

21
Figura 3.1: Diagrama de bloques de la ejecucin del mtodo propuesto.

3.1. Base de datos

Para el entrenamiento y prueba del mtodo utilizado se us la base de datos DRIVE [36].

DRIVE es una base de datos internacional, ampliamente utilizada en publicaciones de


segmentacin de vasos sanguneos de retina. Cuenta con el ground truth de expertos, lo que
posibilita la comparacin con los resultados de otras publicaciones.

La base de datos DRIVE consiste en 40 imgenes del fondo de la retina, junto con segmentaciones
manuales de los vasos sanguneos de la retina. Las imgenes fueron capturadas en forma digital,
con tamao 768 584 pixeles, 8 bits por cada canal de color y muestran un rea de la retina de
aproximadamente 540 pixeles de dimetro.

Las 40 imgenes estn divididas en conjunto de entrenamiento y prueba, conteniendo 20


imgenes cada uno. Han sido segmentadas manualmente por tres observadores entrenados por un
oftalmlogo. Las imgenes en el conjunto de entrenamiento fueron segmentadas una vez, mientras
que las imgenes del conjunto de prueba fueron segmentados dos veces, resultando en los conjuntos
A y B. En el conjunto A 12.7 % de los pixeles fueron marcados como vasos sanguneos, en
comparacin a 12.3 % en el conjunto B. El desempeo de las pruebas es medido en el conjunto
A del conjunto de prueba como ground truth.

Las segmentaciones del conjunto B del conjunto de prueba son usados como un observador de
referencia para comparaciones de desempeo con el conjunto A. La base de datos cuenta con una

22
mscara de segmentacin que delimita el rea de inters con la finalidad de obtener un conteo de
los pixeles correctamente clasificados de forma confiable y reproducible.

En la figura 3.2 se muestra un ejemplo de imagen de fondo, junto con la mscara de segmentacin
de la zona de inters y segmentacin de vasos sanguneos como ground truth correspondientes.

Figura 3.2: Imagen de fondo, mscara de segmentacin de la zona de inters y ground truth de la
imagen 40 de la base de datos DRIVE.

3.2. Medidas estadsticas de clasificacin

A continuacin se describe la medida estadstica utilizada en esta tesis como indicador de


desempeo del mtodo de segmentacin de vasos sanguneos.

3.2.1. Accuracy

El accuracy es la medida de desempeo ms utilizada por las publicaciones de segmentacin


de vasos sanguneos de retina [45, 5270, 7274]. El uso del accuracy permite una comparacin
con los resultados de publicaciones del tema.
El accuracy est definido como la proporcin de casos correctamente clasificados del total de
casos examinados [48].

N de casos correctamente clasificados VP + VN


Accuracy = = . (3.1)

N de casos totales V P + V N + FP + FN

Donde {V P,V N, F P, F N } corresponden a verdaderos positivos, verdaderos negativos, falsos


positivos y falsos negativos respectivamente. En esta tesis los casos positivos son los pixeles que
corresponden a vasos sanguneos en una imagen de retina y los casos negativos son los que no
corresponden a vasos sanguneos.

23
3.3. Preprocesamiento

3.3.1. Seleccin del canal de color

En publicaciones de segmentacin de vasos sanguneos [45] se menciona que la mayor parte


de la informacin est contenida en el canal verde de la imagen de retina, mostrando un mayor
contraste entre pixeles de vasos sanguneos y pixeles de fondo, como se muestra en la figura 3.3.

En este trabajo se utiliz la distancia de Bhattacharyya 3.3.1 entre los histogramas de pixeles de
vasos sanguneos y fondo de cada canal de color (rojo, verde y azul) para la eleccin del canal de
color a utilizar en las siguientes etapas del mtodo. Los resultados se muestran en la seccin 4.1.

Figura 3.3: Imagen original del fondo de la retina y canales rojo, verde y azul de la imagen 40 de
la base de datos DRIVE.

Distancia Estadstica

Distancia de Bhattacharyya La distancia de Bhattacharyya es una medida de tipo divergencia,


utilizada para medir el grado de disimilaridad entre dos distribuciones de probabilidad. La distancia
de Bhattacharyya ha sido usada como una medida de separabilidad entre dos clases para extraccin
de caractersticas [34].

Definicin Primero se define el coeficiente de Bhattacharyya, para dos distribuciones de


probabilidad p1 (x), p2 (x) [33].
Z p
= Coeficiente de Bhattacharyya = p1 (x)p2 (x)dx (3.2)

pertenece a [0, 1]. La medida de distancia de Bhattacharyya, se define como:

B = Distancia de Bhattacharyya = ln (3.3)

Por lo tanto B [0, ]. La distancia de Bhattacharyya no es rigurosamente una distancia, debido a


que se puede demostrar que no cumple la desigualdad triangular. Es interesante observar que para el
caso de distribuciones gaussianas con la misma matriz de covarianza, la distancia de Bhattacharyya

24
toma una forma similar a la distancia de Mahalanobis, tal como se muestra en 3.5. En el caso de
distribuciones gaussianas multivariantes, con pi (x) = N (mi , i ), se tiene:
1 1 det 1 + 2
B(p1 , p2 ) = (m1 m2 )T 1 (m1 m2 ) + ln( ) Con = . (3.4)
8 2 det1 det2 2

Considerando 1 = 2 = :
1
B(p1 , p2 ) = (m1 m2 )T 1 (m1 m2 ) (3.5)
8

3.3.2. Inversin de la imagen

Al igual que en otros trabajos de segmentacin de vasos sanguneos de retina [45, 55], se
invierte la imagen del canal elegido con la finalidad de que los vasos sanguneos se muestren
con un nivel de intensidad mayor que el fondo, sin embargo esta operacin es slo para una
mejor apreciacin sin ningn efecto en el rendimiento del sistema. La inversin consiste en una
transformacin lineal, idntica para la intensidad de cada pixel, como se muestra en la ecuacin
3.6.

Iinvertida (x, y) = 255 Ioriginal (x, y) (3.6)

3.3.3. Extensin del borde del rea de inters

La extensin de los bordes de una imagen, previa a la convolucin con un filtro 2D, es
ampliamente utilizada para evitar los efectos no deseados, como falsos bordes en una imagen.
La dificultad adicional de la aplicacin de una extensin del borde en imgenes de retina se debe
a que el rea de inters es circular, y que por lo tanto las tcnicas usuales de extensin de borde
en imgenes rectangulares no son tiles. Debido a sto se desarroll una tcnica que toma en
cuenta la geometra del problema. ste paso previo tambin es realizado por otras publicaciones de
segmentacin de vasos sanguneos de retina [45].

El rea de inters dentro de la imagen corresponde aproximadamente a un crculo. Existe el peligro


de generar comportamientos errneos en los bordes del rea de inters al aplicar la ecualizacin de
histograma adaptativo y la convolucin con los filtros Gabor, ya que ambos mtodos consideran
una ventana deslizante, que al encontrarse con el borde de la zona de inters, pueden tener
comportamiento no deseados. En el caso de la convolucin con los filtros Gabor es posible que
se generen falsos positivos (falsa deteccin de vasos) en dicho borde. Para evitar estos problemas,
se extiende el borde de forma artificial, de forma de generar un fondo uniforme.

Generacin de la mscara de segmentacin del rea de inters

Como paso previo a la extensin del borde del rea de inters, es necesario obtener una mscara
que delimite la zona de inters. La mscara original incluida en la base de datos no es utilizada

25
debido a errores en los bordes marcados que se muestran en 3.5a,y que generan defectos en la
etapa siguiente, como se muestra en la figura 3.7a.

Para esto se obtiene el histograma normalizado de la imagen, aplicando un umbral obtenido donde
la distribucin acumulada del histograma alcanza el 70 %. La eleccin del valor de umbral del
histograma se obtuvo experimentalmente en el conjunto de entrenamiento. Esto se ilustra en la
figura 3.4, con ambas curvas normalizadas para una mejor visualizacin.

Luego de aplicar el umbral, se aplican operaciones morfolgicas de apertura y cierre con un


elemento estructural cuadrado de 3 3 pixeles.

El resultado obtenido se muestra en la figura 3.5b.

Figura 3.4: Histograma normalizado del canal verde y su distribucin acumulada.

26
(a) Errores en mscara original. (b) Mscara generada.

Figura 3.5: Mscara de segmentacin del rea de inters de la imagen 40 de la base de datos DRIVE.

27
Descripcin del mtodo de extensin de borde

Primero se genera la mscara de segmentacin de la zona de inters.

Se obtiene el centro de masa de los pixeles de la zona de inters obtenida con la mscara
generada, como una aproximacin del centro del crculo que corresponde a la zona de inters.

Se transforma el problema a coordenadas polares de forma que es la distancia del centro


del crculo al pixel actual y es el ngulo correspondiente al pixel actual.

Para cada valor de en [0, 2], se incrementa comenzando desde el radio del crculo hasta
un punto en el borde de la imagen, copiando el valor del pixel anterior al siguiente. De
esta forma se consigue la extensin del ltimo pixel dentro del rea de inters, copindolo
repetidamente hacia fuera del crculo. El resultado de sto se muestra en la figura 3.6.

En el caso de que queden orificios en la extensin de borde, se rellenan con el valor promedio
de los 8 pixeles vecinos ms cercanos. Finalmente, el resultado del extensin de borde se
muestra en 3.7b.

Figura 3.6: Borde extendido incompleto.

28
(a) Usando mscara original. (b) Usando mscara generada.

Figura 3.7: Resultado de la extension de borde.

3.3.4. Ecualizacin de histograma adaptativa

La imagen del fondo de la retina original, al igual que el canal verde de sta, presentan
iluminacin no uniforme espacialmente como se observa en 3.7b. sto se refleja en una baja
separabilidad de las clases de vasos sanguneos y fondo a nivel de pixel, tal como se aprecia en
el histograma del canal verde, en la imagen 3.8.

29
Figura 3.8: Histogramas de vasos sanguneos y fondo del canal verde de la imagen.

Con el fin de mejorar el contraste entre los pixeles del fondo de la imagen y de los
vasos sanguneos y de esa forma aumentar la separabilidad entre sus clases en el espacio de
caractersticas, se efecta la ecualizacin de histograma adaptativa.

Algoritmo de ecualizacin de histograma adaptativa

Ecualizacin de histograma La idea de la ecualizacin de histograma original es asignar un


rango ms amplio de niveles de gris a los valores de gris ms frecuentes de una imagen, induciendo
a que el histograma de la imagen resultante sea ms uniforme que el original. La ecualizacin de
histograma mapea los valores de gris de la imagen de entrada de forma que el histograma de la
imagen de salida se aproxime al de la distribucin uniforme, resultando en una mejora subjetiva de
la calidad de la imagen. Sin embargo, la ecualizacin de histograma tiene resultados pobres cuando
la imagen tiene una iluminacin no uniforme espacialmente.

AHE La ecualizacin de histograma adaptativa corresponde a una mejora de contraste local en


la imagen. Para lograr esto, la imagen es dividida en una grilla de regiones rectangulares donde se
realiza ecualizacin de histograma. La cantidad ptima de regiones usadas dependen de la imagen
utilizada y su determinacin requiere experimentacin.

Para cada regin de la imagen, se calcula el histograma de los pixeles contenidos en ella, obteniendo
la transformacin de los niveles de gris en esa regin. Para evitar la discontinuidad de los bordes de
cada regin se utiliza una interpolacin bilineal, eliminando los bordes inducidos artificialmente.
Sin embargo, el algoritmo AHE tiene el problema de amplificar visiblemente el ruido local de las

30
regiones de la imagen cuando se aplica a regiones uniformes en cuanto a intensidad (y que por lo
tanto tienen un gran peak en el histograma).

CLAHE El algoritmo de ecualizacin de histograma adaptativa con contraste limitado (CLAHE


por sus siglas en ingls), es una tcnica de mejora de contraste en imgenes que supera
las limitaciones de la ecualizacin de histograma estndar, con respecto a los problemas por
iluminacin no uniforme y supera el problema de la amplificacin de ruido en zonas uniformes
del algoritmo AHE. Al igual que el algoritmo AHE, la imagen es dividida en una grilla de regiones
rectangulares donde se aplica la ecualizacin de histograma. Fue originalmente desarrollada para
el procesamiento de imgenes mdicas [32]. El problema del ruido asociado al algoritmo AHE es
reducido limitando el realce de contraste en reas homogneas.

stas reas son caracterizadas por tener un gran peak en el histograma asociado, ya que muchos
pixeles de esa regin caen en un mismo rango de niveles de gris. En el algoritmo CLAHE, el
histograma es limitado con un umbral fijo, definido como un factor del promedio del histograma.
Luego de recortar el histograma, los pixeles que fueron recortados son redistribuidos sobre el
resto del histograma, para mantener la suma del histograma igual al original. Por lo tanto, el
algoritmo CLAHE posee dos parmetros que corresponden al tamao de la grilla en que se realiza
la ecualizacin de histograma y el lmite de recorte del histograma.

En la figura 3.9 se ilustran las etapas del algoritmo CLAHE. En la figura 3.9a se ilustra el histograma
de la imagen original, en la figura 3.9b se muestra el lmite de recorte del histograma como una
lnea negra horizontal, en la figura 3.9c se muestra el recorte del histograma efectuado y en la figura
3.9d se muestra la redistribucin de la porcin del histograma recortado en el resto del histograma.

(a) Histograma imagen(b) Lmite de recorte del (c) Histograma recortado. (d) Redistribucin del
original. histograma. histograma.

Figura 3.9: Etapas del algoritmo CLAHE.

Eleccin de parmetros de la ecualizacin de histograma adaptiva

La eleccin de los parmetros del algoritmo CLAHE se realiz maximizando el promedio


de la separabilidad mediante la distancia de Bhattacharyya (descrita en 3.3.1). En la prctica,
se maximiza la distancia de Bhattacharyya promedio en el conjunto de entrenamiento entre los
histogramas normalizados de los pixeles de vasos sanguneos y los pixeles de fondo, obtenidos del
conjunto de entrenamiento de la base de datos DRIVE.

31
En la ecuacin 3.7 se expresa el ajuste de parmetros donde hVi | es el histograma normalizado de
los pixeles correspondientes a vasos sanguneos de la imagen i del conjunto de entrenamiento, hiF |
es el histograma normalizado de los pixeles de fondo de la imagen i del conjunto de entrenamiento,
y = [Grilla, Lmite] corresponde a los parmetros de tamao de grilla y el lmite de recorte de los
histogramas.

N
1 X
= arg max d B (hVi | , hiF | )

(3.7)
N
i=1

Para generar los valores de los parmetros evaluados, se utiliz una matriz de valores con el
lmite de recorte del histograma con valores desde 0.01 hasta 1 en intervalos de 0.01 y las divisiones
de la grilla desde 2 hasta 50 en intervalos de 1.

3.4. Extraccin de caractersticas

Para la extraccin de caractersticas de la imagen de fondo de retina, en la cual se desean


segmentar los vasos sanguneos, se utilizan filtros lineales basados en los filtros Gabor, descritos en
3.4.1.
En este trabajo se utiliza una ventana de 21 21 pixeles en la etapa de extraccin de caractersticas.

3.4.1. Filtros Gabor

Los filtros Gabor han sido usados exitosamente en muchas aplicaciones de procesamiento
de imgenes, como segmentacin de texturas, anlisis de documentos, deteccin de bordes,
identificacion en base a retina, procesamiento de huellas dactilares, codificacin de imgenes y
representacin de imgenes [37, 8991]. Los filtros Gabor corresponden a filtros pasabanda. Una
ventaja de estos filtros es que proveen resolucion ptima en el dominio espacial y en el frecuencial
de la imagen, ya que alzanzan el lmite inferior del producto del ancho de banda y de ancho temporal
de una seal finita, llamado principio de incerteza informacional 3.8.

t f (3.8)
4

Filtros Gabor 2D La extensin a dos dimensiones de los filtros Gabor tiene similitudes a los
campos receptivos de la corteza visual (reas V1 y V2) en el cerebro de mamferos [38]. En el
dominio espacial corresponden a una funcin gaussiana modulada por una funcin exponencial
compleja. A continuacin se muestra su definicin en forma compleja y la parte real.

Definicin
x 02 + 2 y02 2x 0
! !!
g(x, y) = exp exp i + (3.9)
2 2

32
x 02 + 2 y02 2x 0
! !
g(x, y) = exp cos + (3.10)
2 2
La rotacin de las coordenadas est dada por las siguientes ecuaciones.

x 0 = x cos + y sin
y0 = x sin + y cos

Para analizar la respuesta en frecuencia se utiliza la siguiente expresin, equivalente a la ecuacin


3.9, para el filtro Gabor.

x2 + y2
!
1
g(x, y) = exp exp (i2(U x + V y)) (3.11)
2g2 2g

La transformada de Fourier 2D de g(x, y) es:


 
H (u, v) = exp[2 2 g2 (u U) 2 + (v V ) 2 ] (3.12)

De las ecuaciones 3.11 y 3.12 se puede ver que el filtro Gabor es un filtro pasabanda, centrado en
la frecuencia (U,V ) con un ancho de banda determinado por g .
La respuesta al filtro Gabor I2 (x, y), consiste en la convolucin en 2 dimensiones de una imagen de
entrada I (x, y) con el filtro gabor g(x, y). x, y representan las coordenadas espaciales de la imagen.

X
X
I2 (x, y) = g(x, y) I (x, y) = g(1 , 2 ) I (x 1 , y 2 ) (3.13)
1 = 2 =

3.4.2. Filtros utilizados

Con la intencin de crear filtros lineales que se ajusten de mejor forma al problema en
particular de segmentacin de vasos sanguneos, se propone usar filtros correspondientes a la suma
de 3 filtros Gabor, obteniendo ms grados de libertad para ajustar al problema.

En [88] se concluye que los filtros obtenidos mediante ICA (Anlisis de Componentes
Independientes) en imgenes naturales centradas (cuya intensidad promedio est concentrada en
el centro de la imagen), se pueden expresar como la suma de 2 filtros Gabor. sto muestra
la posibilidad de que para algunos tipos de imgenes, sea ms apropiada la extraccin de
caractersticas mediantes filtros lineales distintos a los filtros Gabor.
La expresin de los filtros propuestos, se muestra en la ecuacin 3.14, donde g1,2,3 (x, y) corresponde
a un filtro Gabor, definido por la ecuacin 3.10. Para cada gi (x, y), adems de los parmetros del
filtro Gabor, se agrega un parmetro adicional 0 , tal que el nuevo valor de se obtiene como
muestra la ecuacin 3.15. Esto se hace con el objetivo de obtener sumas de combinaciones de
filtros en diferentes rotaciones entre s.

g(x, y) = g1 (x, y) + g2 (x, y) + g3 (x, y) (3.14)

0 = + 0 (3.15)

33
En la imagen 3.11 se muestran ejemplo de la suma de filtros Gabor donde los parmetros
fueron elegidos de forma arbitraria, donde se aprecia que la suma de filtros Gabor posee una mayor
variedad de formas con respecto a los filtros Gabor originales 3.10.

Figura 3.10: Ejemplos de Filtros Gabor.

Figura 3.11: Ejemplos de filtros generados como suma de 3 filtros Gabor.

3.4.3. Aplicacin de filtros

La convolucin con un filtro 2D es equivalente a la correlacin del mismo filtro rotado en 180
[47], y como los filtros utilizados son simtricos ante una rotacin de 180 grados, la convolucin
con dichos filtros es equivalente a la correlacin.

La correlacin entre dos vectores es a una medida de similitud entre ellos [46], por lo que
convolucionar la imagen original con el banco de filtros generado corresponde a una medida de
similitud entre una ventana alrededor de un pixel y cada uno de los filtros del banco.

34
En base a esta idea, se justifica agregar al banco de filtros las rotaciones en de los filtros generados,
para evaluar la similitud con el banco de filtros de forma invariante a la rotacin. Siguiendo la
misma idea, se obtiene el mximo de las respuestas al banco de filtros, para evaluar la mayor
similitud en cada pixel con el vaso sanguneo representado por algn filtro del banco de filtros.

La aplicacin de filtros en rotaciones en distintos ngulos y la obtencin de la mxima respuesta es


efectuada en otros trabajos [45, 86, 87].

Rotacin angular

Para lograr invariancia a la rotacin en el resultado de la aplicacin de los filtros, al banco de


filtros se agregan las rotaciones en 10 ngulos equiespaciados entre 0 y 180 grados, o sea:
= {0, 20, 40, 60, 80, 100, 120, 140, 160, 180} grados. (3.16)

Obtencin del mximo

El banco de filtros utilizado corresponde a 4 filtros con 10 rotaciones por cada uno. Por lo
tanto, el banco de filtros completo incluye 40 filtros. En la aplicacin de los filtros, se obtiene la
respuesta a cada uno de los 40 filtros y luego se obtiene, para cada pixel de la imagen original, la
mxima respuesta correspondiente a ese mismo pixel en todas las respuestas a los filtros, tal como
se expresa en la ecuacin 3.17.
gk (x, y) denota al k-simo filtro del banco de filtros, I (x, y) a la imagen resultante de la aplicacin
del algoritmo CLAHE y G(x, y) es el resultado de la aplicacin del banco de filtros.

G(x, y) = max {I (x, y) gk (x, y)} (3.17)


k

Como se mencion previamente, al considerar la convolucin como una medida de similitud


entre porciones de la imagen y los filtros del banco de filtros, se justifica obtener el mximo entre
esas similitudes en cada posicin espacial de la imagen.
De sta forma, G(x, y) representa la similitud a algn vaso sanguneo, para cada pixel de la imagen.

3.4.4. Optimizacin de parmetros de los filtros utilizados

Para la optimizacin de los parmetros de los filtros utilizados se usaron algoritmos


genticos. La funcin objetivo del algoritmo gentico corresponde al accuracy promedio de las
segmentaciones realizadas en el conjunto de entrenamiento de la base de datos. En la seccin 3.4.5
se presenta su definicin, caractersticas y funcionamiento.

3.4.5. Algoritmos Genticos

Los algoritmos genticos son mtodos iterativos de optimizacin estocstica, basados en la


teora de seleccin natural de Darwin. Combinan una funcin objetivo aplicada a una cadena de

35
smbolos con un intercambio de informacin aleatorio, ocupando informacin histrica. Han sido
ocupados exitosamente en muchas tareas de optimizacin [9295].

Diferencias con otros mtodos de optimizacin. Los algoritmos genticos son diferentes de
otros mtodos de optimizacin en 4 formas:

1. Los AG funcionan con una codificacin del conjunto de parmetros, no los parmetros en s.

2. Los AG usan una poblacin de soluciones candidatas, no slo una.

3. Los AG usan una funcin objetivo sin necesitar su gradiente.

4. Los AG usan reglas de transicin probabilsticas, no determinsticas.

Definicin

Se asume que existe un espacio de bsqueda discreto y una funcin f : 7 R.


Y un problema asociado:
max f (3.18)
x

Donde x es un vector de variables de decisin y f es la funcin objetivo o fitness. Se asume


un problema de maximizacin, sin embargo si el problema es de minimizacin, el tratamiento
es anlogo. Con el uso de AG, se separa la representacin del problema de las variables en las
cuales est formulado el problema, separndose el genotipo (la codificacin de las variables o
cromosomas), del fenotipo (las variables en s). As, el vector x es representado por una cadena de
smbolos s Al donde l es el largo de la codificacin, usando el mapeo:

c : Al 7 (3.19)

Por lo tanto, la bsqueda de soluciones realizada por el algoritmo gentico se realiza en un


subespacio de soluciones factibles S Al , de forma que el problema a resolver se transforma
en:

maxg(s)
sS
g(s) = f (c(s))

Las codificaciones del conjunto de parmetros son llamadas cromosomas.

Descripcin del funcionamiento.

Un algoritmo gentico simula el proceso de evolucin biolgica en una poblacin de


individuos. Se utiliza una poblacin inicial de soluciones candidatas para el problema de
optimizacin y se generan nuevos individuos a partir de operadores genticos aplicados a los
individuos originales. En cada generacin sobreviven con mayor probabilidad aquellos individuos
que presenten soluciones con mayor fitness (valor de la funcin objetivo), por lo que la poblacin

36
tiende a evolucionar maximizando la funcin objetivo. Sin embargo, el mtodo no garantiza la
convergencia a un mximo global.

Los algoritmos genticos presentan una etapa de inicializacin de la poblacin que suele ser segn
una distribucin aleatoria y una etapa iterativa, donde se aplican los operadores genticos (mutacin
y crossover principalmente) a la poblacin hasta el cumplimiento de un criterio de trmino del
algoritmo gentico [41]. En la figura 3.12 se muestra un diagrama del funcionamiento de los
algoritmos genticos, obtenido de [43].

Figura 3.12: Diagrama del funcionamiento de los algoritmos genticos. Obtenido de [43].

La forma original de los algoritmos genticos [40], usaba codificacin binaria para una
mayor facilidad en su tratamiento terico, sin embargo se han presentado algoritmos genticos
en codificacin entera y real.
En el caso de esta tesis, se utiliz la codificacin real, donde cada elemento del cromosoma del
individuo pertenece al intervalo [0, 1] R.
En el algoritmo 1 se describe el algoritmo gentico estndar.

37
Algoritmo 1 Algoritmo gentico estndar
Entrada: k = 0. Inicializar poblacin P(0).
Evaluar poblacin P(0).
Mientras no se cumpla condicin de trmino hacer
k = k + 1.
Seleccionar poblacin P0 (k) a partir de P(k 1).
Crear poblacin P(k) a partir de P0 (k), usando operadores genticos.
Evaluar poblacin P(k).
Fin Mientras
Devolver mejor solucin en P(k).

Poblacin inicial

Con respecto al tamao de la poblacin, en [39] se menciona que una poblacin de O(log l)
debera ser suficiente para cubrir el espacio de bsqueda, asumiendo una distribucin uniforme de
la poblacin, donde l corresponde al largo de la codificacin de los individuos.

Con respecto a como se elige la poblacin inicial, sta suele ser de forma aleatoria con distribucin
uniforme. Debido a la dificultad de cubrir el espacio de bsqueda de forma uniforme, en ocasiones
es til con mtodos ms sofisticados, tal como considerar las permutaciones de los smbolos del
alfabeto para cada componente del cromosoma en la poblacin.

Otra posibilidad es agregar a la poblacin inicial soluciones buenas conocidas. Se ha mencionado


que incluir buenas soluciones, puede ayudar a un algoritmo gentico a encontrar mejor soluciones
de forma ms rpida que desde un comienzo aleatorio. Sin embargo, tambin existe la posibilidad
de inducir una convergencia prematura [39].

Operadores Genticos

Los operadores ms ocupados por los algoritmos genticos corresponden a tres: seleccin,
crossover y mutacin.

Seleccin

Operador que selecciona los cromosomas para la reproduccin de la poblacin. El objetivo de


este operador es elegir la porcin de la poblacin con mejor calidad. Los cromosomas con mayor
valor de la funcin objetivo, tienen ms probabilidades de ser seleccionados para la reproduccin.
El operador de seleccin puede actualizar toda la poblacin de individuos o slo una parte de sta.
Debido a la naturaleza estocstica de los algoritmos genticos, es til asegurar la supervivencia del
mejor individuo. Esta estrategia es denominada elitismo. A continuacin se describen los mtodos
de seleccin ms usados.

38
Seleccin por torneo Se crea la siguiente generacin realizando un torneo para asignar cada
descendiente. En cada torneo, se seleccionan k individuos al azar, compara sus fitness y el ganador
pasa a la siguiente generacin. El valor de k suele estar entre 2 y 5, para no imponer una presin
selectiva muy alta. Si los individuos seleccionados se retiran de la poblacin original, se garantiza
que el individuo con mejor fitness va a ser elegido.

Seleccin proporcional o por ruleta Se asigna la probabilidad de supervivencia de un individuo


de acuerdo a su fitness normalizado por el de la poblacin.
fitness(Ii )
Psupervivencia (Ii ) = P N (3.20)
j=1 fitness(I j )

A cada individuo se le asigna una porcin del intervalo [0, 1] de acuerdo a su probabilidad de
supervivencia Psupervivencia , y un individuo es seleccionado si un nmero aleatorio cae en su porcin
del intervalo. Esto es como lanzar N veces una ruleta, eligiendo al individuo en el que cae la ruleta,
para la siguiente generacin.
Un problema es que si pocos individuos tienen el mayor fitness es posible que la poblacin converja
tempranamente y si el fitness es uniforme en la poblacin, la seleccin sera muy azarosa.

Seleccin por ranking Es una variante de la seleccin proporcional, donde la probabilidad de


supervivencia se asigna dependiendo de su ranking de fitness. El ranking es obtenido ordenando
los individuos de acuerdo a su fitness. La eleccin de la funcin que asigna la probabilidad de
supervivencia determina el comportamiento del operador.

Seleccin por ranking lineal Se asigna la probabilidad de supervivencia de forma lineal con
respecto al ranking del individuo. Se define el nmero esperado de copias de un individuo como:
x1
(x) = + ( + ) (3.21)
N 1
Donde x = 1 identifica al mejor individuo de la poblacin y x = N al peor, + [1, 2], = 2 + ,
+ es el mximo nmero de copias asignado al mejor individuo y es el mnimo nmero de copias
asignado al peor.
La probabilidad de supervivencia est definida como:
(x)
Psupervivencia (x) = (3.22)
N

Seleccin por ranking no lineal En este caso, se asigna la probabilidad de supervivencia


de forma no lineal con respecto al ranking del individuo. A continuacin se describen las
distribuciones geomtrica y exponencial.

Distribucin geomtrica. corresponde a la probabilidad de supervivencia del mejor


individuo.
Psupervivencia = (1 ) x1 (3.23)

39
Distribucin exponencial.
1 e(Nx)
Psupervivencia = (3.24)
c
Donde c es una constante de normalizacin.

Seleccin estocstica universal Es una variacin es la seleccin proporcional. Consiste en que


en lugar de lanzar una ruleta N veces, se lanza una sola ruleta de N indices equiespaciados con los
que se elige a los individuos.

Primero se asignan porciones del intervalo [0, 1] proporcionalmente al fitness de los individuos,
del mejor al peor. Luego se elige un nmero al azar en [0, N1 ] que corresponde al primer individuo
elegido y el resto de los individuos se eligen en posiciones equiespaciadas en N1 . N corresponde a
la cantidad de individuos a seleccionar del total de la poblacin.

ste mtodo garantiza que todos los individuos con probilidad de supervivencia mayor a N1 son
seleccionados al menos una vez y a lo ms dN Psupervivencia e [44]. En la figura 3.13, basada
en [44], se muestra un esquema del mtodo.

Figura 3.13: Seleccin estocstica universal. Basada en [44].

Elitismo

El operador de elitismo es usado para guardar las mejores soluciones de la generacin [83], o
sea mantener las soluciones con mayores valores de la funcin objetivo en la generacin siguiente.
Sin el elitismo, los mejores resultados pueden ser perdidos durante las operaciones de seleccin,
crossover y mutacin [82]. El elitismo sacrifica diversidad gentica por una mayor velocidad
de convergencia del algoritmo gentico, lo que podra llevar a una convergencia prematura a un
mnimo local [84].

40
Crossover

Esta operacin selecciona aleatoriamente uno o ms puntos donde realizar un cruce entre
los dos cromosomas padre, para generar nuevos cromosomas hijos. Su finalidad es combinar
los cromosomas de los padres para cubrir una mayor extensin en el espacio de bsqueda de
soluciones.

En el caso del crossover de 1 punto, se eligen un punto de corte al azar en el cromosoma de


los padres. El primer hijo toma la porcin de cromosoma del padre 1 desde el comienzo al punto
de corte y del padre 2 desde el punto de corte hasta el final. El segundo hijo toma las porciones
complementarias al del primer hijo. En la figura 3.14 se ilustra el proceso de crossover de un punto
y en la figura 3.15 se ilustra el crossover de 2 puntos.

En el caso del crossover de n hijos, se tienen n puntos de corte. El primer hijo toma porciones
no contiguas del cromosoma del padre 1, separadas por los puntos de corte y el resto del padre 2.
El hijo 2 se toma como las partes complementarias a las del hijo 1.

Figura 3.14: Operador de crossover de un punto con codificacin binaria. Las lneas verticales
azules representan los puntos de corte.

Figura 3.15: Operador de crossover de dos puntos. Las lneas verticales azules representan los
puntos de corte.

Mutacin

ste operador cambia de forma aleatoria un valor en el cromosoma para explorar el espacio
de soluciones, con la esperanza de evitar la convergencia a un ptimo local. Para el caso de
codificacin binaria, se realiza mediante el cambio en un bit del cromosoma con una probabilidad
p fijada previamente en un valor bajo con el objetivo de no alterar las soluciones en forma drstica.
En el caso de codificacin en variable real, una forma de aplicar la mutacin es sumar un vector
real generado al azar M = (m1 , ..., mn ) a la solucin original:

x0 = x + M (3.25)

41
Criterios de trmino El algoritmo gentico podra iterar indefinidamente, buscando mejores
soluciones al problema de optimizacin, sin embargo para obtener soluciones en un tiempo
razonable se utilizan criterios de trmino de las iteraciones. Los criterios de trmino pueden ser
un nmero mximo de iteraciones, una cantidad mxima de iteraciones sin mejora en la funcin
objetivo o el alcance de un valor umbral de la funcin objetivo (por ejemplo un valor cero en un
problema de minimizacin de una funcin objetivo de error).

Fundamentos del funcionamiento

Hay varias escuelas de pensamiento sobre cmo y por qu funcionan los algoritmos genticos,
a continuacin se presentan los principales conceptos.

La visin tradicional La explicacin hecha por Holland [40], de por qu es ms ventajoso usar
el espacio de las codificaciones Al en vez de , se basa en tres ideas. Como concepto central est la
idea de schema, que corresponde a un subespacio de Al , donde todas las codificaciones comparten
valores en comn. Por ejemplo 1 1 representa a todos los valores en {0, 1}4 en que el primer y
ltimo elemento son 1, o sea {1001, 1011, 1101, 1111}.

La primera idea de Holland es paralelismo implcito. Se cree que dependiendo de las caractersticas
del problema, una poblacin de tamao M contiene informacin de O(M 3 ).

El segundo concepto muestra que si hay N (s,t) instancias de un schema S en la poblacin en


el tiempo t, el nmero esperado de instancias en la poblacin en el instante siguiente, se puede
acotar por:
F (S,t)
E[N (S,t + 1)] N (S,t)(1  (S,t)) (3.26)
F (t)
Donde F (S,t) es el fitness del schema S, F (t) es el fitness promedio de la poblacin, y  (S,t)
es un trmino que refleja el potencial de los operadores genticos de destruir las instancias de S.
Esto quiere decir que a corto plazo, los cdigos con mayor fitness, tendrn mayor presencia en la
poblacin y sern ms resistentes a la destruccin por los operadores genticos.

La tercera idea es el supuesto de que la recombinacin de pequeas porciones de cdigo en


porciones ms grandes es una estrategia til para encontrar buenas soluciones, llamada la hiptesis
de bloques de construccin. El no cumplimiento de sta hiptesis es usada como explicacin del
por qu un algoritmo gentico falla en un problema en particular.

Consideraciones Existen muchas variantes de operadores genticos y parmetros, que al no tener


un fundamento terico fuerte, no se puede saber cul es mejor para cada problema en particular.

An ms, el Teorema No-Free-Lunch [42] indica que considerando todos los problemas posibles,
ningn algoritmo de bsqueda es mejor que la bsqueda aleatoria. Esto significa que se debe tener
en cuenta el problema de bsqueda en particular, para adaptar un mtodo de bsqueda.
El operador gentico de crossover funciona como un mtodo de bsqueda en el espacio
de soluciones, con la hiptesis implcita de que la codificacin est formada por bloques de

42
construccin. Con respecto a esto, en este trabajo, la codificacin de los filtros utilizados est
compuesta de 4 bloques donde cada uno corresponde a un filtro en la etapa de evaluacin. A su vez
cada filtro est compuesto por 3 filtros Gabor, lo que se refleja en la estructura de los cromosomas
que representan a los filtros.

Funcin objetivo

La funcin objetivo que es optimizada por el algoritmo gentico corresponde al promedio


del accuracy obtenido en el conjunto de entrenamiento. El accuracy es calculado comparando la
segmentacin realizada por el sistema de construido y la segmentacin manual (ground truth) de la
imagen correspondiente. Ms detalles del accuracy se encuentran en 3.2.1. El accuracy es elegido
debido a que es utilizado en la mayora de publicaciones sobre segmentacin de vasos sanguneos
de retina (ver tabla 2.1).

Codificacin

La poblacin tiene una codificacin real, dentro del intervalo [0, 1]. El mapeo al intervalo de
los valores verdaderos de los parmetros utilizados se hace multiplicando el valor codificado por
un factor constante para cada parmetro. En la tabla 3.1 se muestran los factores de conversin
utilizados y los parmetros correspondientes.

Se codifican en total 60 parmetros. Para cada uno de los 4 filtros usados, se codifican 3 filtros
Gabor con 5 parmetros cada uno. En la figura 3.16 se ilustra la estructura de la codificacin
resultante.

Tabla 3.1: Tabla de factores asociados a la conversin de parmetros.

Variable Factor
100
2
5
5
0 2

43
Figura 3.16: Ilustracin de la estructura de la codificacin del individuo.

Inicializacin de la poblacin

La generacin de la poblacin inicial se realiza mediante un proceso aleatorio de distribucin


uniforme en el intervalo [0, 1], para cada uno de los 60 parmetros de cada individuo. El tamao de
la poblacin inicial fue elegido en 400.

Implementacin de operadores

Previamente a la seleccin de los individuos para la actualizacin de la poblacin, se evala


a cada uno mediante el promedio del accuracy de las segmentaciones realizadas en el conjunto de
entrenamiento. Posteriormente se efectan los operadores genticos de crossover y mutacin que
generan la nueva poblacin.

Seleccin

Previamente a la seleccin se efecta elitismo (3.4.5), manteniendo una porcin del 10 % mejor
de la poblacin total sin modificaciones.
El operador de seleccin utilizado es seleccin estocstica universal (3.4.5). Se obtiene una
proporcin del 90 % de la poblacin inicial con ste operador, que corresponden a los padres de la
nueva poblacin, completando as el tamao de la poblacin inicial. La generacin de los individuos
de la nueva poblacin se realiza mediante los operadores de crossover y mutacin.

44
Crossover

Se utiliza un crossover de 2 puntos, descrito a continuacin.

Se eligen dos individuos padres desde la poblacin posterior al operador de seleccin,


obteniendo consecutivamente los dos individuos con mejor fitness dentro del conjunto
obtenido con el operador de seleccin.

Se eligen dos puntos de corte donde cada uno se elige como una distribucin uniforme en el
intervalo [1, L] donde L es el tamao de la codificacin.

Las porciones de las codificaciones de los individuos padre delimitadas por los puntos de
corte, son repartidos entre los individuos hijos. sto se ilustra en la imagen 3.15.

Mutacin

Para cada parmetro en la codificacin del individuo, existe una probabilidad PM = 0.05 de
sufrir mutacin. La mutacin consiste en el reemplazo del valor del parmetro por un valor aleatorio
de una distribucin uniforme en el intervalo [0, 1].

Criterios de trmino

La condicin de trmino del algoritmo gentico es elegida para que su ejecucin termine luego
de una cantidad de generaciones en que no se presente un aumento de accuracy en el conjunto de
entrenamiento.

3.5. Segmentacin

Previo a la segmentacin, se utiliza la mscara generada en la etapa de preprocesamiento


(3.3.3) para descartar la zona de la imagen fuera del rea de inters. El resultado de sta operacin
se muestra en la figura 3.17b.

45
(a) Antes de la extraccin del rea de inters. (b) Despus de la extraccin del rea de inters.

Figura 3.17: Efecto de la segmentacin del rea de inters.

Para realizar la segmentacin de la imagen obtenida luego de la aplicacin del banco de filtros,
se aplica un umbral en la intensidad de cada pixel de la imagen. ste umbral es obtenido mediante
la maximizacin de la entropa de la matriz de co-ocurrencia, mtodo que es descrito en 3.5.2.

3.5.1. Entropa

En el contexto de la Teora de la Informacin, la entropa es una medida de la incertidumbre


asociada a una variable aleatoria o a la informacin que sta contiene.

Definicin Sea X una variable aleatoria discreta con distribucin discreta de probabilidad P(X ).
x i son los posibles valores del alfabeto de X y P(x i ) su probabilidad. Shannon [96] defini la
entropa de X como:
X
H (X ) = E[logb (P(X ))] = P(x i )logb (P(x i )) (3.27)
i

Donde b corresponde a la base del logaritmo utilizado. Valores comunes para b son 2, e y 10, dando
lugar a las unidades de bit, nat y hartley para la entropa.

3.5.2. Segmentacin por umbralizacin usando entropa

La idea principal del mtodo de segmentacin por umbralizacin usando entropa es obtener
el histograma de la imagen a segmentar, considerndolo como una distribucin de probabilidad,
y luego obtener un umbral que maximice la entropa, manteniendo la mayor cantidad posible de

46
informacin de la imagen original. Sin embargo, esta idea no toma en cuenta la correlacin espacial
de los pixeles de la imagen. Uno de los mtodos para solucionar esto consiste en obtener la matriz de
co-ocurrencia, como una forma de capturar las transiciones entre pixeles vecinos en un histograma
2D. Teniendo la matriz de co-ocurrencia, se obtiene el umbral que maximice la entropa. ste
mtodo ha sido utilizado en publicaciones de segmentacin de imgenes [2931].

Matriz de co-ocurrencia de escala de grises

Se tiene una imagen de tamao M N con L niveles de gris denotados por G = 0, 1, ..., L 1.
Sea f (x, y) el nivel de gris de la imagen en el pixel (x, y). La matriz de co-ocurrencia de una imagen
es una matriz de tamao L L, denotada por W , cuyos elementos estn dados por la cantidad de
transiciones entre pares de niveles de gris en G, entre pixeles vecinos. Se ha mostrado que no hay
una gran diferencia entre la cantidad de pixeles vecinos considerados [29], por lo que se toma en
cuenta slo un pixel vecino. De esta forma la matriz de co-ocurrencia est definida por:
M X
X N
Wi j = mn (3.28)
m=1 n=1

con:
1 si f (m, n) = i y f (m, n + 1) = j

mn =
0 en caso contrario. (3.29)

La probabilidad de transiciones entre niveles de gris est dado por:
Wi j
pi j = P L1 P L1 (3.30)
k=0 l=0 W kl

Cuadrantes de la matriz de co-ocurrencia

Sea t el umbral de segmentacin de la imagen. ste particiona la matriz de co-ocurrencia en


las zonas A, B, C y D, que se muestran en 3.18. Asumiendo que los pixeles con niveles de gris igual
o sobre el umbral t se les asigna el frente (correspondiente a los vasos sanguneos en esta tesis),
y los de valores de gris bajo el nivel de umbral son asignados al fondo. Entonces los cuadrantes
A y C corresponden a transiciones de pixeles dentro de cada clase, ya sea fondo o frente. Y los
cuadrantes B y D corresponden a transiciones entre valores de gris de clases distintas (bordes de la
segmentacin).
Las probabilidades de transicin de niveles de gris se obtienen normalizando los valores de la
matriz de co-ocurrencia en cada zona.

pi j t pi j pi j pi j
pit j A = t , pi j B = t , pit jC = t , pit j D = t (3.31)
PA PB PC PD
con:
t X
X t t X
X L1 L1 X
X t L1 X
X L1
PtA = pi j , PBt = pi j , PCt = pi j , PD
t
= pi j , (3.32)
i=0 j=0 i=0 j=t+1 i=t+1 j=0 i=t+1 j=t+1

47
Figura 3.18: Cuadrantes de la matriz de co-ocurrencia.

A B
t
D C

Entropa de transiciones locales Los cuadrantes A y C de la matriz de co-ocurrencia


corresponden a los histogramas de transiciones de pixeles de fondo-fondo y frente-frente
respectivamente, por lo que se denominan cuadrantes de transicin local. La entropa de cada
cuadrante se define a continuacin.
t X
X t
H At = pit j A log(pit j A ) (3.33)
i=0 j=0

L1 X
X L1
HCt = pit jC log(pit jC ) (3.34)
i=t+1 j=t+1

Sumando ambas entropas se obtiene la entropa de transiciones locales.


t
HLE = H At + HCt (3.35)

De forma anloga a la anterior, se puede obtener la entropa de transiciones cruzadas; transiciones


de pixeles fondo-frente y frente-fondo, sumando las entropas de los cuadrantes B y D. Sin
embargo, el mtodo utilizado en esta tesis toma slo en cuenta la entropa de transiciones locales.
Finalmente el mtodo obtiene el umbral ptimo para la segmentacin, maximizando la entropa de
transiciones locales. ( )
t = argmax t HLE t
(3.36)

48
Captulo 4

Resultados

En este captulo se presentan los resultados de las diferentes etapas del sistema de
segmentacin.

En la etapa de preprocesamiento, se muestra la distancia de Bhattacharyya de los histogramas


de pixeles de vasos sanguneos y fondo por cada canal de color, para la eleccin del canal de la
imagen a extraer. A continuacin, se muestran los resultados de la optimizacin de parmetros del
algoritmo de ecualizacin de histograma adaptiva y la distancia de Bhattacharyya entre las clases
resultante de esta etapa.

Para la etapa de extraccin de caractersticas, se muestran los resultados de los algoritmos en cuanto
a evolucin del accuracy y los parmetros que obtienen para los filtros lineales utilizados. Tambin
se muestra la distancia de Bhattacharyya posterior a la aplicacin de los filtros. Y luego, se muestran
los resultados de accuracy para la segmentacin realizada con los parmetros ptimos del sistema.

Luego, se muestra los resultados de la aplicacin de la maximizacin de la entropa de la matriz de


co-ocurrencia como mtodo de segmentacin.

Finalmente, se muestran los resultados de tiempo de ejecucin del sistema completo de


segmentacin de vasos sanguneos.

4.1. Resultados del preprocesamiento

4.1.1. Distancia de Bhattacharyya entre clases por canal de color

En la tabla 4.1 se muestran la distancia Bhattacharyya promedio y su desviacin estndar


por cada canal de color. En la figura 4.1 se muestra la distancia de Bhattacharyya para cada
imagen del conjunto de entrenamiento por cada canal, donde se puede apreciar que la distancia
de Bhattacharyya de las clases en el canal verde es siempre mayor a la de los dems canales, con
la excepcin de la imagen 34 de la base de datos. Esta informacin es utilizada para ejegir el canal
verde de la imagen original para la extraccin de caractersticas.

49
Se realiz un test ANOVA [104] para determinar si las diferencias entre los canales de color
eran estadsticamente significativas. Del test ANOVA, se obtiene que las diferencias entre los tres
canales de color son estadsticamente significativas (p < 0.01).

Figura 4.1: Distancia de Bhattacharyya de las clases por cada canal RGB en cada imagen del
conjunto de entrenamiento de la base de datos DRIVE. Las curvas corresponden al canal rojo,
verde y azul respectivamente.

Tabla 4.1: Distancia de Bhattacharyya promedio y desviacin estndar de las clases por canal de
color del conjunto de entrenamiento de la base de datos DRIVE.

Canal Promedio Desviacin estndar


Rojo 0.0269 0.0097
Verde 0.1445 0.0504
Azul 0.0634 0.0262

En la figura 4.2 se muestran imgenes del fondo de la retina y en la figura 4.3 su respectivo
canal verde.

50
Figura 4.2: Imgenes de fondo de retina {1, 8, 16, 24, 32, 40} de la base de datos DRIVE.

51
Figura 4.3: Canal verde de las imgenes {1, 8, 16, 24, 32, 40} de la base de datos DRIVE.

En la figura 4.4 se muestran los histogramas del canal verde de algunas de las imgenes. La
curva de color rojo corresponde al histograma normalizado de los pixeles de vasos sanguneos
y la curva en azul al histograma normalizado de los pixeles de fondo. Para la obtencin de los
histogramas de cada clase, se utiliz el ground truth que define la pertenencia a vasos sanguneos o
fondo para cada pixel.

52
Figura 4.4: Histogramas del canal verde de las imgenes {1, 8, 16, 24, 32, 40} de la base de datos
DRIVE.

4.1.2. Resultados de generacin de mscara de segmentacin

En la figura 4.5 se muestra el resultado de la generacin de las mscaras de segmentacin para


la zona de inters de las imgenes de fondo de retina de la base de datos DRIVE.

53
Figura 4.5: Mscaras de segmentacin de la zona de inters generadas para las imgenes
{1, 8, 16, 24, 32, 40} de la base de datos DRIVE.

4.1.3. Resultados de extensin del borde del rea de inters

En la figura 4.6 se muestra el resultado de la extensin del borde de la zona de inters de las
imgenes de fondo de retina de la base de datos DRIVE. Se puede observar una transicin suave
entre el crculo de la zona de inters y la zona fuera de ella.

54
Figura 4.6: Resultado de la extensin del borde de la zona de inters de las imgenes
{1, 8, 16, 24, 32, 40} de la base de datos DRIVE.

4.1.4. Resultados de ecualizacin de histograma adaptiva

Ajuste de parmetros

En la imagen 4.7 se muestran el valor de la distancia de Bhattacharyya de las clases para


cada eleccin de parmetros del algoritmo CLAHE (tamao de la grilla y el lmite de recorte del
histograma).
El valor de distancia de Bhattacharyya mostrado corresponde al promedio de distancia de
Bhattacharyya de las imgenes del conjunto de entrenamiento luego de la aplicacin del algoritmo
CLAHE.

55
Figura 4.7: Grfica de la distancia de Bhattacharyya de las clases en funcin de los parmetros del
algoritmo clahe.

Luego de tener el valor de distancia de Bhattacharyya de las clases en funcin de los


parmetros del algoritmo CLAHE, se obtienen los valores ptimos de los parmetros en el punto
mximo de distancia de Bhattacharyya promedio, que se muestran en la tabla 4.2. El valor mximo
de distancia de Bhattacharyya promedio en el conjunto de entrenamiento y desviacin estndar se
muestran en la tabla 4.3, mejorando los resultados de en el canal verde de la imagen original, que
se muestra en la tabla 4.1.

Tabla 4.2: Parmetros ptimos del algoritmo CLAHE, obtenidos con la maximizacin del promedio
de la distancia de Bhattacharyya de las clases de cada imagen.

Parmetros ptimos
Divisiones grilla Lmite de recorte
25 0.04

Tabla 4.3: Mxima distancia de Bhattacharyya promedio en el conjunto de entrenamiento de la base


de datos DRIVE, posterior a la aplicacin del algoritmo CLAHE.

Distancia de Bhattacharyya
Promedio Desviacin estndar
0.3261 0.0425

56
En la figura 4.8 se muestran los resultados del algoritmo CLAHE en algunas imgenes de
ejemplo. Se puede apreciar un mayor contraste entre los vasos sanguneos y el fondo, de forma que
los vasos sanguneos se presentan con mayor intensidad que el fondo en las imgenes.

Figura 4.8: Resultados de la aplicacin del algoritmo CLAHE en las imgenes {1, 8, 16, 24, 32, 40}
de la base de datos DRIVE.

En la figura 4.9 se muestran los histogramas normalizados de pixeles de vasos sanguneos y


fondo, posteriores a la aplicacin del algoritmo CLAHE en algunas imgenes de ejemplo.

57
Figura 4.9: Histogramas de la imagen posterior a la aplicacin del algoritmo CLAHE para las
imgenes {1, 8, 16, 24, 32, 40} de la base de datos DRIVE.

4.1.5. Distancia de Bhattacharyya por etapa del preprocesamiento

Los resultados del preprocesamiento realizado consistente en la obtencin del canal verde de
la imagen original y la ecualizacin de histograma adaptiva(CLAHE) se pueden apreciar en el
aumento de la distancia de Bhattacharyya de los histogramas normalizados de los pixeles de vasos
sanguneos y de fondo en el conjunto de entrenamiento que se muestran en la tabla 4.4.

Tabla 4.4: Distancia de Bhattacharyya promedio y desviacin estndar del conjunto de


entrenamiento, en las etapas del preprocesamiento.

Distancia de Bhattacharyya
Etapa Promedio Desviacin estndar
Canal verde 0.1445 0.0504
CLAHE 0.3261 0.0425

4.2. Resultados algoritmos genticos

4.2.1. Influencia de la eleccin de conjuntos de entrenamiento y validacin.

Para observar la influencia de la eleccin de los conjuntos de entrenamiento y validacin en


los resultados de accuracy del algoritmo gentico, se realizaron diversas instancias del algoritmo
gentico con conjuntos de entrenamiento y validacin generados al azar, que se muestran en la

58
tabla 4.5. El conjunto de prueba es el mismo en todos los casos y corresponde a las imgenes 1 a
20 de la base de datos DRIVE. Los resultados de estas pruebas, por cada generacin del algoritmo
gentico, se muestran en la figura 4.10.

Tabla 4.5: Conjuntos de entrenamiento y validacin.

Eleccin de conjuntos
Conjunto de entrenamiento Conjunto de validacin
{21,24,26,27,28,29,35,38,39,40} {22,23,25,30,31,32,33,34,36,37}
{21,22,29,30,32,33,34,36,37,39} {23,24,25,26,27,28,31,35,38,40}
{25,26,28,29,30,32,34,35,37,40} {21,22,23,24,27,31,33,36,38,39}
{23,24,25,26,31,34,36,37,39,40} {21,22,27,28,29,30,32,33,35,38}

59
Figura 4.10: Curvas de accuracy por generacin del algoritmo gentico.

En la figura 4.10, el color rojo corresponde al conjunto de validacin, el color verde al conjunto
de prueba y el color azul al conjunto de entrenamiento. Se puede observar que no se presenta
sobreajuste en las curvas del algoritmo gentico. Tambin se muestran los valores-p de un test

60
ANOVA [104] realizado para determinar si las diferencias entre conjuntos son estadsticamente
significativas, mostrando que no hay una diferencia significativa entre los tres conjuntos (p > 0.05),
en todas las generaciones del algoritmo gentico para las primeras tres elecciones de conjuntos de
entrenamiento y validacin y a partir de la generacin 100 aproximadamente en la ltima eleccin
de conjuntos de entrenamiento y validacin.

En la tabla 4.6 se muestra el valor alcanzado en el conjunto de prueba en el valor mximo del
conjunto de validacin en cada caso. En la tabla 4.7 se muestran los valores de accuracy promedio
y desviacin estndar del accuracy en el conjunto de prueba en todas las pruebas.

Tabla 4.6: Accuracy de cada prueba en el conjunto de prueba, evaluado en el punto donde se obtiene
el mximo accuracy en el conjunto de validacin.

Accuracy de cada prueba


Prueba Accuracy
Prueba 1 0.94489
Prueba 2 0.94617
Prueba 3 0.94450
Prueba 4 0.94566

Tabla 4.7: Promedio y desviacin estndar del accuracy de las pruebas de la tabla 4.6.

Accuracy pruebas
Promedio Desviacin estndar
0.9453 7.5155 104

4.2.2. Optimizacin de parmetros del banco de filtros

En la tabla 4.8 se muestran los resultados de accuracy en el conjunto de validacin y conjunto


de prueba para combinacin de diferentes parmetros para el banco de filtros generado. En este
caso, de forma arbitraria, se usaron las imgenes {31, 32, 33, 34, 35, 36, 37, 38, 39, 40} de la base de
datos como conjunto de entrenamiento y las imgenes {21, 22, 23, 24, 25, 26, 27, 28, 29, 30} como
conjunto de validacin.

Cada conjunto de parmetros es utilizado ms de una vez debido a la naturaleza estocstica de


los algoritmos genticos. El parmetros Cantidad de filtros corresponde a la cantidad de filtros
lineales utilizados como banco de filtros. El parmetro Filtros sumados corresponde a la cantidad
de filtros Gabor que se suman para cada filtro lineal.

61
Tabla 4.8: Promedio y desviacin estndar del accuracy de la segmentacin en el conjunto de
prueba, con los parmetros ptimos de los filtros obtenidos con el algoritmo gentico.

Accuracy conjunto de validacin y prueba


Cantidad de filtros Filtros sumados Accuracy validacin Accuracy prueba
8 1 0.93599 0.94285
8 1 0.93604 0.94346
8 3 0.93944 0.94513
8 3 0.92678 0.93443
4 1 0.94041 0.94601
4 1 0.93319 0.94104
4 1 0.93782 0.94365
4 1 0.93720 0.94358
4 3 0.94043 0.94620
4 3 0.93760 0.94404
4 3 0.93946 0.94496
4 3 0.93816 0.94403

En la tabla 4.9 se muestra el promedio y desviacin estndar del accuracy de la segmentacin


en el conjunto de prueba de la base de datos DRIVE, con los parmetros que obtienen el
mximo accuracy en el conjunto de validacin en la tabla 4.8. Se observan resultados de accuracy
comparables con otros mtodos de publicaciones sobre el tema, como se muestra en la tabla 2.1.

En la figura 4.11, se muestra la curva de evolucin de accuracy por cada generacin en el


entrenamiento del algoritmo gentico que obtiene el mximo accuracy en el conjunto de validacin
en la tabla 4.8. Tambin se muestran los valores-p de un test ANOVA [104] realizado para
determinar si las diferencias entre conjuntos son estadsticamente significativas, mostrando que
no hay una diferencia significativa entre los tres conjuntos en todas las generaciones del algoritmo
gentico (p > 0.05).

Figura 4.11: Izquierda: Curva de accuracy por generacin del algoritmo gentico que obtiene el
mximo accuracy en el conjunto de validacin en la tabla 4.8. Derecha: Valor-p de por generacin.

62
Tabla 4.9: Promedio y desviacin estndar del accuracy de la segmentacin en el conjunto de
prueba, con los parmetros ptimos de los filtros obtenidos con el algoritmo gentico.

Accuracy conjunto de prueba


Promedio Desviacin estndar
0.9462 0.0074

Parmetros del banco de filtros

Los parmetros de los filtros obtenidos con algoritmos genticos se muestran en el apndice A.
stos parmetros corresponden a los que obtienen el mximo accuracy en el conjunto de validacin,
tal como se muestra en la tabla 4.8.

En la figura 4.12 se muestran los filtros obtenidos mediante algoritmos genticos. Se puede observar
que los filtros resultantes son similares a un filtro Gabor simple, pero presentan un peak de
intensidad en el pixel central.

En la figura 4.13 se muestran los filtros Gabor que componen cada uno de los filtros utilizados.
Se puede observar que para cada filtro, se suman dos otros filtros con una intensidad mayor en el
pixel central.

(a) Primer filtro. (b) Segundo filtro. (c) Tercer filtro. (d) Cuarto filtro.

Figura 4.12: Filtros obtenidos.

63
(a) Primer filtro.

(b) Segundo filtro.

(c) Tercer filtro.

(d) Cuarto filtro.

Figura 4.13: Filtros Gabor que al sumarse dan lugar a los filtros utilizados.

4.3. Resultados de la aplicacin de filtros

Posteriormente a la etapa de preprocesamiento, se aplican filtros lineales de 2 dimensiones


para extraccin de caractersticas. Los resultados de distancia de Bhattacharyya de las clases de
pixeles de vasos sanguneos y pixeles de fondo posterior a la aplicacin de los filtros, calculados en
el conjunto de entrenamiento de la base de datos DRIVE, se pueden apreciar en la tabla 4.10. Los
parmetros de los filtros utilizados son los obtenidos con algoritmos genticos.

En la figura 4.14 se muestran ejemplos de la obtencin del mximo de las respuestas a los filtros,

64
utilizando los parmetros obtenidos con algoritmos genticos.

Figura 4.14: Obtencin del mximo de las respuestas al banco de filtros en las imgenes
{1, 8, 16, 24, 32, 40} de la base de datos DRIVE.

En la figura 4.15 se muestran los histogramas normalizados de pixeles de vasos sanguneos y


fondo de la imagen resultante de la aplicacin del banco de filtros. La distancia de Bhattacharyya
se muestra en la tabla 4.10, donde se observa un aumento con respecto a la etapa anterior,
correspondiente a la aplicacin del algoritmo CLAHE (4.3).

Tabla 4.10: Distancia de Bhattacharyya promedio en el conjunto de entrenamiento de la base de


datos DRIVE, posterior a la aplicacin de los filtros.

Distancia de Bhattacharyya
Promedio Desviacin estndar
0.5025 0.0422

65
Figura 4.15: Histogramas de la imagen posterior a la aplicacin de los filtros, para las imgenes
{1, 8, 16, 24, 32, 40} de la base de datos DRIVE.

Anlisis angular A continuacin se ilustra la respuesta angular al primero de los filtros, con los
parmetros que se obtuvieron con algoritmos genticos.

Figura 4.16: Respuesta de los filtros rotados en = {0, 20, 40, 60, 80, 100, 120, 140, 160, 180}

En la figura 4.16 se observa que para cada rotacin de los filtros, se obtiene una respuesta
mayor en diferentes partes de la imagen. Especficamente, para cada valor de , se obtiene una
respuesta mayor en todos las zonas de la imagen que corresponden a vasos sanguneos con una
orientacin angular similar a . El filtro que se ocupa para el anlisis angular, se muestra en la
figura 4.12a.

66
4.4. Obtencin de la matriz de co-ocurrencia

En la figura 4.17 se muestran las matrices de co-ocurrencia calculadas para las imgenes
obtenidas como el mximo de la respuesta al banco de filtros utilizado.

Figura 4.17: Matriz de co-ocurrencia de la imagen posterior a la aplicacin de filtros para las
imgenes {1, 8, 16, 24, 32, 40} de la base de datos DRIVE.

En la figura 4.18 se muestran las matrices de co-ocurrencia con colores asociados a las clases
de las transiciones de los pixeles, de forma aditiva. Una transicin entre pixeles de vasos sanguneos
incrementa el canal verde, una transicin entre pixeles de fondo incrementa el canal rojo y en
caso de transiciones de pixeles de clases diferentes, se incrementa el canal azul. Se observa una
distribucin bastante separada entre las transiciones de la misma clase (colores rojo y verde), en la
mayora de las imgenes.

67
Figura 4.18: Matriz de co-ocurrencia de la imagen posterior a la aplicacin de filtros, para las
imgenes {1, 8, 16, 24, 32, 40} de la base de datos DRIVE, con cdigo de colores.

4.5. Resultados de la segmentacin

El resultado de la aplicacin del umbral obtenido mediante la maximizacin de la entropa de


la matriz de co-ocurrencia, correspondiendo a la segmentacin final, se muestra en la figura 4.19.

68
Figura 4.19: Segmentacin de los vasos sanguneos mediante umbral ptimo. Pixeles en blanco
corresponden a vasos sanguneos y en negro a pixeles de fondo. Segmentacin de las imgenes
{1, 8, 16, 24, 32, 40} de la base de datos DRIVE.

En la figura 4.20, se muestra los pixeles correcta e incorrectamente clasificados con


un cdigo de colores. En verde se muestran los pixeles correctamente clasificados como
vasos sanguneos(verdaderos positivos), en negro los pixeles correctamente clasificados como
fondo(verdaderos negativos), en azul los pixeles errneamente clasificados como vasos sanguneos
cuando pertenecan al fondo (falsos positivos) y en rojo los pixeles errneamente clasificados como
fondo cuando correspondan a vasos sanguneos(falsos negativos). Se puede observar una gran
cantidad de pixeles correctamente clasificados. La mayor parte de los errores corresponde a la no
deteccin de los vasos sanguneos ms delgados.

69
Figura 4.20: Visualizacin de los errores y aciertos de la clasificacin. Segmentacin de las
imgenes {1, 8, 16, 24, 32, 40} de la base de datos DRIVE.

La evaluacin del accuracy en el conjunto de prueba de la segmentacin realizada con los


parmetros ptimos del sistema, se muestra en la tabla 4.9.

Histogramas de accuracy

A la figura 4.21 se muestran los histogramas de accuracy del mtodo para cada eleccin de
conjuntos de entrenamiento y validacin de la seccin de resultados de influencia de eleccin de
conjuntos 4.2.1 adems de los definidos en la seccin anterior. En los histogramas de accuracy
se pueden observar dos muestras con accuracy notoriamente inferior al resto de las muestras en
todos los histogramas, que segn la eleccin de conjuntos entran en el conjunto de entrenamiento o
validacin, stas muestras corresponden a las imgenes 25 y 34 de la base de datos, que se muestran
en la figura 4.22. Tambin se muestra la imagen con mayor accuracy en todos los histogramas, que
corresponde a la imagen 19 del conjunto de prueba 4.23.

70
Figura 4.21: Histogramas de accuracy para cada eleccin de conjunto de entrenamiento y
validacin.

71
Figura 4.22: Las dos muestras con menor accuracy en los histogramas de accuracy junto a su
segmentacin realizada con el mtodo propuesto. De arriba a abajo imgenes 25 y 34 de la base de
datos DRIVE.

Figura 4.23: Imagen con mayor accuracy en los histogramas de accuracy junto a su segmentacin
realizada con el mtodo propuesto. Imagen 19 de la base de datos DRIVE.

4.6. Tipificacin de errores

Al observar los resultados de segmentacin del mtodo en la figura 4.20, se puede observar
que los errores de segmentacin dentro de una imagen, estn asociados principalmente a vasos
sanguneos delgados, correspondiendo a falsos negativos.
En las muestras con menor accuracy en los histogramas de accuracy 4.22, se puede apreciar
que corresponden a imgenes con poca iluminacin o con una deformacin significativa en las
estructuras de la retina.

72
4.7. Curva ROC

La curva ROC corresponde a la grfica de la tasa de verdaderos positivos, en funcin de la tasa


de falsos positivos en un clasificador de dos clases [102]. El rea bajo la curva ROC corresponde
a la probabilidad de que una muestra positiva elegida aleatoriamente sea clasificada ms alta que
una muestra negativa elegida aleatoriamente [103]. En la figura 4.24 se muestra la curva ROC en
el conjunto de prueba para la implementacin realizada del mtodo propuesto. La curva ROC del
sistema fue obtenida variando el umbral de segmentacin de cada imagen posterior a la aplicacin
del banco de filtros entre los valores [0, 255]. Para cada valor del umbral, se obtiene un punto de la
curva (F PR,T PR), que corresponden respectivamente a la tasa de falsos positivos (FPR) y tasa de
verdaderos positivos (TPR). En la tabla 4.11 se muestra el valor del rea bajo la curva ROC(AUC).

Tabla 4.11: rea bajo la curva ROC en el conjunto de prueba.

AUC
0.9526

Figura 4.24: Curva ROC en el conjunto de prueba.

73
4.8. Resultados de tiempos de ejecucin del sistema

En la tabla 4.12 se muestra el tiempo en segundos de ejecucin promedio y desviacin estndar


del algoritmo de segmentacin desarrollado en esta tesis, por cada imagen. ste tiempo es calculado
en el conjunto de prueba de la base de datos DRIVE. l tiempo de ejecucin toma en cuenta
las etapas de carga de la imagen desde el disco duro, preprocesamiento, aplicacin de filtros,
segmentacin y clculo de accuracy.

Tabla 4.12: Tiempo de ejecucin promedio en segundos por imagen del proceso de segmentacin,
en el conjunto de prueba de la base de datos DRIVE.

Tiempo de ejecucin[s]
Promedio Desviacin estndar
5.0332 0.20195

4.9. Comparacin con el mtodo de Soares et al. [45]

En sta seccin se muestran resultados comparativos de la segmentacin por el mtodo


propio y por el mtodo de Soares et al. La segmentacin usando el mtodo de Soares et al. se
bas en una implementacin propia del mtodo publicado. En la tablas 4.13,4.14 se muestra los
porcentajes de pixeles correcta e incorrectamente clasificados por cada mtodo, en el conjunto de
entrenamiento/validacin y prueba respectivamente.
En la figura 4.25 se muestran imgenes de ejemplo de la comparacin realizada, asignndole
a cada pixel un color tal como se explica a continuacin.

En color negro se muestran los pixeles clasificados correctamente en ambos mtodos como
pixeles de fondo.

En blanco se muestran los pixeles clasificados correctamente en ambos mtodos como pixeles
de vasos sanguneos.

En verde se muestran los pixeles clasificados incorrectamente por ambos mtodos.

En azul se muestran los pixeles clasificados errneamente slo por el mtodo de Soares.

En rojo se muestran los pixeles clasificados errneamente slo por el mtodo propio.

Se puede apreciar que la mayora de los errores compartidos por ambos mtodos corresponden
a vasos sanguneos delgados.

74
Tabla 4.13: Fraccin de pixeles correcta e incorrectamente clasificados por cada mtodo, en el
conjunto de entrenamiento y validacin de la base de datos DRIVE.

Fraccin de errores y aciertos en conjunto de entrenamiento y validacin


Tipo Promedio Desviacin estndar
Pixeles correctos en ambos mtodos 0.9266 0.0158
Pixeles incorrectos en ambos mtodos 0.0427 0.0104
Pixeles incorrectos slo con mtodo de Soares 0.0153 0.0037
Pixeles incorrectos slo con mtodo propio 0.0153 0.0052

Tabla 4.14: Fraccin de pixeles correcta e incorrectamente clasificados por cada mtodo, en el
conjunto de prueba de la base de datos DRIVE.

Fraccin de errores y aciertos en conjunto de prueba


Tipo Promedio Desviacin estndar
Pixeles correctos en ambos mtodos 0.9324 0.0081
Pixeles incorrectos en ambos mtodos 0.0407 0.0067
Pixeles incorrectos slo con mtodo de Soares 0.0138 0.0018
Pixeles incorrectos slo con mtodo propio 0.0131 0.0026

75
Figura 4.25: Visualizacin de los errores y aciertos de la clasificacin por ambos mtodos.
Segmentacin de las imgenes {1, 8, 16, 24, 34, 40} de la base de datos DRIVE.

76
Captulo 5

Conclusin

En este trabajo de tesis se desarroll y prob un mtodo que permite la segmentacin autom-
tica de vasos sanguneos en imgenes digitales de retina en base a una etapa de preprocesamiento
para enfatizar vasos, y a un banco de filtros Gabor optimizados genticamente.

Se midi usando la distancia de Bhattacharyya la disimilaridad de los histogramas normaliza-


dos de los pixeles de vasos sanguneos y fondo de cada canal de color, confirmando la hiptesis
mencionada en publicaciones del tema sobre el mayor contraste en el canal verde.

Mediante la extensin del borde de la imagen para evitar escalones artificiales se evit la apari-
cin de falsos positivos generados por deteccin de vasos sanguneos debido a los bordes de la
zona de inters, en la etapa de ecualizacin de histograma y convolucin con el banco de filtros.

La etapa de ecualizacin adaptiva de histograma logr aumentar el contraste entre vasos sanguneos
y fondo, al optimizar los parmetros del mtodo de ecualizacin, mediante la distancia de Bhatta-
charyya.

Con respecto a la extraccin de caractersticas se utiliz un banco de filtros lineales, basado en


una suma de filtros Gabor, cuyos parmetros se optimizaron mediante algoritmos genticos usando
el accuracy de la segmentacin como funcin objetivo. El resultado de la extraccin de caracte-
rsticas logra ser invariante a rotaciones y traslaciones, y es rpida y eficaz en separar las clases
de vasos sanguneos y fondo, lo que es mostrado por el accuracy obtenido posterior a la etapa de
segmentacin.

En la etapa de segmentacin se utiliz un mtodo no supervisado de clasificacin, correspondiente


a la maximizacin de la entropa de la matriz de co-ocurrencia, que encuentra un umbral ptimo
para la segmentacin de la imagen. Al ser un mtodo que no requiere entrenamiento para ajustar
sus parmetros, fue posible ocuparlo en conjunto con algoritmos genticos para la optimizacin de
los parmetros del banco de filtros lineales de forma eficiente. Adems la velocidad del mtodo de
segmentacin permiti que el sistema completo sea rpido en la segmentacin de vasos sanguneos.

El uso del accuracy como medida de desempeo permiti la comparacin de los resultados ob-
tenidos en este trabajo con aquellos previamente publicados en revistas internacionales. Con este

77
mismo objeto se utiliz una base de datos de imgenes de retina internacional (DRIVE) para medir
los resultados de este trabajo.

El uso del algoritmo gentico, permiti optimizar los parmetros de los filtros utilizados, consi-
derando su efecto en la posterior segmentacin realizada, a travs de la utilizacin del accuracy de
la segmentacin como funcin objetivo.

Con respecto al hecho de que no se presente sobreajuste en el conjunto de entrenamiento al usar


algoritmo genticos, se estima que se debe a la gran cantidad de ejemplos que se presentan en el
conjunto de entrenamiento. Tomando en cuenta que cada imagen tiene aproximadamente 250.000
pixeles dentro del rea de inters, que se deben clasificar como vaso sanguneo o fondo, se tiene un
total aproximado de 2.500.000 ejemplos para el conjunto de entrenamiento. sto sumado a la gran
dimensionalidad del problema, indica que para obtener una mayor accuracy en el conjunto de en-
trenamiento, deberan ajustarse una cantidad enorme de parmetros, sin embargo sto podra llevar
a un bajo accuracy en los conjuntos de validacin y prueba al perder la capacidad de generalizar.

En los resultados de algoritmos genticos, se obtienen curvas de accuracy en funcin de las ge-
neraciones, que muestran un rendimiento sin diferencias estadsticamente significativas en los con-
juntos de entrenamiento, validacin y prueba.

Las dificultades que se presentaron en el desarrollo del sistema fueron la gran variabilidad de for-
mas, tamaos e intensidad que presentan los vasos sanguneos en la imagen de retina. Adems, las
imgenes presentan ruido e iluminacin no-uniforme. Tambin, se presentan en el fondo caracte-
rsticas similares a vasos sanguneos. Al considerar estas dificultades, es difcil disear un mtodo
que considere todos los posibles casos y que adems tenga buenos resultados fuera del conjunto de
entrenamiento.

Las limitaciones observadas del mtodo tienen relacin a la no deteccin de vasos sanguneos
que requieren tomar en cuenta el contexto de pixeles lejanos, como cruces de vasos sanguneos y
vasos sanguneos delgados lejanos a las ramas principales de vasos sanguneos.

Con respecto a los resultados obtenidos, se logra un accuracy promedio en la segmentacin del
conjunto de prueba de la base de datos DRIVE de 0.9462, lo que est dentro de los mejores resul-
tados de segmentacin de vasos sanguneos en publicaciones internacionales en la misma base de
datos DRIVE. En cuanto al tiempo de ejecucin del mtodo implementado, ste demora en pro-
medio 5.03 segundos, lo que es un tiempo corto en relacin al accuracy obtenido. Sin embargo, en
la etapa de entrenamiento del mtodo, se requieren varios das de cmputo, al aplicar algoritmos
genticos en la optimizacin de los parmetros del banco de filtros.

Tal como se muestra en la tabla 2.1, el accuracy obtenido por la segmentacin del segundo ex-
perto humano es de 0.9473. Al tomar en cuenta que un segundo experto humano no obtiene un
100 % de accuracy, es posible que no todos los pixeles marcados como vasos sanguneos efecti-
vamente lo sean, y que correspondan a bordes marcados ms all de los vasos sanguneos o a la
percepcin errada de la continuacin de un vaso sanguneo, en el caso de vasos sanguneos delga-
dos. De esta forma, difcilmente tiene sentido esperar un accuracy significativamente mayor al del
segundo experto humano.

78
5.0.1. Contribuciones

Las principales contribuciones del trabajo son las siguientes:

En este trabajo la eleccin de los parmetros de la etapa de preprocesamiento (extraccin del


canal verde y parmetros de la ecualizacin adaptiva de histograma) se realiza utilizando un
mtodo de seleccin de caractersticas que usa la distancia de Bhattacharyya. En contraste,
la mayor parte de las publicaciones de segmentacin de vasos sanguneos en imgenes de
retina, usan caractersticas elegidas de forma arbitraria e intuitiva, debido probablemente
a que la alta dimensionalidad del problema dificulta ciertos mtodos de eleccin de
caractersticas. Por ejemplo, la eleccin del canal verde [36, 45, 51, 55], parmetros de etapas
de preprocesamiento, parmetros de banco de filtros [45].

El uso de un mtodo de clasificacin que no requiere entrenamiento, la maximizacin de


la entropa de la matriz de co-ocurrencia, permiti la seleccin de los parmetros del banco
de filtros usando un algoritmo gentico, ya que el tiempo de evaluacin de la poblacin es
considerablemente inferior.

Un mtodo de segmentacin de imgenes de retina con alto desempeo de accuracy, pero


con bajo tiempo de ejecucin.

5.0.2. Trabajos Futuros

De la comparacin de los resultados de segmentacin del mtodo propio y el mtodo de Soares


et al. [45] se puede suponer que es posible mejorar los resultados integrando ambos mtodos. Sin
embargo sta mejora estara limitada por el porcentaje de errores que se dan en los dos mtodos,
que es aproximadamente 4 % y que por lo tanto, el accuracy de la integracin estara acotado
superiormente por un valor cercano a 0.96.

El uso de los tres canales de color de la imagen original podra involucrar una mejora de desempeo
del mtodo, debido a que no se eliminara informacin que podra ser til. Sin embargo, sto podra
aumentar el tiempo necesario para la segmentacin.

Considerar un mayor tamao en la ventana de extraccin de caractersticas, que en el mtodo propio


es de 21 21 pixeles, podra aumentar el desempeo del mtodo, debido a que se considerara un
contexto mayor del pixel a clasificar, pero con una mayor dimensionalidad del problema y un mayor
tiempo necesario para la segmentacin.

Considerar la tcnica de redes neuronales convolucionales, tiene la ventaja de la reducir las


caractersticas seleccionadas por el diseador del sistema para el problema en particular, ya que
las caractersticas utilizadas por el mtodo son elegidas por el algoritmo de entrenamiento, lo que
reducira las suposiciones (posiblemente incorrectas) realizadas por el diseador del mtodo.

Las redes neuronales convolucionales han obtenido buenos resultados en aplicaciones recientes
[81]. Sin embargo, an requiere grandes recursos computacionales y tiempo en las etapas de
entrenamiento y en la etapa de clasificacin, por lo que es necesario considerar si el desempeo

79
adicional justifica el uso de una tcnica que involucra alto costo computacional al desarrollar la
solucin.

Una aplicacin de ste trabajo sera usar la segmentacin de vasos sanguneos obtenida en la
clasificacin de imgenes de retina en estados de enfermedad de la retina o para la deteccin de
lesiones como microaneurismas y hemorragias. Sin embargo, para esto sera deseable tener una
base de datos numerosa de lesiones o de grado de enfermedad en cada imagen de entrenamiento.

80
Bibliografa

[1] Heneghan, C., Flynn, J., OKeefe, M., & Cahill, M. (2002). Characterization of changes in
blood vessel width and tortuosity in retinopathy of prematurity using image analysis. Medical
image analysis, 6(4), 407-429.

[2] Teng, T., Lefley, M., & Claremont, D. (2002). Progress towards automated diabetic ocular
screening: a review of image analysis and intelligent systems for diabetic retinopathy. Medical
and Biological Engineering and Computing, 40(1), 2-13.

[3] Niemeijer, M., van Ginneken, B., & Abrmoff, M. D. (2009, February). Automatic
classification of retinal vessels into arteries and veins. In SPIE medical imaging (pp. 72601F-
72601F). International Society for Optics and Photonics.

[4] Foracchia, M., Grisan, E., & Ruggeri, A. (2001). Extraction and quantitative description of
vessel features in hypertensive retinopathy fundus images. In Book Abstracts 2nd International
Workshop on Computer Assisted Fundus Image Analysis (Vol. 6).

[5] Lowell, J., Hunter, A., Steel, D., Basu, A., Ryder, R., & Kennedy, R. L. (2004). Measurement
of retinal vessel widths from fundus images based on 2-D modeling. Medical Imaging, IEEE
Transactions on, 23(10), 1196-1204.

[6] Haddouche, A., Adel, M., Rasigni, M., Conrath, J., & Bourennane, S. (2010). Detection of
the foveal avascular zone on retinal angiograms using Markov random fields. Digital Signal
Processing, 20(1), 149-154.

[7] Mario, C., Penedo, M. G., Penas, M., Carreira, M. J., & Gonzalez, F. (2006). Personal
authentication using digital retinal images. Pattern Analysis and Applications, 9(1), 21-33.

[8] Kse, C., & Iki, C. (2011). A personal identification system using retinal vasculature in retinal
fundus images. Expert Systems with Applications, 38(11), 13670-13681.

[9] Zana, F., & Klein, J. C. (1999). A multimodal registration algorithm of eye fundus images
using vessels detection and Hough transform. Medical Imaging, IEEE Transactions on, 18(5),
419-428.

[10] Stewart, C. V., Tsai, C. L., & Roysam, B. (2003). The dual-bootstrap iterative closest point
algorithm with application to retinal image registration. Medical Imaging, IEEE Transactions
on, 22(11), 1379-1394.

[11] Klonoff, D. C., & Schwartz, D. M. (2000). An economic analysis of interventions for diabetes.
Diabetes care, 23(3), 390-404.

81
[12] Gelman, R., Martinez-Perez, M. E., Vanderveen, D. K., Moskowitz, A., & Fulton, A. B.
(2005). Diagnosis of plus disease in retinopathy of prematurity using Retinal Image multiScale
Analysis. Investigative ophthalmology & visual science, 46(12), 4734-4738.

[13] Owen, C. G., Rudnicka, A. R., Nightingale, C. M., Mullen, R., Barman, S. A., Sattar, N., ... &
Whincup, P. H. (2011). Retinal arteriolar tortuosity and cardiovascular risk factors in a multi-
ethnic population study of 10-year-old children; the Child Heart and Health Study in England
(CHASE). Arteriosclerosis, thrombosis, and vascular biology, 31(8), 1933-1938.

[14] Lee, S. J., McCarty, C. A., Taylor, H. R., & Keeffe, J. E. (2001). Costs of mobile screening for
diabetic retinopathy: a practical framework for rural populations. Australian Journal of Rural
Health, 9(4), 186-192.

[15] D. S. Fong, L. Aiello, T. W. Gardner, G. L. King, G. Blankenship, J. D. Cavallerano, F. L.


Ferris, & R. Klein (2003). Diabetic retinopathy. Diabetes Care, vol. 26, pp. 226229.

[16] American Diabetes Association. (2008). Economic costs of diabetes in the US in 2007.
Diabetes care, 31(3), 596-615.

[17] American Academy of Ophthalmology Retina Panel, Preferred Practice Pattern Guidelines.
Diabetic Retinopathy. San Francisco, CA, Am. Acad. Ophthalmo., 2008 [Online]. Available:
http://www.aao.org/ppp

[18] Grisan, E., & Ruggeri, A. (2003, September). A divide et impera strategy for automatic
classification of retinal vessels into arteries and veins. In Engineering in Medicine and Biology
Society, 2003. Proceedings of the 25th Annual International Conference of the IEEE (Vol. 1,
pp. 890-893). IEEE.

[19] Hatanaka, Y., Hara, T., Fujita, H., Aoyama, M., Uchida, H., & Yamamoto, T. (2004, May).
Automated analysis of the distributions and geometries of blood vessels on retinal fundus
images. In Medical Imaging 2004 (pp. 1621-1628). International Society for Optics and
Photonics.

[20] Taylor, H. R., & Keeffe, J. E. (2001). World blindness: a 21st century perspective. British
Journal of Ophthalmology, 85(3), 261-266.

[21] Wild, S., Roglic, G., Green, A., Sicree, R., & King, H. (2004). Global prevalence of diabetes
estimates for the year 2000 and projections for 2030. Diabetes care, 27(5), 1047-1053.

[22] Becker, D. E., Can, A., Turner, J. N., Tanenbaum, H. L., & Roysam, B. (1998).
Image processing algorithms for retinal montage synthesis, mapping, and real-time location
determination. Biomedical Engineering, IEEE Transactions on, 45(1), 105-118.

[23] Frame, A. J., Undrill, P. E., Cree, M. J., Olson, J. A., McHardy, K. C., Sharp, P. F., & Forrester,
J. V. (1998). A comparison of computer based classification methods applied to the detection of
microaneurysms in ophthalmic fluorescein angiograms. Computers in biology and medicine,
28(3), 225-238.

[24] Larsen, M., Godt, J., Larsen, N., Lund-Andersen, H., Sjlie, A. K., Agardh, E., ... & Owens,
D. R. (2003). Automated detection of fundus photographic red lesions in diabetic retinopathy.
Investigative ophthalmology & visual science, 44(2), 761-766.

82
[25] Spencer, T., Olson, J. A., McHardy, K. C., Sharp, P. F., & Forrester, J. V. (1996). An image-
processing strategy for the segmentation and quantification of microaneurysms in fluorescein
angiograms of the ocular fundus. Computers and biomedical research, 29(4), 284-302.

[26] Ramamohanarao, K., Nguyen, U. T., & Bhuiyan, A. (2013, February). Retinal vascular feature
analysis using color fundus imaging. In Biosignals and Biorobotics Conference (BRC), 2013
ISSNIP (pp. 1-9). IEEE.

[27] Nguyen, U. T., Bhuiyan, A., Park, L. A., & Ramamohanarao, K. (2013). An effective retinal
blood vessel segmentation method using multi-scale line detection. Pattern recognition, 46(3),
703-715.

[28] Eye Diseases Prevalence Research Group. (2004). The prevalence of diabetic retinopathy
among adults in the United States. Archives of Ophthalmology, 122(4), 552.

[29] Chang, C. I., Du, Y., Wang, J., Guo, S. M., & Thouin, P. D. (2006, December). Survey and
comparative analysis of entropy and relative entropy thresholding techniques. In Vision, Image
and Signal Processing, IEE Proceedings- (Vol. 153, No. 6, pp. 837-850). IET.

[30] Schwartzkopf, W., Evans, B. L., & Bovik, A. C. (2002). Entropy estimation for
segmentation of multi-spectral chromosome images. In Image Analysis and Interpretation,
2002. Proceedings. Fifth IEEE Southwest Symposium on (pp. 234-237). IEEE.

[31] Tao, W., Jin, H., & Liu, L. (2007). Object segmentation using ant colony optimization
algorithm and fuzzy entropy. Pattern Recognition Letters, 28(7), 788-796.

[32] Karel Zuiderveld. 1994. Contrast limited adaptive histogram equalization. In Graphics gems
IV, Paul S. Heckbert (Ed.). Academic Press Professional, Inc., San Diego, CA, USA 474-485.

[33] Kailath, T. (1967). The divergence and Bhattacharyya distance measures in signal selection.
Communication Technology, IEEE Transactions on, 15(1), 52-60.

[34] Choi, E., & Lee, C. (2003). Feature extraction based on the Bhattacharyya distance. Pattern
Recognition, 36(8), 1703-1709.

[35] Bhattacharyya, A. (1946). On a measure of divergence between two multinomial populations.


Sankhya: The Indian Journal of Statistics, 401-406.

[36] Staal, J., Abrmoff, M. D., Niemeijer, M., Viergever, M. A., & van Ginneken, B. (2004).
Ridge-based vessel segmentation in color images of the retina. Medical Imaging, IEEE
Transactions on, 23(4), 501-509.

[37] Weldon, T. P., Higgins, W. E., & Dunn, D. F. (1996). Efficient Gabor filter design for texture
segmentation. Pattern Recognition, 29(12), 2005-2015.

[38] Daugman, J. G. (1980). Two-dimensional spectral analysis of cortical receptive field profiles.
Vision research, 20(10), 847-856.

[39] Reeves, C. R. (2010). Genetic algorithms. In Handbook of Metaheuristics (pp. 109-139).


Springer US.

83
[40] Holland, J. H. (1975). Adaptation in natural and artificial systems: An introductory analysis
with applications to biology, control, and artificial intelligence. U Michigan Press.

[41] Moreno Caldern, G. F. (2011). Identificacin de Sistemas Basada en Inteligencia


Computacional y su Aplicacin a la Modelacin de un Aerogenerador.

[42] Wolpert, D. H., & Macready, W. G. (1997). No free lunch theorems for optimization.
Evolutionary Computation, IEEE Transactions on, 1(1), 67-82.

[43] Muoz Carpintero, D. A. (2010). Diseo y Evaluacin de Algoritmos Evolutivos para


Estrategias de Control Predictivo Hbrido No Lineal.

[44] Pencheva, T., Atanassov, K., & Shannon, A. (2009, December). Modelling of a stochastic
universal sampling selection operator in genetic algorithms using generalized nets. In
Proceedings of the Tenth International Workshop on Generalized Nets, Sofia (pp. 1-7).

[45] Soares, J. V., Leandro, J. J., Cesar, R. M., Jelinek, H. F., & Cree, M. J. (2006). Retinal vessel
segmentation using the 2-D Gabor wavelet and supervised classification. Medical Imaging,
IEEE Transactions on, 25(9), 1214-1222.

[46] Jacobs, D. Correlation and Convolution. Class Notes for CMSC, 426.

[47] Kienzle, W., Franz, M. O., Schlkopf, B., & Bakir, G. H. (2004). Face DetectionEfficient
and Rank Deficient. In Advances in Neural Information Processing Systems (pp. 673-680).

[48] Metz, C. E. (1978, October). Basic principles of ROC analysis. In Seminars in nuclear
medicine (Vol. 8, No. 4, pp. 283-298). WB Saunders.

[49] Fraz, M. M., Remagnino, P., Hoppe, A., Uyyanonvara, B., Rudnicka, A. R., Owen, C. G., &
Barman, S. A. (2012). Blood vessel segmentation methodologies in retinal imagesa survey.
Computer methods and programs in biomedicine, 108(1), 407-433.

[50] Kirbas, C., & Quek, F. (2004). A review of vessel extraction techniques and algorithms. ACM
Computing Surveys (CSUR), 36(2), 81-121.

[51] Hoover, A., Kouznetsova, V., & Goldbaum, M. (2000). Locating blood vessels in retinal
images by piecewise threshold probing of a matched filter response. Medical Imaging, IEEE
Transactions on, 19(3), 203-210.

[52] Zhang, B., Zhang, L., Zhang, L., & Karray, F. (2010). Retinal vessel extraction by matched
filter with first-order derivative of Gaussian. Computers in biology and medicine, 40(4), 438-
445.

[53] Niemeijer, M., Staal, J., van Ginneken, B., Loog, M., & Abramoff, M. D. (2004, May).
Comparative study of retinal vessel segmentation methods on a new publicly available
database. In Medical Imaging 2004 (pp. 648-656). International Society for Optics and
Photonics.

[54] Staal, J., Abrmoff, M. D., Niemeijer, M., Viergever, M. A., & van Ginneken, B. (2004).
Ridge-based vessel segmentation in color images of the retina. Medical Imaging, IEEE
Transactions on, 23(4), 501-509.

84
[55] Ricci, E., & Perfetti, R. (2007). Retinal blood vessel segmentation using line operators and
support vector classification. Medical Imaging, IEEE Transactions on, 26(10), 1357-1365.

[56] Xu, L., & Luo, S. (2010). A novel method for blood vessel detection from retinal images.
Biomedical engineering online, 9(1), 14.

[57] Lupascu, C. A., Tegolo, D., & Trucco, E. (2010). FABC: retinal vessel segmentation using
AdaBoost. Information Technology in Biomedicine, IEEE Transactions on, 14(5), 1267-1274.

[58] Marn, D., Aquino, A., Gegndez-Arias, M. E., & Bravo, J. M. (2011). A new supervised
method for blood vessel segmentation in retinal images by using gray-level and moment
invariants-based features. Medical Imaging, IEEE Transactions on, 30(1), 146-158.

[59] Villalobos-Castaldi, F. M., Felipe-Rivern, E. M., & Snchez-Fernndez, L. P. (2010). A fast,


efficient and automated method to extract vessels from fundus images. Journal of Visualization,
13(3), 263-270.

[60] Kande, G. B., Subbaiah, P. V., & Savithri, T. S. (2010). Unsupervised fuzzy based vessel
segmentation in pathological digital fundus images. Journal of medical systems, 34(5), 849-
858.

[61] Al-Rawi, M., Qutaishat, M., & Arrar, M. (2007). An improved matched filter for blood vessel
detection of digital retinal images. Computers in Biology and Medicine, 37(2), 262-267.

[62] Chaudhuri, S., Chatterjee, S., Katz, N., Nelson, M., & Goldbaum, M. (1989). Detection of
blood vessels in retinal images using two-dimensional matched filters. IEEE Transactions on
medical imaging, 8(3), 263-269.

[63] Zana, F., & Klein, J. C. (2001). Segmentation of vessel-like patterns using mathematical
morphology and curvature evaluation. Image Processing, IEEE Transactions on, 10(7), 1010-
1019.

[64] Mendonca, A. M., & Campilho, A. (2006). Segmentation of retinal blood vessels by
combining the detection of centerlines and morphological reconstruction. Medical Imaging,
IEEE Transactions on, 25(9), 1200-1213.

[65] Fraz, M. M., Barman, S. A., Remagnino, P., Hoppe, A., Basit, A., Uyyanonvara, B., ... &
Owen, C. G. (2012). An approach to localize the retinal blood vessels using bit planes and
centerline detection. Computer methods and programs in biomedicine, 108(2), 600-616.

[66] Miri, M. S., & Mahloojifar, A. (2011). Retinal image analysis using curvelet transform
and multistructure elements morphology by reconstruction. Biomedical Engineering, IEEE
Transactions on, 58(5), 1183-1192.

[67] Martinez-Perez, M. E., Hughes, A. D., Thom, S. A., Bharath, A. A., & Parker, K. H. (2007).
Segmentation of blood vessels from red-free and fluorescein retinal images. Medical image
analysis, 11(1), 47-61.

[68] Anzalone, A., Bizzarri, F., Parodi, M., & Storace, M. (2008). A modular supervised algorithm
for vessel segmentation in red-free retinal images. Computers in biology and medicine, 38(8),
913-922.

85
[69] Vlachos, M., & Dermatas, E. (2010). Multi-scale retinal vessel segmentation using line
tracking. Computerized Medical Imaging and Graphics, 34(3), 213-227.

[70] Lam, B. S., Gao, Y., & Liew, A. C. (2010). General retinal vessel segmentation using
regularization-based multiconcavity modeling. Medical Imaging, IEEE Transactions on, 29(7),
1369-1381.

[71] Espona, L., Carreira, M. J., Ortega, M., & Penedo, M. G. (2007). A snake for retinal vessel
segmentation. In Pattern Recognition and Image Analysis (pp. 178-185). Springer Berlin
Heidelberg.

[72] Espona, L., Carreira, M. J., Penedo, M. G., & Ortega, M. (2008, December). Retinal vessel
tree segmentation using a deformable contour model. In Pattern Recognition, 2008. ICPR 2008.
19th International Conference on (pp. 1-4). IEEE.

[73] Zhang, Y., Hsu, W., & Lee, M. L. (2009). Detection of retinal blood vessels based on nonlinear
projections. Journal of Signal Processing Systems, 55(1-3), 103-112.

[74] Delibasis, K. K., Kechriniotis, A. I., Tsonos, C., & Assimakis, N. (2010). Automatic model-
based tracing algorithm for vessel segmentation and diameter estimation. Computer methods
and programs in biomedicine, 100(2), 108-122.

[75] Zhou, L., Rzeszotarski, M. S., Singerman, L. J., & Chokreff, J. M. (1994). The detection and
quantification of retinopathy using digital angiograms. Medical Imaging, IEEE Transactions
on, 13(4), 619-626.

[76] Chutatape, O., Zheng, L., & Krishnan, S. M. (1998, October). Retinal blood vessel detection
and tracking by matched Gaussian and Kalman filters. In Engineering in Medicine and Biology
Society, 1998. Proceedings of the 20th Annual International Conference of the IEEE (Vol. 6,
pp. 3144-3149). IEEE.

[77] Can, A., Shen, H., Turner, J. N., Tanenbaum, H. L., & Roysam, B. (1999). Rapid automated
tracing and feature extraction from retinal fundus images using direct exploratory algorithms.
Information Technology in Biomedicine, IEEE Transactions on, 3(2), 125-138.

[78] Haralick, R. M., Sternberg, S. R., & Zhuang, X. (1987). Image analysis using mathematical
morphology. Pattern Analysis and Machine Intelligence, IEEE Transactions on, (4), 532-550.

[79] Li, H., & Chutatape, O. (2004). Automated feature extraction in color retinal images by a
model based approach. Biomedical Engineering, IEEE Transactions on, 51(2), 246-254.

[80] Huang, K., & Yan, M. (2005). A local adaptive algorithm for microaneurysms detection in
digital fundus images. In Computer Vision for Biomedical Image Applications (pp. 103-113).
Springer Berlin Heidelberg.

[81] Schmidhuber, J. (2015). Deep learning in neural networks: An overview. Neural Networks,
61, 85-117.

[82] Vasconcelos, J. A., Ramirez, J. A., Takahashi, R. H. C., & Saldanha, R. R. (2001).
Improvements in genetic algorithms. Magnetics, IEEE Transactions on, 37(5), 3414-3417.

86
[83] Shima, T., Rasmussen, S. J., Sparks, A. G., & Passino, K. M. (2006). Multiple task
assignments for cooperating uninhabited aerial vehicles using genetic algorithms. Computers
& Operations Research, 33(11), 3252-3269.
[84] Ahn, C. W., & Ramakrishna, R. S. (2003). Elitism-based compact genetic algorithms.
Evolutionary Computation, IEEE Transactions on, 7(4), 367-385.
[85] National Eye Institute, Facts About Macular Hole,
http://www.nei.nih.gov/health/macularhole/macularhole.asp
[86] Osareh, A., & Shadgar, B. (2009). Automatic blood vessel segmentation in color images of
retina. Iran. J. Sci. Technol. Trans. B: Engineering, 33(B2), 191-206.
[87] Rangayyan, R. M., Zhu, X., Ayres, F. J., & Ells, A. L. (2010). Detection of the optic nerve
head in fundus images of the retina with Gabor filters and phase portrait analysis. Journal of
digital imaging, 23(4), 438-453.
[88] Saremi, S., Sejnowski, T. J., & Sharpee, T. O. (2013). Double-Gabor filters are independent
components of small translation-invariant image patches. Neural computation, 25(4), 922-939.
[89] Perez, C. A., Cament, L. A., & Castillo, L. E. (2011, March). Local matching Gabor entropy
weighted face recognition. In Automatic Face & Gesture Recognition and Workshops (FG
2011), 2011 IEEE International Conference on (pp. 179-184). IEEE.
[90] Perez, C. A., Cament, L. A., & Castillo, L. E. (2011). Methodological improvement on
local Gabor face recognition based on feature selection and enhanced Borda count. Pattern
Recognition, 44(4), 951-963.
[91] Perez, C. A., Saravia, J., Navarro, C., Castillo, L., Schulz, D., & Aravena, C. (2012, October).
Lithological classification based on Gabor texture image analysis. In Optomechatronic
Technologies (ISOT), 2012 International Symposium on (pp. 1-3). IEEE.
[92] Perez, C. A., & Holzmann, C. A. (1997, October). Improvements on handwritten digit
recognition by genetic selection of neural network topology and by augmented training. In
Systems, Man, and Cybernetics, 1997. Computational Cybernetics and Simulation., 1997 IEEE
International Conference on (Vol. 2, pp. 1487-1491). IEEE.
[93] Perez, C., Casali, A., Gonzalez, G., Vallebuona, G., & Vargas, R. (1999). Lithological
composition sensor based on digital image feature extraction, genetic selection of features
and neural classification. In Information Intelligence and Systems, 1999. Proceedings. 1999
International Conference on (pp. 236-241). IEEE.
[94] Perez, C. A., & Castillo, L. E. (2009, September). Illumination compensation for face
recognition by genetic optimization of the self-quotient image method. In Optomechatronic
Technologies, 2009. ISOT 2009. International Symposium on (pp. 322-327). IEEE.
[95] Perez, C. A., & Salinas, C. (1999). Computational vision enhancement through genetic
selection of biologically inspired receptive field geometry. In Information Intelligence and
Systems, 1999. Proceedings. 1999 International Conference on (pp. 92-97). IEEE.
[96] Shannon, C. E. (1951). Prediction and entropy of printed English. Bell system technical
journal, 30(1), 50-64.

87
[97] Verleysen, M., & Franois, D. (2005). The curse of dimensionality in data mining and
time series prediction. In Computational Intelligence and Bioinspired Systems (pp. 758-770).
Springer Berlin Heidelberg.

[98] Galleguillos, C., Rabinovich, A., & Belongie, S. (2008, June). Object categorization using
co-occurrence, location and appearance. In Computer Vision and Pattern Recognition, 2008.
CVPR 2008. IEEE Conference on (pp. 1-8). IEEE.

[99] Carr, J. R., & De Miranda, F. P. (1998). The semivariogram in comparison to the co-occurrence
matrix for classification of image texture. Geoscience and Remote Sensing, IEEE Transactions
on, 36(6), 1945-1952.

[100] Felipe, J. C., Traina, A. J., & Traina Jr, C. (2003, June). Retrieval by content of medical
images using texture for tissue identification. In Computer-Based Medical Systems, 2003.
Proceedings. 16th IEEE Symposium (pp. 175-180). IEEE.

[101] Miao, W., & Chiou, P. (2008). Confidence intervals for the difference between two means.
Computational Statistics & Data Analysis, 52(4), 2238-2248.

[102] Swets, J. A. (2014). Signal detection theory and ROC analysis in psychology and
diagnostics: Collected papers. Psychology Press.

[103] Fawcett, T. (2006). An introduction to ROC analysis. Pattern recognition letters, 27(8), 861-
874.

[104] Cuevas, A., Febrero, M., & Fraiman, R. (2004). An anova test for functional data.
Computational statistics & data analysis, 47(1), 111-122.

I
Apndice A

Parmetros de los filtros obtenidos

A continuacin se muestran las tablas de parmetros para cada uno de los filtros obtenidos.
Los parmetros y 0 se muestran en grados.

Filtro 1
Variable Componente 1 Componente 2 Componente 3
32.14 5.91 73.2
214.128 195.192 239.004
0.989 1.8515 0.453
3.1205 0.3415 4.986
0 252.684 111.888 242.64

Filtro 2
Variable Componente 1 Componente 2 Componente 3
25.16 6.84 90.22
37.836 334.8 2.448
0.112 1.9935 0.407
4.3045 0.518 4.4655
0 7.02 81.9 142.704

Filtro 3
Variable Componente 1 Componente 2 Componente 3
30.98 4.79 92.98
177.912 190.836 154.8
0.8515 2.737 2.4105
2.0635 0.934 4.724
0 194.796 297.036 200.736

II
Filtro 4
Variable Componente 1 Componente 2 Componente 3
6.17 97.46 35.45
27.72 42.84 45.324
2.026 0.7945 0.6045
0.641 1.9555 3.8415
0 346.428 124.236 349.74

III

También podría gustarte