Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Imgenes
Dra. Nora La Serna Palomino1, Lic. Ulises Romn Concha1
1
RESUMEN
El trabajo que se presenta en este artculo se desarrolla en el marco del procesamiento digital de
imgenes. En particular, se hace una revisin bibliogrfica de la segmentacin de imgenes y sus
principales tcnicas. La segmentacin subdivide una imagen en sus partes constituyentes u objetos, con el fin de separar las partes de inters del resto de la imagen de acuerdo al tipo del problema
que se va a resolver. Fundamentalmente, se han revisado los siguientes tpicos en segmentacin:
1) Deteccin de bordes, 2) Umbralizacin, y 3) Basado en regiones.
Palabras claves: Procesamiento digital de imgenes, segmentacin, bordes, umbralizacin, regiones
ABSTRACT
The work that is presented in this article has being developed in the area of the digital image
processing. Especially, there is done a bibliographical review of the Image Segmentation and its
principals technics. The segmentation subdivides an image in its constituent part or objects, in order
to separate the parts of interest of the rest of the image according to the type of the problem that
is going to be solved. Fundamentally, the following topics have been reviewed in segmentation: 1)
Detection of edges, 2) Thresholding, and 3) Based on regions.
Keywords: Digital image processing, segmentation, borders, thresholding, regions
1. INTRODUCCIN
El trabajo que se presenta en este artculo se desarrolla en el marco del procesamiento digital de imgenes.
En particular, se hace una revisin bibliogrfica de la
Segmentacin de imgenes y sus principales tcnicas.
La segmentacin subdivide una imagen en sus partes
constituyentes u objetos, con el fin de separar las partes de inters del resto de la imagen, por lo tanto el
nivel al que se lleva a cabo esta subdivisin depende
del problema a resolver.
En arqueologa, los mtodos de procesamiento de imgenes han servido para restaurar con xito imgenes
borrosas. En la fsica y en campos afines, las tcnicas
por computador realzan de forma rutinaria imgenes de
experimentos en reas como los plasmas de alta energa y la microscopa del electrn. Igualmente en astronoma, biologa, medicina nuclear, y en aplicaciones
industriales, en este ltimo se utilizan adems diversos
tipos de materiales como el cuero, vidrio, metales, madera, hilos, etc. [9].
Algunas de las tareas fundamentales del procesamiento digital de imgenes son: 1) Mejoramiento de una
imagen digital con fines interpretativos, y 2) Toma de
decisiones de manera automtica de acuerdo al contenido de la imagen digital.
Una imagen puede ser definida como una funcin bidimensional de intensidad de luz f(x, y), donde x e y
representan las coordenadas espaciales y el valor de f
en un punto cualquiera (x, y) es proporcional al brillo (o
nivel de gris) de la imagen en ese punto. Una imagen
digital es una imagen f(x, y) que se ha discretizado tanto en las coordenadas espaciales como en el brillo; y
puede considerarse como una matriz cuyos ndices de
fila y de columna identifican un punto de la imagen y el
valor del correspondiente elemento de la matriz indica
el nivel de gris en ese punto. Los elementos de una distribucin digital de este tipo se denominan elementos
de la imagen o ms comnmente pixels, abreviatura de
su denominacin inglesa picture elements [4].
Diversas son las aplicaciones que se vienen desarrollando utilizando las tcnicas del procesamiento digital
de imgenes. Una de las pioneras son las aplicaciones
a los programas espaciales. En medicina y biologa,
los procedimientos informatizados realzan el contraste
Segmentacin
Descripcin
Preprocesado
Base de conocimiento
Adquisicin
de imgenes
Figura N. 1. Etapas del procesamiento digital de imgenes.
10
Reconocimiento
e interpretacin
Resultado
tituyentes u objetos con el fin de separar las partes necesarias de procesamiento del resto de la imagen que
no interesan de acuerdo a la aplicacin que se quiera
dar. Las tcnicas bsicas en esta etapa son aquellas
orientadas a: a) el pxel, b) a los bordes, y c) a las regiones. Sin embargo, las tcnicas no son excluyentes sino
que se combinan de acuerdo del tipo de aplicacin.
Los algoritmos de segmentacin de imgenes monocromticas generalmente se basan en una de las dos
propiedades bsicas de los valores del nivel de gris:
discontinuidad y similaridad. En la discontinuidad el
mtodo consiste en dividir una imagen basndose en
los cambios bruscos del nivel de gris. Los temas ms
importantes en la discontinuidad son: a) deteccin de
puntos aislados, y b) deteccin de lneas y c) deteccin de bordes de una imagen. En la similaridad, se
presenta la regularidad en los valores del nivel de gris,
los principales mtodos estn basados en a) umbralizacin, b) crecimiento de regin, y c) divisin y fusin
de regiones[4].
La segmentacin de una imagen basado en la discontinuidad o en la similaridad de los valores del nivel de
gris de sus pixels es aplicable tanto a las imgenes estticas como a las dinmicas (variantes en el tiempo).
En la Figura N. 2 se muestra un ejemplo de segmentacin de imagen.
2. SEGMENTACIN DE IMGENES
La segmentacin subdivide una imagen en sus partes
constituyentes u objetos, con el fin de separar las partes de inters del resto de la imagen, por lo tanto el
nivel al que se lleva a cabo esta subdivisin depende
del problema a resolver. En el proceso de detectar las
partes en una imagen se identifican bordes de la imagen, o se segmenta esta en regiones, lneas o curvas,
etc. Otra definicin considera a la segmentacin como
la clasificacin de los puntos de la imagen (pixels), indicando las clases a la que pertenecen los diferentes
pixeles. Los atributos bsicos de segmentacin de una
imagen son: la luminancia en imgenes monocromti-
11
Ecuacin 3. 1
G
G(F(x, y) = x =
Gy
dF / dx
dF / dy
Ecuacin 3.2
G(F(x, y) = ([Gx(x, y)]2 + [Gy(x, y)]2)1/2
Ecuacin 3.3
G(F(x, y) = [Gx(x, y)] + [Gy(x, y)]
12
La primera propiedad establece que un pxel de coordenadas (x, y) es similar a otro (x, y) dentro de su entorno de vecindad si la ecuacin 3.5 se cumple.
Ecuacin 3.4
2 =
La segunda propiedad, es decir la direccin del gradiente (G), se puede establecer utilizando el ngulo
del vector () gradiente que viene dado por la ecuacin
3.6
2
2
+
x2
y2
Ecuacin 3.6
Gx
= tg-1
Gy
Donde representa el ngulo respecto al eje de x.
Si bien hay varias tcnicas que detectan discontinuidades de intensidad, y que deberan dar como resultado
pixels que estuvieran en la frontera entre un objeto y
su fondo, en la prctica, este conjunto de pixels rara
vez caracterizan una frontera completamente debido
al ruido, interrupciones en la frontera debido a la iluminacin no uniforme, y otros efectos que introducen
discontinuidades de intensidad esprias. Por ello, los
algoritmos de deteccin de bordes estn seguidos por
una unin y otros procedimientos de deteccin de frontera diseados para reunir a los pixels del borde en un
conjunto con significado de fronteras de objetos [4].
A continuacin se presentan algunas tcnicas que se
ajustan a ese objetivo.
Ecuacin 3.7
| - '| A
Donde A es un umbral angular y ngulo del vector
gradiente.
Un punto de la vecindad predefinida de (x, y) est enlazado con el pxel de (x, y) si se satisfacen los criterios
de magnitud y direccin. Se repite para cada posicin
de la imagen. Un registro debe conservar los puntos
enlazados a medida que el centro de la vecindad se
desplaza de pxel a pxel.
a)
Ecuacin 3.5
G[F(x, y)] - G[F(x', y')] T
Donde T es un umbral no negativo.
b)
13
se requiere de una especificacin completa de la forma exacta del objeto de la imagen. Asimismo, permite
deteccin de objetos con formas predeterminadas, inclusive es posible la deteccin de objetos cuya forma
exacta no es conocida pero que teniendo o asumiendo
un conocimiento previo se puede formar un modelo
aproximado del objeto.
que describan bordes. La transformada de Hough generalizada hace posible esto, es decir detectar bordes
de objetos aun cuando las expresiones analticas de
bordes no es conocida.
Intuitivamente, este mtodo de deteccin de bordes
consiste en calcular el gradiente de una imagen, luego
crear un campo de acumulacin en funcin de los parmetros de la funcin que se busca, y posteriormente
los mximos en el espacio de acumulacin indican la
existencia de los objetos buscados. Previamente, antes
de aplicar la transformada, la imagen de entrada ser
la imagen binaria de los pixeles que forman parte del
contorno de la imagen.
4. UMBRALIZACIN
La umbralizacin es uno de los mtodos ms importantes de la segmentacin de imgenes. Se define el
umbral como una funcin que convierte una imagen
con diferentes tonalidades en una imagen en blanco y
negro. Si la imagen original es f(x, y), la imagen umbralizada g(x, y) y se fija un umbral U (0 < U < 255), la
operacin de umbralizado se define como la ecuacin
4.1.
a)
Ecuacin 4.3
g(x, y) = 1
b)
si
si
f(x, y) > T
f(x, y) T
De este modo los pixeles marcados con 1 corresponden a objetos, mientras que los pixeles marcados con
0 corresponden al fondo. En la ecuacin 4.3 se ha supuesto que la intensidad de los objetos es mayor que la
intensidad del fondo. Este proceso es conocido como
binarizacin.
(r, ,)
Ecuacin 4.2
T = T [x, y, p(x, y), f(x, y)]
La transformada de Hough generalizada, cuyo algoritmo puede ser revisado en [16], permite detectar bordes
de imgenes que no sean lneas, crculos o elipses;
sin embargo, para alcanzar una segmentacin precisa,
y
Ecuacin 4.1
g(x, y) = 255 si f(x, y) > Umbral
g(x, y) = 0
si f(x, y) Umbral
14
No pixels
fondo
crculo tringulo
Nivel de gris
0
125
Varias tcnicas de esta clasificacin han sido desarrollados, en este trabajo se presentan aquellas ms
utilizadas: a) Crecimiento de regiones, y b) divisin y
fusin.
255
g(x, y) = 255
g(x, y) = f(x, y)
Es una tcnica muy utilizada, que consiste en el crecimiento de regiones agrupando pixeles adyacentes
que presentan caractersticas o propiedades similares.
Se parte de un conjunto de puntos semilla y se hace
crecer las regiones, aadiendo a los puntos semilla
los puntos vecinos que tengan propiedades similares,
como intensidad, textura, color, etc. Por ejemplo, si la
propiedad es intensidad, un criterio utilizado para incluir
un pxel en una regin, puede ser que la diferencia absoluta entre la intensidad del pixel y la intensidad de
la semilla sea menor que un umbral, por ejemplo T =
8. Los puntos semillas pueden ser escogidos manualmente o de manera automtica. En la figura N. 8, se
observa de manera grfica el proceso de esta tcnica.
Regin 1
A1
A3
A2
Regin 2
B1
B3
B2
15
[2] Castleman KR 1996. Digital Image Processing, Prentice-Hall, Englewood Cliffs, New Jersey
07632.
[3] Faugeras O. 1993. Three-Dimensional Computer
Vision: A Geometric Viewpoint, The MIT Press,
Cambridge MA, London.
[4] Gonzalez RC, Woods RE 1996. Tratamiento digital de imgenes, Addison-Wesley Publishing Co,
Reading, Washington.
[5] Gonzalez RC, Woods RE 2004. Steven Eddins
Digital Image using MatLab Processing, PerasonPrentice Hall.
[6] Haralick RM, Shapiro FG 1992. Computer and robot vision. Addison-Wesley Publishing Co, Reading,
Massachusetts.
[7] Jhne B. 1997. Digital Image Processing, Springer,
4th Edition.
[8] Mazo, Q. M. & Boquete, V.L. & Barea N.R. 1996.
Visin Artificial. Publicaciones UAH. ISBN 84 8138
101 2, DL. M 1321.
[9] Domingo M. 2002. Inspeccin Visual Automtica.
Primer Congreso Internacional de Ingeniera Mecatrnica. Lima.
[10] Domingo. M. 2002. Automated Flaw Detection in
Aluminum Castings Based on the Tracking of Potencial Defects in a Radioscopic Image Sequence.
IEEE Transactions on Robotics and Automation,
Vol. XX August.
[11] Pratt WK. 1991. Digital Image Processing, John Wiley & Sons.
[12] Pistori H.; Pereira, M. C. 2006. Utilizacao de Ferramentas Livres em um Curso de Visao Computacional. II Workshop sobre Computao Grfica e
Educao - SIBGRAPI2006, Manaus, Octubre 8.
[13] Pistori H. 2006. Computer Vision and Digital Inclusion of Persons with Special Needs: Overview and
State of Art. CompIMAGE - Computational Modelling
of Objects Represented in Images: Fundamentals,
Methods and Applications, Coimbra, Outubro 20.
[14] Russ J. 1995. The image processing handbook.
Boca Ratn, CRS Press.
[15] Reid M, Millar R. y Black N. 1997. Second-Generation Image Coding: An Overview. ACM computing
surveys, Vol. 29, N. 1.
[16] Sonka M, Hlavac V, y Boyle R. 2008. Image Processing, Analysis, and Machine Vision. Thomson.
si tienen propiedades similares como nivel de gris similares, o son divididos si no comparten las mismas
propiedades, como variaciones considerables de niveles de gris. Finalmente, la imagen queda segmentada
en un conjunto de regiones homogneas. La figura N.
9, muestra una imagen segmentada en 1405 regiones
utilizando este mtodo.
6. CONCLUSIONES
El trabajo desarrollado ha dado lugar a una revisin
bibliogrfica de las principales tcnicas usadas de segmentacin de imgenes. En deteccin de bordes se han
presentado las tcnicas: a) Derivada de primer orden,
el operador gradiente, b) Deteccin de bordes utilizando derivadas de segundo orden, el operador laplaciano,
y c) Tcnicas de enlazado de bordes y deteccin de
lmites. Se ha desarrollado el mtodo de umbralizacin;
y en segmentacin orientada a regiones se han bosquejado las tcnicas: a) Crecimiento de regiones, y b)
Divisin y fusin.
Si bien se han presentado las definiciones fundamentales de las tcnicas mencionadas en el prrafo anterior,
por la longitud del trabajo no se han implementado las
tcnicas utilizando un software como el MatLab u otro
similar, dejando esta tarea para un prximo trabajo.
Agradecimientos
El presente trabajo se desarrolla en el marco del proyecto de investigacin 2007 Procesamiento digital de
imgenes aplicado al rea de Biologa, financiado parcialmente por el Vicerrectorado de Investigacin de la
Universidad Nacional Mayor de San Marcos.
7. REFERENCIAS BIBLIOGRFICAS
[1] Artculos seleccionados de las revistas IEEE Trans.
Image Processing, IEEE Trans. Pattern Analysis
and Machine Intelligence 1992-2001.
16