Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Imgenes
1
Facultad de Ingeniera de Sistemas e Informtica
Universidad Nacional Mayor de San Marcos
{nlasernap, uromanc}@unmsm.edu.pe
RESUMEN
El trabajo que se presenta en este artculo se desarrolla en el marco del procesamiento digital de
imgenes. En particular, se hace una revisin bibliogrfica de la segmentacin de imgenes y sus
principales tcnicas. La segmentacin subdivide una imagen en sus partes constituyentes u obje-
tos, con el fin de separar las partes de inters del resto de la imagen de acuerdo al tipo del problema
que se va a resolver. Fundamentalmente, se han revisado los siguientes tpicos en segmentacin:
1) Deteccin de bordes, 2) Umbralizacin, y 3) Basado en regiones.
Palabras claves: Procesamiento digital de imgenes, segmentacin, bordes, umbralizacin, re-
giones
ABSTRACT
The work that is presented in this article has being developed in the area of the digital image
processing. Especially, there is done a bibliographical review of the Image Segmentation and its
principals technics. The segmentation subdivides an image in its constituent part or objects, in order
to separate the parts of interest of the rest of the image according to the type of the problem that
is going to be solved. Fundamentally, the following topics have been reviewed in segmentation: 1)
Detection of edges, 2) Thresholding, and 3) Based on regions.
Keywords: Digital image processing, segmentation, borders, thresholding, regions
9
Revista de Ingeniera de Sistemas e Informtica vol. 6, N. 2, Julio - Diciembre 2009
Segmentacin Descripcin
Preprocesado
Resultado
Reconocimiento
Base de conocimiento
e interpretacin
Adquisicin
de imgenes
10
UNMSM - Universidad Nacional Mayor de San Marcos
tituyentes u objetos con el fin de separar las partes ne- cas, los componentes de color en imgenes en color,
cesarias de procesamiento del resto de la imagen que textura, forma, etc. [4].
no interesan de acuerdo a la aplicacin que se quiera
La segmentacin automtica es una de las tareas ms
dar. Las tcnicas bsicas en esta etapa son aquellas
difciles del procesamiento de imgenes, esta etapa de-
orientadas a: a) el pxel, b) a los bordes, y c) a las regio-
termina el eventual xito o fracaso del anlisis, de he-
nes. Sin embargo, las tcnicas no son excluyentes sino
cho rara vez llega a alcanzar una solucin satisfactoria,
que se combinan de acuerdo del tipo de aplicacin.
se debe buscar un mtodo alternativo de comprobacin
La siguiente etapa es la descripcin o extraccin de para la verificacin de los resultados. Un considerable
caractersticas, consiste en extraer caractersticas con nmero de trabajos de investigacin se centran en este
alguna informacin cuantitativa de inters o que sean problema.
fundamentales para diferenciar una clase de objetos de
Los algoritmos de segmentacin de imgenes mono-
otra. Luego la etapa de reconocimiento es el proceso
cromticas generalmente se basan en una de las dos
que asigna una etiqueta a un objeto basndose en la
propiedades bsicas de los valores del nivel de gris:
informacin proporcionada por sus descriptores. La in-
discontinuidad y similaridad. En la discontinuidad el
terpretacin implica asignar significado a un conjunto
mtodo consiste en dividir una imagen basndose en
de objetos reconocidos. Finalmente, la etapa Base de
los cambios bruscos del nivel de gris. Los temas ms
Conocimiento, que va almacenar el dominio del proble-
importantes en la discontinuidad son: a) deteccin de
ma para guiar la operacin de cada mdulo de proce-
puntos aislados, y b) deteccin de lneas y c) detec-
samiento, tambin controla la interaccin entre dichos
cin de bordes de una imagen. En la similaridad, se
mdulos.
presenta la regularidad en los valores del nivel de gris,
La estructura del presente artculo es la siguiente: En la los principales mtodos estn basados en a) umbrali-
seccin 2 se bosqueja el marco terico que corresponde zacin, b) crecimiento de regin, y c) divisin y fusin
a segmentacin de imgenes; en la seccin 3 se dedica de regiones[4].
a las tcnicas de deteccin de bordes, y a cada uno
La segmentacin de una imagen basado en la discon-
de las subsecciones que comprende: Procesamiento
tinuidad o en la similaridad de los valores del nivel de
local y Procesamiento global usando la Transformada
gris de sus pixels es aplicable tanto a las imgenes es-
de Hough; en la seccin 4 se presenta el proceso de
tticas como a las dinmicas (variantes en el tiempo).
Umbralizacin; en la seccin 5 se bosqueja la tcnica
En la Figura N. 2 se muestra un ejemplo de segmen-
de segmentacin orientada a regiones. Mientras que la
tacin de imagen.
seccin 6 corresponde a las conclusiones del trabajo
realizado y se proponen tareas futuras para su imple-
mentacin; y finalmente en la seccin 7 se presentan
las referencias bibliogrficas del trabajo desarrollado.
2. SEGMENTACIN DE IMGENES
La segmentacin subdivide una imagen en sus partes
constituyentes u objetos, con el fin de separar las par-
tes de inters del resto de la imagen, por lo tanto el Figura N. 2. Segmentacin de imagen.
nivel al que se lleva a cabo esta subdivisin depende De otra manera, a lo largo de las ltimas dcadas se
del problema a resolver. En el proceso de detectar las han desarrollado diversas tcnicas de segmentacin,
partes en una imagen se identifican bordes de la ima- las que se pueden agrupar en tres: tcnicas orientadas
gen, o se segmenta esta en regiones, lneas o curvas, al pixel, a los bordes y a las regiones. Dentro de ellas se
etc. Otra definicin considera a la segmentacin como pueden destacar los siguientes mtodos: lnea divisoria
la clasificacin de los puntos de la imagen (pixels), in- de aguas (watershed) que a partir de los mnimos en la
dicando las clases a la que pertenecen los diferentes imagen se aumenta gradualmente el nivel de gris, como
pixeles. Los atributos bsicos de segmentacin de una si fuera agua que se vierte en un valle, hasta encontrar
imagen son: la luminancia en imgenes monocromti- sus valles vecinos; deteccin de bordes de las regiones
11
Revista de Ingeniera de Sistemas e Informtica vol. 6, N. 2, Julio - Diciembre 2009
Otra corriente intenta, por medio de filtros de mediana Una de las tcnicas ms comunes para detectar un
adaptados al objeto de inspeccin, la estimacin de borde de dos dimensiones (2D), es el uso de deriva-
una imagen libre de fallas a partir de la imagen tomada das de primer orden mediante el operador gradiente.
del objeto mismo. Mediante simple comparacin entre El gradiente de una imagen es una funcin f(x, y) que
la imagen real y la imagen libre de fallas estimada se se define como el vector bidimensional presentado en
segmentan las fallas. Si bien es cierto que con este la ecuacin 3.1.
ltimo mtodo se obtienen excelentes resultados, es Ecuacin 3. 1
necesario invertir mucho tiempo en el diseo del filtro
para conseguir una adaptacin al objeto. Tpicamente, G dF / dx
G(F(x, y) = x =
para el anlisis de una imagen es necesario dividirla Gy dF / dy
a priori en cientos de subimgenes. Cada subimagen
posee un filtro morfolgico distinto, configurado a partir El operador gradiente G alcanza su mximo valor en la
de las caractersticas de la porcin del objeto presente direccin en que la variacin es mxima, por lo tanto
en ella [8]. puede definirse como la ecuacin 3.2.
Ecuacin 3.2
3. DETECCIN DE BORDES [4,8] G(F(x, y) = ([Gx(x, y)]2 + [Gy(x, y)]2)1/2
Como se mencion en la seccin 2 de este artculo, la Es prctica comn aproximar el gradiente mediante los
deteccin de la discontinuidad consiste en dividir una valores absolutos, con el fin de conseguir un procesa-
imagen basndose en los cambios bruscos del nivel de miento ms rpido a costa de un error despreciable, y
gris. Es particularmente importante porque proporciona la expresin se aproxima a la ecuacin 3.3.
informacin de los objetos de la imagen a otras tareas Ecuacin 3.3
del procesamiento de imgenes como reconocimien- G(F(x, y) = [Gx(x, y)] + [Gy(x, y)]
to e interpretacin. Los temas ms importantes en la
discontinuidad son: a) deteccin de puntos aislados, y A partir de las ecuaciones 3.1 y 3.2, se deduce que
b) deteccin de lneas y c) deteccin de bordes o con- el clculo del gradiente de una imagen se basa en la
tornos de una imagen. Aunque la deteccin de punto obtencin de las derivadas parciales dF/dx y dF/dy en
y lnea son elementos de cualquier presentacin de la cada posicin de pixel. Las derivadas de primer orden
segmentacin de imgenes, la deteccin de bordes es permiten encontrar lugares en una imagen en donde
la tcnica ms comn para detectar discontinuidades la intensidad que cambia rpidamente es mayor en
significativas en el nivel de gris, debido a que son ms magnitud que un umbral especificado. Existen varios
frecuentes en las aplicaciones prcticas. estimadores derivativos como los de Sobel y Prewit.
Los mtodos de extraccin de bordes de una imagen, Las instrucciones i) y ii) de MatLab, que se muestran a
se basan en la diferencia que experimenta una carac- continuacin, permiten obtener la figura 3 b) deteccin
terstica en dos regiones adyacentes y que indican la de bordes de la imagen a), en este caso se utiliz el
existencia de un borde. A la vez los bordes pueden operador de Sobel.
clasificarse por su anchura, ngulo de su pendiente i) I = imread (C:\Documents and Settings \ exclam.
de variacin, y las coordenadas de su punto medio. En gif);
general, se identifican diferentes modelos de bordes o ii) [g, t] = edge(I); en donde el umbral t = 0.2187
contornos: lnea, tipo escaln, tipo rampa y tipo tejado.
Las discontinuidades son detectadas usando derivadas
12
UNMSM - Universidad Nacional Mayor de San Marcos
3.2 Deteccin de bordes utilizando derivadas de La primera propiedad establece que un pxel de coor-
segundo orden, el operador laplaciano denadas (x, y) es similar a otro (x, y) dentro de su entor-
no de vecindad si la ecuacin 3.5 se cumple.
El laplaciano de una funcin bidimensional f(x, y) es
una derivada de segundo orden definida por la ecua- Ecuacin 3.5
cin 3.4. G[F(x, y)] - G[F(x', y')] T
Ecuacin 3.4 Donde T es un umbral no negativo.
La segunda propiedad, es decir la direccin del gra-
2 2
2 = + diente (G), se puede establecer utilizando el ngulo
x2 y2
del vector () gradiente que viene dado por la ecuacin
3.6
3.3 Enlazado de bordes y deteccin de lmites
Ecuacin 3.6
Si bien hay varias tcnicas que detectan discontinuida-
des de intensidad, y que deberan dar como resultado Gx
pixels que estuvieran en la frontera entre un objeto y = tg-1
Gy
su fondo, en la prctica, este conjunto de pixels rara
vez caracterizan una frontera completamente debido Donde representa el ngulo respecto al eje de x.
al ruido, interrupciones en la frontera debido a la ilu- As, un pxel del borde situado en (x, y) tiene un ngulo
minacin no uniforme, y otros efectos que introducen similar a (x, y) si se cumple la ecuacin 3.7.
discontinuidades de intensidad esprias. Por ello, los
algoritmos de deteccin de bordes estn seguidos por Ecuacin 3.7
una unin y otros procedimientos de deteccin de fron- | - '| A
tera diseados para reunir a los pixels del borde en un Donde A es un umbral angular y ngulo del vector
conjunto con significado de fronteras de objetos [4]. gradiente.
A continuacin se presentan algunas tcnicas que se Un punto de la vecindad predefinida de (x, y) est enla-
ajustan a ese objetivo. zado con el pxel de (x, y) si se satisfacen los criterios
3.3.1 Procesamiento local de magnitud y direccin. Se repite para cada posicin
de la imagen. Un registro debe conservar los puntos
Consiste en analizar un entorno de vecindad (por ejem- enlazados a medida que el centro de la vecindad se
plo, 3x3, 5x5) sobre todos los puntos (x, y) de una ima- desplaza de pxel a pxel.
gen en los que haya sido llevado a cabo un proceso de
deteccin de borde, de forma que todos los puntos que 3.3.2 Procesamiento global usando la Transforma-
presenten caractersticas similares se unen formando da de Hough [4, 16]
una frontera comn. Se utilizan dos propiedades para Originalmente fue diseado para detectar lneas y cur-
determinar la similitud entre pixeles del borde: a) Mag- vas, utilizando ecuaciones analticas conocidas de bor-
nitud del vector gradiente (valor del umbral para deter- des de objetos, sin embargo con este mtodo original,
minar el borde), y b) Direccin del gradiente. no siempre es posible encontrar ecuaciones analticas
a) b)
Figura N. 3. a) Imagen; b) Deteccin de bordes de la imagen en a). Figura N. 3.1. Deteccin de bordes en escala de grises.
13
Revista de Ingeniera de Sistemas e Informtica vol. 6, N. 2, Julio - Diciembre 2009
que describan bordes. La transformada de Hough ge- se requiere de una especificacin completa de la for-
neralizada hace posible esto, es decir detectar bordes ma exacta del objeto de la imagen. Asimismo, permite
de objetos aun cuando las expresiones analticas de deteccin de objetos con formas predeterminadas, in-
bordes no es conocida. clusive es posible la deteccin de objetos cuya forma
exacta no es conocida pero que teniendo o asumiendo
Intuitivamente, este mtodo de deteccin de bordes
un conocimiento previo se puede formar un modelo
consiste en calcular el gradiente de una imagen, luego
aproximado del objeto.
crear un campo de acumulacin en funcin de los pa-
rmetros de la funcin que se busca, y posteriormente
los mximos en el espacio de acumulacin indican la 4. UMBRALIZACIN
existencia de los objetos buscados. Previamente, antes
La umbralizacin es uno de los mtodos ms impor-
de aplicar la transformada, la imagen de entrada ser
tantes de la segmentacin de imgenes. Se define el
la imagen binaria de los pixeles que forman parte del
umbral como una funcin que convierte una imagen
contorno de la imagen.
con diferentes tonalidades en una imagen en blanco y
La idea bsica del mtodo puede ser presentado desde negro. Si la imagen original es f(x, y), la imagen um-
un problema simple como la deteccin de lneas rectas, bralizada g(x, y) y se fija un umbral U (0 < U < 255), la
en este caso el objetivo de la transformada de Hough operacin de umbralizado se define como la ecuacin
es encontrar puntos alineados que puedan existir en la 4.1.
imagen, es decir, puntos en la imagen que satisfagan Ecuacin 4.1
la ecuacin de la recta para distintos valores de y .
Para ello, de manera general, se siguen los siguientes g(x, y) = 255 si f(x, y) > Umbral
pasos: g(x, y) = 0 si f(x, y) Umbral
a) La ecuacin de la lnea puede ser definida como Se selecciona un umbral que permita agrupar los pixels
(Figura N. 4-A) de una imagen pertenecientes a los diversos objetos
b) La transformada de Hough de esa lnea es un punto de la misma imagen diferencindolos del fondo. De
en el plano (r, ) (Figura N. 4-B) esta manera la segmentacin basada en el histograma
se basa en la eleccin de uno o varios umbrales que
c) Para cada punto de la imagen se calcula su repre- permiten agrupar los puntos de la imagen en regiones
sentacin en el plano. de caractersticas similares en funcin de sus niveles
d) Para reducir la bsqueda, se cuantifica el espacio de gris. El umbral de una imagen se define como la
de parmetros r y , dividiendo este en un espacio ecuacin 4.2 [4].
de grupos de posibles lneas.
Ecuacin 4.2
e) Los mximos locales en (r, ) son las lneas que se
T = T [x, y, p(x, y), f(x, y)]
desean encontrar.
Donde f(x, y) es la intensidad o nivel de gris del punto
La transformada de Hough generalizada, cuyo algorit-
(x, y) y p(x, y) representa alguna propiedad local medi-
mo puede ser revisado en [16], permite detectar bordes
da en un entorno de vecindad de este punto. La imagen
de imgenes que no sean lneas, crculos o elipses;
que se obtiene al llevar a cabo un procesamiento de
sin embargo, para alcanzar una segmentacin precisa,
umbral se define como la ecuacin 4.3.
y r Ecuacin 4.3
g(x, y) = 1 si f(x, y) > T o
si f(x, y) T
De este modo los pixeles marcados con 1 correspon-
(r, ,) den a objetos, mientras que los pixeles marcados con
r
0 corresponden al fondo. En la ecuacin 4.3 se ha su-
x
a) b) puesto que la intensidad de los objetos es mayor que la
Figura N. 4. a) lnea recta y los parmetros r y , y b) Punto en el intensidad del fondo. Este proceso es conocido como
plano (r , ). binarizacin.
14
UNMSM - Universidad Nacional Mayor de San Marcos
15
Revista de Ingeniera de Sistemas e Informtica vol. 6, N. 2, Julio - Diciembre 2009
16