Está en la página 1de 25

5 Segmentacin

En las tcnicas de procesamiento de las imgenes cada pxel era transformado de


un valor a otro. Estos cambios, mayoritariamente, se realizan para facilitar la particin
de la imagen en reas de pxeles con significado. En esta nueva fase se trata de agrupar
los pxeles, por algn criterio de homogeneidad, para particionar la escena en regiones
de inters. Estas reas deben de tener algn significado fsico. Por tanto, la
segmentacin de una imagen es un proceso de extraccin de los objetos de inters
insertados en la escena capturada. La agrupacin de los pxeles se hace a razn de que
sus vecinos sean similares en criterios como de luminancia, color, texturas,
movimientos,... Una vez que la
imagen ha sido particionada, la
unidad dejara de ser el pxel
para ser la agrupacin de
pxeles que constituye el
objeto. La imagen estar
definida por un conjunto de
objetos, habiendo pasado de
un nivel bajo a otro ms
elaborado o nivel medio
visual. La informacin estar
preparada para el
reconocimiento e
interpretacin de la imagen.

Para la segmentacin Figura 5. 1 Esquema general de Visin Artificial


de las imgenes se usan tres

Dpto. Electrnica, Automtica e Informtica Industrial 149


Carlos Platero Apuntes de Visin Artificial

conceptos bsicos:

Similitud: los pxeles agrupados del objeto deben ser similares respecto
algn criterio (nivel de gris, color, textura,....).

Conectividad: los objetos corresponden a reas de pxeles con


conectividad. Las particiones corresponden con regiones continuas de
pxeles.

Discontinuidad: los objetos tienen formas geomtricas que definen unos


contornos. Estos bordes delimitan unos objetos de otros.

En la prctica, la imposicin de estas condiciones sobre la estrategia de


segmentacin resulta casi imposible. As, por ejemplo, los criterios de similitud fallan
debido a la aparicin del ruido, a la falta de iluminacin uniforme sobre el escenario o a
la creacin de sombras de unos objetos sobre otros. Todas estas causas producen que
algo que pareca sencillo de definir, como es alguna regla sobre la similitud, resulte
impracticable de acotar. Todas ellas fracasan sobre escenas ms o menos complejas. En
cuanto a la conectividad, la ocultacin parcial de un objeto capturado hace fallarla.
Suele ser normal en el proceso de segmentacin que se produzcan varias regiones de
pxeles agrupados que provienen del mismo objeto fsico. No slo por las oclusiones de
ste, sino tambin debido a los cambios de la textura del objeto, a la variacin de la
iluminacin de la escena o al reflejo de otros objetos adyacentes. Por ltimo y tal cual se
coment en el anterior captulo, la deteccin de los contornos fsicos suele estar plagada
de errores y de discontinuidades en los bordes. Resulta extraordinariamente difcil
obtener los contornos cerrados, inmunes al ruido y sin desplazamiento entre el contorno
real y el obtenido.

La conclusin es obvia, la segmentacin es un proceso altamente complejo y sin


solucin final en muchos aos. Es una labor de investigacin actual y en las siguientes
dcadas venideras. En el paradigma actual se combinan las tcnicas basadas en la
localizacin de regiones uniformes con los contornos de los objetos.

Figura 5. 2. Estadio actual de las tcnicas de segmentacin sobre escenarios naturales

150 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

No obstante, en la actual Visin Artificial todava existe mucho recorrido para


las aplicaciones industriales. Las citadas dificultadas de la fase de segmentacin son
resueltas con una eleccin esmerada en la formacin de la imagen, eligiendo una
iluminacin adecuada y simplificando la escena. Como se ha comentado varias veces,
las tcnicas de Visin Artificial resultan factibles para el anlisis de imgenes simples y
repetitivas.

Figura 5. 3. Tcnicas de segmentacin sobre escenarios repetitivos y alienantes para el


hombre. Aplicaciones de segmentacin sobre imgenes procedentes de microscopa.

La exposicin de este captulo versa sobre las distintas tcnicas de


segmentacin, clasificadas en:

Contornos de los objetos: trata de localizar las fronteras de los objetos.


Hace referencia a los aspectos geomtricos de los objetos.

Bsqueda de regiones homogneas: agrupa los pxeles por algn criterio


de similitud y stos tienen conectividad entre ellos. Est unido a las
caractersticas texturales de los objetos.

5.1 Tcnicas basadas en los bordes

Para la localizacin de las fronteras de los objetos en la escena se emplearn las


tcnicas de deteccin de los bordes, vistas en el captulo anterior. Sin embargo, esta
etapa no es definitiva para poder segmentar los objetos presentes en la imagen. La
presencia de ruido, el efecto de las sombras, la falta de iluminacin uniforme y un largo
etctera de causas, produce que los contornos no sean del todo continuos y cerrados
sobre los objetos. Se requiere otra etapa de post-procesamiento. Esta nueva fase emplea
los resultados de la deteccin de bordes para elaborar las fronteras de los objetos. Se
trata de agrupar los pxeles etiquetados como bordes, de la etapa anterior (de deteccin

Dpto. Electrnica, Automtica e Informtica Industrial 151


Carlos Platero Apuntes de Visin Artificial

de bordes), empleando la propiedad de conectividad. Para que un pxel etiquetado


como borde se defina como pxel frontera de un objeto se necesitar que otros pxeles
bordes tengan similar direccin y mdulo del gradiente. Dos pxeles sern considerados
pertenecientes a una misma frontera si presentan alguna condicin de conectividad y las
diferencias entre sus gradientes no superan un determinado umbral:

G1 G2 TM
1 2 TA (5. 1)

Donde |Gi| y i se ha denotado el mdulo y argumento del gradiente del pxel i,


siendo i = 1 2, indicando dos pxeles vecinos. Evidentemente, en la construccin de la
frontera aparecer ruido, habr pxeles que constituyen los bordes de los objetos y otros
que son defectuosos y que han aparecido por una alta variacin local de intensidad
debido a sombras, cambios de iluminacin,... Hay varios planteamientos para superar
estos inconvenientes. Algunos autores emplean tcnicas de crecimiento de regiones, las
cuales se vern ms adelante, pero que bsicamente se trata de partir de un pxel borde
semilla ir agrupando pxeles con conectividad siempre y cuando cumplan algn criterio
de homogeneidad, por ejemplo, el expresado en la anterior ecuacin. Otros autores
emplean un marco de trabajo basado en la optimizacin. Realizan un grafo de los
posibles caminos que pueda llevar la frontera del objeto y mediante una funcin de
coste, eligen la mejor solucin. Un planteamiento alternativo es la agrupacin de los
pxeles que cumplen un cierto criterio en una primitiva ms elaborada, como puede ser
un pequeo segmento con orientacin. Posteriormente, se procede a encadenar estas
primitivas dando paso a la delimitacin de los objetos.

Un campo muy atractivo en esta materia son los contornos activos. Se trata de
emplear una curva cerrada que vaya adaptndose dinmicamente hasta alcanzar la
frontera del objeto.

Figura 5. 4 Ejemplo de contornos activos

Muchas aplicaciones se basan en las localizaciones de lneas rectas o de otras


formas bsicas como crculos o elipses, ya que se consideran elementos fundamentales
en la percepcin de entornos estructurados o semi-estructurados. Se basa en el hecho de
que las escenas artificiales, construidas por el hombre, estn plagadas de contornos
rectos o de objetos con formas circulares o elpticas. En este sentido se aplican las
transformadas de Hough para la localizacin de estas fronteras.

152 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

5.1.1 Transformada de Hough

Este algoritmo trata de detectar formas geomtricas sencillas en una imagen. En


su procesamiento emplea el conjunto total de la imagen, hacindolo robusto ante la
presencia del ruido o discontinuidades de las etapas previas. De hecho, para su
ejecucin requiere de una imagen binarizada en la que se ha seleccionado previamente
los bordes. Por tanto, la entrada al algoritmo de Hough es una imagen en la que se le ha
aplicado un detector bordes. Hough, desde una perspectiva global, intentar extraer las
primitivas de ms alto nivel como pueden ser lneas, elipses o cualquier tipo de curva
parametrizada o no. El mayor inconveniente es su alto coste computacional.

5.1.1.1 Deteccin de lneas rectas

Considerando un pxel de coordenadas (xi,yi), seleccionado como elemento que


representa un borde; sobre este pixel pasarn infinitas rectas:

yi axi b (5. 2)

El modelo de todas las infinitas rectas que pasan por (xi,yi) queda definida por
los infinitos valores de a y b. Haciendo la transformacin al espacio paramtrico, a y b
quedarn definidos como:

b yi axi (5. 3)

Al variar el parmetro a desde - a + se obtendr los infinitos valores de b. La


representacin geomtrica de b yi axi , en el espacio paramtrico, ser tambin una
recta. La caracterstica interesante de esta presentacin consiste que si dos pxeles que
pertenezcan a una misma lnea son representados en el espacio paramtrico, el modelo
de la recta est definido en la interseccin de las dos rectas del espacio paramtrico.

y b
(xi,yi) (a1,b1)
(a2,b2)
(xl,yl)

x a
Figura 5. 5 Ejemplo de conversin hacia el espacio paramtrico

La transformada de Hough (1962) aplica este concepto para la localizacin de


lneas rectas en la imagen. Discretiza el espacio paramtrico en intervalos de [amin, amax]
y [bmin, bmax], creando una rejilla de celdas de acumulacin. Por cada pxel, considerado
como borde, se hace recorrer el rango dinmico de a obteniendo los valores de b. Por

Dpto. Electrnica, Automtica e Informtica Industrial 153


Carlos Platero Apuntes de Visin Artificial

cada valor de a y b se le pone un voto en la celda correspondiente. Esta operacin se


hace con todos los pxeles etiquetados como bordes. Al finalizar, aquellas celdas con
ms votos indicarn la presencia de rectas en la y
imagen, cuyos modelos correspondern con las
coordenadas de las celdas ms votadas.

Sin embargo, el espacio paramtrico elegido
no es el ms correcto, ya que los rangos dinmicos
de a y b no estn limitados. En cambio, si se hace
una representacin en coordenadas polares, el x
ngulo de la normal de la recta, , est limitado en
un intervalo de radianes, mientras la distancia de Figura 5. 6. Espacio paramtrico en
coordenadas polares
proyeccin, , est acotada por el tamao de la
imagen:

xi cos yi sen (5. 4)

La representacin de un pxel seleccionado en este espacio paramtrico ser una


parte de una senoide.

Espacio de lneas

160
-150

140
-100
rho (pixeles desde el centro)

120
-50
100

0
80

50
60

100 40

150 20

0 20 40 60 80 100 120 140 160 180


theta (grados)

Figura 5. 7 Votaciones en el espacio paramtrico de coordenadas polares

Una forma de mejorar el coste computacional es aprovechar el ngulo del


gradiente de cada pxel, pues ste, aunque es de carcter local, dar una primera
aproximacin del ngulo de la normal. De esta forma, se disminuye el rango dinmico
de y por tanto del nmero de operaciones y de votos en la rejilla de acumulacin.

154 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

Catenaria Detector de Canny

Espacio de lneas
rho (pixeles desde el centro)

150
-100

100
0

50
100

0 50 100 150
theta (grados)

Figura 5. 8. Transformadas de Hough para lneas rectas

Resolucin Matlab
imgEnt=imread('cables_gris.bmp');imshow(imgEnt);pause;
imgBorde=edge(imgEnt,'canny');imshow(imgBorde);
theta = 0:180;
[acum,rho] = radon(imgBorde,theta);
imagesc(theta,rho,acum), colorbar;
xlabel ('theta (grados)'), ylabel ('rho (pixeles desde el centro)')
title('Espacio de lneas');

Otro inconveniente de la transformada de Hough est en su salida, al retornar el


modelo de una recta infinita y no de un segmento. No se sabe donde empieza y acaba la
recta.

Dpto. Electrnica, Automtica e Informtica Industrial 155


Carlos Platero Apuntes de Visin Artificial

Imagen de entrada Imagen binarizada con detector de Canny

Espacio de lneas Resultados de la transformada de Hough

-150 120
rho (pixeles desde el centro)

-100
100
-50
80
0
60
50
40
100

150 20

0 50 100 150
theta (grados)

Figura 5. 9 Resultados de la transformada de Hough, si las rectas tenan al menos 80 votos

5.1.1.2 Deteccin de crculos

Para este caso, el espacio paramtrico ser 3D, correspondiente a la posicin del
centro del crculo, (x0, y0), y al radio, r:

xi x0 2 yi y0 2 r 2 (5. 5)

Las votaciones de cada celdilla del espacio paramtrico se realizar variando la


posicin del centro del crculo, (x0, y0), para cada pxel etiquetado, (xi,yi), obteniendo
los distintos valores del radio, r. Por tanto, entrado en la rejilla de acumulacin por
posicin del centro del crculo y del radio calculado se proceder a depositar los votos
correspondientes. Los crculos seleccionados sern aquellos que superen un cierto
umbral de votos recibidos. El mayor inconveniente es su alto coste computacional. Una
forma de ahorro en el clculo es prefijar el valor del radio del crculo. Si se conoce el
radio, junto con la informacin de la orientacin del gradiente del pxel etiquetado,
(xi,yi), las posibles coordenadas del centro del crculo darn una nube de puntos
limitados. Se observa que fijado el radio, cada pxel etiquetado como borde se convierte
en una circunferencia en el espacio de las votaciones.

La ventaja de esta deteccin de los crculos proviene de las caractersticas


inherentes de las transformadas de Hough, la inmunidad al ruido y que es capaz de
detectar crculos, aunque exista oclusin del mismo. Por otro lado, en este tipo de
curvas, al ser cerradas, no hay problemas como suceda en las lneas rectas en cuanto a
su limitacin dentro de la imagen.

156 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

Figura 5. 10. Transformadas de Hough para crculos

Resolucin Matlab
imgEnt = imread('coins.png');radioMoneda = 30;
[y0,x0,Accumulator]=houghcircle(edge(imgEnt,'canny'),radioMoneda,4)
UmbralVotaciones = 45; [x,y]=find(Accumulator>UmbralVotaciones);
imshow(imgEnt);hold on;
for i=1:size(x,1)
dibujarCirculos(radioMoneda,y(i),x(i));
end;hold off

Las funciones houghcircle y dibujarCirculos no estn en el toolbox de Image Processing, stas han sido previamente
implementadas.

5.1.1.3 Transformadas de Hough


generalizadas
r
Cuando no hay expresin analtica en las
curvas a detectar, se emplean las transformadas de
Hough generalizadas. El mtodo es esencialmente
un detector de formas o curvas geomtricas.
Consiste en elegir un punto de referencia dentro del
objeto a describir, por ejemplo el centroide del
mismo, (xref,yref). Luego, siguiendo el borde del
objeto se obtiene una tabla donde se guarda la Figura 5. 11. Descripcin de Hough para
objetos cualesquieras

Dpto. Electrnica, Automtica e Informtica Industrial 157


Carlos Platero Apuntes de Visin Artificial

distancia al punto etiquetado, r, el ngulo de apertura, , y la orientacin del gradiente


compensado, +90. La tabla ser indexada por la orientacin del gradiente
compensado, +90. Posteriormente, para cada pxel etiquetado se entrar en la tabla
segn la orientacin del gradiente compensado, +90, obtenindose el radio y el ngulo
de apertura, . Con estos valores se evaluar la expresin:

xref xi r cos
y ref yi r sen (5. 6)

Retornado para cada valor de un punto de referencia distinta, (xref,yref). El


espacio de votaciones estar formado por:

a) Las coordenadas de referencia del objeto, (xref,yref).

b) Y la orientacin del objeto, .

La celda con ms votos indicar la posicin y orientacin del objeto en la


imagen. Como se ha comentado, las transformadas de Hough generalizadas se emplean
como descriptores de alto nivel de los bordes.

5.2 Umbralizacin

La umbralizacin es una tcnica de segmentacin ampliamente utilizada en las


aplicaciones industriales. Se emplea cuando hay una clara diferencia entre los objetos a
extraer respecto del fondo de la escena. Los principios que sigue son la similitud entre
los pxeles pertenecientes a un objeto y sus diferencias respecto al resto. Por tanto, la
escena debe caracterizarse por un fondo uniforme y por objetos bien contrastados.

Al aplicar un umbral, la imagen de niveles de grises quedar binarizada;


etiquetando con 1 los pxeles correspondientes al objeto y con 0 aquellos que son del
fondo. Por ejemplo, si los objetos son claros respecto del fondo, se aplicar:

1 f x, y T
g x, y
0 f x, y T (5. 7)

f(x,y) es la funcin que retorna el nivel de gris del pxel (x,y), g(x,y) ser la
imagen binarizada y T es el umbral. En el caso de que los objetos sean oscuros respecto
del fondo, la asignacin sera:

1 f x, y T
g x, y
0 f x, y T (5. 8)

158 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

El umbral puede depender de f(x,y), de alguna propiedad local del pxel, p(x,y) y
hasta de su propia posicin:

T T f x, y , px, y , x, y (5. 9)

Si el umbral slo depende de f(x,y) se dice que es un umbral global; en el caso de


que adems dependa de p(x,y), por ejemplo, el valor medio del entorno de vecindad, el
umbral es denominado local y si depende tambin de la posicin del pxel, se
denominar dinmico. El problema es encontrar el umbral; operacin nada sencilla ya
que las imgenes suelen estar contaminadas. Para acotar el estudio, slo se centrar en
las tcnicas globales.

5.2.1 Segmentacin por histograma

La segmentacin por histograma es una tcnica global que se basa en una


definicin clara de los objetos respecto del fondo, con una iluminacin relativamente
uniforme en toda la escena. Se supone que el histograma est constituido por dos picos
y un valle. Al segmentar empleando el histograma, se observa que esta tcnica no
considera las relaciones de vecindad de los pxeles. El umbral estar definido
justamente en el valle del histograma.

4
x 10 Umbral de 43 segn Otsu

1.8

1.6

1.4
Escenario con clulas Imagen binarizada

1.2

0.8

0.6

0.4

0.2

0 100 200

Figura 5. 12 Tcnica de segmentacin mediante anlisis del histograma

Esta tcnica es extensible a un histograma con N picos y N-1 valles, presentado


varios umbrales. Sin embargo, a mayor nmero de umbrales en la imagen, menos
fiables sern los resultados. La umbralizacin por histograma presenta ciertas
limitaciones:

Dpto. Electrnica, Automtica e Informtica Industrial 159


Carlos Platero Apuntes de Visin Artificial

Es difcil identificar correctamente los mnimos del histograma.

Se tienen problemas cuando las regiones varan suavemente su nivel (por


ejemplo, la falta de iluminacin uniforme en la escena).

Se aplica slo cuando hay pocas regiones.

No se pueden distinguir regiones separadas por niveles de gris similares.

No considera la conectividad de los pxeles. Debido a este inconveniente,


se suele emplear a continuacin tcnicas de post-procesado morfolgico
(se tratarn en el captulo siguiente).

5.2.1.1 Seleccin ptima del umbral

Hay diferentes estrategias para la eleccin del umbral ptimo; entre ellas
destacan aquellas cuyos fundamentos se basan en:

Ajuste gaussiano.

Minimizacin de la varianza interclase.

Entropa del histograma.

Anlisis de la concavidad.

Mtodos basados en momentos.

Un resumen detallado de los distintos algoritmos se puede encontrar en artculos


especializados1. De entre todas las propuestas se va a destacar el umbral de Otsu, por su
alta utilizacin en las aplicaciones de la Visin Artificial.

5.2.1.1.1 Mtodo de Otsu

Este mtodo se basa en la suposicin de que las funciones de densidad del fondo
y de los objetos siguen un modelo gaussiano, N(f, f2) y N(o, o2). Sin prdida de
generalidad, se supone que el fondo es oscuro y los objetos brillantes. Cada clase estar
formada por los niveles de grises fijados por el umbral, T:

1
Sahoo, P.K., A survey of Thresholding Techniques, Computer Vision, Graphics
and Image processing, 41, pp. 233-260, 1988.

160 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

C f 0,1,2,..., T Co T 1, T 2,..., I 1 (5. 10)

El umbral debe de minimizar la suma ponderada de las varianzas de las clases


fondo y objetos, ya que se supone que el modelo es la suma de las dos normales, las
cuales se aproxima al histograma real ponderado.

Para determinar los parmetros de los modelos se toman las probabilidades


muestreales de cada una de las clases. Considerando un valor fijo de umbral, T, las
probabilidades de cada categora sern:

T I 1
PC f pi PCo p i
i 0 i T 1 (5. 11)

Donde pi es la probabilidad muestreal de la intensidad i en la imagen. Las


medias y varianzas de cada grupo correspondern a:

T I 1
1 1
C
f
PC f
i p
i 0
i C o
PC0
i p
i T 1
i

i
I 1

i
T
1 2 1 2
C2 Cf pi C2 C0 pi
f
PC f i 0
o
PCo i T 1 (5. 12)

Siendo entonces la varianza interclase ponderada:

p2 PC C2 PC C2
f f o o (5. 13)

Se recorre todo el rango de niveles de gris, desde T igual 0 hasta I-2,


calculndose la varianza ponderada y se elige el umbral, T, que minimiza este valor. La
imagen quedar binarizada como:

1 f x, y T
g x, y
0 f x, y T

5.3 Segmentacin orientada a las regiones

La estrategia a emplear en este tipo de segmentacin est basada en los criterios


de similitud y continuidad de los pxeles que forman una regin. Bajo esta perspectiva,
la imagen se considera formada por n regiones disjuntas, cada una de las cuales tiene
agrupada a los pxeles por alguna propiedad que los hace ser caractersticos de esa zona
y discrepantes respecto al resto. Desde el punto de vista formal, las condiciones de la
segmentacin orientada a regiones seran:

Dpto. Electrnica, Automtica e Informtica Industrial 161


Carlos Platero Apuntes de Visin Artificial

n
a) I Ri b) Ri R j i j
i 1

c) pi R j PR j ( pi ) 1 d) pi R j PR j ( pi ) 0 (5. 14)

Siendo I la imagen, Ri una regin de sta, pi un pxel cualquiera de la imagen y


PRj la regla de similitud de la regin j. Las dos primeras condiciones describen la
segmentacin como un proceso de particin de la imagen en regiones disjuntas;
mientras, las otras dos restantes hacen referencia a las propiedades de similitud de los
pxeles agrupados y de discrepancia respecto al resto.

5.3.1 Crecimiento de regiones

A partir de pxeles semillas se hace crecer la regin considerando alguna regla


de similitud y teniendo en cuenta la propiedad de conectividad de los pxeles. Una vez
definida una semilla, se analiza los vecinos segn la regla de similitud de la regin, PRj.
Los pxeles que cumplan la propiedad se aadirn a la regin de crecimiento. Aquellos
que no cumplan significarn que pertenecen a otra regin. Con los nuevos pxeles
unidos a la regin de crecimiento, se volver a procesar sus nuevos vecinos. El
algoritmo de crecimiento finalizar cuando todos los vecinos hayan sido estudiados.
Obsrvese el carcter de conectividad espacial y similitud radiomtrica de la tcnica de
segmentacin de crecimiento de regiones.

Esta estrategia tiene dos problemas: a) Cul es el criterio de similitud de las


regiones?, y b) Cmo se definen las semillas de las regiones?. Para la primera cuestin,
las reglas de similitud de las regiones se fundamentan en alguna propiedad tal como
luminancia, color, textura, etc. Por ejemplo, se presentan tres reglas basadas en la
intensidad de los pxeles:

a) f x, y f xs ,i , y s ,i T b) f x, y Ri T c) f x, y Ri k Ri (5. 15)

Donde f(x,y) es la intensidad del pxel (x,y), f(xs,i,ys,i) es nivel de gris de la


semilla, T es un umbral, Ri es el brillo de la regin de crecimiento Ri y 2Ri es su
varianza o contraste. La primera regla aade pxeles vecinos que sean menores a una
variacin determinada del nivel de gris respecto a la semilla, fijada por el umbral T. La
segunda actualiza la comparacin en cada iteracin con el valor medio de intensidad de
la regin creciente. Por ltimo, en la tercera se emplea como umbral k veces la
desviacin tpica de la regin.

La segunda cuestin resulta ser tan decisiva como la regla de similitud: cul es
el pxel semilla?. La eleccin de uno u otro pxel hace que el resultado final de la
segmentacin pueda variar. Estas tcnicas suelen ser frgiles en sus resultados por la
alta dependencia entre los pxeles semillas y las reglas de similitud. Por tanto, se suele
acompaar con otras estrategias para incrementar su robustez. La eleccin de la semilla
puede abordase buscando el nivel de gris de mayor probabilidad en el histograma. Para
su situacin espacial se puede apoyarse en una deteccin de los bordes, los cuales
delimitarn las fronteras de las regiones. Los centroides de las reas delimitadas por las

162 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

fronteras, junto con el valor del nivel de gris del entorno del centroide, dar un conjunto
de semillas. En todo caso, la casustica de cada problema de anlisis de imagen decidir
que algoritmia emplear en la localizacin de las semillas y en las reglas de similitud.

Figura 5. 13 a) imagen adquirida con etiquetado los pxeles semilla b) Resultados de la


tcnica de crecimiento empleando la regla del brillo de la regin creciente

5.3.2 Pirmides y rboles cuaternarios

Muchas tcnicas de anlisis de imgenes, no


slo las tcnicas de segmentacin orientada a
regiones, emplean en su procesamiento distintas
resoluciones espaciales de la imagen. La
informacin visual se puede organizar en forma de
pirmide. En la base se encontrara la mxima
resolucin espacial, con M filas y N columnas y a
partir de este valor, se reducira el nmero de
pxeles en cada nivel ascendiente en la pirmide Figura 5. 14. Pirmide de resoluciones de
la imagen
hasta alcanzar la cspide con un nico
pxel. Normalmente, se suele emplear
un promediado de los pxeles en la
reduccin de la resolucin espacial, de
un nivel a otro.

Una de las formas piramidales


de resolucin son los rboles
cuaternarios (quadtree). La imagen de
mxima resolucin se divide en cuatro
rectngulos iguales. Cada regin es Figura 5. 15 Estructura de rboles cuaternarios

Dpto. Electrnica, Automtica e Informtica Industrial 163


Carlos Platero Apuntes de Visin Artificial

posteriormente dividida en otras cuatro subregiones. Estas divisiones se van haciendo


recursivamente hasta alcanzar a nivel de pxel. Por tanto, por cada nodo o regin padre
colgarn otras cuatro subregiones. Esta organizacin de los datos se denomina rbol
cuaternario.

Sin embargo, estas divisiones arbitraria de las regiones en otras sub-cuatros, en


cualquier nivel de la pirmide, hace que sean divisiones geomtricas de cuatro
subregiones de igual nmero de pxeles. Esta forma de dividir no tiene en cuenta el
contenido de la escena, produciendo una descomposicin rpida desde el punto de vista
computacional, pero pobre desde el punto de vista de anlisis de las imgenes. Las
tendencias actuales es a una actuacin mixta. Las nuevas particiones tienen en cuenta la
existencia de bordes de la imagen obtenida de la informacin radiomtrica.

5.3.3 Divisin y fusin de regiones

Uno de los puntos dbiles de las tcnicas de crecimiento de regiones est en la


localizacin de las semillas. Para superar esta situacin se pasa a la descomposicin de
la imagen en regiones arbitrarias, de forma que si la regin es muy discrepante con
algn tipo de regla se dividir, en caso contrario, buscar fusionarse con las regiones
adyacentes.

Esta tcnica suele emplear una descomposicin inicial de la imagen empleando


un rbol cuaternario. En esta fase, la imagen se ha particionado en un conjunto de
regiones arbitrarias y disjuntas. La regla de divisin suele estar relacionada con el
contraste o varianza de la regin. Si la varianza es elevada se pasar a descomponerlo en
otras cuatro subregiones.

Figura 5. 16 Divisin de la imagen de entrada empleando rboles cuaternarios

Una vez dividida la imagen con diferentes grados de resolucin, se procede a la


fusin de regiones adyacentes empleando tcnicas de crecimiento de regiones.

164 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

Figura 5. 17. Resultado de la fusin de las regiones empleando tcnicas de crecimiento de


regiones

Los resultados de esta tcnica de segmentacin hacen no preservar los contornos


reales de los objetos. Esta consecuencia se debe al proceso de divisin de la imagen en
cuatro reas iguales, sin considerar el contenido existente en ellas.

Resolucin Matlab
%Divisin de la imagen
imgEnt = imread('liftingbody.png');
im1=imfilter(imgEnt,fspecial('gaussian'));
imgDescomp = qtdecomp(im1,.27);
imgDivision = imgEnt;
for dim = [128 64 32 16 8 4 2 1]
[valores,fila,columna] = qtgetblk(im1, imgDescomp, dim);
if (~isempty(valores))
doublesum = sum(sum(valores,1,'double'),2);
end
imgDivision = qtsetblk(imgDivision, imgDescomp, ...
dim, doublesum ./ dim^2);
end

Dpto. Electrnica, Automtica e Informtica Industrial 165


Carlos Platero Apuntes de Visin Artificial

5.4 Ejercicios

1. Estado actual de las tcnicas de segmentacin.

2. Clasificacin de las tcnicas de segmentacin.

3. Transformadas de Hough para lneas rectas y crculos.

4. Mtodo de umbralizacin de Otsu.

5. Tcnicas de crecimiento de regiones.

6. Tcnicas de divisin y fusin de regiones.

5.5 Problemas

Ejercicio 1

2 3 4 3 2 2 3 2

2 2 2 8 9 2 2 3
2 2 2 9 10 3 2 2

Dada la siguiente imagen calcular 2 9 8 8 9 9 8 2
:
3 8 8 8 2 3 3 2

2 9 8 9 9 2 2 3
2 8 8 9 8 4 2 2

2 2 3 2 2 2 2 2

1. El mdulo
del gradiente mediante la aproximacin
f ( x, y) x f ( x, y) y f ( x, y)
. Utilice la mscara ms simple para la
implementacin de la diferenciacin y para los bordes replique el valor de los
pxeles de frontera (condicin de Neumman).

2. Determinar el umbral ptimo para la deteccin de los bordes y


representar la imagen resultado.

Las diferencias finitas en cada componente son:

166 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

0 0 0 0 0 0 0 1 1 1 1 0

0 1 2 5 7 0 0 0 0 6 1 7
0 0 0 1 0 1 0 0 0 7 0 6

y f x, y
0
x f x, y
0 7 6 1 0 6 0 7 1 0 1
1 1 0 0 7 6 0 5 0 0 6 1

1 1 0 1 7 1 0 7 1 1 0 7
0 1 0 0 1 2 0 6 0 1 1 4

0 0 0
6 5 7 6 2 0 1 1 0

Y el mdulo del gradiente aproximadamente ser la suma de


0 1 1 1 1 0

0 1 2 11 8 7
0 0 0 8 0 7

f x, y
0 14 7 1 1 6
ambas: .
1 6 0 0 13 7

1 8 1 2 7 8
0 7 0 1 2 6

0 2
6 6 8 6

Analizando el histograma se observa que el umbral de 6 servir para detectar los bordes:
20
18
16
14
12
10
8
6
4
2
0
0 2 4 6 8 10 1 14
2

Dpto. Electrnica, Automtica e Informtica Industrial 167


Carlos Platero Apuntes de Visin Artificial

Ejercicio 2

Dado los puntos: (x,y) = {(1,0), (3,2), (4,3), (3,4)}. Determinar mediante la
transformada de Hough, como tres de ellos pertenecen a la misma recta.

Para cada punto se muestrea las votaciones, tal que a = y bx:

a = y i - b*x i
15

(1 0) azul
(3 2) verde
10
(4 3) rojo
(3 4) cian

5
a

-5

-10
-3 -2 -1 0 1 2 3
b

Ejercicio 3

Detectar las lneas de la imagen binarizada mediante las transformadas


de Houhg. Emplear el espacio paramtrico en coordenadas polares
( xi cos yi sen ) y con solo muestreo de los ngulos de 0 y 90.

0 1 1 1 1 1 1

0 0 0 0 0 0 0
0 0 0 0 0 0 1

0 0 0 0 0 0 1
0 0 0 0 0 0 1

0 0 0 0 0 0 1
0 0 0 0 0 0 1

Los valores muestreados de para cada pxel detectado de borde es:

xi 1 1 1 1 1 1 3 4 5 6 7

yi 2 3 4 5 6 7 7 7 7 7 7

0 1 1 1 1 1 1 3 4 5 6 7

168 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

90 2 3 4 5 6 7 7 7 7 7 7

Las votaciones sern:

1 2 3 4 5 6 7

0 6 0 1 1 1 1 1

90 0 1 1 1 1 1 6

Las rectas estarn definidas por las normales = 1 y 0 junto con = 7 y


90 .

Ejercicio 4

Segmentar el vaso capilar de la mamografa de la figura a) como se


muestra en b)

Se trata de determinar la recta que identifica el vaso


capilar presente en la mamografa. Para ello se utilizar la
transformada de Hough. Primero se aplica una deteccin de
bordes, por ejemplo, mediante el algoritmo de Canny, donde
habr que definir la escala, a travs de la varianza, y el nivel de
umbral.

Una vez obtenida la imagen binaria de deteccin de


bordes, f(x,y), se procede al siguiente algoritmo:
a) Inicializacin de la matriz de votaciones:

C(, ) = 0, para = 1,...,a, = 1,..., b.


b) Para = 1,...,a:
Para todos los pixeles (xi, yi) con f(xi, yi)=1 se determina:

= xi cos + yi sen

Dpto. Electrnica, Automtica e Informtica Industrial 169


Carlos Platero Apuntes de Visin Artificial

y se aade el voto: C(, ) = C(, ) + 1.


El algoritmo da la matriz de votaciones C(,). La recta se determinar con la
celda de mayor votacin.
Espacio de lneas

-100 35
rho (pixeles desde el centro)

30
-50
25

20
0

15

50
10

5
100

0
0 20 40 60 80 100 120 140 160 180
theta (grados)

Ejercicio 5

Para la siguiente figura, con 8 niveles de grises de cuantificacin,


obtener:
a) Umbral mediante mtodo Otsu

1 1 2 0 2 2 1 3 1 1

1 1 3 3 3 3 2 2 1 0
1 1 2 2 5 3 2 2 1 1

3 2 3 6 6 6 2 2 1 1
2 2 6 7 7 6 6 1 1 1

2 2 6 6 7 6 6 0 3 2

2 2 2 6 5 5 3 2 1 1
1 1 2 3 5 5 3 2 1 0

1 1 1 3 3 3 3 2 2 1
0 0
1 1 1 1 2 1 1 1

nivel(i) 0 1 2 3 4 5 6 7
h(i) 6 33 26 16 0 5 11 3
p(i) 0.06 0.33 0.26 0.16 0 0.05 0.11 0.03

T Pcf Pco cf cf 2cf 2cf 2P


0 0.06 0.94 0 2.60 0 3.30 3.10

170 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

1 0.39 0.61 0.84 3.47 0.13 2.93 1.84


2 0.65 0.35 1.30 4.57 0.39 2.30 1.06
3 0.81 0.19 1.64 5.89 0.77 0.41 0.70
4 0.81 0.19 1.64 5.89 0.77 0.41 0.70
5 0.86 0.14 1.83 6.21 1.34 0.16 1.18
6 0.97 0.03 2.30 7.00 2.93 0 2.84

Evolucin de varianza ponderada


3.5

2.5

1.5

0.5
0 1 2 3 4 5 6

El umbral segn el mtodo de Otsu ser 3 4.

Ejercicio 6

Segmente la imagen empleando crecimiento de regiones a partir de la


semilla indicada. Aplique vecindad a 4 y utilice la regla: f x, y f xs , ys 1 .

1 1 2 0 2 2 1 3 1 1

1 1 3 3 3 3 2 2 1 0
1 1 2 2 5 3 2 2 1 1

3 2 3 6 6 6 2 2 1 1
2 2 6 7 7 6 6 1 1 1

2 2 6 6 7 6 6 0 3 2
2 2 2 6 5 5 3 2 1 1

1 1 2 3 5 5 3 2 1 0
1 1 1 3 3 3 3 2 2 1

0 0
1 1 1 1 2 1 1 1

Ejercicio 7

Para la siguiente matriz, realizar una descomposicin de rbol


cuaternario empleando como regla de divisin de la regin que la diferencia

Dpto. Electrnica, Automtica e Informtica Industrial 171


Carlos Platero Apuntes de Visin Artificial

entre el nivel de gris mximo y mnimo debe de mayor a un determinado


umbral:
a) Obtener el rbol cuaternario si el umbral es 5.
b) Obtener la matriz de salida con el umbral anterior.

1 1 1 1 2 3 6
6

1 1 2 1 4 5 6
8
1 1 1 1 7 7 7
7

1 1 1 1 6 6 5
5
20 22 20 22 1 2 3 4

20 22 22 20 5 4 7 8

20 22 20 20 9 12 40 12
14 15 16
20 22 20 20 13

a)

1 1 1 1 2 3 6
6

1 1 2 1 4 5 6
8
1 1 1 1 7 7 7
7

1 1 1 1 6 6 5
5
20 22 20 22 1 2 3 4

20 22 22 20 5 4 7 8

20 22 20 20 9 12 40 12
14 15 16
20 22 20 20 13

b)

1.06 1.06 1.06 1.06 3.5 3.5 6.5 6.5



1.06 1.06 1.06 1.06 3.5 3.5 6.5 6.5
1.06 1.06 1.06 1.06 6.5 6.5 6 6

1.06 1.06 1.06 1.06 6.5 6.5 6 6
20.75 20.75 20.75 20.75 3 3 5.5 5.5

20.75 20.75 20.75 20.75 3 3 5.5 5.5

20.75 20.75 20.75 20.75 12 12 40 12
20.75 20.75 20.75 20.75 12 12 15 16

Ejercicio 8

Dada la imagen I aplicar el mtodo de divisin mediante rboles


cuaternarios, luego proceda al crecimiento de regiones con vecindad a 4 y

172 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 5: Segmentacin

segmente. Aplicar la regla de similitud: la diferencia en valor absoluto entre un


pxel y la media de la regin debe ser inferior a 2.

2 2 4 4

2 2 3 3
I
7 8 1 7

7 8 8 9

Al aplicar rboles cuaternarios quedaran definidas las siguientes regiones:

2 2 44

2 2 33
7 8 1 7

7 8 8 9

2 2 4 4 7 8
R1 R2 R3 R4 1 R5 8 R6 7 R7 9
2 2 3 3 7 8

Procediendo al crecimiento de regiones con las siguientes fusiones:

R1 R2 R4 R3 R5 R6 R7

0 0 0 0

0 0 0 0
S
1 1 0 1

1 1 1 1

Derecho de Autor 2016 Carlos Platero Dueas.


Permiso para copiar, distribuir y/o modificar este documento bajo los trminos
de la Licencia de Documentacin Libre GNU, Versin 1.1 o cualquier otra
versin posterior publicada por la Free Software Foundation; sin secciones
invariantes, sin texto de la Cubierta Frontal, as como el texto de la Cubierta
Posterior. Una copia de la licencia es incluida en la seccin titulada "Licencia de
Documentacin Libre GNU".

La Licencia de documentacin libre GNU (GNU Free Documentation License)


es una licencia con copyleft para contenidos abiertos. Todos los contenidos de estos
apuntes estn cubiertos por esta licencia. La version 1.1 se encuentra en
http://www.gnu.org/copyleft/fdl.html. La traduccin (no oficial) al castellano de la
versin 1.1 se encuentra en http://www.es.gnu.org/Licencias/fdles.html

Dpto. Electrnica, Automtica e Informtica Industrial 173

También podría gustarte