Está en la página 1de 35

Procesamiento de Señales e Imágenes Digitales: Segmentación de

Imágenes II

MSc. Renán Rojas G.

Pontificia Universidad Católica del Perú

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 1 / 31
Conexión de bordes por procesamiento local

Dados dos elementos vecinos definidos como discontinuidades:

(s, t), (x, y) | (s, t) ∈ N m×n (x, y).

Ambos son relacionados a un mismo borde si:




|∇f (s, t)| − |∇f (x, y)| ≤ E ∧ ∠∇f (s, t) − ∠∇f (x, y) ≤ A;

* E, A ∈ R+ : valores umbrales.
* Proceso ejecutado en cada elemento definido como discontinuidad.

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 2 / 31
Conexión de bordes por procesamiento local

Figura 1: Conexión de bordes por procesamiento local.


Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 3 / 31
Conexión de bordes por procesamiento global: Transformada de Hough

Analizar si un conjunto de elementos definidos como discontinuidades forman una curva


con determinada forma.
Caso particular: Transformada de Hough para lineas.
Parametrización:
x cos θ + y sin θ = ρ
Cada punto tiene infinitos pares {θ, ρ}, los cuales representan las infinitas lineas que
pasan sobre él.
Dos o más puntos describen una recta en común si comparten un par {θ, ρ}.

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 4 / 31
Conexión de bordes por procesamiento global: Transformada de Hough

Procedimiento en un sistema numérico:


i Definir intervalo y resolución para θ y ρ:
π π π
−D ≤ ρ ≤ +D, − ≤θ≤ , ∆θ =
2 2 k
* k: número de elementos, D: longitud diagonal de la imagen.
ii En cada discontinuidad, hallar ρ para cada θ. Redondear ρ para obtener valores enteros.
iii Acumular los pares {θ, ρ} resultantes:
Aij ← Aij + 1 si round(x cos θi + y sin θi ) = ρj
* Aij de valor alto implica que la lı́nea con (θi , ρj ) presenta múltiples discontinuidades.
Entonces, la linea (θi , ρj ) es un borde presente en la imagen.
iv Examinar la distancia entre los elementos asociados a una determinada linea y definir su
continuidad:
Si la distancia es menor a un valor umbral (ej: 20 % del ancho de la imagen), entonces incluir
a los pı́xeles intermedios (formar el borde).

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 5 / 31
Conexión de bordes por procesamiento global: Transformada de Hough

(a) Parametrización de lı́neas (b) Análisis de lı́neas a partir de la Transformada de


Hough.

Figura 2: Transformada de Hough para lı́neas.


Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 6 / 31
Conexión de bordes por procesamiento global: Transformada de Hough

Figura 3: Transformada de Hough para lı́neas.

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 7 / 31
Umbralización de Intensidad

Objetos y fondo en una imagen tienden a estar descritos por agrupaciones de intensidad
bien distinguidas. Esto se refleja en histogramas con modas bien definidas.
* Efectos de ruido e iluminación en el histograma: reduce la separación entre modas!
adverso a la umbralización.
* Estrategia ante dichos efectos: filtro pasabajos (ej: filtro Gaussiano).

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 8 / 31
Umbralización de Intensidad

(a) Efecto de ruido en Histogramas (b) Efectos de ruido y cambio de


iluminación en histogramas

(c) Histograma bimodal y multimodal

Figura 4: Distribución de intensidades


Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 9 / 31
Umbralización de Intensidad
Umbralización automática para histogramas bimodales:
Dada una imagen con objetos y fondo bien distinguidos en el histograma, es posible
seleccionar automáticamente un valor umbral global a partir del siguiente procedimiento:
i Elegir T0 (umbral inicial), Tk ← T0
ii Segmentar la imagen en:
( (
1, f (x, y) > Tk 1, f (x, y) ≤ Tk
g1 (x, y) = g2 (x, y) =
0, otros 0, otros

iii Hallar intensidad promedio de g1 (x, y), g2 (x, y)


P P
x,y f (x, y) · g1 (x, y) x,y f (x, y) · g2 (x, y)
P1 = P ; P2 = P ;
x,y g1 (x, y) x,y g2 (x, y)

P1 +P2
iv Tk−1 ← Tk ; Tk ← 2

v si |Tk − Tk−1 | < τ (usualmente 1), entonces finalizar. Caso contrario regresar a II.
Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 10 / 31
Umbralización de Intensidad

Figura 5: Umbralización global de intensidad en histograma bimodal.

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 11 / 31
Umbralización de Intensidad

Umbralización automática para histogramas unimodales [2].


Dado el histograma h(k); k ∈ {0; L − 1}:
i Establecer Y como la recta que une los pares {k1 , h(k1 ) = hmax } y {kempty , h(kempty ) = 0}.
{k1 , hmax }: par ordenado correspondiente a la intensidad con mayor repetición en la imagen.
{kempty , 0}: par ordenado correspondiente a la primera intensidad sin repeticiones en la imagen.
Es decir:
h(k) = 0; k ≥ kempty .
En caso h(L − 1) 6= 0, entonces kempty = L − 1.

ii Para cada indice k ≥ k1 , determinar dk como la recta perpendicular a Y que pasa por el par
ordenado {k, h(k)} y hallar su punto de intersección.
iii Establecer el umbral óptimo como el argumento k que maximiza la magnitud de la recta
perpendicular dk :
T = argmax|dk |.
k

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 12 / 31
Umbralización de Intensidad

Figura 6: Umbralización de intensidad en histograma unimodal.[2]

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 13 / 31
Método de Otsu
Asumiendo funciones de probabilidad con distribución Gaussiana: dos clases C1 y C2
2 ) con el
Maximizar la métrica de varianza entre clases (between-class variance, σB
umbral global seleccionado.
Procedimiento Simplificado: Analizar todas las intensidades como posibles umbrales
globales.
T (k) = k; k ∈ {0; L − 1}.
Clase 1: intensidades ∈ {0; k}. Clase 2: intensidades ∈ {k + 1; L − 1}.
i Hallar la función de distribución de probabilidad (histograma normalizado):
h(k)
pk = .
MN
ii Hallar probabilidad de la Clase 1:
k
X
P1 (k) = pi .
i=0

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 14 / 31
Método de Otsu
iii Hallar la suma acumulada de la Clase 1:
k
X
m(k) = i · pi .
i=0

iv Calcular la intensidad promedio global:


L−1
X
mg = i · pi .
i=0

2
v Calcular σB (k):
2 [mg P1 (k) − m(k)]2
σB (k) =
P1 (k)[1 − P1 (k)]
2
vi Seleccionar T = argmax σB (k).
k
2
* Si hay más de un argumento k que maximiza σB (k), elegir T como el promedio.
Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 15 / 31
Método de Otsu

(a) Comparación entre métodos de umbralización (b) Respuesta del método de Otsu ante ruido

Figura 7: Segmentación basada en el método de Otsu

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 16 / 31
Region Splitting and Merging

Region Splitting and Merging: subdividir la imagen en regiones (sin intersecciones) que
satisfacen un determinado criterio de agrupación Q y luego unir aquellas regiones
adyacentes de manera iterativa.
Procedimiento iterativo:
Dada una imagen f ∈ RM ×N
i Dividir la imagen en cuatro cuadrantes {R1 , R2 .R3 , R4 }.
Si Q{Ri } = 0, i = 1, 2, 3, 4, subdividir Ri en cuatro cuadrantes {Ri1 , Ri2 , Ri3 , Ri4 }
ii Detener la división cuando todas las Quadregiones satisfagan Q o cuando se haya alcanzado
el tamaño mı́nimo (arbitrario)

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 17 / 31
Region Splitting and Merging

*Ej: (
1, σ{R} > a ∧ 0 < µ{R} < b
Q(R) =
0, otros
ii Unir regiones adyacentes que cumplan con:

Q(Rj ) = 1; Q(Ri ) = 1; Q(Ri ∪ Rj ) = 1;

Ejecutar dicho procedimiento de manera iterativa hasta que no sea posible unir más regiones.

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 18 / 31
Region Splitting and Merging

(a) Particionamiento de la imagen (splitting) (b) Segmentación a partir de diferentes tamaños de


quad-regiones

Figura 8: Splitting and Merging

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 19 / 31
Métodos locales de Umbralización de Intensidad
Aplicar valores umbrales en función a la ubicación y vecindad de cada elemento.
i Umbralización local por subregiones de la imagen:
* Minimizar efectos por cambios de iluminación
a Dividir la imagen en rectángulos de m × n suficientemente pequeños para reducir los cambios
de iluminación de la imagen.
b Aplicar el método de selección automática (ej: Otsu) independientemente a cada rectángulo.

ii Umbralización local basada en propiedades locales de la imagen:


Aplicar un umbral Txy para cada punto (x, y) a partir de propiedades estadı́sticas de su
vecindad.
* Ej: a partir de su media local µ y desviación estandar σ:
σ{N m×n (x, y)}; µ{N m×n (x, y)};
s  
1 X 2
µ{x} = xi ; σ{x} = µ x − µ{x}
N i
Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 20 / 31
Métodos locales de Umbralización de Intensidad

a Alternativa 1:
Definir Txy = a · σ{N m×n (x, y)} + b · µ{N m×n (x, y)} y
(
1, f (x, y) > Txy
g(x, y) =
0, otros

b Alternativa 2:
(
1, f (x, y) > a · σ{N m×n (x, y)} ∧ f (x, y) > b · µ{N m×n (x, y)}
g(x, y) =
0, otros

{a, b}: valores heurı́sticos

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 21 / 31
Métodos locales de Umbralización de Intensidad

Figura 9: Umbralización local de intensidad

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 22 / 31
Umbralización de Intensidad

(a) Umbralización de intensidad global vs. umbralización de (b) Histogramas para parches de imagen ruidosa.
intensidad por parches

Figura 10: Comparación de métodos de umbralización de intensidad

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 23 / 31
Umbralización de Imágenes a Colores (RGB)

Dados elementos en una imagen f (x, y) caracterizados por tres valores de intensidad:

f (x, y) = {fr (x, y); fg (x, y); fb (x, y)}

Es posible segmentar aquellos pixeles cercanos a un determinado color


a = {ar ; ag ; ab } a partir de una umbralización de distancias entre intensidades.
(
1, D2 {f (x, y), a} < T
g(x, y) =
0, otros
D2 : distancia euclidiana

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 24 / 31
Segmentación de Objetos en Movimiento

Segmentación en video:
Dado un conjunto de imágenes (video) correctamente alineado y afectado por iluminación
constante y las imágenes f (x, y, ti ), f (x, y, tj ) en tiempos (ti , tj ), respectivamente, es
posible discriminar objetos no-estacionarios a partir de su diferencia de intensidades.
(
1, |f (x, y, ti ) − f (x, y, tj )| > T
dij (x, y) =
0, otros
T : arbitrario. Debe tener en cuenta cambios de iluminación.
* Robusto ante ruido: identificar regiones de valor “1” 8-adyacentes o 4-adyacentes y
eliminar regiones con número de elementos < N .
* Desventaja: rechaza objetos pequeños no estacionarios.

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 25 / 31
Segmentación de Objetos en Movimiento
Diferencias Acumulativas: discriminar objetos en movimiento a partir de la suma de
diferencias en cada pixel con relación a una determinada imagen de referencia.
i La imagen de referencia debe describir la mayor cantidad de regiones estacionarias posibles
(minimizar los objetos en movimiento).
ii Emplear alguno de estos tres tipos de diferencias acumulativas
(
Ak−1 (x, y) + 1, |f (x, y, ti ) − f (x, y, tj )| > T
Ak (x, y) =
Ak−1 (x, y), otros
  
P
k−1 (x, y) + 1, f (x, y, ti ) − f (x, y, tj ) > T
Pk (x, y) =
Pk−1 (x, y), otros

  
N
k−1 (x, y) + 1, f (x, y, ti ) − f (x, y, tj ) < −T
Nk (x, y) =
Nk−1 (x, y), otros

*Acumuladores comienzan en cero.


Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 26 / 31
Segmentación de Objetos en Movimiento

Figura 11: Segmentación en videos

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 27 / 31
Morfologia Matemática I

Morfologı́a Matemática (para imágenes binarias)


Herramienta analı́tica que permite extraer componentes simples de una imagen para
representar, describir y modificar objetos en ella.
A partir del concepto de conjuntos matemáticos, Morfologı́a permite describir objetos
como un subconjunto de ubicaciones en una imagen, donde el dominio pertenece a Z2 .

1 Imagen binaria: Dado un par ordenado p = (px , py ), una imagen binaria I(p) puede ser
descrita por su subconjunto de elementos de valor 1:

QI = {p|I(p) = 1}; p ∈ Z2

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 28 / 31
Morfologia Matemática II
2 Reflexión: La reflexión de un conjunto QI corresponde a un cambio de signo en sus pares
ordenados. Esto implica una reflexión respecto al origen de coordenadas.

Q̂I = {w|w = −p; p ∈ QI }

3 Complemento: El complemento de un conjunto QI corresponde a todos los elementos


de la imagen con valor 1. Dado que se trata de imágenes binarias, esto hace referencia a
los elementos de la imagen con valor 0.

QcI = {w|w ∈
/ QI }

4 Unión e Intersección: Dados los conjuntos QI1 y QI2 , las operaciones unión ∪ e
intersección ∩ corresponden a los siguientes conjuntos:

QI1 ∪ QI2 = {w|w pertenece a QI1 , QI2 o a ambos.}

QI1 ∩ QI2 = {w|w pertenece a ambos conjuntos QI1 , QI2 }


Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 29 / 31
Morfologia Matemática III
5 Traslación: La traslación de un conjunto QI corresponde a sumar un valor constante z a
todos sus elementos. Esto implica que los pares ordenados cambian de valor de forma
uniforme, indicando que los elementos con valor 1 en la imagen sufren un desplazamiento.

(QI )z = {p + z; p ∈ QI }

6 Erosión: Dada una imagen representada por QI y una máscara (elemento estructural)
representada por un conjunto H, Erosión corresponde a todos los pares ordenados z tal
que los elementos de H desplazados un factor z estén incluidos en QI .

QI H = {z|(H)z ⊆ QI }

7 Dilatación: Dada una imagen representada por QI y una máscara (elemento estructural)
representada por un conjunto H, Dilatación corresponde a todos los pares z tal que el
conjunto reflejado Ĥ desplazado por un factor z tenga algún elemento incluido en QI .

QI ⊕ H = {z|(Ĥ)z ∩ QI 6= ∅}
Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 30 / 31
Morfologia Matemática

Figura 12: Erosión

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 31 / 31
Morfologia Matemática

Figura 13: Erosión

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 32 / 31
Morfologia Matemática

Figura 14: Dilatación

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 33 / 31
Morfologia Matemática

Figura 15: Morfologı́a en recuperación de caracteres.

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 34 / 31
Referencias

(1) Capı́tulo 10
Gonzalez, Rafael C. & Woods, Richard E. (2006), Digital Image Processing, 3rd Edition,
Prentice-Hall Inc.
http://www.imageprocessingplace.com/
(2) Rosin, Paul L., “Unimodal thresholding”. Pattern recognition 34, no. 11 (2001):
2083-2096.

Renán Rojas G. IEE239: Segmentación de Imágenes II Pontificia Universidad Católica del Perú 35 / 31

También podría gustarte