Actividad de Investigación

Universidad Politécnica de Querétaro
Actividad de Investigación
Nombre del profesor: Montes Martínez Josué Nombre del alumno: Alexander Olvera Lugo
Rafael
Materia: Sistemas de Visión Artificial Fecha Entrega: 02/03/2021
Sistemas de Visión Artificial
1.-Umbralización (Thresholding)
La umbralización es uno de los más importantes métodos de segmentación. El objetivo

es convertir una imagen en escala de grises a una nueva con sólo dos niveles, de manera
que los objetos queden separados del fondo.
El histograma de la Figura 7b corresponde a una imagen compuesta de objetos claros

sobre un fondo oscuro (Fig.7a). Una forma de extraer el objeto del fondo es seleccionar
un umbral de intensidad T que separe los dos conjuntos. De este modo, cualquier punto
(x, y) para el que f (x, y)>T, pertenecerá al objeto, en caso contrario, pertenecerá al
fondo. Si los valores de gris del objeto y del resto de la imagen difieren claramente,
entonces el histograma mostrará una distribución bimodal, con dos máximos distintos,
separados por una región vacía.
Si (viejo pixel>umbral)
Nuevo pixel=MAX
Sino
Nuevo pixel=MIN
A) B)
Fig. 7: A) Imagen con objetos claros sobre fondo oscuro; B) Histograma de la imagen.
Fig. 8: Imagen umbralizada con un umbral de 76.
Así, en la Figura 9 se pueden ver varios ejemplos de imágenes umbralizadas con distintos
valores.
Fig. 9: a) Lenna a 256 niveles de gris; b) Lenna con un umbral bajo; c) Lenna con un
umbral alto; d) Lenna con un umbral intermedio.
2.- - Segmentación de imágenes
La segmentación de imágenes divide la imagen en sus partes constituyentes hasta un

nivel de subdivisión en el que se aíslen las regiones u objetos de interés.
Los algoritmos de segmentación se basan en una de estas dos propiedades básicas de

los valores del nivel de gris: discontinuidad o similitud entre los niveles de gris de píxeles
vecinos.
Discontinuidad. Se divide la imagen basándose en cambios bruscos de nivel de gris:
 Detección de puntos aislados

 Detección de líneas
 Detección de bordes
Similitud. Se divide la imagen basándose en la búsqueda de zonas que tengan valores

similares, conforme a unos criterios prefijados:
 Crecimiento de región
 Umbralización
Detección de discontinuidades (Puntos Aislados)

La segunda derivada tiene
una respuesta más fuerte
ante detalles como puntos
aislados o líneas, por lo que
se usa el Laplaciano para
detectar estos tipos de
discontinuidad.
Un punto aislado de una imagen tiene un tono de gris que difiere significativamente de
los tonos de gris de sus píxeles vecinos, es decir, de los ocho píxeles de su entorno 3×3.
Una máscara (Laplaciano) para detectar un punto aislado es la siguiente:
−1 −1 −1
[−1 8 −1]
−1 −1 −1
Diremos que un píxel es un punto aislado si el resultado de aplicar la máscara sobre el

píxel (en valor absoluto) es mayor o igual que un cierto valor umbral T, fijado por el
decisor. Dicho valor depende de la aplicación que estemos realizando.
Ejemplo:
1 1 1 1 1 - - - - -
1 10 1 1 1 - 72 -9 0 -
-1 -1 -1
 1 1 1 1 1 = - -9 -9 0 -
-1 8 -1
-1 -1 -1 1 1 1 1 1 - 0 0 0 -
1 1 1 1 1 - - - - -
Dependiendo del valor de T, obtenemos

4 puntos, si (0 < T <=9)
1 punto, si (9 < T < =72)
Ningún punto, si (T > 72)
Detección de discontinuidades (Líneas)
Análogamente, para la detección de líneas de un píxel de ancho, podemos utilizar una

máscara de Laplaciano.
a) Imagen original b) Imagen laplaciano;

la sección ampliada muestra el efecto de
doble línea positivo / negativo
característico del Laplaciano. c) Valor
absoluto de Laplaciano d) Valores
positivo de Laplaciano.
Sin embargo, frecuentemente estamos interesados en detectar líneas en una

determinada dirección. Los píxeles que forman parte de una línea horizontal, vertical o
diagonal, tendrán respuestas extremas ante alguna de las máscaras siguientes:
-1 -1 -1 2 -1 -1 -1 2 -1 -1 -1 2
2 2 2 -1 2 -1 -1 2 -1 -1 2 -1
-1 -1 -1 -1 -1 2 -1 2 -1 2 -1 -1
Ejemplo, supongamos que estamos interesados en las líneas de la imagen con una
orientación de -45º
2 -1 -1
-1 2 -1
2 -1 -1
Valores absolutos de los resultados usando la máscara de detección de líneas con – 45º
y posterior umbralización.
Detección de discontinuidades (Bordes)
Borde de una imagen digital en escala de grises
Borde Ideal: Forman camino de un Borde “Rampa”: Forman un conjunto

pixel de ancho, en los que se de pixeles conexos en los que se
produce, perpendicularmente un produce, en una determinada
cambio en el nivel de gris dirección, una variación gradual en el
nivel de gris.
Un punto se dice que es del borde si su derivada primera dos-dimensional es mayor

que un cierto valor umbral.
Detección de bordes en imágenes en escala de grises: Marr-Hildreth
PASO 1
Realizar una convolución a la imagen I con una matriz G que modeliza una función
gaussiana bidimensional:
1 𝑥 2 +𝑦 2
−
𝐺(𝑥, 𝑦) = 𝑒 2𝜎 2
2𝜋𝜎 2
Donde σ representa la desviación típica
Ejemplo de máscara 5x5 para el filtro gaussiano con σ=1.0:
1 4 7 4 1
1 4 16 26 16 4
173 7 26 41 26 7
4 16 26 16 4
1 4 7 4 1
Recuérdese que la convolución de una imagen con una función de esta forma
emborrona la imagen con un grado de emborronamiento proporcional a σ (por tanto,
se produce una reducción de ruido).
PASO 2
Calcular el Laplaciano de la imagen resultante.
𝜕2 𝑓
2
𝜕2
∇ 𝑓= 2+ 2
𝜕𝑥 𝜕𝑦
Los pasos 1 y 2 se pueden aproximar mediante la convolución con la máscara: Se trata
del filtro Laplaciano del Gaussiano (Log). Existen otras aproximaciones alternativas que
modelizan este filtro.
0 0 1 0 0
0 1 2 1 0
1 2 −16 2 1
0 1 2 1 0
[0 0 1 0 0]
Determinar los píxeles de “paso por cero”.
Los píxeles del borde son aquellos

tal que el Laplaciano de dos de
sus vecinos en posiciones
opuestas tienen distinto signo
(píxeles de paso por cero).
Normalmente se considera un
valor umbral para el valor
absoluto de la diferencia
numérica entre posiciones
opuestas para considerar que un
píxel es de paso por cero.
3.-Morfologia Matemática
Son varios conjuntos de operaciones de procesamiento de imágenes que procesan

imágenes basadas en formas. Morfología Las operaciones morfológicas aplican un
elemento de estructuración a una imagen de entrada, creando una imagen de salida del
mismo tamaño. En una operación morfológica, el valor de cada píxel de la imagen de
salida se basa en una comparación del píxel correspondiente en la imagen de entrada
con sus vecinos.
Dilatación morfológica y erosión
Las operaciones morfológicas más básicas son la dilatación y la erosión. La dilatación

agrega píxeles a los límites de los objetos de una imagen, mientras que la erosión
elimina los píxeles en los límites de los objetos.
El número de píxeles agregados o eliminados de los objetos de una imagen depende del
tamaño y la forma del utilizado para procesar la imagen. Elemento estructurante En las
operaciones de dilatación morfológica y erosión, el estado de cualquier píxel dado en la
imagen de salida se determina aplicando una regla al píxel correspondiente y a sus
vecinos en la imagen de entrada.
Reglas para la dilatación y la erosión
Operación Regla Ejemplo (imagen Origel e imagen procesada)

Dilatación El valor del píxel de salida es el
valor de todos los píxeles de la
vecindad. Máximo En una imagen
binaria, un píxel se establece en si
alguno de los píxeles vecinos tiene
el valor .11
La dilatación morfológica hace que

los objetos sean más visibles y
rellena pequeños agujeros en los
objetos.
Erosión El valor del píxel de salida es el
valor de todos los píxeles de la
vecindad. Mínimo En una imagen
binaria, un píxel se establece en si
alguno de los píxeles vecinos tiene
el valor .00
La erosión morfológica elimina las

islas y los objetos pequeños para
que sólo queden objetos
sustantivos.
La siguiente figura ilustra la dilatación de una imagen binaria. Observe cómo el elemento
de estructuración define la vecindad del píxel de interés, que está en círculo. La función
de dilatación aplica la regla adecuada a los píxeles de la vecindad y asigna un valor al
píxel correspondiente en la imagen de salida. La función de dilatación morfológica
establece el valor del píxel de salida porque uno de los elementos de la vecindad
definidos por el elemento de estructuración está activado
Dilatación morfológica de una imagen binaria
La figura siguiente ilustra este procesamiento para una imagen en escala de grises. La
figura muestra el procesamiento de un píxel determinado en la imagen de entrada.
Observe cómo la función aplica la regla a la vecindad del píxel de entrada y utiliza el
valor más alto de todos los píxeles de la vecindad como el valor del píxel correspondiente
en la imagen de salida.
Dilatación morfológica de una imagen en escala de grises

Operaciones basadas en la dilatación y la erosión
La dilatación y la erosión se utilizan a menudo en combinación para implementar

operaciones de procesamiento de imágenes. Por ejemplo, la definición de una imagen
morfológica es una erosión seguida de una dilatación, utilizando el mismo elemento de
estructuración para ambas operaciones. Apertura Puede combinar la dilatación y la
erosión para eliminar objetos pequeños de una imagen y suavizar el borde de objetos
grandes.
Esta tabla enumera las funciones de la caja de herramientas que realizan operaciones
morfológicas comunes basadas en la dilatación y la erosión.
Función Definición morfológica Ejemplo (imagen original e imagen procesada)

imopen La operación de apertura erosiona una
imagen y luego dilata la imagen
erosionada, utilizando el mismo
elemento de estructuración para ambas
operaciones.
La apertura morfológica es útil para
eliminar objetos pequeños de una imagen
conservando la forma y el tamaño de los
objetos más grandes de la imagen
imclose
Realizar cierre morfológico. La operación
de cierre dilata una imagen y, a
continuación, erosiona la imagen
dilatada, utilizando el mismo elemento de
estructuración para ambas operaciones.
El cierre morfológico es útil para rellenar
pequeños agujeros de una imagen
conservando la forma y el tamaño de los
objetos de la imagen
bwskel
Objetos en una imagen binaria.
Skeletonize El proceso de esqueletización
erosiona todos los objetos a líneas
constructivas sin cambiar la estructura
esencial de los objetos, como los agujeros
y ramas existentes
bwperim
Buscar perímetro de objetos en una
imagen binaria. Un píxel forma parte del
perímetro si es distinto de cero y está
conectado a al menos un píxel de valor
cero.
bwhitmiss
Transformación de hit-miss binario. La
transformación hit-miss conserva los
píxeles de una imagen binaria cuyas
vecindades coinciden con la forma de un
elemento de estructuración y no
coinciden con la forma de un segundo
elemento de estructuración
desarticulado.
Las transformaciones hit-miss se pueden
utilizar para detectar patrones en una En este ejemplo se utiliza un elemento de
imagen. estructuración con una vecindad por encima y a la
derecha del centro, y un segundo elemento de
estructuración con una vecindad debajo y a la
izquierda del centro
imtophat transformación morfológica de
sombrero superior. La transformación
top-hat abre una imagen y, a
continuación, resta la imagen abierta de
la imagen original.
La transformación del sombrero superior
se puede utilizar para mejorar el
contraste en una imagen en escala de
grises con iluminación no uniforme. La
transformación también puede aislar
pequeños objetos brillantes en una
imagen.
imbothat La transformación del sombrero
inferior cierra una imagen y, a
continuación, resta la imagen
original de la imagen cerrada.
La transformación del sombrero

inferior se puede utilizar para
encontrar valles de intensidad
en una imagen en escala de
grises.

Actividad de Investigación

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Actividad de Investigación

Cargado por

Copyright:

Formatos disponibles

Universidad Politécnica de Querétaro

Sistemas de Visión Artificial

La umbralización es uno de los más importantes métodos de segmentación. El objetivo

El histograma de la Figura 7b corresponde a una imagen compuesta de objetos claros

Fig. 8: Imagen umbralizada con un umbral de 76.

La segmentación de imágenes divide la imagen en sus partes constituyentes hasta un

Los algoritmos de segmentación se basan en una de estas dos propiedades básicas de

Discontinuidad. Se divide la imagen basándose en cambios bruscos de nivel de gris:

 Detección de puntos aislados

Similitud. Se divide la imagen basándose en la búsqueda de zonas que tengan valores

Detección de discontinuidades (Puntos Aislados)

Diremos que un píxel es un punto aislado si el resultado de aplicar la máscara sobre el

Dependiendo del valor de T, obtenemos

Análogamente, para la detección de líneas de un píxel de ancho, podemos utilizar una

a) Imagen original b) Imagen laplaciano;

Sin embargo, frecuentemente estamos interesados en detectar líneas en una

Detección de discontinuidades (Bordes)

Borde de una imagen digital en escala de grises

Borde Ideal: Forman camino de un Borde “Rampa”: Forman un conjunto

Un punto se dice que es del borde si su derivada primera dos-dimensional es mayor

Donde σ representa la desviación típica

Ejemplo de máscara 5x5 para el filtro gaussiano con σ=1.0:

Calcular el Laplaciano de la imagen resultante.

Determinar los píxeles de “paso por cero”.

Los píxeles del borde son aquellos

Son varios conjuntos de operaciones de procesamiento de imágenes que procesan

Dilatación morfológica y erosión

Las operaciones morfológicas más básicas son la dilatación y la erosión. La dilatación

Reglas para la dilatación y la erosión

Operación Regla Ejemplo (imagen Origel e imagen procesada)

La dilatación morfológica hace que

La erosión morfológica elimina las

Dilatación morfológica de una imagen binaria

Dilatación morfológica de una imagen en escala de grises

La dilatación y la erosión se utilizan a menudo en combinación para implementar

Función Definición morfológica Ejemplo (imagen original e imagen procesada)

La transformación del sombrero

También podría gustarte