Sistema de Percepcion

PERCEPCIÓN COMPUTACIONAL - ACTIVIDAD 2 1
Filtros espaciales y morfológicos

para identificación de matrı́culas
Abstract—El avance de la visión artificial ha sufrido un Por todo ello y para tener una idea clara de la aplicación a
crecimiento exponencial en los últimos años. Uno de sus fines desarrollar es necesario realizar un estudio del estado del arte
es ayudar a observar detalles que al ojo humano se le escapan, para poder proponer mejoras sobre la tecnologı́a ya existente.
ya sea por su tamaño microscópico, por el entorno o incluso, por
la velocidad a la que deben ser registrados. El presente estudio
busca describir como dicha tecnologı́a, nos permite visualizar
matrı́culas eliminando las distracciones presentes en la imagen. II. E STADO DEL A RTE
Abstract—The advancement of artificial vision has exponential Actualmente existen diferentes alternativas para detectar
growth in recent years. One of its purposes is to help observe details
matrı́culas en vehı́culos. De cada metodologı́a parten multitud
that escape the human eye, either because of their microscopic size,
because of the environment or even because of the speed at which de versiones, a cada cual resuelve conflictos presentes en otras
they must be recorded. The present study seeks to describe how y viceversa, siendo de esta forma aplicaciones estandarizadas
this technology allows us to visualize license plates eliminating the para unas condiciones determinadas.
distractions present in the image. Una compañı́a que da solución a la búsqueda de matrı́culas
Index Terms—Percepción computacional, Actividad 2, proce- es OPENALPR [2], la cual posee una aplicación de código
samiento de imágenes, filtros espaciales, filtros morfológicos. abierto que emplea diferentes técnicas, las cuales serán co-
mentadas a continuación.
I. I NTRODUCCI ÓN
A Ctualmente el análisis de imágenes por computación de A. Detección por lı́mites

forma autónoma es un sector en auge, el cual participa en Este método busca los lı́mites verticales de la imagen
diferentes ámbitos de nuestra vida cotidiana. Ejemplos de ello [3]. Para ello estudia la ubicación de lı́mites verticales en
son el reconocimiento facial a la hora de realizar pagos con el histograma, localizando de esta forma los laterales de la
el móvil, en la industria para seleccionar o medir posiciones, matrı́cula. Posteriormente, con ese fragmento vertical de la
o incluso a la hora de reconocer texto escrito y transcribirlo imagen, busca los lı́mites horizontales, acotando con ello la
en formato digital. zona en la que se encuentra la matrı́cula.
Es en este último ámbito donde se va a centrar el presente
Dicho modelo de detección posee un inconveniente, ya que,
estudio. Concretamente se ha generado un algoritmo que
si la imagen de entrada posee lı́neas verticales tales como ed-
permita extraer la matrı́cula de un coche a través de filtros
ificios, puede impedir que el software funcione correctamente
espaciales y morfológicos para su posterior segmentación y
y no se obtengan zonas candidatas en la imagen.
lectura.
En los últimos años la venta de automóviles ha venido
creciendo, tal y como reflejan los datos del Instituto Nacional B. Detección por binarizado
de Estadı́stica (INE) [1]. Es por ello por lo que es necesario
ser capaces de realizar una detección rápida y veraz que Otra forma de obtención es a través de un binarizado de la
permita identificarlos. El criterio más evidente que nos lleva imagen. Por lo general el blanco es algo no muy presente en
a diferenciar un vehı́culo de otros es su matrı́cula. los entornos interurbanos o incluso urbanos. Esta técnica se
Obviamente cabe destacar el gran interés de obtener este aprovecha de ello binarizando la imagen y buscando la zona
dato de un coche ya que se puede implementar en difer- blanca de la misma la cual con una alta probabilidad será la
entes facetas, tales como radares de carreteras, detección de matrı́cula.
vehı́culos mal estacionados o, incluso, entradas y salidas de Una vez obtenida la zona de interés se establece un margen
zonas restringidas o garajes. de recorte y se aplica en la misma zona de la imagen original,
El mercado está continuamente mejorando en este ámbito obteniendo ası́ la matrı́cula.
ofreciendo cámaras con mayor resolución que puedan acceder El contrapunto que tiene esta técnica es que la matrı́cula
a capturar múltiples carriles, trabajar bajo malas condiciones ha de ser blanca para ası́ poder obtenerla, si la misma es de
de luz o, incluso, realizando un prefiltrado de la imagen para otro color el proceso puede llegar a no identificar nada como
facilitar el posterior procesamiento. posible zona de recorte.
C. Filtrado de imágenes 3) Transformación Top Hat: Está transformación favorece

Puesto que el objetivo de este trabajo es el de profundizar y las variaciones de intensidad, resaltando los elementos más
poner en práctica los filtros espaciales y morfológicos, es claros. Por lo que aplicándola obtendremos una imagen que
conveniente analizar en el funcionamiento de aquellos que resalta objetos más brillantes que los elementos aledaños
pueden aplicar con mayor precisión al problema planteado. [4]. Para obtener este resultado el procedimiento realiza una
apertura de la imagen para restar dicha apertura a la imagen
1) Cierre o clausura: La clausura, es un operador mor-
original, tal y como se describe en (3). En la Figura 3 se
fológico que realiza en primer lugar una dilatación y posteri-
puede apreciar un ejemplo de aplicación de este filtro.
ormente una erosión. Matemáticamente, la clausura se define
según (1), considerando A como la imagen original y B como
A (A B) = A ((A B) B) (3)
el elemento estructural que se use para la transformación .
A · B = (A B) B (1)
La clausura, al aplicar primero una dilatación, los efectos

de expansión que produce sobre el contorno de un objeto
de la imagen van a ser eliminados después por la erosión,
respectando la forma original aunque rellenando su interior.
Para ilustrar este proceso podemos observar la Figura 1 donde
se aplica una clausura.
Fig. 3. Ejemplo de imagen original y resultado de aplicar transformación Top

Hat
4) Transformación Bottom Hat: Al contrario que la anterior

transformación, con esta logramos destacar los elementos
oscuros [5]. Para ello se realiza un cierre de la imagen y
Fig. 1. Ejemplo de imagen original y resultado de aplicar transformación una resta de la imagen original, formulándose como (4), de
Cierre o clausura forma que se obtiene una imagen con, únicamente, los detalles
que el cierre ha eliminado (los puntos negros en el interior de
2) Apertura: La apertura, es un operador morfológico las zonas afectadas). En la Figura 4 se muestra un ejemplo del
que es la sucesión de una erosión seguida por una dilat- efecto conseguido con esta transformación.
ación. Matemáticamente, la apertura se define según (2), con-
siderando A como la imagen original y B como el elemento (A · B) A = ((A B) B) A (4)
estructural que se use para la transformación. Para ilustrar este
proceso podemos observar la Figura 2 donde se aplica una
apertura.
A B = (A B) B (2)
El efecto de la apertura será eliminar los detalles más

pequeños, manteniendo los objetos más grandes, por lo que
al hacer la diferencia con la imagen original se obtiene lo
opuesto: se eliminan los contornos de los objetos más grandes
y permanecen los detalles de su interior.
Fig. 2. Ejemplo de imagen original y resultado de aplicar transformación Fig. 4. Ejemplo de imagen original y resultado de aplicar transformación
Apertura Bottom Hat
5) Filtro Gaussiano: Este filtro permite eliminar el ruido IV. S OLUCI ÓN PLANTEADA
que pueda existir en una imagen produciendo un suavizado Una vez conocida la necesidad y el estado del arte de
más uniforme. El principal inconveniente es que puede llegar las soluciones existentes y las diferentes técnicas que se
a desenfocar una imagen, perdiendo la nitidez de esta. Para ello pueden aplicar para alcanzar el objetivo, en el presente trabajo
hay que controlar la desviación estándar de la distribución, ya se propone un algoritmo que encadena diferentes filtros y
que en caso de asignar una sigma demasiado alta se pueden transformaciones, dentro del ámbito de los espaciales y mor-
obtener resultados como el que se muestra en la siguiente fológicos, con el objetivo de identificar dentro de una imagen
ilustración [6]. En la Figura 5 se muestra un ejemplo de la sección de la misma que corresponde con una matrı́cula y
aplicación de este filtro. la obtención de sus contornos para una posterior segmentación
e identificación.
En concreto, la secuencia de operaciones que se propone es
la indicada a continuación:
1) Conversión de la imagen a escala de grises.
2) Aplicación de transformación Bottom Hat.
3) Aplicación de transformación Top Hat.
4) Gradiente.
5) Filtro Gaussiano.
6) Localización de la matrı́cula por intensidades.
7) Detección de bordes aplicando un filtro Canny.
Para llevar a cabo estas operaciones se hace uso de la librerı́a
Fig. 5. Ejemplo de imagen original y resultado de aplicar filtro Gaussiano
skimage de Python.
1) Conversión de la imagen a escala de grises: Las im-
6) Filtro Canny: La finalidad de este filtro es dar una agenes deben ser convertidas a escala de grises de forma
descripción a los objetos presentes. Dicho filtro aplica una que se trabajará con la iluminación de cada pı́xel, obteniendo
erosión en las zonas claras y una dilatación en las zonas un umbral adecuado para su procesado, de hecho, los filtros
oscuras obteniendo con ello dos imágenes, para posteriormente morfológicos y espaciales se comportan mejor en imágenes en
realizar una resta entra las imágenes obtenidas obteniendo el esta escala (grises) o binarizadas. Para ello se hace uso de la
contorno de los objetos presentes en la imagen de entrada [7]. función rgb2gray.
En la Figura 6 se muestra un ejemplo de aplicación de este 2) Aplicación de transformación Bottom Hat: Al aplicar
filtro. esta transformación se genera una imagen donde resaltan, entre
otras caracterı́sticas de la imagen, las letras de la matrı́cula en
un color blanco sobre fondo negro. El elemento estructural
utilizado será el de un cuadrado de tamaño 5x5. En la Figura
7 se puede observar el resultado al aplicar esta transformación,
donde lo que queda resaltado son los caractéres de la matrı́cula
y algún perfil del vehı́culo.
3) Aplicación de transformación Top Hat: El siguiente paso
en el proceso de localización de la matrı́cula es aplicar el
operador Top Hat, que devuelve una imagen con, únicamente,
los detalles que la apertura ha eliminado. Esto permite resaltar
Fig. 6. Ejemplo de imagen original y resultado de aplicar el filtro de Canny las transiciones bruscas. El elemento estructural utilizado será
el de un cuadrado de tamaño 5x5. En la Figura 8 se puede
observar el resultado al aplicar esta transformación.
III. D ESCRIPCI ÓN DEL PROBLEMA 4) Gradiente: Una vez aplicados las dos transformaciones
Primero se han de obtener las imágenes las cuales serán la anteriores, el siguiente paso es el de aplicar un gradiente fruto
entrada del algoritmo desarrollado. Estas pueden ser obtenidas de la resta de las imágenes resultantes de aplicar el Botton
a través de una cámara que se active por sensores de Hat y el Top Hat, obteniendo una imagen en escala de grises
movimiento o pueden ser frames de un vı́deo que, con las en la que se resaltan los detalles con alto contraste como las
cámaras actuales, significarı́a obtener 30 imágenes por se- letras y números de la matrı́cula y algunas zonas del interior
gundo. El algoritmo desarrollado se ha generado para que las del contorno del coche, como las llantas o el contorno de las
imágenes de entrada hayan sido realizadas con luz ambiental al ventanas. En la Figura 9 se puede ver el resultado de esta
aire libre. Aun limitando la toma de imágenes a exteriores se operación, consiguiendo que la parte con mayor intensidad de
pueden encontrar diversos problemas, tales como matrı́culas grises sea la matrı́cula.
distorsionadas por la toma de la foto o, incluso, que no se 5) Filtro Gaussiano: Una vez resaltadas las zonas candi-
encuentren centradas en la imagen formando un rectángulo con datas, el siguiente paso es aplicar un ruido Gaussiano con
ángulos de 90 grados. Estas casuı́sticas han sido contempladas una sigma ( ) lo suficientemente alta (10 en el algoritmo
tal y como se verá en los siguientes apartados. propuesto) para que, en la imagen obtenida en el gradiente,
Fig. 7. Imagen original de vehı́culo y resultado de aplicar el filtro de Bottom Fig. 9. Imagen original de vehı́culo y resultado de aplicar el gradiente
Hat propuesto
al gradiente, donde claramente se denota un bloque negro

asociado a la matrı́cula del vehı́culo.
Fig. 8. Imagen original de vehı́culo y resultado de aplicar el filtro de Top

Hat
se consiga un efecto similar al del cierre donde la zona que Fig. 10. Imagen original de vehı́culo y resultado de aplicar el filtro Gaussiano
a la imagen gradiente
forman los números y letras de la matrı́cula se convierta en
un bloque oscuro difuminado.
De esta forma se aumenta el contraste entre la matrı́cula 6) Localización de la matrı́cula por intensidades:
(totalmente oscura) y el resto de la imagen, lo cual facilitará su Una vez resaltada la zona donde está la matrı́cula del
localización en el punto siguiente del proceso. En la Figura 10 vehı́culo, se define una función denominada FindPlate,
se puede apreciar el resultado tras aplicar el filtro Gaussiano que recibe una imagen de entrada y devuelve la
posición de la sección de la imagen más oscura para ello, se propone la aplicación de un filtro Canny con el
(rowStart, rowEnd, columnStart, columnEnd). que se detectan los bordes para el segmento localizado.
El proceso de esta función serı́a simplemente calcular los El filtro Canny identifica el mayor número de bordes de la
valores mı́nimos de intensidad para cada fila de la imagen imagen, minimizando el número de falsos negativos y falsos
y ordenarlos de menos a mayor. A continuación se busca el positivos en su identificación, que se realiza una única vez sin
bloque de filas donde haya menor intensidad. En la Figura 11 que el ruido presente en la imagen de lugar a falsos bordes.
se puede apreciar la imagen tras el filtro Guassiano junto con
su distribución de intensidades, de forma que las más bajas se
encuentran en las filas donde está la matrı́cula (marcadas en
rojo en la gráfica de la derecha).
Fig. 14. Subimagen de la matrı́cula y el resultado de aplicar el filtro Canny
En la Figura 14 se observa el resultado de aplicar este filtro

y corresponderı́a con el resultado que devuelve el algoritmo
propuesto en este trabajo.
Fig. 11. Imagen del vehı́culo tras aplicar el filtro Gaussiano y su distribución
de intensidades por filas
V. R ESULTADOS
La subimagen formada por esa sección de filas se binariza
Para poner a prueba el algoritmo propuesto, se ha aplicado
de forma que se pueda localizar el bloque o sección mayor
a diferentes imágenes descargadas de Internet con diferentes
con mayor intensidad ya que corresponderı́a a la matrı́cula.
ángulos, modelos de vehı́culo y situaciones, obteniendo los
En la Figura 12 se puede apreciar el segmento horizontal
resultados que se mostrarán a continuación, a excepción de
de la imagen delimitado en el paso anterior junto con una
la imagen Arona.jpg que se corresponde a la utilizada en los
binarización generada considerando como umbral o threshold
apartados anteriores para explicar el procedimiento definido.
la medida del segmento, quedando marcados en negro las
zonas más oscuras. El proceso localiza el bloque de mayor Para un mejor seguimiento de todo el proceso, el algoritmo
tamaño que sea negro, que en esta ocasión está delimitado propuesto tiene una opción denominada trace que cuando
por las lı́neas rojas de la gráfica inferior. se indica con valor True al invocarlo, muestra las diferentes
imágenes resultantes de aplicar cada uno de los pasos del
proceso.
1) Audi.jpg: En la Figura 15 se puede ver todo el proceso
llevado a cabo para una imagen cuya matrı́cula no es española.
Fig. 12. Subimagen con mayores intensidades horizontales junto con su

binarización y marcado de lı́mites verticales.
Tras aplicar esta función, los valores devueltos corresponden

justo a la matrı́cula del vehı́culo, tal y como se muestra en la
Figura 13.
Fig. 13. Subimagen donde está ubicada la matrı́cula según la función

FindPlate
7) Detección de bordes aplicando un filtro Canny: Hasta

este momento, la aplicación de filtros morfológicos y espa-
ciales para localizar la matrı́cula corresponde a la parte central
de la resolución del problema. Una vez localizada la matrı́cula, Fig. 15. Proceso de localización de matrı́cula para la imagen Audi.jpg
el objetivo será mejorar la visualización de esta por lo que,
Fig. 19. Proceso de localización de matrı́cula para la imagen Volkswagen.jpg
Fig. 16. Proceso de localización de matrı́cula para la imagen Lexus.jpg

VI. C ONCLUSIONES
El proceso de localización y visualización de las matrı́culas
mediante la aplicación de filtros espaciales y morfológicos
2) Lexus.jpg: En la Figura 15 se puede ver el resultado es un problema que ha sido ampliamente tratado con fines
final para una imagen que presenta más de un vehı́culo en prácticos, como parkings, radares de velocidad, etc.. . . y el uso
escena. de distintos filtros o simplemente distinto orden de aplicación
3) Policı́a.jpg: En la Figura 17 se puede ver todo el proceso
de estos podrı́a conducir a resultados similares, mejores o
llevado a cabo para una imagen que presenta un vehı́culo de
peores.
policı́a donde podrı́a haber otros elementos que complicaran
La selección y el orden de los filtros y operaciones en
la detección de la matrı́cula.
este trabajo no es solo obtener una solución óptima sino
también poder observar los efectos de aquellos que son más
comunes en la literatura cientı́fica. Se puede concluir por
tanto que se ha alcanzado el objetivo principal, una solución
completa en la que se demuestran y justifican los efectos de
las operaciones aplicadas y que, a su vez, han conducido a
realizar una localización de la matrı́cula bastante precisa y
definir el contorno de la misma de forma que la visualización
de los caractéres y dı́gitos que la componen sea clara.
Queda para trabajos futuros la adaptación de este algoritmo
para soportar matrı́culas de otros colores, como podrı́an ser las
azules de los taxis y vehı́culos de transporte con conductor,
ası́ como permitir identificar más de una matrı́cula en una
única imagen, soportar imágenes con diferentes iluminaciones
o ajustar la rotación de la imagen para solventar posibles
problemas con los ángulos de las matrı́culas.
R EFERENCES
[1] Ficha Histórica. Instituto Nacional de Estadı́stica. [Online]. Enlace:
https://www.ine.es/dyngs/IOE/es/fichaHistorica.htm?cid=1259930960724
[2] OpenALPR, OpenALPR de Rekor.[Online]. Enlace:
https://es.openalpr.com/contact
[3] López Fdez, J. M., González, J., & Galindo Vicente Arévalo, C., Re-
conocimiento automático de matrı́culas usando operadores morfológicos
y múltiples redes neuronales. 2006
Fig. 17. Proceso de localización de matrı́cula para la imagen Policia.jpg [4] Alegre E., Pajares G., de la Escalera A.Conceptos y métodos en visión
por computador. Grupo de Visión del Comité Español de Automática
4) Seat.jpg: En la Figura 18 se puede ver el resultado final (CEA). 2016
[5] Mundaca-Vidarte, G. Detección de caractéres de placas de automóviles
obtenido junto con la imagen original. mediante técnicas de visión artificial. 2016
[6] MathWorks. Filtrado gaussiano 2D de imágenes - MAT-
LAB imgaussfilt MathWorks España. [Online] Enlace:
https://es.mathworks.com/help/images/ref/imgaussfilt.html 2022
[7] MathWorks. Detección de bordes - MATLAB & SimulinkMathWorks
España. [Online] Enlace: https://es.mathworks.com/help/images/edge-
detection.html 2022
Fig. 18. Proceso de localización de matrı́cula para la imagen Seat.jpg
5) Vokswagen.jpg: En la Figura 19 se puede ver el resultado

final obtenido junto con la imagen original.
Sistema de Percepción
Preprocesamiento
How is the signal obtained in the

form of a continuous signal converted into a discrete signal, that is, into a digital picture?
The moving average filter replaces each pixel with the average pixel value of it and a neighborhood window of adjacent pixels . The effect is a
more smooth image with sharp features removed.
Increasing the size of a digital image is named “up sampling” and decreasing is named “down sampling”
For example, the range of values that pixels can have in a gray level of 3 bits is [0–7], while the range of values that pixels can take in a gray
level of 8 bits is [0–255]. The values that pixels have are also called the “intensity” of that pixel.
The processes applied to obtain a different version of the image on an image that does not have any deformation in its essence are included in
the operations in the Image Enhancement category
If an image is processed pixel by pixel, that is, if the process is applied to each pixel individually, it’s examined in Gray Level
Transformations and if the processes are applied to pixel groups larger than 1 pixel, it is examined in the Filtering category.
When we consider a picture matrix that can take values between 0 –255, we said that the pixels closer to 0, are closer to black
and the ones closer to 255, are closer to white.
Another linear process is to take the negative of the picture. This process is to subtract each pixel from its complement. Gamma
correction changes not only the amount of light but also the contrast settings of an image
Equalization Histogram
A histogram of an image is the graphical interpretation of the image’s pixel intensity values. It can be
interpreted as the data structure that stores the frequencies of all the pixel intens ity levels in the image
Histogram Equalization is an image processing technique that adjusts the contrast of an image by using
its histogram. To enhance the image’s contrast, it spreads out the most frequent pixel intensity values or
stretches out the intensity range of the image
Smoothing Filters are used to smooth the image. Basically when we apply this filter to an image for example via convolution
operation, we get a more smooth version of our input image.
Gaussian Filter (Gaussian Low Pass Filter) is a popular smoothing filter which is based on Gaussian Distribution where the
formula of Gaussian
Filtro de mediana
– Comúnmente empleado para eliminar artefactos (ruido)
impulsivo
– Se aplica mediante ventana deslizante de tamaño N muestras
– Desventaja: modifica el valor de las muestras que no son
anomalías
Realce de imagen
– Etapas iniciales de procesado (tras reducción de ruido)
– Capturar información relevante vs. información
prescindible
Supresión de ruido de fondo. Resalte del contenido frente a la textura

(ruido) de fondo de la imagen
– Ajuste de intensidad. Aumento de contraste
– Realce de bordes. Ensalce de transiciones entre elementos de la
imagen
Conocer las principales técnicas de procesado punto a punto

– Ajuste de intensidad
– Basadas en histograma
– Operaciones aritméticas
Se conocen como transformaciones del nivel de gri s

Hay una imagen más contrastada. El algoritmo de segmentación podría detectar la posición de cada
nube.
Los algoritmos de segmentación se basan en propiedades básicas de
los valores del nivel de gris:
- Discontinuidad: Los bordes de las regiones son suficientemente diferentes del fondo lo que permite la detección de los
mismos basándonos en cambios bruscos de nivel de intensidad.
- Similitud: Se divide la imagen basándose en la búsqueda de zonas que tengan valores similares, conforme a unos criterios
prefijados.
- Umbralización: Un método básico para diferenciar un objeto del fondo de la imagen es mediante binarización (e n
realidad se puede considerar una medida de similitud).
Transformación Logaritmica
– Valores pequeños  Se expanden: se amplian las diferencias

– Valores grandes  Se concentran: se reducen las diferencias
– Se emplea cuando se pretende expandir el rango de intensidad d e
los píxeles oscuros, mientras que, a la vez, el objetivo es equiparar
entre sí los píxeles más claros
Filtros Espaciales
– Promediado (integral)  Elimina variaciones bruscas  Atenúa el contraste entre píxeles próximos entre sí (fecuencias altas de
laseñal)  LPF
– Substracción (derivada)  Resalta diferencias o cambios bruscos  Ensalza el contraste y atenúa áreas de valor similar de
intensidad entrepíxeles (frecuencias bajas de la señal)  HPF
sobel_horizontal = np.array([[-1,-2,-1],[0,0,0], [1,2,1]])

sobel_vertical = np.array([[-1,0,1],[-2,0,2],[-1,0,1]])
sobel_diagonal = np.array([[0,1,2],[-1,0,1],[-2,-1,0]])
sobel_diagonal_inverso = np.array([[-2,-1,0],[-1,0,1],[0,2,1]])
Operador Roberts
– Máscaras 2 x 2
– Identificación de bordes en dirección 135º y 45º
– Respuesta débil a los bordes y sensible a la presencia de ruido
Operadores de Prewitt
– Máscaras 3 x 3
– Identificación de bordes en direcciones vertical y horizontal
Máscaras 3 x 3
– Identificación de bordes en direcciones vertical y hori zontal
– Menos sensible al ruido
Operador de Canny
Filtro paso-bajo de tipo gaussiano: suavizado y reducción de ruido
– Cálculo del gradiente en las diferentes direccione s
– Intensidad a 0 para los píxeles que no son un máximo local
– Umbral sobre la intensidad de los píxeles para binarizar la imagen y
quedarnos con las estructuras que potencialmente pueden
corresponderse con bordes
– Se eliminan aquellas estructuras más débiles que no están conectadas
con bordes mayores
Filtros Morfologicos
Se utiliza también para separar objetos tras una segmentación

► Puede utilizarse antes o después de la segmentación, no existe limitación
Any grayscale image can be viewed as a topographic surface where high intensity denotes peaks and
hills while low intensity denotes valleys. You start filling every isolated valleys (local minima) with
different colored water (labels). As the water rises, depending on the peaks (gradients) nearby, water
from different valleys, obviously with different colors will start to merge. To avoid that, you build
barriers in the locations where water merges. You continue the work of filling water and building
barriers until all the peaks are under water. Then the barriers you created gives you the segmentation
result. This is the "philosophy" behind the watershed. You can visit the CMM webpage on watershed to
understand it with the help of some animations.
We start with finding an approximate estimate of the coins. For that, we can use the Otsu's binarization
ret, thresh = cv.threshold(gray,0,255,cv.THRESH_BINARY_INV+cv.THRESH_OTSU)
Now we need to remove any small white noises in the image. For that we can use morphological
opening. To remove any small holes in the object, we can use morphological closing. So, now we know
for sure that region near to center of objects are foreground and region much away from the object are
background. Only region we are not sure is the boundary region of coins
So we need to extract the area which we are sure they are coins. Erosion removes the boundary pixels.
So whatever remaining, we can be sure it is coin. That would work if objects were not touching each
other. But since they are touching each other, another good option would be to find the distance
transform and apply a proper threshold. Next we need to find the area which we are sure they are not
coins. For that, we dilate the result. Dilation increases object boundary to background. This way, we can
make sure whatever region in background in result is really a background, since boundary region is
removed. See the image below.
The remaining regions are those which we don't have any idea, whether it is coins or background.
Watershed algorithm should find it. These areas are normally around the boundaries of coins where
foreground and background meet (Or even two different coins meet). We call it border. It can be
obtained from subtracting sure_fg area from sure_bg area.
Theory
Morphological transformations are some simple operations based on the image shape. It is
normally performed on binary images. It needs two inputs, one is our original image, second one
is called structuring element or kernel which decides the nature of operation. Two basic
morphological operators are Erosion and Dilation. Then its variant forms like Opening, Closing,
Gradient etc also comes into play. We will see them one-by-one with help of following image:
image
1. Erosion
The basic idea of erosion is just like soil erosion only, it erodes away the boundaries of
foreground object (Always try to keep foreground in white). So what it does? The kernel slides
through the image (as in 2D convolution). A pixel in the original image (either 1 or 0) will be
considered 1 only if all the pixels under the kernel is 1, otherwise it is eroded (made to zero).
So what happends is that, all the pixels near boundary will be discarded depending upon the size
of kernel. So the thickness or size of the foreground object decreases or simply white region
decreases in the image. It is useful for removing small white noises (as we have seen in
colorspace chapter), detach two connected objects etc.
Here, as an example, I would use a 5x5 kernel with full of ones. Let's see it how it works:
import cv2 as cv
import numpy as np
img = cv.imread('j.png',0)
kernel = np.ones((5,5),np.uint8)
erosion = cv.erode(img,kernel,iterations = 1)
Result:
image
2. Dilation
It is just opposite of erosion. Here, a pixel element is '1' if at least one pixel under the kernel is
'1'. So it increases the white region in the image or size of foreground object increases. Normally,
in cases like noise removal, erosion is followed by dilation. Because, erosion removes white
noises, but it also shrinks our object. So we dilate it. Since noise is gone, they won't come back,
but our object area increases. It is also useful in joining broken parts of an object.
dilation = cv.dilate(img,kernel,iterations = 1)
Result:
image
3. Opening
Opening is just another name of erosion followed by dilation. It is useful in removing noise, as
we explained above. Here we use the function, cv.morphologyEx()
opening = cv.morphologyEx(img, cv.MORPH_OPEN, kernel)
Result:
image
4. Closing
Closing is reverse of Opening, Dilation followed by Erosion. It is useful in closing small holes
inside the foreground objects, or small black points on the object.
closing = cv.morphologyEx(img, cv.MORPH_CLOSE, kernel)
Result:
image
5. Morphological Gradient
It is the difference between dilation and erosion of an image.
The result will look like the outline of the object.
gradient = cv.morphologyEx(img, cv.MORPH_GRADIENT, kernel)
Result:
image
6. Top Hat
It is the difference between input image and Opening of the image. Below example is done for a
9x9 kernel.
tophat = cv.morphologyEx(img, cv.MORPH_TOPHAT, kernel)
Result:
image
7. Black Hat
It is the difference between the closing of the input image and input image.
blackhat = cv.morphologyEx(img, cv.MORPH_BLACKHAT, kernel)
Result:
image
Goal
In this tutorial you will learn how to:
• Use the OpenCV function cv::Canny to implement the Canny Edge Detector.
Theory
The Canny Edge detector [40] was developed by John F. Canny in 1986. Also known to many as
the optimal detector, the Canny algorithm aims to satisfy three main criteria:
• Low error rate: Meaning a good detection of only existent edges.

• Good localization: The distance between edge pixels detected and real edge pixels have to be
minimized.
• Minimal response: Only one detector response per edge.
Steps
1. Filter out any noise. The Gaussian filter is used for this purpose. An example of a
Gaussian kernel of size=5 that might be used is shown below:
K=1159⎡⎣⎢⎢⎢⎢⎢⎢245424912945121512549129424542⎤⎦⎥⎥⎥⎥⎥⎥
2. Find the intensity gradient of the image. For this, we follow a procedure analogous to Sobel:
a. Apply a pair of convolution masks (in x and y directions:
Gx=⎡⎣⎢−1−2−1000+1+2+1⎤⎦⎥
Gy=⎡⎣⎢−10+1−20+2−10+1⎤⎦⎥
b. Find the gradient strength and direction with:
G=G2x+G2y−−−−−−−√θ=arctan(GyGx)
The direction is rounded to one of four possible angles (namely 0, 45, 90 or 135)
3. Non-maximum suppression is applied. This removes pixels that are not considered to be part of
an edge. Hence, only thin lines (candidate edges) will remain.
4. Hysteresis: The final step. Canny does use two thresholds (upper and lower):
a. If a pixel gradient is higher than the upper threshold, the pixel is accepted as an edge
b. If a pixel gradient value is below the lower threshold, then it is rejected.
c. If the pixel gradient is between the two thresholds, then it will be accepted only if it is
connected to a pixel that is above the upper threshold.
Canny recommended a upper:lower ratio between 2:1 and 3:1.
5. For more details, you can always consult your favorite Computer Vision book.
Purpose of Image processing
The purpose of image processing is divided into 5 groups. They are :
Visualization - Observe the objects that are not visible.
Image sharpening and restoration - To create a better image.
Image retrieval - Seek for the image of interest.
Measurement of pattern – Measures various objects in an image.
Image Recognition – Distinguish the objects in an image.
Fundamental steps in Digital Image Processing :
1. Image Acquisition
This is the first step or process of the fundamental steps of digital image processing. Image
acquisition could be as simple as being given an image that is already in digital form. Generally,
the image acquisition stage involves preprocessing, such as scaling etc.
2. Image Enhancement
Image enhancement is among the simplest and most appealing areas of digital image processing.
Basically, the idea behind enhancement techniques is to bring out detail that is obscured, or
simply to highlight certain features of interest in an image. Such as, changing brightness &
contrast etc.
3. Image Restoration
Image restoration is an area that also deals with improving the appearance of an image.
However, unlike enhancement, which is subjective, image restoration is objective, in the sense
that restoration techniques tend to be based on mathematical or probabilistic models of image
degradation.
4. Color Image Processing
Color image processing is an area that has been gaining its importance because of the significant
increase in the use of digital images over the Internet. This may include color modeling and
processing in a digital domain etc.
5. Wavelets and Multiresolution Processing
Wavelets are the foundation for representing images in various degrees of resolution. Images
subdivision successively into smaller regions for data compression and for pyramidal
representation.
6. Compression
Compression deals with techniques for reducing the storage required to save an image or the
bandwidth to transmit it. Particularly in the uses of internet it is very much necessary to
compress data.
7. Morphological Processing
Morphological processing deals with tools for extracting image components that are useful in th e
representation and description of shape.
8. Segmentation
Segmentation procedures partition an image into its constituent parts or objects. In general,
autonomous segmentation is one of the most difficult tasks in digital image processing. A rugged
segmentation procedure brings the process a long way toward successful solution of imaging
problems that require objects to be identified individually.
9. Representation and Description
Representation and description almost always follow the output of a segmentation stage, which
usually is raw pixel data, constituting either the boundary of a region or all the points in the
region itself. Choosing a representation is only part of the solution for transforming raw data into
a form suitable for subsequent computer processing. Description deals with extracting attributes
that result in some quantitative information of interest or are basic for differentiating one class of
objects from another.
10. Object recognition
Recognition is the process that assigns a label, such as, “vehicle” to an object based on its
descriptors.
11. Knowledge Base:
Knowledge may be as simple as detailing regions of an image where the information of interest
is known to be located, thus limiting the search that has to be conducted in se eking that
information. The knowledge base also can be quite complex, such as an interrelated list of all
major possible defects in a materials inspection problem or an image database containing high -
resolution satellite images of a region in connection with change-detection applications.

Sistema de Percepcion

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Sistema de Percepcion

Cargado por

Copyright:

Formatos disponibles

PERCEPCIÓN COMPUTACIONAL - ACTIVIDAD 2 1

Filtros espaciales y morfológicos

A Ctualmente el análisis de imágenes por computación de A. Detección por lı́mites

C. Filtrado de imágenes 3) Transformación Top Hat: Está transformación favorece

La clausura, al aplicar primero una dilatación, los efectos

Fig. 3. Ejemplo de imagen original y resultado de aplicar transformación Top

4) Transformación Bottom Hat: Al contrario que la anterior

El efecto de la apertura será eliminar los detalles más

al gradiente, donde claramente se denota un bloque negro

Fig. 8. Imagen original de vehı́culo y resultado de aplicar el filtro de Top

Fig. 14. Subimagen de la matrı́cula y el resultado de aplicar el filtro Canny

En la Figura 14 se observa el resultado de aplicar este filtro

Fig. 12. Subimagen con mayores intensidades horizontales junto con su

Tras aplicar esta función, los valores devueltos corresponden

Fig. 13. Subimagen donde está ubicada la matrı́cula según la función

7) Detección de bordes aplicando un filtro Canny: Hasta

Fig. 19. Proceso de localización de matrı́cula para la imagen Volkswagen.jpg

Fig. 16. Proceso de localización de matrı́cula para la imagen Lexus.jpg

Fig. 18. Proceso de localización de matrı́cula para la imagen Seat.jpg

5) Vokswagen.jpg: En la Figura 19 se puede ver el resultado

How is the signal obtained in the

Supresión de ruido de fondo. Resalte del contenido frente a la textura

Conocer las principales técnicas de procesado punto a punto

Se conocen como transformaciones del nivel de gri s

– Valores pequeños  Se expanden: se amplian las diferencias

sobel_horizontal = np.array([[-1,-2,-1],[0,0,0], [1,2,1]])

Se utiliza también para separar objetos tras una segmentación

opening = cv.morphologyEx(img, cv.MORPH_OPEN, kernel)

closing = cv.morphologyEx(img, cv.MORPH_CLOSE, kernel)

It is the difference between dilation and erosion of an image.

The result will look like the outline of the object.

gradient = cv.morphologyEx(img, cv.MORPH_GRADIENT, kernel)

tophat = cv.morphologyEx(img, cv.MORPH_TOPHAT, kernel)

blackhat = cv.morphologyEx(img, cv.MORPH_BLACKHAT, kernel)

• Low error rate: Meaning a good detection of only existent edges.

b. Find the gradient strength and direction with:

Canny recommended a upper:lower ratio between 2:1 and 3:1.

The purpose of image processing is divided into 5 groups. They are :

Visualization - Observe the objects that are not visible.

Image sharpening and restoration - To create a better image.

Image retrieval - Seek for the image of interest.

Measurement of pattern – Measures various objects in an image.

Image Recognition – Distinguish the objects in an image.

Fundamental steps in Digital Image Processing :

4. Color Image Processing

5. Wavelets and Multiresolution Processing

9. Representation and Description

10. Object recognition

11. Knowledge Base:

También podría gustarte