Documentos de Académico
Documentos de Profesional
Documentos de Cultura
RESUMEN El presente documento propone una nueva metodología para el reconocimiento de matrículas (LP) en el estado del arte de los algoritmos de procesamiento de
imágenes y un conjunto neutrosófico (NS) optimizado basado en el algoritmo genético (GA). En primer lugar, hemos realizado algunas técnicas de procesamiento de imágenes,
como detección de bordes y operaciones morfológicas para utilizar la localización (LP). Además, hemos extraído las características más destacadas mediante la implementación
de una nueva metodología utilizando (GA) para optimizar las operaciones (NS). El uso de (NS) disminuye la indeterminación en las imágenes (LP). Además, el algoritmo de
agrupamiento k-means se ha aplicado para segmentar los caracteres (LP). Finalmente, hemos aplicado el algoritmo de análisis de etiquetado de componentes conectados
(CCLA) para identificar las regiones de píxeles conectadas y agrupar los píxeles apropiados en componentes para extraer cada carácter de manera efectiva. Se han calculado
varios índices de rendimiento para medir la eficiencia del sistema, como precisión, sensibilidad, especificidad, dados y coeficientes de jaccard. Además, hemos creado una base
de datos para todos los detectados y reconocidos (LP) con fines de prueba. Los resultados experimentales muestran que la metodología propuesta tiene la capacidad de ser
adecuada tanto para (árabe-egipcio) como para inglés (LP). El sistema propuesto logra un alto grado de precisión de reconocimiento para todo el sistema de acuerdo con los
siguientes estudios de caso; (i) para un egipcio de alta resolución (LP), el sistema propuesto alcanza aproximadamente el 96,67% de precisión del reconocimiento correcto, (ii)
para un inglés (LP) corrupto de baja resolución, el sistema propuesto alcanza una precisión del 94,27%. Además, hemos aplicado el sistema propuesto en algún tipo de
perturbación de la imagen, es decir (destello en la imagen, ruido externo y variación de iluminación), el sistema propuesto alcanza una precisión de 92,5% de identificación
correcta. Sin embargo, los métodos tradicionales logran aproximadamente un 79% de precisión de identificación correcta en presencia de tales degradaciones de imagen. Esto
refleja cómo el sistema propuesto se generaliza, optimiza y propone un alto grado de precisión de reconocimiento. Precisión del 5% de la identificación correcta. Sin embargo, los
métodos tradicionales logran aproximadamente un 79% de precisión de identificación correcta en presencia de tales degradaciones de imagen. Esto refleja cómo el sistema
propuesto se generaliza, optimiza y propone un alto grado de precisión de reconocimiento. Precisión del 5% de la identificación correcta. Sin embargo, los métodos tradicionales
logran aproximadamente un 79% de precisión de identificación correcta en presencia de tales degradaciones de imagen. Esto refleja cómo el sistema propuesto se generaliza,
TÉRMINOS DEL ÍNDICE Análisis de etiquetado de componentes conectados, algoritmo genético, k-medias, segmentación de letras y números, localización
de matrículas, conjunto neutrosófico.
I. INTRODUCCIÓN signos y colores de un país a otro. Se han sugerido muchos métodos para
El reconocimiento automático de matrículas de vehículos (AVLPR) ha aumentado (AVLPR) dependiendo de las características y regulaciones del país (LP). Localizar
ampliamente en aplicaciones tales como la supervisión del tráfico por carretera, el la matrícula en un fondo complejo es una misión difícil. Por lo tanto, se deben
seguimiento de vehículos, el estacionamiento y los sistemas inteligentes de transporte (ITS). considerar algunos factores importantes para adquirir una extracción exitosa de la
La placa de matrícula (LP) es una placa de metal que incluye caracteres y palabras que se (LP) como el tamaño de la placa, la calidad de la imagen, el estilo de la placa, la
fijan en el cuerpo exterior del vehículo y se utilizan para reconocer los vehículos [1]. Debido a condición de la iluminación, la ubicación de la placa y las especificaciones de fondo
las diversas discriminaciones de (LP) con respecto a la forma, el tamaño, el idioma, [2], [3].
Este trabajo está bajo una licencia Creative Commons Attribution 4.0. Para obtener más información, consulte https://creativecommons.org/licenses/by/4.0/
VOLUMEN 8, 2020 49285
BB Yousif et al .: Hacia un ONKM-AVLPR
el problema de detección de placa (LP) depende solo del diseño geométrico de los iii En caso de egipcio (LP), hemos aplicado el
caracteres (LP). La técnica propuesta tiene una alta impunidad a los cambios en la sistema propuesto en algún tipo de perturbación de la imagen, es
iluminación. decir (destello en la imagen, ruido externo y variación de la iluminación), el
KM Babuand et al. tiene cuatro pasos principales para el reconocimiento de sistema propuesto alcanza aproximadamente el 92.5% de precisión de la
matrículas [11]. En primer lugar, en el preprocesamiento, las imágenes se capturan a identificación correcta de la binarización. Sin embargo, los métodos
través de la cámara digital, se ajusta el brillo apropiado, se elimina el ruido y se convierte tradicionales logran aproximadamente un 79% de precisión en la
en una imagen en escala de grises. En segundo lugar, encontraron los bordes en la identificación correcta de la binarización en presencia de degradación de la
imagen para extraer la ubicación (LP). Además, los caracteres están segmentados en imagen. Esto refleja cómo el sistema propuesto se generaliza, optimiza y
(LP). Finalmente, han aplicado un algoritmo de coincidencia de plantillas para reconocer propone un alto grado de precisión de reconocimiento. La parte restante de
cada carácter en la imagen (LP). Todo el sistema ha logrado aproximadamente un este documento se organiza de la siguiente manera. Sección III, proporciona
91,11% de precisión. Sin embargo, no trataron con algunas dificultades de la siguiente la posibilidad de localización (LP). Sección IV propuso un nuevo método para
manera (imagen borrosa, rota (LP) y similitudes entre los personajes). segmentar y extraer letras y números. Sección V, presentó cómo podemos
reconocer los caracteres según la base de datos de almacenamiento.
Sección VI,
distancia euclidiana). Han logrado un 92% de precisión de éxito y fallas almacenamiento de nuestro resultado como un texto en la base de datos de acceso de
debido a la iluminación inapropiada y al desenfoque. Microsoft. Finalmente, el trabajo se concluye en la sección VIII
Vidhya norte et al. han presentado diferentes tipos de enfoques como sus desafíos
involucrados en la detección, localización y reconocimiento de números de matrículas III. LOCALIZACIÓN DE PLACA DE LICENCIA
[13]. Este documento presenta una encuesta de las técnicas de reconocimiento de A. ADQUISICION DE IMAGEN
matrículas clasificándolas en función de las características utilizadas en cada etapa y Las imágenes de la matrícula egipcia (LP) se capturan con una cámara digital de alta
descubrió que la mayor precisión de ellas fue la detección basada en bordes, la resolución (Nikon) con una resolución de (5152 × 3864) píxeles. Las imágenes se
ventana concéntrica deslizante, que logró una precisión de éxito del 98.4%. toman desde los lados delantero y trasero de los vehículos con una distancia
(aproximadamente 2 metros y hasta 3 metros de distancia) a las (12.00 p.m.). Las
imágenes se recopilan de muchos lugares, como parques, campamentos, calles
Este trabajo presenta las siguientes contribuciones: 1- Hemos propuesto (https: //drive.google.com/file/d/1CUSzJgDM10zrsRo1SQj5 mibZPddFriP / view). Las
una nueva metodología para la matrícula imágenes en inglés (LP) se capturan utilizando la cámara digital (OLYMPUS
reconocimiento (LPR) en el estado del arte de algoritmos de procesamiento CAMEDIA C-2040ZOOM) con una resolución de (640 × 480) píxeles. Las imágenes de
de imágenes y un conjunto neutrosófico optimizado (NS) basado en algoritmo la base de datos han incluido más de 500 imágenes de las vistas traseras de varios
genético (GA). 2- Hemos extraído las características más destacadas por vehículos (camiones, automóviles, autobuses), tomadas bajo diferentes condiciones
4- Hemos aplicado componentes conectados etiquetado anal- En el preprocesamiento de la imagen RGB del automóvil, como se muestra
Algoritmo ysis (CCLA) para identificar las regiones de píxeles conectadas y en la Fig. 4 (a), se reduce a 50% de su escala original para reducir el
agrupar los píxeles apropiados en componentes para extraer cada carácter de tiempo de cálculo. Además, se han utilizado imágenes de corte y cambio de
manera efectiva. 5- El sistema propuesto tiene como objetivo una alta tasa de tamaño para disminuir la probabilidad de encontrar regiones candidatas
reconocimiento como se muestra en la Fig. 4 (b). La imagen RGB contiene tres canales
Precisión de la posición en presencia de degradaciones e interrupciones de la rojo, verde y azul, cada canal tiene un valor en el rango (0-255), mientras
imagen (LP). que la imagen en escala de grises tiene solo un canal, por lo que
6- Finalmente, los resultados experimentales muestran lo siguiente: convertimos la imagen RGB al formato de escala de grises como se
i Para un egipcio de alta resolución (LP), el sistema propuesto logra muestra en la Fig.4 (c ) Además, hemos aumentado el contraste de las
aproximadamente un 96,67% de precisión de reconocimiento correcto. imágenes para facilitar el proceso de detección de (LP) [15] como se
muestra en la Fig. 4 (d). Del mismo modo, todos los pasos discutidos
ii Para un inglés (LP) dañado de baja resolución, anteriormente también se han aplicado en las placas de matrícula en inglés.
el sistema propuesto logra una precisión del 94,27%. Algunos Sin embargo, en este caso,
ejemplos de tales corrupciones (letras discontinuas o invisibles,
variación de iluminación y oscurecimiento).
FIGURA 5. ( a) Imagen RGB, (b) Cambiar el tamaño de la imagen, (c) Imagen en escala de grises, (d)
Imagen de contraste, (e) Filtros medianos, (f) Detectores de borde Sobel, (g) Dilatación, (h) Imagen llena,
(i ) Erosión, (j) Eliminar objetos no deseados.
(iv) puede haber más de un área candidata para la ubicación (LP), por lo que la eliminación de
objetos no deseados se ha aplicado como se muestra en la Fig. 4 (j), y la similitud de todos los
FIGURA 4. ( a) Imagen RGB, (b) Imagen de corte y redimensionamiento, (c) Imagen de escala de grises, (d)
verificadores básicos para garantizar que la región de la placa sea correcta y
Imagen de contraste, (e) Filtros medianos, (f) Detectores de borde Sobel, (g) Dilatación, (h) Imagen rellena, (i) rechazar las regiones indeseables. Estos pasos se enumeran a continuación
Erosión, (j) Eliminación de objetos no deseados.
[18]:
apropiados como se muestra en la Fig. 4 (f). (iii) aplique operaciones morfológicas Compruebe si (a < altura / ancho de la región de éxito < si).
(dilatación y erosión de la imagen) para aislar la placa del fondo. La dilatación se usa Mientras que los valores de los parámetros (a, b) dependen de las dimensiones
para aumentar el grosor del límite para evitar problemas de líneas discontinuas, la de la matrícula (LP). El algoritmo 1 explica brevemente los criterios de detección
dilatación hace que los objetos sean más grandes a medida que cada píxel de fondo se (LP) con las dos fichas. Tenga en cuenta que si la región detectada no se ha
transfiere a un píxel de objeto como se muestra en la Fig. 4 (g). Además, todos los considerado como una placa, entonces comenzamos el procedimiento de detección
agujeros se han llenado como se muestra en la Fig. 4 (h). La erosión utilizada para desde su primer paso. Sin embargo, en lugar de utilizar una imagen en escala de
asignar las regiones de placa candidatas mediante el uso de elementos de estructura grises contrastada, utilizamos una imagen en color de canal verde [20]. El canal
cuadrada como se muestra en la Fig. 4 (i). Finalmente, verde proporciona suficiente contraste para la imagen, también desenfocamos la
imagen para suavizar los bordes (LP) y
Calcular longitud, ancho para cada región que se detectaría y calcular la relación (longitud /
ancho).
Si suma de píxeles blancos = (+ 5% o -5%) como tolerancia para el área de estas regiones. la región se analizaría en el modo de escala de grises para reconocer letras
Leer Proxima linea. y números en (LP).
Si a <( largo / ancho) < si
Cosecha imagen y guárdelo. Más
A. IMAGEN NEUTROSÓFICA
Carga ruta de la imagen y recortar y cambiar el tamaño de la imagen. El análisis de neutrosofía se ha utilizado para estimar la indeterminación
Aplicar imagen de canal verde en lugar de imagen de canal en escala de grises e imagen borrosa. Probado (incertidumbre) en el conjunto de datos de imagen. Conjuntos de pertenencia que
= verdadero contienen un cierto grado de falsedad (F), indeterminación (I) y verdad (T). Estas
funciones de membresía se aplican para asignar la imagen de entrada al dominio
Final interior si
(NS), lo que resulta en la imagen (NS) ( UNA NS). Entonces, para la imagen, el píxel
Final exterior si
A (x, y) se define como UNA NS ( x, y) = A (t, i, f) = {T (x, y), I (x, y), F (x, y)} para el
dominio (NS) que da la pertenencia verdadera, indeterminada y falsa al conjunto
de píxeles brillantes. Suponga que A (x, y) demuestra el valor de intensidad del
reduce el ruído. La figura 6 explica todo el algoritmo de localización de
píxel (x, y), y Hacha, y) indicado a su valor medio local, las funciones de membresía
matrículas.
se pueden representar de la siguiente manera [21] - [24].
la indeterminación de UNA NS ( x, y). La entropía de la imagen (NS) representa donde 'b' expresa el tamaño del filtro promedio, que se establece como b = 3
como, la suma de entropías de los tres conjuntos T, para producir la imagen del conjunto neutrosófico (NS), el valor absoluto de la
F e I, que reflejan la distribución de elementos en el dominio (NS), que se varianza entre la intensidad media y su valor medio de la intensidad media, se
representaría de la siguiente manera: expresa mediante
δ T ( X, y) La entropía de I aumenta al obtener una distribución uniforme de los
mi NS = mi T + mi I + mi F, (6) elementos, donde el α valor en el α- mean ha sido optimizado mediante el uso
Las probabilidades de los elementos en las tres funciones de membresía están JAC (f, q) = A rf ∩ UNA rq (19)
UNA rf ∪ UNA rq,
representadas por ( PAGS T ( i), P YO ( i), P F ( yo)). Además, las desviaciones en F y T
crean la distribución de elementos en la imagen, y la entropía de I para hacer que F dónde, UNA rf es la región segmentada computarizada (LP)
y T se correlacionen con I. utilizando el sistema propuesto (ONKM), y UNA rq es la región de la verdad
fundamental (LP) como se discute en el algoritmo 3. La Fig. 10 ilustra el diagrama de
flujo del algoritmo de segmentación de caracteres de la placa de matrícula (ONKM)
1) α- MEDIO DE IMAGEN NEUTROSÓFICA para obtener ( α óptimo). Para lograr el máximo de coeficiente (JAC) con algoritmo
La operación media local para una imagen de nivel de gris A es [25]: genético, aplicamos la ecuación. (20)
x + si 2 y + si 2
∑ ∑
Hacha, y) = 1 A.m, norte), (10) F (f, q) = 1 - JAC (f, q), (20)
si ∗ si
m = x - si 2 n = j - si 2
C. K-MEDIA CLUSTERING UTILIZANDO
Los ( α- media) operación para imagen neutrosófica UNA NS es OPTIMIZADO ( α- MEDIA)
re j
∑ ∑ ∥∥ W yo - Z j ∥∥,
Yo < α
T ( α) = { T (12) O=q (21)
T α, yo ≥ α
j=1 i=1
FIGURA 8. ( a) Placa detectada, (b) Placa gris, (c) Imagen de verdad, (d) Imagen de indeterminación, (e) Imagen falsa, (f) Imagen de última verdad, (g) Última imagen de indeterminación, (h) Última imagen falsa, (i) Imagen
K-mean, (j) Imagen de verdad del terreno, (k) Imagen de salida de optimización genética, (l) Imagen después de aplicar (CCLA).
FIGURA 9. ( a) Placa detectada, (b) Placa gris, (c) Imagen de verdad, (d) Imagen de indeterminación, (e) Imagen falsa, (f) Imagen de última verdad, (g) Última imagen de indeterminación, (h) Última imagen falsa, (i) Imagen
K-mean, (j) Imagen de verdad del terreno, (k) Imagen de salida de optimización genética, (l) Imagen después de aplicar (CCLA).
Algoritmo 3 Extracción de la verdad del terreno Aquí aplicamos el agrupamiento k-means para el optimizado (NS) al subconjunto ( T)
Algoritmo 4 Segmentación
Entrada: Imagen de matrícula.
Pasos:
cada imagen.
Obtener valor absoluto entre imagen gris y valor medio local de imagen gris según ecuación ( 4 4 ) && obteniendo min, max de valor absoluto.
Segmento última imagen verdadera que logra la condición de bucle con umbral (alfa).
Otra repetición
mientras finaliza el bucle
C: algoritmo genético
Aplicando el (GA) para buscar α óptimo a través del rango especificado que alcanza el valor más alto de jaccard, que se usa para medir la similitud entre 2
conjuntos, y es la función de ajuste de acuerdo con ecuación ( 19 ), (20).
Fase de verificación
Calcular ( NS) para la imagen de prueba usando α óptimo sin usar (GA).
Mapa la imagen de prueba en el conjunto optimizado - (NS).
Grupo y segmento los píxeles usando k –medios según ecuación ( 23 )
D: Análisis de etiqueta de componente conectado
En la técnica de correspondencia, utilizamos el método estadístico de correlación cruzada VI. RESULTADOS EXPERIMENTALES Y DISCUSIÓN
[37]. Se han utilizado experimentos con MAT LAB R2016b, procesador corei5 y (4
Dado que había dos imágenes (imagen de base de datos conocida e imagen de entrada) GB de RAM). El sistema propuesto se ha utilizado de acuerdo con 250
en este sistema. Correlación cruzada considerada como imágenes con un tamaño de (5152 ×
F 1 ( j, k) para 1 ≤ j ≤ J y F 2 ( j, k) para 1 ≤ k ≤ K expresa aproximadamente dos imágenes 3864) píxeles para egipcio (LP) y 500 imágenes con un tamaño de (640 × 480)
discretas que indican la imagen que se va a encuestar y la plantilla, respectivamente. La píxeles para inglés (LP). Además, hemos registrado los resultados de acuerdo con
correlación cruzada normalizada entre el par de imágenes se expresa como Eq. (24), algunas degradaciones de la imagen, como placas sucias, placas de iluminación
como se muestra en la parte inferior de la página siguiente. La figura 11 resume los no uniformes, imágenes ruidosas, imágenes borrosas e imágenes oscuras. Se
pasos principales para la etapa de reconocimiento. han tomado imágenes de ambas direcciones de vehículos (adelante y
TABLA 2. Mediciones de rendimiento promedio utilizando (NS + K-means) con δ = 0.001, para matrículas egipcias.
hacia atrás). Las imágenes egipcias (LP) se separaron con la distancia (2 a 3 m) de y falso negativo (FN) [38], [39]. yo) TP: píxeles correctamente segmentados como la
los vehículos. Capturamos imágenes de prueba egipcias (LP) con una cámara columna vertebral en la verdad y el algoritmo que usamos. ii) TENNESSE: píxeles no
digital (NIKON D5200) con resolución del sensor (24 MP CMOS), y capturaron representados como la columna vertebral en la verdad básica y por el algoritmo que
imágenes de prueba en inglés (LP) con una cámara digital (OLYMPUS CA MEDIA utilizamos. iii) FP:
C-2040 ZOOM) con resolución del sensor (2 MP CMOS). Las imágenes se han los píxeles no se representan como la columna vertebral en la verdad básica, pero se
recopilado como una base de datos de muchos lugares como parques, representan como la columna vertebral mediante el algoritmo que usamos (falsamente
campamentos y calles, la Tabla 1 ilustra una muestra del resultado general del segmentado). iv) FN: píxeles representados como la columna vertebral en la verdad básica,
sistema. pero no representados como la columna vertebral por el algoritmo que utilizamos.
1) MEDIDAS CLÁSICAS
∑ ∑
F 1 ( j, k) F 2 ( j - m + (M + 1) / 2, K - n + (N + 1) / 2)
j k
R (m, n) = (24)
[∑ [∑ ] 12
∑ ∣∣ F 1 ( j, k) 2 ∣∣] 1 2 ∑
El | F 2 ( j - m + (M + 1) / 2, K - n + (N + 1) / 2) | 2
J K j k
TABLA 3. Mediciones de rendimiento promedio utilizando (NS + K-means) con δ = 0.001, para matrículas inglesas.
CUADRO 4. Mediciones de rendimiento promedio utilizando (NS + K-means + algoritmo genético) con δ = 0.001, para matrículas egipcias.
CUADRO 5. Mediciones de rendimiento promedio utilizando (NS + K-means + algoritmo genético) con δ = 0.001, para matrículas inglesas.
CUADRO 6. Mediciones de rendimiento promedio utilizando (NS + K-means) con δ = 0.05, para matrículas egipcias.
(si) Sensibilidad: determine los píxeles positivos en la verdad básica, que se (C) Ciudad específica: determine los píxeles negativos en la verdad básica, también
especifican como positivos por el algoritmo que se estima. La sensibilidad se puede especificados como negativos por el algoritmo que se estima. Esta métrica está determinada
CUADRO 7. Mediciones de rendimiento promedio utilizando (NS + K-means) con δ = 0.05, para matrículas inglesas.
CUADRO 8. Mediciones de rendimiento promedio utilizando (NS + K-means + algoritmo genético) con δ = 0.05, para matrículas egipcias.
CUADRO 9. Mediciones de rendimiento promedio utilizando (NS + K-means + algoritmo genético) con δ = 0.05, para matrículas inglesas.
2) MATRICES DE SIMILITUD O
(una) Coeficiente de dados (DC): determina el rango de la superposición espacial entre
JAC (f, q) = DC (29)
dos imágenes binarias. Los valores (DC) oscilan entre 0, es decir (sin superposición) y 1, es 2 - DC
decir, (Compacto ideal al 100%), los valores (DC) se calculan utilizando la ecuación. ( 28 )
Estudio de caso (1): Estudio comparativo entre (NS + k - medias) y (NS +
k-medias + Algoritmo genético) para matrículas egipcias e inglesas, al utilizar
∣∣ las métricas de valoración comparamos el rendimiento con δ = 0.001 y δ = 0,05
como umbral de (NS). Los resultados se ilustran en la Tabla 2, Tabla 3,
DC (f, q) = 2 ∣∣ UNA rf∣∣∩ UNA
UNA∣∣rfrq+ ∣∣ UNA rq ∣∣, (28)
Tabla 4 y Tabla 5, Tabla 6, Tabla 7, Tabla 8 y Tabla 9.
(si) Coeficiente de Jaccard (JAC): Se utiliza para medir la similitud entre dos Tenga en cuenta que la base de datos de placas egipcias se ha capturado con
imágenes binarias. Se puede representar como se muestra en la ecuación. ( 29 ) una cámara digital (NIKON D5200) con un tamaño de (5152 × 3864) píxeles y
resolución (24 mega píxeles). Sin embargo, la base de datos de matrículas en
inglés se capturó utilizando una cámara digital (OLYMPUS CAMEDIA
∣∣
C-2040ZOOM) con un tamaño de (640 × 480) píxeles y resolución (2 mega
JAC (f, q) = ∣∣ UNA rf ∩ UNA rq ∣∣, píxeles).
∣∣ UNA rf ∪ UNA rq
CUADRO 10. Mejor valor de función con cada generación del conjunto de entrenamiento para matrícula
egipcia.
CUADRO 11. El mejor valor de función con cada generación del conjunto de entrenamiento para placas de
inglés. FIGURA 12. Resultados de iteración de GA durante generaciones para placas egipcias.
La operación de iteración de la GA en la Fig. 12, Fig. 13 demuestra el 4) Agregar ruido periódico: este tipo de degradación tiene una
mejor y el valor medio de ajuste del umbral de segmentación de caracteres efecto grande, y es difícil eliminar o reducir su efecto utilizando
para las placas. métodos de limpieza tradicionales.
Estudio de caso (2): 5) Oscurecer la imagen: disminuir la intensidad de cada píxel en
Estudio comparativo entre (métodos tradicionales) y (NS + k-significa imagen.
+ Algoritmo genético en δ = 0,05), en casos críticos [40] como: 6) Imagen borrosa: esta es la distorsión en la imagen
debido al movimiento de la cámara o fuera de foco. Como mencionamos
1) Agregar sal y ruido de papel: también, llamado ruido binario, anteriormente, la mayoría de los investigadores han presentado algunas técnicas
ruido de disparo y ruido de impulso. Por perturbaciones repentinas tradicionales para placas de matrícula (LP)
CUADRO 12. Estudio comparativo entre (Métodos tradicionales) y (NS + k-means + Algoritmo genético), al agregar sal y ruido de papel.
CUADRO 13. Estudio comparativo entre (Métodos tradicionales) y (NS + k-means + Algoritmo genético), cuando se agrega ruido gaussiano blanco.
CUADRO 14. Estudio comparativo entre (Métodos tradicionales) y (NS + k-means + Algoritmo genético), cuando se agrega ruido moteado.
CUADRO 15. Estudio comparativo entre (métodos tradicionales) y (NS + k-means + algoritmo genético), al agregar ruido periódico.
CUADRO 16. Estudio comparativo entre (Métodos tradicionales) y (NS + k-means + Algoritmo genético), cuando se reduce el brillo de la imagen.
CUADRO 17. Estudio comparativo entre (métodos tradicionales) y (NS + k-means + algoritmo genético), al difuminar la imagen.
FIGURA 15. Sistema propuesto para sal y ruido de papel. eso sería necesario para eliminar objetos ruidosos y finalmente aplicar el análisis de
etiquetado de componentes conectados (CCLA) que escanea imágenes de prueba y
agrupa los píxeles apropiados en componentes etiquetados de acuerdo con la
conectividad de píxeles.
Hemos ilustrado un estudio comparativo entre (métodos tradicionales) y
(sistema propuesto (NS + k-means + algoritmo genético)) en δ = 0.05, y sus
resultados relacionados con las imágenes de verdad del terreno
correspondientes.
Mesa (12), hemos agregado ruido de sal y papel con (varianza = 0.09),
esto afecta aproximadamente al 9% de los píxeles. Hemos notado que el
método tradicional introduce una superposición obvia entre letras y
números en egipcio (LP), y poca superposición en inglés (LP). Sin
FIGURA 16. Métodos tradicionales para el ruido gaussiano. embargo, la metodología introducida ha logrado detectar cada letra y
número.
reconocimiento [41], [4], como convertir imágenes en escala de grises en imágenes
binarias mediante el uso de técnicas de umbral simple o doble [42], aplicando una Mesa (13), hemos agregado ruido gaussiano blanco con (media = 0.09) y
máscara de filtro como (sobel, canny, prewitt) para encontrar los bordes. Para la mayoría (varianza = 0.01), hemos notado que el método tradicional introduce una
de los sistemas de reconocimiento de patrones, algunos investigadores han utilizado superposición obvia entre letras y números y elimina algunos píxeles como el
operaciones morfológicas como la erosión y la dilatación, que son procesos importantes. punto de la primera letra en egipcio (LP), y tenemos un error para detectar
letras en
Mesa (17), ilustrado cuando desenfocamos la imagen, hemos notado La figura 19 ilustra que, el promedio (precisión, sensibilidad, especificidad,
que el método tradicional introduce una superposición obvia entre letras y dados, jaccard) fue eso (92.24%, 89.34%, 94.60%,
números para egipcio (LP), y no pudo detectar ninguna letra para inglés 91.85%, 85.02%), respectivamente para el sistema propuesto. En caso de
(LP). Sin embargo, la metodología introducida ha logrado detectar cada agregar ruido periódico para las imágenes, la Fig.20 ilustra que, promedio
letra y número. (precisión, sensibilidad, especificidad, dados, jaccard) fue eso (63.35%, 64.73%,
63.93%, 60.77%,
Hemos calculado los principales índices de rendimiento sobre las 250 44,40%), respectivamente para el método tradicional. La figura 21 ilustra que,
imágenes de matrículas egipcias para las técnicas tradicionales y el sistema de promedio (precisión, sensibilidad, especificidad, dados, jaccard) fue eso
interés propuesto. Del mismo modo, los mismos pasos se pueden aplicar a más (90.43%, 86.05%, 94.20%,
de 500 imágenes de matrículas en inglés. Se han utilizado y notado los 89,38%, 81,4%), respectivamente para el sistema propuesto. En caso de
siguientes estudios de caso: reducir el brillo de las imágenes, la Fig. 22 ilustra que el promedio
(precisión, sensibilidad, especificidad, dados, jaccard) fue (71.05%,
En caso de agregar sal y ruido de papel para las imágenes, la Fig. 14 ilustra 99.83%, 38.58%, 77.7%,
ese promedio (precisión, sensibilidad, especificidad, 64,21%), respectivamente, para el método tradicional.
Construimos nuestra base de datos utilizando la base de datos de acceso de Microsoft conectada
FIGURA 25. Sistema propuesto para desenfocar la imagen. Las siguientes tablas (20 y 21) ilustran un estudio de comparación
concluido entre nuestro sistema propuesto y algunos trabajos de interés
La figura 23 ilustra que, el promedio (precisión, sensibilidad, especificidad, relacionados. Hemos observado que la metodología propuesta tiene la
dados, jaccard) fue eso (95.18%, 95.04%, 95.32%, capacidad de mejorar y reconocer con éxito tanto los caracteres como los
94,99%, 90,55%), respectivamente para el sistema propuesto. En el caso de números de matrícula (árabe e inglés) (alta resolución-baja resolución) con una
imágenes borrosas, la Fig. 24 ilustra que el promedio (precisión, sensibilidad, precisión de reconocimiento muy alta y un tiempo de cálculo bajo en
especificidad, dados, jaccard) fue (86.19%, 80.81%, 89.45%, 84.74%, 73.89%), comparación con el trabajo relacionado.
respectivamente, para el método tradicional.
Para evaluar la precisión del método propuesto para diferentes variaciones de LP en
La figura 25 ilustra que, promedio (precisión, sensibilidad, especificidad, conjuntos de datos de referencia populares y disponibles al público [43], hemos utilizado
dados, jaccard) fue eso (90.40%, 90.27%, 90.65%, el conjunto de datos de LP de referencia de Media Lab [44] y los conjuntos de datos de
91.59%, 84.53%), respectivamente para el sistema propuesto. El sistema propuesto tiene LP de referencia de AOLP [45]. Hemos agregado algunos estudios de caso importantes
como objetivo un alto grado de precisión de reconocimiento con la presencia de algunas y críticos según el conjunto de datos LP de referencia de Media Lab como se muestra
corrupciones de imagen externas como se muestra en la Tabla 18. en la Tabla 22, y también los conjuntos de datos LP de referencia de AOLP como se
muestra en la Tabla 23. Las dos tablas presentan la precisión de detección con la
Por otro lado, el sistema propuesto adolece de algunos problemas de detección y presencia de imagen LP crítica degradaciones Además, el tiempo promedio para los
reconocimiento en el caso de sombras de imágenes muy pesadas y placas dañadas, cálculos de la
como se muestra en la Tabla 19.
FIGURA 27. La interfaz gráfica de usuario (GUI) para el reconocimiento de caracteres con MATLAB 2016b.
El método de reconocimiento de LP propuesto en ambos puntos de referencia fue de Las Tablas discutidas anteriormente (22 y 23) han evaluado nuestro método
aproximadamente 1.688535 segundos. Todos los experimentos se han utilizado con MATLAB propuesto para diferentes variaciones de LP en conjuntos de datos de referencia
R2016b, procesador corei5 y (4 GB de RAM). populares y disponibles públicamente, como
'' Conjunto de datos LP de referencia de Media Lab '' y '' Conjuntos de datos LP Hemos medido tanto el MSE como el PSNR [46] - [49] de acuerdo con la
de referencia de AOLP. Hemos notado que la metodología propuesta tiene la ecuación. (30, 31)
capacidad de mejorar y reconocer las placas en diferentes va Riaciones. Licencia Los
∑ ∑norte ∣∣ X ij - y ij ∣∣ 2,
caracteres y números de la placa se han utilizado con éxito con alta precisión de MSE = METRO (30)
reconocimiento y bajo tiempo de cálculo. Sin embargo, las imágenes con mucho i=1 j=1
sombreado han sufrido algún tipo de precisión degra dacion (aproximadamente [ max 2 ]
Además, la calidad de reconocimiento de extremo a extremo, el tiempo de donde max es un valor de intensidad máxima en una imagen, mientras que M y N son
cálculo promedio, el error cuadrático medio (MSE) y la relación pico señal / ruido altura y anchura, respectivamente, de una imagen. X ij es la imagen original y y ij Es la
(PSNR) se han utilizado y discutido brevemente en la Tabla 24. imagen final.
La Tabla 24 ilustra que ambos valores de PSNR y MSE son lo suficientemente
PSNR se ha utilizado como medida de calidad para medir la calidad buenos en comparación con las nuevas técnicas de reconocimiento de aprendizaje
entre la imagen original y la imagen final. profundo [50] - [54].
VIII CONCLUSIÓN [12] N. Rana y PK Dahiya, '' Técnicas de localización en sistemas ANPR:
A-state-of-art '' En t. J. Adv. Res. Comput Sci. Softw. Ing., vol. 7, no. 5, págs. 682-686, mayo de
Este documento propone una nueva metodología para mejorar la precisión de
2017.
reconocimiento de las matrículas (árabe-Egipto) e inglés. Hemos introducido la [13] N. Vidhya y SG Sundari, '' Una encuesta sobre localización y reconocimiento de
segmentación y extracción de caracteres con el sistema (ONKM) de acuerdo con numero de licencia,'' En t. J. Advance Comput. Ing. Netw., vol. 3, no. 2, págs. 49–52, febrero de 2015.
[14] Detección de placa de matrícula, reconocimiento y almacenamiento automatizado.
el algoritmo genético. El análisis de etiquetado de componentes conectados se ha
aplicado para garantizar una coincidencia de plantilla exitosa. Acceso: 19 de octubre de 2019. [En línea]. Disponible en: http://www.zemris.fer.hr/ projects /
LicensePlates / english / results.shtml [15] HZ Nafchi, A. Shahkolaei, R. Hedjam y M. Cheriet, ''
El sistema propuesto ofrece una detección exitosa con un reconocimiento CorrC2G: Color
a conversión gris por correlación '' Proceso de señalización IEEE. Letón., vol. 24, no. 11, págs. 1651–1655,
preciso en las placas de matrícula árabe e inglesa. Se ha introducido un estudio
noviembre de 2017.
de comparación completo entre el sistema propuesto y las técnicas tradicionales [16] R. Hedjam, HZ Nafchi, M. Kalacska y M. Cheriet, '' Influencia de
conversión de color a gris en el rendimiento de la binarización de la imagen del documento: hacia un
de acuerdo con los índices de rendimiento estándar. La metodología propuesta
nuevo problema de optimización '' IEEE Trans. Proceso de imagen.
ofrece una alta tasa de precisión de reconocimiento (LP) en presencia de algunas
vol. 24, no. 11, págs. 3637–3651, noviembre de 2015. [17] J. Kim y S. Lee, '' Extracción de líneas principales
degradaciones de imagen populares. La extensión de nuestro trabajo tiene como mediante el reclutamiento de umbral cero
enlaces de borde caninos a lo largo de Sobel '' Proceso de señalización IEEE. Letón.,
objetivo implementar el conjunto neutrosófico de acuerdo con más técnicas de
vol. 22, no. 10, págs. 1689–1692, octubre de 2015. [18] MA Massoud, M. Sabee, M. Gergais y
optimización, como enjambre de partículas, colonia de hormigas, enjambre de
R. Bakhit, '' Nuevo automatizado
gallinas y técnicas difusas. Además, se incluiría más interrupción y variación de la reconocimiento de matrículas en Egipto '' Alexandria Eng. J. vol. 52, no. 3, págs. 319–326, septiembre de
imagen para tener un amplio criterio de toma de decisiones para el mejor 2013.
[19] BR Mohamed, HMA El Kader, HM Rafaat y MS Sharaf,
optimizador.
'' Reconocimiento automático de matrículas '' En t. J. Sci. Res. Publicaciones, vol. 3, no. 12, págs. 1-7, diciembre
de 2013.
CUMPLIMIENTO DE LAS NORMAS ÉTICAS [21] SF Ali, H. El Ghawalby y AA Salama, '' De imagen a neutrosófica
imagen '' en Conjuntos y sistemas neutrosóficos. Port Fuad, Egipto: Port Said Univ., Facultad
Conflicto de intereses: Los autores declaran que no hay conflicto de intereses
de Ciencias, Departamento de Matemáticas e Informática, abril de 2015, págs. 1-13.
con respecto al manuscrito.
[22] D. Koundal, '' Segmentación de imagen basada en texturas usando clúster neutrosófico
tering '' Proceso de imagen IET. vol. 11, no. 8, págs. 640–645, agosto de 2017. [23] Y. Guo y HD
Referencias Cheng, '' Nuevo enfoque neutrosófico para segmentar imágenes
[1] H. Hu, Z. Zhang e Y. Bai, '' Ubicación de la matrícula del automóvil basada en tation '' Reconocimiento de patrones. vol. 42, no. 5, págs. 587–595, mayo de 2009. [24] Y.
morfología matemática '' en Avances recientes en informática e ingeniería de la información, vol. Dong, H. Zhang, Z. Liu, C. Yang, G.-S. Xie, L. Zheng y
128. Berlín, Alemania: Springer, enero de 2012, págs. 415–420. L. Wang, `` Factorización de matriz de transformación de conjuntos neutrosóficos basada en contornos
activos para segmentación de textura de color '' Acceso IEEE, vol. 7, págs. 93887–93897, julio de 2019.
y reconocimiento utilizando el método de cuadro delimitador '' en Proc. En t. Conf. Adv. Commun. Control de etiquetado de componentes conectados '' IEEE Trans. Proceso de imagen. vol. 23, no. 2, págs. 943–951,
Computación. Technol. (ICACCCT), Mayo de 2016, págs. 106-110. febrero de 2014.
[36] D. Gilly y K. Raimond, '' Reconocimiento de matrículas: una coincidencia de plantilla BEDIR BEDIR YOUSIF recibió el B.Sc. Licenciado en ingeniería
método ing '' En t. J. Eng. Res. Appl., vol. 3, no. 2, págs. 1240-1245, marzo / abril. 2013 electrónica por la Facultad de Ingeniería Electrónica, Menou fi a
University, Egipto, en 1999, y el M.Sc. y Ph.D. grados del
[37] B. Dhanalakshmi, G. Yogasri y M. Mohanapriya, '' Mejora de la precisión Departamento de Ingeniería Electrónica y de Comunicaciones,
del sistema de reconocimiento automático de matrículas de vehículos con algoritmo de coincidencia de
Facultad de Ingeniería, Universidad de Mansoura, Mansoura,
plantillas '' En t. Res. J. Eng. Technol. (IRJET) vol. 5, no. 2, págs. 1-4, febrero de 2018.
Egipto, en 2006 y 2013, respectivamente. Actualmente es
profesor asociado del Departamento de Ingeniería Electrónica y
[38] M. Vania, D. Mureja y D. Lee, '' Segmentación automática de la columna vertebral
Comunicaciones, Facultad de
Imágenes de TC que utilizan redes neuronales convolucionales a través de la generación redundante de etiquetas
de clase ''. J. Comput. Des. Ing., vol. 6, no. 2, págs. 224–232, abril de 2019. [39] DS Prabha y JS Kumar, '' Evaluación
[40] P. Singh y R. Shree, '' Un estudio comparativo de los modelos de ruido y la imagen. nanoelectrónica y antenas. Sus intereses de investigación y enseñanza incluyen las áreas de
técnicas de restauración '' En t. J. Comput. Appl., vol. 149, no. 1, págs. 18–27, septiembre de 2016. comunicaciones ópticas inalámbricas, el modelado de dispositivos electromagnéticos,
nanoelectrónica, dispositivos ópticos y comunicaciones ópticas.
[41] AM Al-Ghaili, S. Mashohor, AR Ramli y A. Ismail, '' Vertical-edge-
método de detección basado en matrículas de automóviles '' IEEE Trans. Veh. Technol.,
vol. 62, no. 1, págs. 26–38, enero de 2013.
MOHAMED MAHER ATA recibió el Ph.D. Licenciado en el
[42] CNE Anagnostopoulos, IE Anagnostopoulos e ID Psoroulas,
Departamento de Comunicación Eléctrica y Electrónica,
'' Reconocimiento de matrículas de imágenes fijas y secuencias de video: una encuesta '' IEEE
Facultad de Ingeniería, Universidad de Tanta, Egipto, con la
Trans. Intell. Transp. Syst. vol. 9, no. 3, págs. 377–391, septiembre de 2008.
cooperación de la Universidad de Regina, Canadá. Actualmente
[43] NR Soora y PS Deshpande, '' Color, escala y rotación independientes es profesor asistente en el Instituto Superior de Ingeniería y
detección de múltiples placas en videos e imágenes fijas '' Matemáticas. Problemas Ing., vol. 2016, Tecnología de MISR, Mansoura, Egipto. Ha publicado muchos
págs. 1-14, junio de 2016. artículos de investigación indexados (SJR indexado-ISI
[44] Acceso: 8 de enero de 2020. [En línea]. Disponible: http: //www.medialab.ntua. indexado) en el estado del arte de la ingeniería biomédica,
gr / research / LPRdatabase.html astrofísica,
[45] G.-S. Hsu, J.-C. Chen y Y.-Z. Chung, '' Licencia orientada a aplicaciones
reconocimiento de placa '' IEEE Trans. Veh. Technol., vol. 62, no. 2, págs. 552–561, febrero de 2013. Comunicación eléctrica, bioinformática, encriptación, cifrado y sistemas inteligentes de transporte (ITS). Su
área de interés de investigación se utilizó en el campo del procesamiento de señales, procesamiento de
[46] B. Balamurugan y S. Dinesh, '' Reconocimiento avanzado de matrículas utilizando
imágenes, multimedia, aprendizaje automático, procesamiento de video y visión por computadora.
red neuronal '' En t. J. Adv. Res. Electrón. Commun. Ing. (IJARECE),
vol. 3, no. 12, págs. 1-4, diciembre de 2014.
características de caracteres empleados para el reconocimiento de matrículas de vehículos '', en Proc. En t. Conf.
Comunicaciones Inalámbricas, Proceso de Señal. Netw. (WiSPNET), Marzo de 2017, págs. 864–869.
[50] S.-L. Chang, L.-S. Chen, Y.-C. Chung y S.-W. Chen, '' Automático
reconocimiento de matrícula '' IEEE Trans. Intell. Transp. Syst. vol. 5, no. 1, págs. 42–53, marzo de MARWA OBAYA recibió el B.Sc. Licenciado en ingeniería electrónica y de comunicaciones por la
2004. Facultad de Ingeniería de la Universidad de Mansoura, Mansoura, Egipto, en 2001, y el M.Sc. y
[51] MK Hossen, AC Roy, SA Chowdhury, S. Islam y K. Deb '' Licencia
Ph.D. grados del Departamento de Ingeniería Electrónica y de Comunicaciones, Facultad de
sistema de detección y reconocimiento de placas basado en el enfoque morfológico y la red
Ingeniería, Universidad de Mansoura, en 2005 y 2008, respectivamente. Actualmente es
neuronal de alimentación '' IJCSNS Int. J. Comput. Sci. Netw. Secur. vol. 18, no. 5, págs. 36–46,
profesora asociada del Departamento de Ingeniería Electrónica y Comunicaciones, Facultad de
mayo de 2018.
Ingeniería, Universidad de Mansoura, Egipto. También es Directora del Programa de Ingeniería
[52] P. Shivakumara, D. Tang, M. Asadzadehkaljahi, T. Lu, U. Pal y
de Comunicaciones, Departamento de Ingeniería Eléctrica, Universidad Princesa Nora Bint
MH Anisi, '' Método basado en CNN-RNN para el reconocimiento de matrículas ''
Abdurrahman, Riad, Arabia Saudita. Tiene varias publicaciones en ingeniería biomédica,
CAAI Trans. Intell. Technol., vol. 3, no. 3, págs. 169-175, septiembre de 2018. [53] X. Zhai, F.
Bensaali y R. Sotudeh, '' Red neuronal basada en OCR para optimización y aprendizaje automático inteligente. Su área de interés de investigación se utilizó
ANPR '' en Proc. IEEE Int. Conf. Imag. Syst. Techn. Proc. Julio de 2012, págs. 393–397. en el campo del procesamiento de imágenes, procesamiento de señales,
[54] H. Li, P. Wang y C. Shen, '' Hacia una placa de matrícula de extremo a extremo
detección y reconocimiento con redes neuronales profundas '' IEEE Trans. Intell. Transp. Syst. vol. 20,
no. 3, págs. 1126–1136, marzo de 2019.