Está en la página 1de 14

Captulo 4 .

- Reconocimiento de imgenes

Captulo 4




Reconocimiento de imgenes

En la actualidad, el reconocimiento de imgenes es una herramienta de gran utilidad en el
rea de control y automatizacin. Varias empresas usan el reconocimiento de imgenes en
procesos de control de calidad en donde intervienen defectos y seleccin de productos.
Realizar un buen reconocimiento de imgenes requiere de un complejo sistema de
procesamiento digital, que puede ser extremadamente difcil de implementar. De acuerdo
con el propsito de esta tesis, se emplea el reconocimiento de imgenes para la
determinacin de la posicin y ngulo relativos del espectador dentro del cuarto de pruebas.

Algunos programas como LabVIEW presentan herramientas de procesamiento de imgenes
que facilitan la creacin de aplicaciones inteligentes de visin y reconocimiento.


Pgina 41
Captulo 4 .- Reconocimiento de imgenes
4.1 IMAQ Vision en LabVIEW
IMAQ Vision es una nueva librara para LabVIEW que permite implementar aplicaciones
inteligentes de imagen y visin.
IMAQ Vision presenta herramientas complejas de procesamiento digital de imgenes como
los detectores de borde y reconocimiento de patrones complejos entre otros.
Dentro de las aplicaciones que se realizan en IMAQ Vision se tienen que tomar en cuenta
una serie de conceptos y de pasos para lograr un mejor desempeo en la elaboracin de
sistemas de reconocimiento de imgenes.

4.2 Deteccin de bordes
La deteccin de bordes es usada en las aplicaciones en donde se requiera identificar y
localizar discontinuidades en la intensidad de los pxeles de la imagen. A un borde se le
conoce como un cambio significante de valores en escala de grises entre los pxeles
adyacentes de una imagen.
El detector de bordes de IMAQ Vision trabaja usando un arreglo de una sola dimensin
como se muestra en la Figura 4.1.

Figura 4.1.- Ejemplo de deteccin de bordes. 1) Lneas de bsqueda, 2) bordes.
National Instruments Corporation
Pgina 42
Captulo 4 .- Reconocimiento de imgenes
El modelo a seguir para la deteccin de bordes se ilustra en la Figura 4.2. En esta figura se
puede distinguir la dimensin del borde ubicacin y la fuerza del borde a lo largo de los
valores lineales de pxeles en escala de grises [13].


Intensidad en
escala de grises
Direccin de
bsqueda

Figura 4.2.- Modelo de borde. 1) Valores en escala de grises, 2) Ancho de borde,
3) Fuerza de borde, 4) Ubicacin del borde.
National Instruments Corporation

La fuerza del borde define la diferencia mnima en escala de grises entre el fondo y el
borde. La fuerza de borde tambin se le conoce como contraste de borde, y esta puede
variar por condiciones de iluminacin o por diferencias en las caractersticas de la escala de
grises. Si la luz de iluminacin es baja, la fuerza de borde tiende a ser pequea y difcil de
detectar. Por otro lado la presencia de objetos brillantes hace que otros objetos en la imagen
aparezcan con poca intensidad.
En la Figura 4.3 se observa un objeto a diferentes contrastes de borde [13].
Pgina 43
Captulo 4 .- Reconocimiento de imgenes

Figura 4.3.- Contraste de borde a diferente iluminacin.
National Instruments Corporation

El mtodo usado en IMAQ Vision es simple. Primero se detecta una pendiente positiva en
la curva de escala de grises. Despus se localiza el centro del borde haciendo una media
entre el valor de pendiente positiva y el valor de pendiente negativa. El proceso se repite
para toda la lnea de bsqueda seleccionada. El mtodo simple de localizacin de bordes se
presenta en la Figura 4.4 [13].

Intensidad en
escala de grises

Direccin de
bsqueda
Figura 4.4.- Modelo simple de deteccin de bordes. 1) Valores, 2) Nivel mnimo,
3) Histresis, 4) Deteccin de subida, 5) Deteccin de bajada.
National Instruments Corporation
Pgina 44
Captulo 4 .- Reconocimiento de imgenes
4.3 Reconocimiento de patrones
El reconocimiento de patrones permite localizar regiones completas en escala de grises que
correspondan con la imagen patrn predeterminada.
La herramienta de reconocimiento de patrones de IMAQ funciona correctamente incluso
cuando la imagen se encuentra girada, escalada o cuando existen varias copias de la misma.
La Figura 4.5 muestra el patrn a reconocer (4.5 a), y los patrones localizados en diferentes
posiciones y escalamiento [13].

Figura 4.5.- Reconocimiento de patrones en diferentes posiciones.
National Instruments Corporation


Las variaciones de luz o la adicin de ruido a las imgenes a reconocer pueden presentar
dificultades al sistema de reconocimiento de patrones. An con estas variaciones, los
componentes de IMAQ Vision presentan una gran tolerancia y buen funcionamiento.

Tcnicas de reconocimiento de patrones
Dentro de las tcnicas tradicionales usadas para el reconocimiento de patrones se
encuentran la Normalized Cross Correlation, Pyramidal Matching y Scale-Invariant
Matching [13].

Pgina 45
Captulo 4 .- Reconocimiento de imgenes
1.- Cross Correlation (Correlacin Cruzada)
Es la manera ms usada para el reconocimiento de patrones. Este mtodo se basa en una
serie de multiplicaciones como se muestra en la ecuacin 4.1.

+ +

=

=

=
1
0
1
0
) , ( ) , ( ) , (
L
x
K
y
j y i x f y x w j i C
(4.1)
Considerando una subimagen w(x,y) de tamao K x L adentro de una imagen f(x,y) de
tamao M x N, en donde KM y LN. La correlacin entre w(x,y) y f(x,y), es C(i,j) [13].
De manera grfica, el proceso de correlacin se ilustra en la Figura 4.6.

Figura 4.6.- Procedimiento de correlacin.
National Instruments Corporation

La subimagen se recorre por toda la regin de bsqueda. El mximo valor de C(i,j) indica la
posicin que mejor se ajusta a la imagen patrn.
Pgina 46
Captulo 4 .- Reconocimiento de imgenes
Se puede reducir el tiempo de procesamiento si se reduce el tamao de la imagen patrn o
el tamao de bsqueda dentro de la imagen. Sin embargo, este mtodo no satisface la
velocidad requerida en varias de las aplicaciones.

2.- Piramidal Matching (Localizacin Piramidal)
A manera de reducir el tiempo de bsqueda presentado en la tcnica anterior, la
localizacin piramidal crea dos versiones comprimidas del patrn y del rea de bsqueda.
La compresin se basa en la reduccin del tamao hasta de cuatro veces el tamao original
de ambas imgenes. La correlacin primero se realiza en las imgenes reducidas y
posteriormente se analiza la imagen original pero slo en el rea en donde la primera
correlacin encontr el mximo.

3.- Scale Invariant Matching (Localizacin Invariante a la Escala)
Esta tcnica fue creada a partir de la necesidad de localizar patrones que se encuentran
escalados en tamao. Normalmente la correlacin cruzada puede detectar patrones del
mismo tamao variaciones de ngulo de 5 a 10. Crear una tcnica capaz de identificar
diferentes escalas y ngulos en una imagen resulta sumamente complejo.
Para este mtodo, se tiene que probar cada tamao y cada ngulo del patrn para efectuar la
correlacin cruzada. Esto requiere bastante tiempo de cmputo en el proceso de
localizacin.

Debido a que no se tienen pistas de la forma en que el patrn fue rotado, el sistema realiza
una bsqueda exhaustiva en ngulo y tamao lo que hace que esta tcnica no resulte til
para la mayora de las aplicaciones.
Pgina 47
Captulo 4 .- Reconocimiento de imgenes
Nuevas tcnicas de identificacin de patrones
Debido a las limitaciones de las tcnicas tradicionales de localizacin de patrones, IMAQ
Vision ha creado nuevas tcnicas que tratan de incorporar el entendimiento de la imagen.
Esto consiste en un tipo de procesamiento de imagen que genera cierta informacin del
patrn a reconocer. Estas tcnicas incluyen modelos geomtricos del patrn, muestreo
eficiente de imgenes no uniformes y la extraccin de la informacin del patrn invariante
en ngulo y escala.
Estas nuevas tcnicas crean patrones geomtricos bsicos que eliminan la informacin
redundante de las tcnicas tradicionales. En lugar de evaluar pxel por pxel, evalan
formas geomtricas simples. Esto hace que se reduzca el tiempo de cmputo del proceso de
localizacin de patrones complejos invariantes en ngulo y escala [13].

4.4 Preparacin del sistema de imgenes
Antes de capturar, analizar y procesar las imgenes que sern usadas en la aplicacin, se
debe de preparar el sistema de imgenes.
La manera en que se prepara el sistema de imgenes depende del tipo y del ambiente en el
que se desarrollar la aplicacin.
Los pasos a seguir para la preparacin del sistema de imgenes son los siguientes [14]:

1. Determinar las dimensiones del objeto y del lugar en donde se desarrollar la
aplicacin, tomando en cuenta las siguientes recomendaciones:
a. Asegurarse que el dispositivo de captura satisface las necesidades de
resolucin deseadas.
b. Asegurarse que el lente capture los objetos de inters con el foco requerido.
Pgina 48
Captulo 4 .- Reconocimiento de imgenes
c. Asegurarse que la iluminacin en el lugar de la aplicacin produce el
suficiente contraste entre el objeto y el fondo para su ptima localizacin.

2. Posicionar la cmara de manera que quede paralela con el objeto a inspeccionar, con
la intencin de reducir distorsin de perspectiva de la imagen.

3. Seleccionar el dispositivo de captura ptimo para la aplicacin e instalar los drivers
o controladores correspondientes.

En la Figura 4.7 se muestra el diagrama secuencial de los pasos necesarios para la creacin
de un sistema de imgenes.


Localizar los objetos deseados
Definir el rea de bsqueda
Encontrar los puntos de medicin
Convertir coordenadas en pxeles
a coordenadas del mundo real
Hacer las mediciones del objeto
Mostrar resultados

Figura 4.7.- Diagrama secuencial del sistema de reconocimiento de imgenes.
National Instruments Corporation


Pgina 49
Captulo 4 .- Reconocimiento de imgenes
4.5 Distorsin y Calibracin de la imagen
Despus de preparar el sistema de imgenes, se tiene que realizar un proceso de calibracin.
Este proceso es necesario en el caso que los resultados de salida del sistema se requieran en
un sistema de coordenadas del mundo real en lugar de coordenadas en pxeles.
Existen dos tipos de calibracin: La calibracin lineal sencilla y la calibracin de distorsin
no lineal.
El primer tipo de calibracin se refiere a un simple escalamiento lineal que relaciona a un
pxel con una unidad de medida real conocida.
En el segundo caso de calibracin, se toman en cuenta deformaciones causadas por
perspectivas o deformaciones provocadas por el tipo de lente usado.
Si la cmara est colocada de forma paralela al objeto que se desea inspeccionar, la
deformacin de perspectiva ser mnima, por o que una calibracin lineal ser ms que
suficiente para lograr un buen desempeo [14].

Los pasos a seguir para la calibracin de distorsin no lineal del sistema de imgenes son
los siguientes:

1. Definir una retcula de calibracin.
La intencin de definir una retcula de calibracin es la de tener un patrn de referencia
entre el nmero de pxeles y unidades estandarizadas como lo son los centmetros.
Capturando y analizando la imagen de la retcula en el sistema de visin, permite
corregir problemas de distorsin y perspectiva. La Figura 4.8 muestra el diseo de una
retcula de calibracin.
Pgina 50
Captulo 4 .- Reconocimiento de imgenes
El radio de los puntos en un sistema convencional es de unos 6 a 10 pxeles, mientras
que la distancia de centro a centro se encuentra alrededor de unos 18 a 32 pxeles [14].


Figura 4.8.- Retcula de calibracin.
1) Distancia centro a centro, 2) Centro de los puntos, 3) Distancia entre bordes
National Instruments Corporation



2. Definir la referencia del sistema de coordenadas.
Se usa el componente Calibration Axis Info para definir el sistema de coordenadas a
usar por el sistema como origen, ngulo y orientacin de los ejes que ms se adapte al
tipo de aplicacin que se est realizando. En la Figura 4.9 se observan las dos opciones
de orientacin de los ejes. El origen y el ngulo se establecen en alguno de los puntos
de la retcula de calibracin.

Figura 4.9.- Referencia y direccin del sistema de coordenadas.
National Instruments Corporation

3. Ensear al sistema la informacin de calibracin.
Pgina 51
Captulo 4 .- Reconocimiento de imgenes
Despus de ajustar todos los valores de calibracin y del sistema de coordenadas, el
programa tiene que procesar una imagen que contenga la retcula de calibracin para
que pueda definir que tipo de correccin se tiene que usar. En la Figura 4.10 se ilustran
los diferentes tipos de distorsin que se presentan en los sistemas de visin. La 4.10(a)
no tiene distorsin, la (b) distorsin trapezoidal y la (c) cilndrica.

Figura 4.10.- Tipos de distorsin de la imagen.
National Instruments Corporation



Para entender de manera ms clara el proceso de distorsin de las imgenes podemos
analizar la ilustracin de la Figura 4.11.

Figura 4.11.- 1) Distorsin del lente, 2) Error de perspectiva,
3) Conocida orientacin de corrimiento. a) Imagen sin distorsin.
National Instruments Corporation
Pgina 52
Captulo 4 .- Reconocimiento de imgenes
4.6 Diseo del patrn a reconocer

Se construy un arreglo de leds infrarrojos con el fin de que ste fuera la marca a localizar
en la imagen como se ilustra en la Figura 4.12.

Led rojo
Led infrarojo
Pilas AA
Switch ON/OFF
9cm
3cm

Figura 4.12.- Arreglo de leds infrarrojos armado.

Se realizaron varias pruebas de localizacin con este patrn de leds y los resultados no
fueron los deseados. Las marcas luminosas resultaron ser muy pequeas y con poca
intensidad. La deteccin del objeto era inestable e inexacta.

En lugar de usar las marcas luminosas, se pens en una simple flecha de papel en un fondo
oscuro creando un patrn de alto contraste. La imagen ahora no sera analizada a colores
sino con un filtro de alta intensidad.
El desempeo de este patrn fue considerablemente mejor que en el caso anterior.
Usar imgenes asimtricas de alto contraste como patrones de reconocimiento presenta
mltiples ventajas en costo, peso y construccin.

El patrn a reconocer propuesto para la medicin de ngulo y posicin relativa del
espectador se muestra en la Figura 4.13.
Pgina 53
Captulo 4 .- Reconocimiento de imgenes


Figura 4.13.- Patrn a reconocer nmero uno.


Dicho patrn de alto contraste presenta un problema. Debido a sus caractersticas
simtricas, el programa de localizacin puede presentar errores de 90 lo que hacen al
sistema ineficiente.
La solucin al problema anterior es disear un patrn de alto contraste que no presente
ningn tipo de simetra como es el caso de la Figura 4.14


Figura 4.14.- Patrn a reconocer nmero dos.


Los programas realizados para el sistema completo de Generacin de fuentes virtuales de
sonido en audfonos, as como su desempeo se ilustran en el captulo 5.
Pgina 54

También podría gustarte