Está en la página 1de 27

APLICACIONES DE LA VISIN

ARTIFICIAL

1 INTRODUCCIN
Es preciso reconocer que hoy por hoy la visin por computador a veces no es la
mejor solucin a un problema. Existen muchas ocasiones en las que el problema es tan
complejo que la solucin humana es lo mejor. Por ejemplo imaginemos una conduccin
de un vehculo en una carretera con trfico intenso. Pero a veces, las soluciones
humanas tienden a ser inexactas o subjetivas y en ocasiones lentas y presentan una
ausencia de rigor as como una pobre percepcin (Marshall y Martin 1993, Hamey y col.
1993). No obstante, la solucin humana es menos estructurada que la solucin artificial
y muchos problemas de visin por computador requieren un nivel de inteligencia mucho
mayor que el que la mquina pueda ofrecer. El sistema de visin humana puede
describir automticamente una textura en detalle, un borde, un color, una representacin
bidimensional de una tridimensional, ya que puede diferenciar entre imgenes de
diferentes personas, firmas, colores, etc., puede vigilar ciertas zonas, diagnosticar
enfermedades a partir de radiografas, etc. Sin embargo, aunque algunas de estas tareas
pueden llevarse a cabo mediante visin artificial, el software o el hardware necesario no
consigue los resultados que seran deseables.
Aun a pesar de las limitaciones expuestas, cada da es mayor el nmero de
aplicaciones de la visin artificial. Por ello slo es posible dar una pequea pincelada
sobre las mltiples aplicaciones en las que la visin artificial se ha aplicado hasta el
momento. Aqu solamente proporcionamos algunas ideas para generar aplicaciones en la
mente del lector. Obviamente los ejemplos que se presentan son aplicables a cualquier

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

otro proceso diferente y en otro campo industrial o cientfico tambin diferentes. En


Newman y Jain (1995) o Davies (1997) se puede encontrar una amplia revisin sobre la
inspeccin visual y aplicaciones de la visin a diferentes campos de la vida real, que nos
dan idea del amplio abanico de posibilidades.
Existen herramientas y paquetes software cuya finalidad principal son las
aplicaciones industriales, tal es el caso de IMAQ Vision de National Instruments
(IMAQ), y por supuesto paquetes de propsito general con ciertas funciones de
aplicacin como es el caso de las Matrox Imaging Libraries (Mil) o el Toolbox Image de
MATLAB (Matlab). A partir de ahora la aparicin en el texto de los anacronismos entre
parntesis expresar la capacidad de la herramienta correspondiente para llevar a cabo la
tarea que se describe.
Cabe no obstante diferenciar entre las aplicaciones donde la visin artificial
constituye una herramienta por s sola y aquellas otras en las que es parte de un sistema
multisensorial. El primer caso engloba todas aquellas aplicaciones en las que el nico
sensor presente es el de visin. En el segundo caso nos estamos refiriendo a la
navegacin en robtica donde la visin constituye una capacidad sensorial ms para la
percepcin del entorno que rodea al robot.
En muchas aplicaciones las imgenes se presentan al sistema bajo diferentes
formatos, cuyos detalles estn lejos del alcance de este libro. A modo de ejemplo
citamos los siguientes: TIFF, BMP, GIF, JPG, PNG, DICOM, RAW.

2 NAVEGACIN EN ROBTICA
En este caso, la visin es un elemento de un sistema multisensorial. La
informacin procedente de la visin es validada, comparada y finalmente integrada con
el resto de la informacin proporcionada por otro tipo de sensores. El resultado es la
reconstruccin de la escena 3-D, que permite la navegacin autnoma del sistema
(Schneider 1996, Lpez-Orozco 1999).
Para la navegacin en robtica se recurre generalmente a tcnicas de visin
estereoscpica con el fin de poder reconstruir la escena 3-D. Si a esto se le aade algn
mdulo de reconocimiento 3-D con el fin de identificar la presencia de determinados
objetos, hacia los que debe dirigirse o evitar, tanto mejor. La utilizacin del movimiento
basado en la visin constituye un magnfico recurso puesto que el propio sistema est ya
de hecho en movimiento. Naturalmente, cualquier otra informacin que pueda extraerse
con ayuda de la visin puede proporcionar una gran ayuda para conseguir el movimiento
del robot.
No es exclusivo su uso en robtica, sino que podra utilizarse en otras
aplicaciones tales como guiado automtico de mquinas, tal y como proponen Amat y

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 3

Casal (1989) para mquinas agrcolas. Tambin para la deteccin y estimacin del
movimiento de vehculos (Pei y Liou 1998, Tan y col. 1998).

3 BIOLOGA, GEOLOGA Y METEOROLOGA


En el campo de la biologa podramos distinguir entre aplicaciones microscpicas
y macroscpicas. En una imagen microscpica nos podemos encontrar con abundantes
organismos, que mediante tcnicas de segmentacin orientadas a regiones, por ejemplo
utilizando una binarizacin, podran ser aislados para su identificacin mediante las
correspondientes propiedades (tamao, excentricidad, color, etc.) o para contar el
nmero de microorganismos o clulas presentes en una imagen, IMAQ, Mil, Matlab. En
las imgenes macroscpicas pueden utilizarse las regiones para la identificacin de
determinados tipos de texturas en vegetales o caractersticas de diferentes reas
naturales por su color o el crecimiento de ciertas especies por diferencia de imgenes.
En geologa se puede tambin detectar movimientos de terrenos captando dos imgenes
en diferentes momentos de tiempo para observar la variacin mediante una diferencia de
imgenes (bajo similares condiciones de iluminacin). En esta rea tambin es posible la
reconstruccin de reas 3-D mediante visin esteroescpica o la obtencin de la forma a
partir de la iluminacin.
Puede resultar de inters el hecho de identificar el grado de floracin de un
determinado cultivo, por ejemplo, de un campo de girasoles. Para ello se extrae de la
imagen la componente de color amarillo, al igual que se hizo en el apartado 7.5 donde se
obtuvieron las regiones por el color, tras lo cual se binariza la imagen y se obtiene el
nmero de pxeles blancos o negros, que nos permite obtener el porcentaje de floracin.
En Glasbey y Horgan (1995) se estudia el procesamiento de forma especfica en
imgenes biolgicas con las tcnicas descritas a lo largo de este libro.
La transformada de Fourier puede resultar til por ejemplo para determinar la
naturaleza de una determinada formacin geolgica o de una especie biolgica. En
efecto, la figura S.21(b) muestra una formacin rugosa de un tronco de rbol con una
orientacin media de las arrugas en sentido vertical, tal y como se deduce del espectro
de frecuencias de la figura 1(a). Anlogamente, en la figura S.32(a) se muestra una
imagen de una formacin geolgica con estratos inclinados formando un ngulo de 45
aproximadamente. El espectro de frecuencias en este caso, muestra una tendencia
inclinada de unos 45, que caracteriza dicha estratificacin, tal y como se muestra en la
figura 1 (b) (IMAQ, Matlab).
En Meteorologa podramos utilizar las tcnicas de deteccin y prediccin del
movimiento estudiadas en el Captulo 12 para observar, por ejemplo, la evolucin de
ciertas masas nubosas, u otros fenmenos meteorolgicos, a travs de imgenes

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

recibidas va satlite. En Sonka y col. (1995) se muestra precisamente un ejemplo sobre


la evolucin y prediccin de una masa de nubes a partir de una secuencia de imgenes.

(a)

(b)

Figura 1 Espectros de frecuencia (a) de una estructura biolgica correspondiente


a la corteza de rbol de la figura S.21(b) y (b) de una formacin geolgica cuya imagen
se muestra en S.32 (a)
Tambin puede resultar de inters determinar el grado de cobertura de una nevada
en funcin de la superficie cubierta. En la imagen de la figura S.32(b) se muestra un
campo cubierto por una intensa nevada. En la imagen de la figura 2(a) aparece la misma
imagen en tonos de grises de la que mediante binarizacin se determina la superficie no
cubierta por la nieve.

(a)

(b)

Figura 2 (a) Imagen de grises obtenida a partir de la imagen de la figura S.32(b);


(b) imagen binaria, obtenida a partir de (a) donde se muestra en negro la superficie no
cubierta
En Vesecky (1988) se propone un estudio para observar la dinmica de placas de
hielo en el mar mediante el anlisis de imgenes de radar.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 5

4 MEDICINA
La comunidad mdica tiene muchas aplicaciones en las que aparece el
procesamiento de imgenes, a menudo orientadas hacia el diagnstico de dolencias o
enfermedades, entre las que se incluyen radiografas, resonancias magnticas,
tomografas etc.
ste es un campo extraordinariamente amplio donde la mejor fuente de ejemplos
y aplicaciones la constituye la revista IEEE Trans. Medical Imaging. A veces, en
algunas otras revistas de medicina se incluyen diversas aplicaciones basadas en
imgenes mdicas. Lester y Arridge (1999) presentan una revisin de mtodos relativos
a lo que en ingls se denomina Image Registration y que en definitiva se trata de definir
una estrategia para encontrar la correspondencia entre un modelo y un objeto, siendo
necesario definir las caractersticas o estructuras, el espacio de bsqueda y la mtrica
para determinar el grado de semejanza. El propio trabajo contiene abundantes
referencias bibliogrficas en las que se incluyen algunos ejemplos de inters en el
campo de las imgenes mdicas. Adems Duncan y Ayache (2000) hacen una revisin
sobre el progreso en los ltimos 20 aos del anlisis de imgenes mdicas as como los
cambios en el futuro. Desarrollan un exhaustivo trabajo al respecto, que incluye 139
referencias de inters. En IPMI99 (1999) se encuentran en exclusiva abundantes
trabajos aplicados al campo de la medicina.
Veamos algunos ejemplos de aplicaciones de procesamiento bsico.
Consideremos la imagen dada en la figura 3(a) que corresponde a una radiografa con
una imagen de muy baja calidad, se pretende extraer informacin sobre las manchas
blancas que aparecen en la misma. En (b) se muestra su histograma de frecuencias. Se
modifica el histograma mediante aumento del contraste y gamma con lo que se obtiene
la imagen dada en (c) y su histograma correspondiente en (d), aqu las manchas aparecen
explcitamente, sin embargo todava se puede extraer ms informacin. Utilizando una
tcnica de binarizacin mediante seleccin de umbral se obtiene (e) que posteriormente
se dilata mediante la correspondiente operacin morfolgica para rellenar huecos y
hacer ms explcitas las manchas, obteniendo (f). Posteriormente, de esta imagen se
extraen las manchas (objetos) subyacentes, que son etiquetados. Segn el nmero de
etiqueta as es su color en S.33(a), con esta informacin podemos obtener el rea de las
diferentes regiones etiquetadas (coloreadas).
En la figura S.33(b) se muestra una ecografa con una grfica en su parte inferior.
La segmentacin de dicha grfica por extraccin de la componente de color verde
mediante las tcnicas de extraccin de regiones por el color descrita en el Captulo 7,
permite su tratamiento (medida de los picos, anchura entre picos, etc.). En la parte
inferior de dicha figura aparece la grfica binarizada.

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

En la figura S.34 (a) se proporciona una imagen original, en (b) y (c) las
componentes dominante de color rojo y verde respectivamente para su anlisis. As,
resulta fcil determinar la superficie de rojo o verde y dnde se localizan.
La tcnica del pseudocolor puede utilizarse tambin para clarificar o visualizar
mejor una imagen. En la figura 4, aparece una imagen original y la misma imagen
coloreada en S.6(a) y (c) con sus respectivos mapas de colores en (b) y (d) utilizando la
tcnica del pseudocolor expuesta en el Captulo 5.

(a)

(b)

(c)

(d)

(e)

(f)

Figura 3 (a) Radiografa original; (b) histograma de la imagen original; (c)


nueva imagen mediante modificacin de histograma (aumento de contraste y gamma);
(d) histograma correspondiente a (c); (e) imagen binarizada a partir de (c); (f) imagen
dilatada a partir de (e)

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 7

Figura 4 Imagen de grises, cuyo coloreado se muestra en S.6 as como sus


respectivos mapas de colores.
Hemos considerado algunos ejemplos elementales para el tratamiento de
imgenes mdicas, si bien, resulta abundante la literatura en este campo, entre mltiples
y diversas aplicaciones podemos mencionar las siguientes:
El zoom permite ampliar detalles de la imagen que en una primera vista aparecen
confusos
Mediante sustraccin de imgenes se puede detectar el movimiento de un objeto, o la
variacin de volumen por ejemplo en los movimientos de sstole y distole del corazn.
Mediante reduccin de la escala de grises o binarizacin se puede eliminar de la
imagen los niveles de gris que no interesen y dejar slo aquellas partes de inters, por
ejemplo el resaltado de dientes en una radiografa (Umbaugh 1998).
Mediante sustraccin se puede determinar la evolucin de un tinte que se inyecta en
las venas tomando como referencia la imagen antes de la inyeccin (Gonzlez y Woods
1993)
Coloreado de regiones de inters en una radiografa mediante tcnicas de
pseudocolor (Umbaugh 1998).
Obtencin del entramado de vasos capilares, o nervios en un determinado tejido
mediante la extraccin de bordes (Gonzlez y Woods 1993).
Deteccin de lesiones vasculares a partir de angiogramas renales (extensible a otros
rganos) (Jaulent y col. 1997 y Jendrysik 1997).
Diferenciar tejidos sanos de tejidos cancergenos o infectados por el color (Umbaugh
1998).
Deteccin de cnceres de piel mediante tcnicas de color y extraccin de bordes (Xu
y col. 1999).

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

Medida del grosor de venas y arterias (Wick y col. 1993, Chen y col. 1987, SchmidChoenbein y col. 1977).
Deteccin de puntos de inters en una radiografa como precursores de la presencia
de un tumor (Low 1991) o como puntos de referencia en ciertos rganos como el
cerebro en Rohr (1999).
Identificacin de un ndulo sospechoso en una mamografa por diferencia de
contraste y textura en Trucco y Verri (1998).
En neurologa para determinar el estado de enfermedad y el grado de deformacin de
la materia gris del cerebro en enfermos epilpticos mediante el uso de contornos
deformables (Schnabel y Arridge 1999, Gee 1999).
Deteccin de costillas en radiografas mediante la transformada de Hough (Wechsler
1977).
Deteccin de microcalcificaciones en mamografas mediante redes neuronales
(Tsujii y col. 1999).
Reconstruccin de arterias coronarias utilizando imgenes de angiogramas (Windyga
y col. 1998).
La diferencia de imgenes ha sido utilizada en la substraccin de angiogramas para
estimar el movimiento de una vena o vaso capilar (Rong y col. 89, Abdel-Malek y col.
90).
Movimiento de las paredes cardacas a partir de imgenes de Resonancia Magntica
de las que se extraen puntos de inters sobre los que se establecen las correspondencias,
mediante correlacin, entre las distintas imgenes de una secuencia de imgenes. Se
determina el flujo ptico a travs de dichas correspondencias (Fisher y col. 1991).
Otro mtodo de anlisis de movimiento para imgenes del corazn obtenidas
mediante resonancia magntica se basa en la deteccin de bordes y la correspondencia
de mscaras en las direcciones esperadas (Guttmann y Prince 1990).
Los modelos deformables se han aplicado tambin al anlisis del movimiento 3D en
imgenes de resonancia magntica del corazn (Young y Axel 1992). En Kambhamettu
y Goldgof (1992) la estima de correspondencia de puntos en una superficie no rgida
(rganos biolgicos) se basa en cambios de la curvatura Gaussiana.
En Fernndez-Rodrguez y col. (1993) se presenta un sistema de redes neuronales
para el diagnstico de carcinomas y neumonas en los pulmones mediante imgenes de
radiografas del trax.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 9

Xin y col. (1996) presentan un mtodo para establecer correspondencias de


contornos extrados de imgenes del corazn (ventrculos) y del cerebro, basado en el
anlisis de curvas deformables.
Las curvas deformables son tambin utilizadas en Knoll y col. (1999) para detectar
contornos de la prstata y poder medir volmenes de la misma.
Chen y col. (1999) detectan anomalas en el cerebro comparando las estructuras
subyacentes con un cerebro de referencia contenido en una base de datos.
Procesamiento de imgenes de Resonancia Magntica del cerebro humano (Pien y
col. 1997).
En Theodoridis y Koutroumbas (1999) se utilizan tcnicas de reconocimiento de
patrones para detectar cirrosis e infiltraciones de grasa en el hgado.

IDENTIFICACIN DE CONSTRUCCIONES,
INFRAESTRUCTURAS Y OBJETOS EN ESCENAS
DE EXTERIOR

Mediante imgenes areas o de satlite se puede determinar la presencia de


ciertas regiones a travs de la segmentacin de las mismas as como detectar la
presencia de ciertas construcciones (edificios) o infraestructuras (carreteras, canales,
puentes) a travs de tcnicas de extraccin de bordes o contornos combinadas con la
segmentacin de regiones.
Un ejemplo puede ser la reconstruccin de tejados de casas urbanas (por su
estructura geomtrica mejor definida que los rurales) propuesto por Moons y col. (1998)
por medio de relaciones topolgicas y geomtricas teniendo una base de datos de
modelos a partir de los cuales se reconstruye el tejado que est siendo inspeccionado.
Sobre la identificacin y extraccin de estructuras urbanas existen algunos trabajos en la
literatura como por ejemplo Collins (1995), Fischer y col. (1998), Grn y col. (1995,
1997), Kim y Muller (1999), McGlone y Shuffelt (1994), Nevatia y col. (1997), Roux y
Matre (1997).
Otro ejemplo lo podemos encontrar en Kass y col. (1987) donde se describe la
deteccin de carreteras mediante el procedimiento de contornos deformables. Tambin
en Fischler y col. (1987) se presenta un mtodo de deteccin de carreteras.
A modo de ejemplo, la transformada de Hough puede resultar de inters en
determinadas aplicaciones en las que aparecen estructuras detectables por la misma, tal
es el caso de la imagen de la figura S.35(a) en la que aparece una carretera con sus
lneas blancas. En la figura 5(a) se ha obtenido una imagen de bordes mediante el

10

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

siguiente proceso: 1) conversin de la imagen a grises segn la tcnica descrita en el


Captulo 5; 2) obtencin de una imagen binaria mediante umbral segn el Captulo 7 y
3) extraccin de las lneas mediante la aplicacin de las operaciones morfolgicas de
apertura y cierre y un posterior XOR. Finalmente, las ecuaciones de las lneas rectas se
obtienen por la transformada de Hough, descrita en el Captulo 8. Obsrvese la
transformacin de perspectiva, que ayuda a identificar la estructura como una carretera
en los procesos de reconocimiento posteriores. Por otro lado, en la figura S.35(b) se
muestra un panel indicativo del punto kilomtrico y en la figura 5(b) la binarizacin de
la imagen para la lectura de los caracteres de dicho punto, sealado por la flecha,
mediante tcnicas de reconocimiento de caracteres.
Mediante mtodos similares al ejemplo anterior o tcnicas de extraccin de las
componentes de color, de acuerdo a lo visto en el Captulo 5, se puede deducir la
presencia de diferentes parcelas sobre una determinada extensin de terreno. En este
tipo de estructuras seran aplicables los operadores de texturas.

(a)

(b)

Figura 5 (a) Imagen de bordes obtenidos a partir de la imagen de la figura


S.35(a) para la extraccin de las lneas mediante la transformada de Hough; (b)
Imagen binaria obtenida a partir de la imagen de la figura S.35(b) para la
identificacin del punto kilomtrico marcado por la flecha mediante tcnicas de
reconocimiento de caracteres
Los trabajos de Lotufo y col. (1990), Guiducci (1999) y Paetzold y Franke (2000)
se enmarcan tambin dentro de la lnea de deteccin de carreteras y su reconstruccin
3D.
En Vailaya y col. (1998) se presenta un mtodo para discernir entre imgenes
urbanas y paisajes naturales, lo cual puede ser til por ejemplo para extraer imgenes de
bases de datos grandes o para los buscadores de Internet. Utilizan para ello histogramas
de color, la Transformada Discreta del Coseno, histogramas que contienen direcciones
de los bordes. El color, por cierto, es un extraordinario atributo para la discriminacin en
construcciones 3D (Henricsson 1998).

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 11

Batlle y col. (2000) presentan una revisin de mtodos y estrategias para extraer y
reconocer objetos en escenas naturales mediante el color. Dichas estrategias
comprenden diferentes enfoques: arriba-abajo, abajo-arriba e hbridos. Las 61
referencias citadas constituyen a su vez una buena fuente de documentacin. El color
junto con la textura y los contornos deformables se ha utilizado para localizar objetos en
Zhong y Jain (2000).

6 RECONOCIMIENTO Y CLASIFICACIN
Una posible aplicacin puede ser la clasificacin de objetos por su tamao y en su
caso el recuento de los mismos, ver figura 6. Por ejemplo, para contar monedas en
funcin del rea de la moneda, permetro o nmero de Euler tras el correspondiente
proceso de binarizacin (Mil).
En Cspedes y col. (1998) se muestra una tcnica para el reconocimiento de caras
de personas mediante visin artificial utilizando perfiles de intensidad tal y como se
describe ms adelante. En Intrator y col. (1996) se utilizan redes neuronales con el
mismo fin, y en Kwon y Lobo (1999) se clasifican las edades a partir de imgenes de
caras. Feng y Yuen (1998) reconocen ojos en caras humanas. Purnell y col. (1998)
reconocen caras de entre un grupo de personas.

(a)

(b)

Figura 6 (a) Imagen original; (b) reas de las monedas originales


En JIVA (1991) se propone un procedimiento de lectura automtica de datos del
Documento Nacional de Identidad, as como reconocimiento de objetos basados en el
color.
El reconocimiento de huellas dactilares tambin es posible mediante visin, as en
Capelli y col. (1999) se utiliza un conjunto de mscaras para obtener un vector numrico
representando cada huella digital como un vector de atributos multidimensional, luego
mediante optimizacin se realiza la clasificacin. Los trabajos de Caru y Jain (1996) y
Kawagoe y Tojo (1984) tambin presentan mtodos de reconocimiento de huellas
dactilares.
IMAQ posee una aplicacin para leer displays LCDs reconociendo obviamente
los caracteres que aparecen a pesar de la variacin de intensidad de la luz. Este mismo

12

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

paquete incluye la posibilidad de chequear la validez o no de una determinada etiqueta,


en concreto en los disquetes de ordenador de alta densidad analiza la correcta grabacin
de los caracteres HD incluso aunque el disquete se muestre ligeramente girado con
relacin al modelo.
IMAQ tambin posee un mdulo especfico de reconocimiento ptico de
caracteres as como otro mdulo para leer la posicin de la aguja en un multmetro
analgico.
Quizs una de las reas de aplicacin ms importantes sea el Reconocimiento
ptico de Caracteres (en ingls OCR). En Maravall (1993), JIVA (1991) o Lisa y col.
(1993) se proporcionan los correspondientes ejemplos para la identificacin de
matrculas de vehculos, que en el caso de Lisa y col. (1993) incluyen tcnicas de redes
neuronales. En aplicaciones OCR es abundante la bibliografa existente al respecto, a
continuacin citaremos una serie de trabajos, que pueden resultar de inters en este
campo: Li y Xu (1992) que utilizan un clasificador basado en tcnicas de correlacin y
utilizan los 7 momentos invariantes de Hu (1962) como caractersticas, al igual que
Flusser y Suk (1993) o Wong y col. (1995). Chim y col. (1999) utilizan los momentos de
Hu (1962), los momentos invariantes afines de Flusser y Suk (1993, 1994) y los
momentos de Tsirikolias y Mertzios (1993). Mahmoud (1994) que usa descriptores de
Fourier y cdigos del contorno de caracteres. En Lu y Shridhar (1996) se presenta una
revisin de tcnicas para el reconocimiento de caracteres manuscritos. Las tcnicas de
Learning Vector Quantization y Self-Organizing maps han sido utilizadas tambin en
reconocimiento de caracteres manuscritos por Lee y Song (1994) y Chi y col.
respectivamente. Waard (1995) propone un criterio de mnima distancia para el
reconocimiento de caracteres manuscritos. Los trazos en los caracteres manuscritos son
utilizados por Han y col. (1995) o Zou y Yan (1999) para su reconocimiento. Liang y
col. (1994), mediante una nueva funcin de discriminacin, reconocen caracteres de
documentos impresos. Kovacs (1995) propone un mtodo de reconocimiento estadstico
para caracteres manuscritos. Rocha y Pavlidis (1994, 1995) y Nishida (1995) desarrollan
un mtodo de descripciones estructurales de caracteres. Kanai y col. (1995) obtienen
primero los prrafos o secciones de textos (por ejemplo de los peridicos) antes de
proceder al reconocimiento. Cai y Liu (1999) integran informacin estadstica y
estructural para el reconocimiento de nmeros manuscritos.
Hussein y col. (1999) tambin reconocen caracteres manuscritos mediante
tcnicas estructurales y Kato y col. (1999) mediante la distancia de Mahalanobis.
Kim y col. (1996) utilizan sendas redes neuronales de Hopfield (discreta y
continua) para el reconocimiento de objetos parcialmente ocludos mediante sus bordes,
de utilidad en la inspeccin de equipajes en aeropuertos o aplicaciones militares.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 13

Del Bimbo y col. (1998) proporcionan un mtodo para mejorar la bsqueda en


bases de datos en imgenes basndose en las caractersticas cromticas de las mismas, lo
cual es til para el manejo de bases de datos grandes.
Cantoni y col. (1997) o Reiss (1993) presentan diversas tcnicas para
reconocimiento de objetos.

7 INSPECCIN Y CONTROL DE CALIDAD


La inspeccin de un objeto manufacturado puede tomar muchas formas, que
podra involucrar las siguientes tareas:
a) verificar la presencia de cada caracterstica esperada
b) verificar las dimensiones de esas caractersticas (por ejemplo radio y longitud de un
cilindro)
c) verificar las interrelaciones entre caractersticas (por ejemplo distancias entre centros
de gravedad y ngulos entre planos).
La inspeccin en el sentido ms amplio se refiere a la verificacin de si un objeto
cumple con determinados criterios. Esto implica comparar el objeto con algn objeto
modelo que describe las caractersticas relevantes del objeto. Para muchos tipos de datos
existen tolerancias definidas dentro de las cuales las medidas realizadas pueden
considerarse como aceptables. Abordaremos en primer lugar el problema de la
inspeccin geomtrica para posteriormente tratar otros tipos de inspeccin. Un
tratamiento ms exhaustivo de todos estos aspectos se pueden encontrar en Marshall y
Martin (1992), Davies (1997), Demant y col. (1999) o Soloman (2000). Marshall y
Martin (1992) constituye una buena referencia para procesos de inspeccin visual
automatizada con abundantes detalles en cuanto a mtodos y procedimientos, que en
realidad son los expuestos a lo largo de este libro, si bien, desde una perspectiva
detallada de anlisis de errores y mtodos muy especficos para aplicaciones muy
concretas.
Una de las finalidades de los controles de calidad consiste en detener la
produccin de algn producto si el sistema de produccin comienza a generar productos
que no cumplen con las normas estndares generales. Imaginemos que para la
fabricacin de galletas se exige que las mismas tengan un tamao con unos mrgenes de
confianza, mediante la segmentacin de la misma se determina el rea, pero si adems es
preciso que la forma sea circular, la transformada de Hough nos facilita el cumplimiento
de dicho requisito.

14

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

7.1 La inspeccin geomtrica


Ciertos procesos industriales de produccin requieren que los productos
manufacturados sean inspeccionados para asegurar que algunas medidas de calidad y
fiabilidad se cumplen. El proceso de inspeccin, dependiendo de lo que se quiera
inspeccionar puede ser complejo, por lo que en ocasiones ser necesario reducir costos
de tiempo y dinero (Batchelor y col. 1985).
Existen las denominadas mquinas de medidas de coordenadas, basadas en
sensores tctiles que requieren una reprogramacin para cada objeto, ambos problemas a
veces hacen que estas mquinas no se puedan usar en la realidad (Reinshaw, 1991). En
la actualidad existen sistemas de inspeccin basados en visin industrial para inspeccin
en dos dimensiones tales como inspeccin de circuitos impresos por ejemplo Batchelor
y col. (1985). Sin embargo, son pocos los que abordan la inspeccin de objetos
tridimensionales. En cualquier caso las ventajas de un sistema de inspeccin visual son
las siguientes: Flexibilidad, cualquier tipo de objetos puede ser inspeccionado al tratarse
de un sistema pasivo y no interactuar con los objetos a inspeccionar; Velocidad,
determinada por el procesamiento interno, sin necesidad de tener que colocar y tocar el
objeto; Registro automtico de los datos, etc. No obstante, algunas desventajas seran
que las partes no visibles no se pueden inspeccionar y la resolucin del sistema en
cuanto al nmero de pxeles y calibracin efectuada, que a veces puede impedir la
inspeccin de determinadas anomalas o elementos de dimensin reducida.
Los requisitos que se le exigen a cualquier sistema de inspeccin basado en visin
son los siguientes: flexibilidad, para poder inspeccionar cualquier tipo de objetos;
resolucin, debe ser capaz de proporcionar medidas que sean suficientemente precisas
para poder establecer si los objetos inspeccionados estn dentro de tolerancia;
resolucin espacial, para decidir si las caractersticas inspeccionadas estn posicionadas
y orientadas con la precisin adecuada con respecto a algn sistema de referencia; fcil
de usar, para facilitar su versatilidad y fcil manipulacin.
A partir del estudio previo realizado en los captulos anteriores es evidente que
muchas de las tcnicas desarrolladas en ellos no satisfacen los anteriores requisitos. Por
ejemplo, los mtodos basados en la forma a partir de la tonalidad no son apropiados para
inspeccin por las siguientes razones:
a) son demasiado sensibles a los pequeos cambios de iluminacin y a la reflectancia de
las superficies
b) slo trabajan bien en superficies con textura uniforme
c)

es difcil deducir las profundidades absolutas de los puntos, y solamente la


orientacin de la superficie o curvatura se puede deducir.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 15

d) la resolucin de profundidad o tercera dimensin obtenida resulta generalmente


insuficiente.
Las tcnicas pasivas de visin estereoscpica requieren la determinacin de la
correspondencia de caractersticas bidimensionales en cada una de las dos imgenes.
Esto necesita la extraccin fiable de esas caractersticas a partir de dos imgenes
bidimensionales separadas y luego establecer la correspondencia de las caractersticas
entre imgenes, para finalmente deducir la tercera dimensin. Cuando las caractersticas
son bordes o regiones el mapa 3D obtenido no es suficientemente denso.
Marshall y Martin (1992) proponen un sistema de visin estereoscpica activa
como se ilustra en la figura 7. El sistema consta de un par de cmaras y un lser
montadas sobre un banco para reducir las vibraciones junto con un espejo. Las cmaras
estn montadas en un sistema giratorio de rotacin independiente. El espejo se mueve
para que genere un barrido vertical del objeto y se proyecte su imagen en ambas cmaras
adems de barrer el objeto. El sistema completo es controlado por un computador que
adems tiene acceso a la base de datos donde se encuentran los modelos geomtricos. El
procedimiento establece las correspondencias de forma muy precisa y con ellas
reconstruye el objeto 3D deseado para ser comparado con los modelos.
Al obtener los valores de profundidad se cometen ciertos errores que es preciso
evaluar (Marshall y Martin 1992).

Espejo
Objeto

Direccin
del lser

Plataforma
giratoria

Cmara en
plataforma
giratoria

Figura 7 Diagrama esquemtico del sistema de visin para inspeccin


En primer lugar, es necesario considerar los efectos de la cuantizacin espacial.
La posicin (x,y) de un punto tiene inexactitudes, que surgen del sistema ptico. Un
valor de z en el mapa de profundidad que supuestamente corresponde a una posicin
(x,y) puede realmente corresponderse con una posicin que realmente difiere en unas
pocas dcimas de pxeles de la posicin correcta, por ejemplo 0.2 como se indica en
Marshall y Martin (1992). A este resultado llegan a travs de las diferencias observadas
en los mapas de profundidad a partir de configuraciones del sistema idnticas. Este error
depende de muchas cosas, incluyendo las propiedades de reflectancia de los objetos, las

16

RA-MA

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

propiedades pticas de las lentes y cmaras y la resolucin del CCD. Tambin depende
de la distancia del sistema de visin al objeto como se explicar seguidamente.
Aparece un rea de incertidumbre en la localizacin precisa de los puntos, como
se ilustra en la figura 8.

E je
p tic o 2

E je
p tic o 1

d
C m a ra 1

A re a d e
In c e rtid u m b re

C m a ra 2

Figura 8 Error en la medida de la profundidad de un punto utilizando visin


estereoscpica
Tanto la resolucin de profundidad y angular pueden evaluarse fcilmente
considerando los siguientes parmetros:

: campo de vista de las cmaras en radianes


n : nmero de puntos evaluables a travs del campo de vista
d : separacin de las cmaras en metros

: ngulo entre el eje ptico y los puntos de la imagen en radianes


z : profundidad en metros

: resolucin angular de la cmara


z : resolucin de profundidad
La resolucin angular puede expresarse como (Marshall y Martin 1992),

tan
= 0.5tan 1

n
mientras la resolucin en profundidad se puede demostrar que es (Hutber 1987)

z =

2 z 2 tan 2
d

tan + tan + 1

d
z

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 17

por tanto, la incertidumbre en la medida de profundidad z es proporcional al valor de z al


cuadrado, e inversamente proporcional a la separacin de las cmaras.
A modo orientativo, con valores tpicos el sistema de Marshall y Martin (1992)
obtiene los siguientes resultados,

: 0.08 radianes
n : 512 x 5 = 2560
d : 0.3 m

: 0.0 radianes
z : 0.7 m

: 4.9 x 10-5 radianes


z : 0.052mm

7.2 Tolerancias en la inspeccin


En inspeccin visual geomtrica resulta del mximo inters considerar el hecho
de que los objetos geomtricos a inspeccionar van a admitir una serie de valores de
tolerancia en las correspondientes medidas de los elementos geomtricos que los
componen. Un estudio detallado con abundantes fuentes de referencia lo constituye el
libro de Marshall y Martin (1992).
En JIVA (1991) se present un sistema de control dimensional de elementos
alargados.
En IMAQ se muestra un ejemplo de inspeccin de acabado de conectores de
fuentes de alimentacin, donde debe aparecer un contorno de borde dentro de los lmites
de una circunferencia previamente especificada con la protuberancia del conector
tambin dentro de los lmites establecidos.
En la figura 9 a) y (c) se muestran dos imgenes de un conector de fibra ptica en
diferentes posiciones giradas. El objetivo consiste en detectar la presencia de los cinco
orificios de conexin y que se siten entre s a las distancias especificadas. En la figura
9(b) y (d) se muestran las correspondientes imgenes binarizadas por el mtodo del
umbral descrito en el Captulo 7, de dichas regiones se extraen las siguientes
propiedades: rea, compacidad y nmero de Euler para determinar la calidad de los
orificios, as como la posicin del centro de gravedad para establecer las medidas de
distancias entre ellos. Con ello se pretende identificar y verificar la correcta fabricacin
de estos conectores independientemente de su posicin, obviamente manteniendo la
misma perspectiva y escalado, es decir la misma posicin relativa de la cmara respecto
del conector.

18

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

7.3 Acabado de superficies y deteccin de imperfecciones


En muchos casos resulta ms fcil inspeccionar objetos utilizando un perfil o una
serie de perfiles de las diferentes vistas del objeto. En este caso, los problemas de
adquisicin tridimensional son eliminados y las medidas se hacen con referencia a los
datos bidimensionales.
Por ello hay que tener especial cuidado en que la posicin de la cmara y las
condiciones de iluminacin sean idnticas con el fin de que las vistas del objeto
inspeccionado sean las mismas en cada imagen. En cuanto a la posicin de la cmara
habr que especificar por ejemplo que la lnea de vista sea perpendicular al rea de
inters, o paralela o perpendicular a algn eje de simetra del objeto. La eleccin de las
condiciones de iluminacin es tambin determinante, ya que en caso contrario pueden
aparecer efectos no deseados tales como sombras y reflejos. El libro de Batchelor y col.
(1985) trata en profundidad estas cuestiones.

(a)

(b)

(c)

(d)

Figura 9 (a) y (c) El mismo conector de fibra ptica en dos posiciones diferentes;
(b) y (d) orificios de insercin de los hilos del cable extrados mediante binarizacin
En cualquier caso, la inspeccin requiere comparar un modelo ideal con el que
est siendo inspeccionado.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 19

El acabado de una superficie puede determinarse mediante descripciones tales


como: spera, ondulada, granulada o rayada por ejemplo. Para llevar a cabo esta tarea es
necesario conocer la fuente de luz que se utiliza para iluminar la superficie de forma que
la cmara reciba la luz reflejada de la superficie. Muchas tcnicas se han aplicado para
la inspeccin del acabado de superficies usando mtodos similares a los discutidos para
la obtencin de la forma, por ejemplo Mundy (1982).
Muchas propiedades del acabado de superficies estn relacionadas con la textura
de las superficies, que se estudi en el Captulo 9. Weszka y Rosendfeld (1976) han
identificado un cierto nmero de propiedades de texturas relacionadas con el acabado de
las superficies. Don y col. (1984) clasifican las superficies de los metales en seis
categoras diferentes utilizando textura.
No obstante, es difcil medir el acabado de superficies visualmente debido a las
pequeas dimensiones de las caractersticas de las superficies que afectan a su acabado.
Generalmente, esta tarea requiere la ayuda de instrumentos de alta precisin tales como
aquellos que obtienen el perfil mediante un sistema de agujas recorriendo las superficies
en lneas (a veces presionan a la superficie y pueden alterar sus propiedades). Una
alternativa consiste en usar un microscopio de seccin de luz.
En lugar de tratar de medir el acabado de las superficies, resulta ms comn en
sistemas de inspeccin visual detectar defectos de las superficies. Esta tarea es mucho
ms fcil y est basada en la deteccin de algn cambio significativo en las
caractersticas de la superficie. Para desarrollar esta tarea se han propuesto muchos
sistemas (Batchelor y col. 1985, Brook, 1971, Jain y Jain 1990, Mundy, 1982). Estos
sistemas a menudo obtienen ciertas medidas a partir de una secuencia de pxeles a lo
largo de la superficie y determinan un cambio o desviacin en la secuencia. A modo de
ejemplo durante el precintado de las botellas de vino se producen ciertas anomalas en el
precinto, si se dispone de un modelo como es el caso de la figura 10(a), podemos
comparar el correcto precintado con cualquier anomala presentada en esta fase, ver
figura 10(b). El procedimiento consiste en comparar sendos perfiles de intensidad
horizontal del modelo y de la imagen con la superficie supuestamente deteriorada.
Previamente para facilitar el proceso se puede convertir la imagen de color a imagen de
grises. En (c) se muestra el perfil de intensidad correspondiente a la misma lnea que
aparece en (b) pero relativa a la imagen (a). En (d) aparece el perfil de la imagen con la
superficie deteriorada. Ambos perfiles son diferentes debido a la anomala.

20

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

(a)

(b)

(c)

(d)

RA-MA

Figura 10 (a) Imagen original modelo; (b) imagen deteriorada; (c) perfil de
intensidad de (a) a lo largo de la lnea horizontal a la misma altura que en (b); (d) perfil
de intensidad a lo largo de la lnea horizontal marcada en (b). Obsrvese la diferencia
del perfil en la zona deteriorada de (b) con respecto al modelo

7.4 Inspeccin en tarjetas de circuitos impresos


Existen muchos aspectos diferentes en el proceso de fabricacin de circuitos
impresos que requieren inspeccin. Por ejemplo, es necesario:
a) verificar que los componentes han sido colocados en sus lugares correctos
b) chequear las pistas para verificar cualquier ruptura
c) componentes inclinados sobre la tarjeta
d) chequear soldaduras incorrectas
Las tcnicas expuestas en la seccin anterior para la deteccin de anomalas en
superficies son aplicables para resolver los dos primeros problemas. En cualquier caso,
tanto la verificacin de componentes como la deteccin de elementos inclinados supone
una comparacin entre un modelo y la tarjeta inspeccionada. Ms detalles de las tareas
implicadas en estos procesos se pueden encontrar en Chin y Harlow (1982), Kaufmann y
col. (1984), Capson y Eng (1988), Batchelor y col. (1985) o Bretschi (1981).

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 21

En la figura 11(a) y (b) se muestran sendas imgenes de dos circuitos impresos


diferentes mientras que en (c) y (d) aparecen los perfiles de intensidad correspondientes
a sendas lneas verticales. Obsrvese la diferencia en los perfiles obtenidos, lo que nos
permite deducir claramente que las dos tarjetas son diferentes (en lo que se refiere a
dicho perfil). Una exploracin ms exhaustiva nos llevara a la misma conclusin para
diferentes lneas de exploracin. Para deducir su semejanza deberamos obtener perfiles
de intensidad similares. Esta tcnica tambin nos proporciona la posibilidad de
determinar si todos los componentes han sido instalados, sin ms que conocer el perfil o
perfiles correspondientes a una instalacin apropiada. Como tcnica adicional, se puede
obtener la diferencia entre ambas imgenes, de forma que si ambas tarjetas son iguales
la imagen de diferencias sera nula (imagen negra) cosa que no ocurre en el ejemplo,
como se puede apreciar en la figura 11(e).
Es absolutamente imprescindible que las condiciones de iluminacin y
posicionamiento sean idnticas en la captura de las imgenes. Tambin puede, en
ocasiones, ser necesario tomar algn punto de referencia fcilmente reconocible a partir
del cual obtener el perfil correspondiente.
El chequeo para la deteccin de rupturas en circuitos impresos se realiza antes de
la insercin de los componentes, pero los chequeos para la deteccin de cortocircuitos o
circuitos abiertos debidos a soldaduras incorrectas debe chequearse despus de colocar y
soldar los componentes. No obstante, los procesos bsicos para detectar dichos defectos
son similares. De nuevo, las tcnicas estn basadas en la sustraccin de una imagen ideal
y la imagen bajo inspeccin. Claramente, las imgenes deben ser previamente alineadas
y las condiciones de iluminacin y posicin de la cmara consideradas, como ya se ha
mencionado anteriormente. Esto puede lograrse estableciendo la correspondencia entre
caractersticas de ambas imgenes, mediante las tcnicas de correlacin estudiadas en el
Captulo 17. Alternativamente, la tarjeta se puede colocar en cualquier dispositivo que
permita su alineamiento. Algunos mtodos que emplean estas tcnicas pueden
encontrarse en Chin y Harlow (1982) o Bretschi (1981).
La inspeccin de soldaduras en circuitos impresos presenta un conjunto de
problemas no relacionados con los descritos anteriormente. Muchos investigadores han
tratado este problema (Besl y col., 1985, Chin y Harlow, 1982, McIntosh 1984,
Nakagawa 1982, Seah y Lea 1985, Kim y col. 1999). A veces, debido a la invisibilidad,
es necesario recurrir a rayos-X para hacer visible la soldadura, tal es el caso de Seah y
Lea (1985).

22

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

(a)

(b)

(c)

(d)

RA-MA

(e)
Figura 11 (a) y (b) Imgenes originales; (c) y (d) perfiles correspondientes a las
lneas verticales marcadas; (e) diferencia entre las dos imgenes originales
Nakagawa (1982) utiliza luz estructurada proyectando un haz de luz sobre la
soldadura y midiendo su perfil. No obstante, la luz reflejada de ciertos tipos de
soldadura puede originar problemas en la obtencin de imgenes claras. McIntosh
(1984) sugiri el uso de luz coloreada aunque a veces la percepcin de los colores para
diferentes imgenes puede ser diferente. Capson y Eng (1988) utilizaron luz coloreada
por capas, en realidad dos anillos de luz fluorescente de forma que sus centros caen en el
mismo eje, uno que emite luz roja y el otro azul.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 23

Es posible tener como referencia un determinado modelo para luego detectar


mediante correlacin la presencia del mismo en un conjunto ms amplio, por ejemplo en
relacin con la imagen de la figura 11(a) podemos tener almacenado el patrn dado en
12, que nos permitir detectar si dicho componente se ha instalado o no en la tarjeta
(Mil, IMAQ).

Figura 12 Modelo de componente electrnico


Cootes y col. (1995) proponen un modelo deformable para analizar la presencia
de resistores en tarjetas electrnicas, aunque los contornos de los mismos tras su
extraccin se presenten deformados.

7.5 Inspeccin en las industrias de alimentacin y agricultura


Son dos reas en las que se pueden aplicar tcnicas de inspeccin visual, pero la
naturaleza no determinista de sus productos hace que esta tcnica sea difcil.
El manejo de ciertos productos comestibles exige que los mismos necesiten un
proceso de inspeccin ya que pueden daarse o contaminarse. Se pueden mencionar
algunas aplicaciones en este campo, como por ejemplo: calidad del algodn, calidad de
las frutas, inspeccin de rboles, crecimiento de plantas, etc.
Como puede observarse, el rango de productos es inmenso, no obstante la fuente
de problemas puede dividirse en dos categoras:
a) defectos de produccin y
b) impurezas no deseadas
Los defectos de produccin pueden provenir de muchas fuentes, incluyendo los
equipos no fiables o defectuosos, mezcla errnea de ingredientes en los productos
preparados, proceso de manufactura incorrecto tales como tiempo y temperatura de
preparacin incorrectos, empaquetado defectuoso. Los defectos de este tipo pueden
deteriorar los productos finales, por ejemplo:
a) una estructura deformada o dimensin incorrecta
b) textura externa incorrecta

24

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

c) textura interna incorrecta (tales como burbujas)


d) color inapropiado
Un problema adicional consiste en cuantificar lo que realmente constituye un
defecto particular. Por tanto habr que proceder previamente a determinar lo que se
puede considerar un defecto. Por ejemplo considerar una barra de pan, se pueden
determinar dos criterios para pasar la inspeccin:
es satisfactoria la forma
ha sido cocida correctamente
Los dos criterios son subjetivos y depender de las preferencias del panadero. Las
medidas de forma de la barra pueden determinarse por tcnicas bi o tridimensionales. Se
puede determinar el grado de coccin examinando el color de la corteza bajo
condiciones de luz controladas.
Otro ejemplo puede ser la deteccin de fisuras o grietas en ciertos productos
terminados, cuya deteccin se puede llevar a cabo como en el mtodo expuesto en la
figura 10.
La apariencia de los productos es tambin importante, en cuyo caso los mtodos
de textura pueden ser interesantes para su deteccin (Chan y col. 1990).
Otro ejemplo podra ser el control del nivel de tostado de galletas en hornos
industriales, cuando las galletas salen del horno son segmentadas en regiones mediante
un proceso de binarizacin y tras una serie de operaciones morfolgicas se afinan los
contornos de las regiones. Una vez extradas las regiones se procede a analizar el nivel
promedio de gris de las regiones, que es indicativo del tostado final (Fuente y col. 1998).
En IMAQ se muestra un ejemplo de deteccin del nivel de llenado de una botella
de lquido teniendo como referencia un determinado nivel de referencia.
La deteccin de cuerpos extraos en los alimentos constituye otro de los campos
de aplicacin, ya que contribuyen a la credibilidad y buena imagen del producto.
Batchelor y col. (1985) han presentado algunas tcnicas de aplicacin en este aspecto.
Algunas manifestaciones de esto son: la presencia de huesos en filetes que deberan
estar deshuesados, o espinas en el pescado que debera manifestarse limpio, insectos en
las verduras, pelos del operario, etc. Algunas impurezas necesitan ser detectadas
mediante Rayos-X (Chan y col. 1990). Las tcnicas a utilizar son diversas y varan
dependiendo de la naturaleza de la inspeccin, por ejemplo, tcnicas de color, de nivel
de gris, texturas, etc.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 25

La calidad del producto final tambin puede cuantificarse mediante tcnicas de


inspeccin visual. Por ejemplo, el contenido y distribucin de grasa intramuscular es un
factor determinante de la calidad del jamn ibrico. Las medidas qumicas clsicas
determinan el contenido pero no la distribucin, mediante visin se puede encontrar una
relacin entre ambas (Plaza y col. 1998, Durn y col. 1998). Esta tarea se lleva a cabo
mediante tcnicas de binarizacin, operaciones morfolgicas y crecimiento de regiones.
En JIVA (1991) se proporciona una tcnica de tratamiento de imgenes en color
en la manipulacin de carne.
Jimnez y col. (1999) presentan un sistema automtico para el reconocimiento de
frutas incluso en situaciones complicadas, tales como con la presencia de sombras, reas
brillantes, oclusiones, solapamientos. Se presenta adems una revisin de tcnicas en
esta misma lnea.
En Keller y col. (1990) encontramos un sistema para identificar filetes de vaca
mediante tcnicas de color y razonamiento aproximado.

7.6 Inspeccin en el envasado de productos


En IMAQ se muestra un ejemplo para detectar si un determinado envase de
cpsulas de farmacia ha sido correctamente rellenado con las cpsulas correctas
identificadas por su color, tamao y forma y adems que todos los compartimentos
poseen una cpsula. Por ejemplo, en S.36(a) se muestra un envase en el que falta una
grajea en la parte inferior izquierda, lo cual se detectara por la ausencia del color rojo y
amarillo, que aparecen en las celdas correctas. Incluso podra detectarse la correcta
colocacin suponiendo que el rojo se situara siempre a la derecha del amarillo, si se
asume esto, el envasado en este caso sera incorrecto. En la imagen de la figura S.36(b)
todas las grageas estn correctas, lo cual se puede determinar tanto por su color rojo
como por su forma circular, lo que impedira que se introdujeran grageas o cuerpos
ajenos y extraos en los correspondientes compartimentos. Si fuera necesario, se podra
detectar fcilmente el tamao de las grageas mediante la extraccin de regiones
coloreadas.
La lectura e interpretacin del cdigo de barras de los productos manufacturados.
Aunque esto es una tcnica muy utilizada en la industria mediante lectores pticos, en
IMAQ se muestra un mdulo de lectura de cdigo de barras mediante visin artificial.

7.7 Inspeccin en la industria textil


Bahlmann y col. (1999) presentan un mtodo para determinar la calidad de las
costuras en las prendas utilizando un extractor de bordes y la transformada de Hough

26

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

mediante el uso de una red neuronal basada en el Self-Organizing Feature Map. El


trabajo de Dorrity (1995) es precursor en esta lnea.
Latif-Amet y col. (2000) utilizan texturas, en concreto las matrices de
coocurrencia del nivel de gris para detectar defectos en tejidos.

7.8 Inspeccin bajo el agua


En Elnagar y Basu (1998) se propone un trabajo para la inspeccin de objetos
bajo el agua, es el caso de cascos de buques, plataformas petrolferas, etc. El mtodo
consiste en tomar una secuencia de imgenes para con ellas realizar una reconstruccin
3D a partir de la cual obtener la superficie del objeto para despus ser analizada
convenientemente.

7.9 Inspeccin de formas geomtricas bsicas


Mediante la transformada de Fourier es posible la deteccin de figuras
elementales bsicas: tringulos, rectngulos, etc. tal y como se describe en el Captulo 2,
ver figura 2.10, al margen obviamente de las tcnicas basadas en la transformada de
Hough.
Igualmente es posible inspeccionar formas circulares mediante el uso de
histogramas radiales. Este concepto fue introducido por Davies (1997) y obtiene un
histograma de intensidad como una funcin de la distancia radial del centro del objeto
que est siendo inspeccionado.

8 CARTOGRAFA
Mediante el uso de imgenes estereoscpicas areas o de satlite es posible
obtener las elevaciones del terreno con los procedimientos descritos en el Captulo 17,
fundamentalmente a travs de tcnicas de correspondencia basadas en el rea.
Por otro lado, de cara a la elaboracin de los catastros, particularmente en las
zonas rurales, la utilizacin de imgenes areas permiten una fcil identificacin de las
diferentes parcelas y sus delimitaciones tras el correspondiente tratamiento de las
imgenes mediante tcnicas de extraccin de bordes y regiones, as como sus
descripciones tal y como se ha visto a lo largo de los captulos 6 a 9. Si los sensores que
captan las imgenes estn perfectamente calibrados se puede llegar a determinar la
superficie real de las parcelas basndose en el rea de las imgenes medida en pxeles,
simplemente aplicando la correspondiente funcin de transformacin.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 27

9 FOTOINTERPRETACIN
La fotointerpretacin es la ciencia que trata del anlisis de las imgenes por parte
de un experto para extraer de ellas la informacin de inters o relevante, por ejemplo,
ver las construcciones existentes en una determinada imagen de satlite o una imagen
area. Cuanto mejor sea la calidad de la imagen mejor ser el resultado del anlisis. Por
ello las imgenes pueden ser tratadas con todas las tcnicas encaminadas a mejorar la
calidad de la imagen y que se han expuesto a lo largo de este libro, por ejemplo realzado
en el Captulo 4 y restauracin de imgenes (Captulos 21 y 22). Adems, puede ocurrir
que se desee obtener una imagen en color por combinacin de las bandas roja, verde y
azul procedentes de un sensor multiespectral de satlite, en este caso se puede recurrir a
las tcnicas expuestas en el Captulo 5.
El uso de las wavelets descritas en el Captulo 2 resultan de inters para la fusin
de imgenes de diferente resolucin, en efecto, en Garguet-Duport y col. (1996) se
describe un procedimiento de fusin que consiste en partir de dos imgenes, una de
doble resolucin espacial que la otra, y la de doble resolucin se descompone en las
cuatro subimgenes descritas en el Captulo 2 mediante la TDW; a continuacin se
obtiene una nueva imagen mediante la transformada inversa de wavelets, pero
sustituyendo la subimagen resultante del filtrado Paso Bajo/Paso Bajo por la original de
menor resolucin.
Para la fusin de imgenes en fotointerpretacin se puede utilizar el
procedimiento de componentes principales descrito en el Captulo 2.
Adems suele ser til la deteccin de cambios en una zona en diferentes instantes
de tiempo. Esta aplicacin resulta de gran utilidad para la deteccin de zonas
deforestadas, incendios, inundaciones, variacin de la edificacin, etc. Para ello se
pueden utilizar por ejemplo imgenes areas o de satlite captadas en diferentes
instantes de tiempo sobre las que se pueden aplicar diversas tcnicas, entre las que
citamos las siguientes (Jensen 1982): a) una simple diferencia de imgenes como se
explic en el Captulo 12; b) clculo del cociente entre los valores de los pxeles de dos
imgenes de diferentes fechas; c) comparacin de las clasificaciones obtenidas en las
diferentes imgenes con las tcnicas descritas en los captulos 13, 14 y 15; d)
comparacin de texturas mediante las tcnicas descritas en el Captulo 9; e) mediante
tcnicas de anlisis de componentes principales como se describe en el Captulo 2 para
determinar mediante el uso de autovalores y autovectores la diferencia entre imgenes
de diferentes instantes de tiempo; f) anlisis de cambio vectorial, se pueden medir dos
variables (vector bidimensional) en los diferentes instantes de tiempo para detectar el
ngulo y magnitud del cambio cuando esas variables se representan en un sistema de
ejes cartesianos.

También podría gustarte