Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Aplicaciones de La Visión Artificial
Aplicaciones de La Visión Artificial
ARTIFICIAL
1 INTRODUCCIN
Es preciso reconocer que hoy por hoy la visin por computador a veces no es la
mejor solucin a un problema. Existen muchas ocasiones en las que el problema es tan
complejo que la solucin humana es lo mejor. Por ejemplo imaginemos una conduccin
de un vehculo en una carretera con trfico intenso. Pero a veces, las soluciones
humanas tienden a ser inexactas o subjetivas y en ocasiones lentas y presentan una
ausencia de rigor as como una pobre percepcin (Marshall y Martin 1993, Hamey y col.
1993). No obstante, la solucin humana es menos estructurada que la solucin artificial
y muchos problemas de visin por computador requieren un nivel de inteligencia mucho
mayor que el que la mquina pueda ofrecer. El sistema de visin humana puede
describir automticamente una textura en detalle, un borde, un color, una representacin
bidimensional de una tridimensional, ya que puede diferenciar entre imgenes de
diferentes personas, firmas, colores, etc., puede vigilar ciertas zonas, diagnosticar
enfermedades a partir de radiografas, etc. Sin embargo, aunque algunas de estas tareas
pueden llevarse a cabo mediante visin artificial, el software o el hardware necesario no
consigue los resultados que seran deseables.
Aun a pesar de las limitaciones expuestas, cada da es mayor el nmero de
aplicaciones de la visin artificial. Por ello slo es posible dar una pequea pincelada
sobre las mltiples aplicaciones en las que la visin artificial se ha aplicado hasta el
momento. Aqu solamente proporcionamos algunas ideas para generar aplicaciones en la
mente del lector. Obviamente los ejemplos que se presentan son aplicables a cualquier
RA-MA
2 NAVEGACIN EN ROBTICA
En este caso, la visin es un elemento de un sistema multisensorial. La
informacin procedente de la visin es validada, comparada y finalmente integrada con
el resto de la informacin proporcionada por otro tipo de sensores. El resultado es la
reconstruccin de la escena 3-D, que permite la navegacin autnoma del sistema
(Schneider 1996, Lpez-Orozco 1999).
Para la navegacin en robtica se recurre generalmente a tcnicas de visin
estereoscpica con el fin de poder reconstruir la escena 3-D. Si a esto se le aade algn
mdulo de reconocimiento 3-D con el fin de identificar la presencia de determinados
objetos, hacia los que debe dirigirse o evitar, tanto mejor. La utilizacin del movimiento
basado en la visin constituye un magnfico recurso puesto que el propio sistema est ya
de hecho en movimiento. Naturalmente, cualquier otra informacin que pueda extraerse
con ayuda de la visin puede proporcionar una gran ayuda para conseguir el movimiento
del robot.
No es exclusivo su uso en robtica, sino que podra utilizarse en otras
aplicaciones tales como guiado automtico de mquinas, tal y como proponen Amat y
RA-MA
Casal (1989) para mquinas agrcolas. Tambin para la deteccin y estimacin del
movimiento de vehculos (Pei y Liou 1998, Tan y col. 1998).
RA-MA
(a)
(b)
(a)
(b)
RA-MA
4 MEDICINA
La comunidad mdica tiene muchas aplicaciones en las que aparece el
procesamiento de imgenes, a menudo orientadas hacia el diagnstico de dolencias o
enfermedades, entre las que se incluyen radiografas, resonancias magnticas,
tomografas etc.
ste es un campo extraordinariamente amplio donde la mejor fuente de ejemplos
y aplicaciones la constituye la revista IEEE Trans. Medical Imaging. A veces, en
algunas otras revistas de medicina se incluyen diversas aplicaciones basadas en
imgenes mdicas. Lester y Arridge (1999) presentan una revisin de mtodos relativos
a lo que en ingls se denomina Image Registration y que en definitiva se trata de definir
una estrategia para encontrar la correspondencia entre un modelo y un objeto, siendo
necesario definir las caractersticas o estructuras, el espacio de bsqueda y la mtrica
para determinar el grado de semejanza. El propio trabajo contiene abundantes
referencias bibliogrficas en las que se incluyen algunos ejemplos de inters en el
campo de las imgenes mdicas. Adems Duncan y Ayache (2000) hacen una revisin
sobre el progreso en los ltimos 20 aos del anlisis de imgenes mdicas as como los
cambios en el futuro. Desarrollan un exhaustivo trabajo al respecto, que incluye 139
referencias de inters. En IPMI99 (1999) se encuentran en exclusiva abundantes
trabajos aplicados al campo de la medicina.
Veamos algunos ejemplos de aplicaciones de procesamiento bsico.
Consideremos la imagen dada en la figura 3(a) que corresponde a una radiografa con
una imagen de muy baja calidad, se pretende extraer informacin sobre las manchas
blancas que aparecen en la misma. En (b) se muestra su histograma de frecuencias. Se
modifica el histograma mediante aumento del contraste y gamma con lo que se obtiene
la imagen dada en (c) y su histograma correspondiente en (d), aqu las manchas aparecen
explcitamente, sin embargo todava se puede extraer ms informacin. Utilizando una
tcnica de binarizacin mediante seleccin de umbral se obtiene (e) que posteriormente
se dilata mediante la correspondiente operacin morfolgica para rellenar huecos y
hacer ms explcitas las manchas, obteniendo (f). Posteriormente, de esta imagen se
extraen las manchas (objetos) subyacentes, que son etiquetados. Segn el nmero de
etiqueta as es su color en S.33(a), con esta informacin podemos obtener el rea de las
diferentes regiones etiquetadas (coloreadas).
En la figura S.33(b) se muestra una ecografa con una grfica en su parte inferior.
La segmentacin de dicha grfica por extraccin de la componente de color verde
mediante las tcnicas de extraccin de regiones por el color descrita en el Captulo 7,
permite su tratamiento (medida de los picos, anchura entre picos, etc.). En la parte
inferior de dicha figura aparece la grfica binarizada.
RA-MA
En la figura S.34 (a) se proporciona una imagen original, en (b) y (c) las
componentes dominante de color rojo y verde respectivamente para su anlisis. As,
resulta fcil determinar la superficie de rojo o verde y dnde se localizan.
La tcnica del pseudocolor puede utilizarse tambin para clarificar o visualizar
mejor una imagen. En la figura 4, aparece una imagen original y la misma imagen
coloreada en S.6(a) y (c) con sus respectivos mapas de colores en (b) y (d) utilizando la
tcnica del pseudocolor expuesta en el Captulo 5.
(a)
(b)
(c)
(d)
(e)
(f)
RA-MA
RA-MA
Medida del grosor de venas y arterias (Wick y col. 1993, Chen y col. 1987, SchmidChoenbein y col. 1977).
Deteccin de puntos de inters en una radiografa como precursores de la presencia
de un tumor (Low 1991) o como puntos de referencia en ciertos rganos como el
cerebro en Rohr (1999).
Identificacin de un ndulo sospechoso en una mamografa por diferencia de
contraste y textura en Trucco y Verri (1998).
En neurologa para determinar el estado de enfermedad y el grado de deformacin de
la materia gris del cerebro en enfermos epilpticos mediante el uso de contornos
deformables (Schnabel y Arridge 1999, Gee 1999).
Deteccin de costillas en radiografas mediante la transformada de Hough (Wechsler
1977).
Deteccin de microcalcificaciones en mamografas mediante redes neuronales
(Tsujii y col. 1999).
Reconstruccin de arterias coronarias utilizando imgenes de angiogramas (Windyga
y col. 1998).
La diferencia de imgenes ha sido utilizada en la substraccin de angiogramas para
estimar el movimiento de una vena o vaso capilar (Rong y col. 89, Abdel-Malek y col.
90).
Movimiento de las paredes cardacas a partir de imgenes de Resonancia Magntica
de las que se extraen puntos de inters sobre los que se establecen las correspondencias,
mediante correlacin, entre las distintas imgenes de una secuencia de imgenes. Se
determina el flujo ptico a travs de dichas correspondencias (Fisher y col. 1991).
Otro mtodo de anlisis de movimiento para imgenes del corazn obtenidas
mediante resonancia magntica se basa en la deteccin de bordes y la correspondencia
de mscaras en las direcciones esperadas (Guttmann y Prince 1990).
Los modelos deformables se han aplicado tambin al anlisis del movimiento 3D en
imgenes de resonancia magntica del corazn (Young y Axel 1992). En Kambhamettu
y Goldgof (1992) la estima de correspondencia de puntos en una superficie no rgida
(rganos biolgicos) se basa en cambios de la curvatura Gaussiana.
En Fernndez-Rodrguez y col. (1993) se presenta un sistema de redes neuronales
para el diagnstico de carcinomas y neumonas en los pulmones mediante imgenes de
radiografas del trax.
RA-MA
IDENTIFICACIN DE CONSTRUCCIONES,
INFRAESTRUCTURAS Y OBJETOS EN ESCENAS
DE EXTERIOR
10
RA-MA
(a)
(b)
RA-MA
Batlle y col. (2000) presentan una revisin de mtodos y estrategias para extraer y
reconocer objetos en escenas naturales mediante el color. Dichas estrategias
comprenden diferentes enfoques: arriba-abajo, abajo-arriba e hbridos. Las 61
referencias citadas constituyen a su vez una buena fuente de documentacin. El color
junto con la textura y los contornos deformables se ha utilizado para localizar objetos en
Zhong y Jain (2000).
6 RECONOCIMIENTO Y CLASIFICACIN
Una posible aplicacin puede ser la clasificacin de objetos por su tamao y en su
caso el recuento de los mismos, ver figura 6. Por ejemplo, para contar monedas en
funcin del rea de la moneda, permetro o nmero de Euler tras el correspondiente
proceso de binarizacin (Mil).
En Cspedes y col. (1998) se muestra una tcnica para el reconocimiento de caras
de personas mediante visin artificial utilizando perfiles de intensidad tal y como se
describe ms adelante. En Intrator y col. (1996) se utilizan redes neuronales con el
mismo fin, y en Kwon y Lobo (1999) se clasifican las edades a partir de imgenes de
caras. Feng y Yuen (1998) reconocen ojos en caras humanas. Purnell y col. (1998)
reconocen caras de entre un grupo de personas.
(a)
(b)
12
RA-MA
RA-MA
14
RA-MA
RA-MA
Espejo
Objeto
Direccin
del lser
Plataforma
giratoria
Cmara en
plataforma
giratoria
16
RA-MA
propiedades pticas de las lentes y cmaras y la resolucin del CCD. Tambin depende
de la distancia del sistema de visin al objeto como se explicar seguidamente.
Aparece un rea de incertidumbre en la localizacin precisa de los puntos, como
se ilustra en la figura 8.
E je
p tic o 2
E je
p tic o 1
d
C m a ra 1
A re a d e
In c e rtid u m b re
C m a ra 2
tan
= 0.5tan 1
n
mientras la resolucin en profundidad se puede demostrar que es (Hutber 1987)
z =
2 z 2 tan 2
d
tan + tan + 1
d
z
RA-MA
: 0.08 radianes
n : 512 x 5 = 2560
d : 0.3 m
: 0.0 radianes
z : 0.7 m
18
RA-MA
(a)
(b)
(c)
(d)
Figura 9 (a) y (c) El mismo conector de fibra ptica en dos posiciones diferentes;
(b) y (d) orificios de insercin de los hilos del cable extrados mediante binarizacin
En cualquier caso, la inspeccin requiere comparar un modelo ideal con el que
est siendo inspeccionado.
RA-MA
20
(a)
(b)
(c)
(d)
RA-MA
Figura 10 (a) Imagen original modelo; (b) imagen deteriorada; (c) perfil de
intensidad de (a) a lo largo de la lnea horizontal a la misma altura que en (b); (d) perfil
de intensidad a lo largo de la lnea horizontal marcada en (b). Obsrvese la diferencia
del perfil en la zona deteriorada de (b) con respecto al modelo
RA-MA
22
(a)
(b)
(c)
(d)
RA-MA
(e)
Figura 11 (a) y (b) Imgenes originales; (c) y (d) perfiles correspondientes a las
lneas verticales marcadas; (e) diferencia entre las dos imgenes originales
Nakagawa (1982) utiliza luz estructurada proyectando un haz de luz sobre la
soldadura y midiendo su perfil. No obstante, la luz reflejada de ciertos tipos de
soldadura puede originar problemas en la obtencin de imgenes claras. McIntosh
(1984) sugiri el uso de luz coloreada aunque a veces la percepcin de los colores para
diferentes imgenes puede ser diferente. Capson y Eng (1988) utilizaron luz coloreada
por capas, en realidad dos anillos de luz fluorescente de forma que sus centros caen en el
mismo eje, uno que emite luz roja y el otro azul.
RA-MA
24
RA-MA
RA-MA
26
RA-MA
8 CARTOGRAFA
Mediante el uso de imgenes estereoscpicas areas o de satlite es posible
obtener las elevaciones del terreno con los procedimientos descritos en el Captulo 17,
fundamentalmente a travs de tcnicas de correspondencia basadas en el rea.
Por otro lado, de cara a la elaboracin de los catastros, particularmente en las
zonas rurales, la utilizacin de imgenes areas permiten una fcil identificacin de las
diferentes parcelas y sus delimitaciones tras el correspondiente tratamiento de las
imgenes mediante tcnicas de extraccin de bordes y regiones, as como sus
descripciones tal y como se ha visto a lo largo de los captulos 6 a 9. Si los sensores que
captan las imgenes estn perfectamente calibrados se puede llegar a determinar la
superficie real de las parcelas basndose en el rea de las imgenes medida en pxeles,
simplemente aplicando la correspondiente funcin de transformacin.
RA-MA
9 FOTOINTERPRETACIN
La fotointerpretacin es la ciencia que trata del anlisis de las imgenes por parte
de un experto para extraer de ellas la informacin de inters o relevante, por ejemplo,
ver las construcciones existentes en una determinada imagen de satlite o una imagen
area. Cuanto mejor sea la calidad de la imagen mejor ser el resultado del anlisis. Por
ello las imgenes pueden ser tratadas con todas las tcnicas encaminadas a mejorar la
calidad de la imagen y que se han expuesto a lo largo de este libro, por ejemplo realzado
en el Captulo 4 y restauracin de imgenes (Captulos 21 y 22). Adems, puede ocurrir
que se desee obtener una imagen en color por combinacin de las bandas roja, verde y
azul procedentes de un sensor multiespectral de satlite, en este caso se puede recurrir a
las tcnicas expuestas en el Captulo 5.
El uso de las wavelets descritas en el Captulo 2 resultan de inters para la fusin
de imgenes de diferente resolucin, en efecto, en Garguet-Duport y col. (1996) se
describe un procedimiento de fusin que consiste en partir de dos imgenes, una de
doble resolucin espacial que la otra, y la de doble resolucin se descompone en las
cuatro subimgenes descritas en el Captulo 2 mediante la TDW; a continuacin se
obtiene una nueva imagen mediante la transformada inversa de wavelets, pero
sustituyendo la subimagen resultante del filtrado Paso Bajo/Paso Bajo por la original de
menor resolucin.
Para la fusin de imgenes en fotointerpretacin se puede utilizar el
procedimiento de componentes principales descrito en el Captulo 2.
Adems suele ser til la deteccin de cambios en una zona en diferentes instantes
de tiempo. Esta aplicacin resulta de gran utilidad para la deteccin de zonas
deforestadas, incendios, inundaciones, variacin de la edificacin, etc. Para ello se
pueden utilizar por ejemplo imgenes areas o de satlite captadas en diferentes
instantes de tiempo sobre las que se pueden aplicar diversas tcnicas, entre las que
citamos las siguientes (Jensen 1982): a) una simple diferencia de imgenes como se
explic en el Captulo 12; b) clculo del cociente entre los valores de los pxeles de dos
imgenes de diferentes fechas; c) comparacin de las clasificaciones obtenidas en las
diferentes imgenes con las tcnicas descritas en los captulos 13, 14 y 15; d)
comparacin de texturas mediante las tcnicas descritas en el Captulo 9; e) mediante
tcnicas de anlisis de componentes principales como se describe en el Captulo 2 para
determinar mediante el uso de autovalores y autovectores la diferencia entre imgenes
de diferentes instantes de tiempo; f) anlisis de cambio vectorial, se pueden medir dos
variables (vector bidimensional) en los diferentes instantes de tiempo para detectar el
ngulo y magnitud del cambio cuando esas variables se representan en un sistema de
ejes cartesianos.