Está en la página 1de 6

Grupo de Reconocimiento de Imgenes y Visin Articial (RIVA)

Joaqum Arlandis, Javier Cano, Jos Garca Hernndez, Rafael Llobet, Gloria Mainar, Roberto Paredes, Jernimo Pla, Alberto Prez, Juan Carlos Prez Corts, Ismael Salvador, Alejandro Toselli, Mauricio Villegas
Instituto Tecnolgico de Informtica Universidad Politcnica de Valencia {arlandis,jcano,jgarcia,rllobet,gmainar,rparedes,jcperez,aperez,jpla,issalig,ahector,mvillegas}@iti.upv.es

Resumen
El grupo de Reconocimiento de Imgenes y Visin Articial (RIVA) del Instituto Tecnolgico de Informtica se corresponde con una lnea de trabajo dentro del grupo de investigacin de Reconocimiento de Patrones y Tecnologas del Lenguaje Humano (PRHLT). Centra su actividad en el rea de anlisis de imgenes y visin por computador.

signicativamente, pueden zonas estar en las que

ya se

que

los o

documentos las a el texto

manuscritos

impresos,

encuentra

reconocer pueden estar localizadas o por el contrario pueden aparecer situadas arbitrariamente sobre cualquier punto, etc. Desde hace tiempo, el grupo de Visin ha participado en proyectos relacionados con el reconocimiento ptico de caracteres manuscritos e impresos [1, 2, 3, 4, 11], dando como resultado un motor de reconocimiento propio, as como diversas herramientas diseadas adhoc"para resolver las tareas propuestas en cada colaboracin realizada con empresas especializadas en introduccin de datos y proceso de documentos.

1.

reas de investigacin

Una importante lnea de I+D en el Instituto Tecnolgico de Informtica est centrada en al rea de Visin por Computador. El Grupo de Reconocimiento de Imgenes y Visin Articial est avalado por numerosas publicaciones y proyectos, y se enmarca en una lnea de trabajo amplia centrada en las reas de Reconocimiento de Formas y Tecnologas de la percepcin. Tiene experiencia en tareas de inspeccin de materiales continuos, en anlisis de escenas complejas, reconocimiento de caracteres, color y otras reas anes como identicacin biomtrica (huellas dactilares, reconocimiento facial, etc.). A continuacin se describen las principales reas de investigacin del grupo.

1.2.

Imagen mdica

Uno de los campos en los que el procesado digital de imgenes est aportando inestimables ventajas es el caso del anlisis de imgenes mdicas. Dado que la responsabilidad y complejidad asociada a las tareas en este mbito es muy alta, las aplicaciones que actualmente se disean siguen una lnea de asistencia al diagnstico, constituyndose en herramientas de ayuda para el especialista, ms que en sistemas automatizados [12]. Por ejemplo, el grupo ha colaborado con varios centros hospitalarios para el diseo de herramientas de ayuda al diagnstico de

1.1.

Anlisis de documentos

Existen multitud de aplicaciones en las que se requiere digitalizar documentos. En funcin de su origen el problema a resolver diere

Actas del Simposio de Reconocimiento de Formas y Anlisis de Imgenes (AERFAI), pp.153-158 ISBN: 84-9732-445-5 2005 Los autores, Thomson

154
cncer de prstata sobre imgenes ultrasonogrcas [14, 8] y se encuentra en fase de experimentacin para el diagnstico de cncer de mama sobre radiografas digitalizadas [9, 10]. Otra aplicacin en la que tambin se trabaja actualmente tiene como objetivo el desarrollo de un sistema de ayuda al diagnstico de patologas del pie, a partir de informacin extrada de seales de presin plantares [7].

Visin por Computador

Figura 1: Anlisis de escenas. Segmentacin del rostro

1.3.

Anlisis de escenas

Algunas de las aplicaciones existentes en el campo de la visin por computador, y al mismo tiempo relacionadas con el reconocimiento de objetos o personas, pueden verse como el resultado de la compaginacin de dos tcnicas: la primera de ellas consistira en la localizacin de los objetos de inters dentro de una imagen (anlisis de escenas) [13, 5], y la segunda se correspondera con la identicacin de los objetos seleccionados (reconocimiento). destacar que el Por lo tanto, de hay es que un de control de dimensional, parmetros metrologa, de textura, especiforma, anlisis escenas cacin
Figura 2: Anlisis de escenas. Segmentacin de matrculas

rea que abarca multitud de aplicaciones y consecuentemente las soluciones ideadas para resolver este problema siguen aproximaciones muy diversas.

color, detalles, control de defectos de todo tipo, como elementos extraos, abolladuras, grietas, desperfectos, etc. Cuando alguna impide caracterstica el uso de especial productos

El grupo de Visin Articial tiene experiencia en la deteccin de matrculas y caras sobre imgenes no restringidas, es decir, imgenes en las que las condiciones de captura no estn controladas. Esto quiere decir que, al problema de localizar un determinado objeto en una imagen, se suman los problemas derivados de los cambios de iluminacin, perspectiva y entorno variables.

del

proceso

comerciales de inspeccin (o the shelf"), normalmente orientados a tareas sencillas, la aplicacin se convierte en un posible proyecto de I+D. En nuestro caso, el grupo de Visn Articial ha participado en el diseo, construccin e implantacin de un sistema de inspeccin dedicado a la deteccin automtica de defectos de estampado textil.

1.4.

Inspeccin industrial
2. Proyectos

En esta rea, por ejemplo, existen numerosos procesos de control de calidad sin contacto cuyas restricciones o caractersticas no permiten el uso de las herramientas convencionales disponibles en el mercado. Entre ellos: procesos

A continuacin se comentan algunos de los proyectos realizados en colaboracin con empresas del sector, en los que se aplican los co-

Simposio de Reconocimiento de Formas y Anlisis de Imgenes (AERFAI)


nocimientos adquiridos en el campo de investigacin (reconocimiento de patrones y visin articial) del grupo de visin.

155

2.1.
El

Reconocimiento de texto manuscrito (Anlisis de documentos)


reconocimiento de texto manuscrito

continuo es todava un desafo. Aunque el texto se compone bsicamente de caracteres individuales, muchas aproximaciones al reconocimiento ptico de caracteres no consiguen buenos resultados ya que la segmentacin de texto continuo en caracteres es una tarea compleja [17]. Sin embargo, los seres humanos son capaces de segmentar y reconocer la escritura aparentemente sin esfuerzo. Una forma de conseguir precisin consiste en retrasar el reconocimiento hasta el nivel ms alto. Una frase se comprende mejor cuando la hemos ledo por completo. Esto implica una cooperacin de los niveles morfolgico, lxico y sintctico que se lleva a cabo mediante tcnicas anlogas a las de reconocimiento de habla continua. Esta metodologa hace uso de algoritmos robustos y validados. Adems, no se requiere segmentacin previa; ya que se obtiene automticamente en la decodicacin. Varios integrantes del grupo de Visin Articial han colaborado, con empresas privadas del sector, para el desarrollo de sistemas experimentales. Dichos sistemas son capaces de reconocer cantitades numricas escritas en cheques bancarios y formularios con encuestas tamben escritas a mano y sin restricciones lingsticas. un formulario. Los caracteres se extraen automticamente de los campos manuscritos de los formularios. El uso de modelos particularizados, aprendidos automticamente a partir de muestras, permite que el sistema pueda trabajar con cualquier lengua y cualquier tipo de alfabeto. En lneas generales, el preproceso aplicado para la digitalizacin de un formulario manuscrito podra dividirse en las siguientes 3 etapas:
Figura 3: Anlisis de documentos. Reconocimiento de texto manuscrito

Preproceso: los campos y las celdas son aisladas mediante la segmentacin. Esto implica diversas etapas de procesado digital de la imagen: eliminacin de ruido, deteccin de blancos, determinacin de la caja mnima de inclusin y reescalado.

2.2.

Reconocimiento de formularios manuscritos (Anlisis de documentos)

El sistema desarrollado en el ITI emplea algoritmos de OCR, basados en mtodos de clasicacin estadstica, para la extraccin de informacin alfanumrica de los campos de

Clasicacin: Cada carcter aislado es clasicado de forma individual por el motor de reconocimiento.

156

Visin por Computador


trabajar con imgenes no restringidas: iluminacin, perspectiva y entorno variables. En la etapa de segmentacin se buscan texturas similares a una matrcula. Posteriormente se aplica un postproceso sobre los puntos candidatos a pertenecer a zonas de matrcula y se devuelve el rea rectangular en la que se encuentra la matrcula [5]. Posteriormente y de forma complementaria se detectan los lmites de la matrcula dentro de la hiptesis de segmentacin. Finalmente, se aplica un proceso de clasicacin pixels proceso mltiple de sobre a la un conjunto de una pertenecientes matrcula. proporciona Este

clasicacin

cadena de caracteres que se debe ajustar a un modelo lingstico conocido: el formato de las matrculas. Aplicando un analizador sintctico es posible recticar fallos parciales
Figura 4: Anlisis de documentos. Reconocimiento de formularios manuscritos

del clasicador. Como resultado, el motor de reconocimiento proporciona el identicador de matrcula y un nivel de conanza.

Parsing:

Cada

secuencia

de

caracteres

reconocidos en un campo es sometida a un proceso de anlisis sintctico que corrige, si es necesario, la cadena original para que se ajuste a un modelo lingstico preestablecido [15]. Finalmente, se proporciona la cadena corregida y un valor de conanza.

Integrantes del grupo de Visin Articial tienen experiencia con empresas privadas del sector, con las cuales colaboran en el diseo y desarrollo de un sistema de reconocimiento automtico de matrculas que ser implantado a la entrada de un parking.

2.4.

Ayuda a la deteccin del cncer de prstata (Imagen mdica)

El Instituto Tecnolgico de Informtica ha participado en varios proyectos de colaboracin con empresas de la Comunidad Valenciana involucradas en tareas de procesado automtico de miles de documentos, como la elaboracin del censo espaol del 2001 o la digitalizacin de boletines ociales (partes de nacimiento, matrimonio, defuncin, etc.). y

El objetivo es la obtencin de un sistema automtico de ayuda al diagnstico ecogrco del cncer de prstata mediante tcnicas de anlisis de imagen y reconocimiento de formas. Esta herramienta puede ayudar al experto en la decisin de realizar o no biopsia. Para discriminar entre tumores malignos benignos por es necesario realizar Sin biopsias embargo, guiadas ultra-sonografa.

2.3.

Reconocimiento de placas de matrculas (Anlisis de escenas)

existe el problema de que no siempre la zona de puncin es signicativa. Por ello, sera de ayuda una estimacin de las zonas con cncer. Para ello, se selecciona la imagen del

Se dispone de un motor de reconocimiento de matrculas de vehculos diseado para

Simposio de Reconocimiento de Formas y Anlisis de Imgenes (AERFAI)


instante anterior a la puncin. sta se etiqueta marcando la zona biopsiada y la prstata completa, para su posterior utilizacin como muestra de entrenamiento o de "test". La clasicacin de las texturas se puede obtener mediante:

157

Un factor de conanza a partir de una bsqueda rpida de vecinos [6]. La probabilidad de un modelo oculto de Markov, que modela la clase no cncer y la clase cncer.

Las zonas candidatas a contener cncer son coloreadas a n de orientar la zona de puncin. Se tiene experiencia en este campo gracias a la colaboracin de miembros del Grupo de Visin Articial con mdicos de un Hospital de Valencia.

Figura 5: Inspeccin Industrial. Deteccin de defectos de estampado

2.5.

Control de calidad textil (Inspeccin industrial)

Figura 6: Inspeccin Industrial. Detalle de un defecto

Uno de los primeros proyectos en los que particip el ITI con empresa privada tuvo como objetivo el diseo, desarrollo y construccin de un sistema completo de inspeccin industrial para la deteccin de ciertos fallos de estampado. Finalmente, se consigui una herramienta que permita a los operarios de la estampadora textil registrar los primeros metros de estampado y comprobar automticamente si en el resto de la partida de estampado apareca algn defecto. El proceso de estampado textil es complejo, entre otras cosas se requiere un sincronismo muy preciso de de los rodillos, as como un aporte tinta perfectamente homogneo.

utilizacin de 4 cmaras lineales para alcanzar una resolucin de imagen que permita detectar defectos del ancho de un hilo. Respecto a las tcnicas empleadas, gracias al registrado local elstico, [16], se consigue eliminar las deformaciones elsticas que experimenta el tejido al ser arrastrado a gran velocidad por el tren de estampado. Cada pixel de la imagen de referencia se representa por un vector de caractersticas de gran dimensionalidad, que contiene caractersticas de color de toda la vecindad del pixel.

Debido a las exigentes condiciones anteriores se producen errores de estampado a menudo.

Referencias
La presencia de un hilo en determinados casos se confunde con la textura. Cuando un hilo se adhiere a un rodillo de impresin obstruye el tinte resultando una zona de color ms claro. La anchura del tejido puede alcanzar los 3.6 metros, siendo necesaria la [1] Arlandis J., Prez-Corts J.C., Llobet R.

Handwritten Character Recognition Using Continuos Distance Transformation, Proceedings of the 15th. International Conference on Pattern Recognition, 2000.

158
[2] Arlandis J., Prez-Corts J.C.,

Visin por Computador

The Continuos Distance Transformation: A Generalization of the Distance Transformation for Continuos-valued Images, Pattern ReFast Handwritten Recognition Using Continuous Distance Transformation, Progress in Pattern Recognition Speech and Image Analysis, Lecture Notes in Computer
J., Prez-Corts J.C., Science (2905), 2003. Llobet R., Training Set Expansion in Handwritten Character Recognition, International Workshop on Statistical Pattern Recognition, 2002.

Conference on Advances in Biomedical Signal and Information Processing, 2004. [10] Llobet R., Paredes R., Prez-Corts J.C.,

cognition and Applications, 2000. [3] Arlandis

Comparison of feature extraction methods for breast cancer detection, 2nd Iberian
Conference on Pattern Recognition and Image Analysis, 2005.

[11] Keysers D., Paredes R., Ney H., Vidal E.,

Combination of Tangent Vectors and Local Representations for Handwritten Digit Recognition, International Workshop on Statistical Pattern Recognition, 2002.

[4] Cano J., Prez-Corts J.C., Arlandis J.,

[12] Paredes R., Keysers D., Lehmann T.,

[5] Cano J., Prez-Corts J.C.,

Vehicle License Plate Segmentation In Natural Images,


Proceedings of the 1st Iberian Conference on Pattern Recognition and Image Analysis (IbPRIA), 2003.

Classication of Medical Images using Local Representations, Bildverarbeitung fr die MediWein B. B., Ney H., Vidal E., zin, 2002.

[13] Deselaers T., Keysers D., Paredes R., Vidal E., Ney H.,

Local Representations for Multi-Object Recognition, Pattern Recognition, 25th DAGM Symposium, 2003.

[6] Cano I.,

Comparison Of Two Fast NearestNeighbour Search Methods in HighDimensional Large-Sized Databases,

J.,

Prez-Corts

J.C.,

Salvador

[14] Prez-Corts J.C., Juan A., Vallada E.,

Workshop on Statistical Pattern Recognition, 2005. [7] Garca-Hernndez J., Paredes R., Garrido

Textural Analysis Of Prostate Cancer In Transrectal Ultrasound Images, Proc. of


Biosignal, 2002.

[15] Perez-Cortes J.C., Amengual J.C., Arlandis J., Llobet, R.,

Foot pathologies classication pressure distribution over the foot plant,


D., Soler C., on Biosignal Processing and Classication, 2005.

Stochastic Error Correcting Parsing for OCR Post-processing, International Conference on Pattern Recognition, 2000.

Enviado al First International Workshop

[16] Perez-Cortes J.C., Paredes R., Valiente

[8] Llobet R., Toselli A. H., Prez-Corts J. C.,

Computer-aided Prostate Cancer Detection in Ultrasonographic Images,


Juan A., sis, 2003.

An Elastic Registration Method for Quality Control of Textile Printing, Pattern Recognition and
J.M., Arlandis J., Cano J., Image Analysis, 1999.

Proceedings of the 1st Iberian Conference on Pattern Recognition and Image Analy-

[17] Toselli A., Juan A., Vidal E.,

[9] Llobet R., Toselli A. H., Prez-Corts J.

C., Breast Cancer Detection in Digitized Mammograms Using Non-Parametric Methods, Proceedings of the 2nd International

Spontaneous Handwriting Recognition and Classication, Proceedings of the 17th International Conference on Pattern Recognition, 2004.

También podría gustarte