ProDigIma y VC

PROCESAMIENTO DIGITAL DE IMGENES Y VISIN POR COMPUTADORES
Autor: Dr. Juan Jos Aranda Aboy RESUMEN

El presente trabajo ofrece una introduccin general sobre Procesamiento Digital de Imgenes, Visin por Computadores y Reconocimiento de Patrones, como sntesis y a partir de las conferencias dictadas por el autor en la Universidad Iberoamericana de Ciencia y Tecnologa los das 31 de marzo y 1 ro y 2 de abril de 1998.
INTRODUCCIN Bajo los nombres de Procesamiento Digital de Imgenes y Visin por Computadores se integra un amplio rango de procesos de cmputo y representaciones de informacin relacionada con imgenes. El Reconocimiento de Patrones es una teora general usada para clasificar elementos. Una imagen representa a una escena dentro del computador. Se obtiene mediante un detector de algn tipo de energa: luz en el espectro visible en el no visible, sonido, resonancia magntica, rayos X, radio-istopos, calor, etc.; y se digitaliza, por lo que la informacin se almacena como una matriz de muestras discretas: pxeles. Existe un auge mundial en las investigaciones sobre estos tpicos, reflejado por un creciente nmero de investigadores, congresos cientficos internacionales y publicaciones, la obtencin de novedosas patentes sobre mtodos desarrollados y la aparicin de numerosos productos comercializados. Al respecto, el Profesor Emrito de la Universidad de Tennessee Knoxville (UTK), Dr. Rafael C. Gonzlez, escribe: Una de las mas llamativas atracciones de la tecnologa es que el horizonte para nuevos desarrollos es virtualmente ilimitado, no slo en equipos, sino en aplicaciones... Este mercado se espera crezca a un promedio de $50 mil millones de dlares hacia el ao 2007,... en reas tales como el entretenimiento, los cuidados de salud y la seguridad.[7] PROCESAMIENTO DIGITAL DE IMGENES El Procesamiento Digital de Imgenes (PDI) transforma una imagen en otra con propiedades deseadas que ser analizada o interpretada de manera ms fcil por los seres humanos. Las transformaciones fundamentales que se realizan son: Mejoramiento de Contraste, Eliminacin o Suavizado de Ruidos, Realce de Contornos, Compresin, Ampliacin de Detalles, Restauracin de una imagen degradada a partir del conocimiento previo del fenmeno ocurrido y Reconstruccin tridimensional a partir de mltiples vistas bidimensionales. Algunas aplicaciones [5] ampliamente difundidas son: 4 Medicina: Equipos como la Tomografa Axial Computarizada, la Cmara Gamma y la Resonancia Magntica no existiran; y los de angiografa por sustraccin y ecografa se veran muy limitados. Tambin tienen amplio uso los Sistemas de Almacenamiento y Comunicacin de Imgenes, donde se guardan estudios realizados por diversas modalidades, que pueden analizarse simultneamente para obtener informacin completa anatmica y funcional en salas de diagnstico, ciruga y consultas, adems de permitir acceso remoto a especialistas renombrados. 4 Biologa: Estudio de cromosomas, cidos nucleicos, virus y bacterias; Biotecnologa humana, pecuaria y forestal; Seleccin y crecimiento de plantas y animales; etc. 4 Geologa, Geografa y Geofsica: Identificacin de yacimientos minerales, creacin de mapas, estudio del impacto del desarrollo econmico humano sobre el medio ambiente, etc. 4 Astronoma: Composicin estelar; Anlisis de emisiones; etc. 4 Publicaciones y Publicidad: Composicin de propaganda, revistas y libros, video clips, escenas para filmes, etc. 4 Agricultura: Control y anlisis del rendimiento en plantaciones, desarrollo de cultivos, etc. 4 Conservacin de documentos: Creacin de oficinas sin papeles, Almacenamiento de bibliotecas y documentos histricos. 4 Restauracin de obras de arte : Coloreado de filmes monocromticos, devolucin de colores originales a dibujos animados, arquitectura de templos antiguos, etc. 4 Tareas militares: Inspeccin de teatros de operaciones, etc.
-1-
y en otras ramas de la actividad humana, recalcndose la creciente diversificacin de las aplicaciones. VISIN POR COMPUTADORES El propsito de la Visin es percibir el mundo para concebir una estrategia, realizar acciones y comprobar su ejecucin. La Visin por Computadores (VC) se ocupa de analizar imgenes y obtener una interpretacin que corresponda con lo observado: comprensin de la escena a partir de su imagen proyectada. La retina del Sistema de Visin Humano posee millones de clulas especializadas conos y bastoncillos- que reciben luz a travs de los sistemas pticos cristalino y humores acuoso y vtreodel ojo y la transforman en impulsos nerviosos para ser transmitidos al cerebro. Las posibilidades actuales de la tcnica y el desconocimiento que an se tiene sobre los procesos humanos no permiten construir sistemas con tales caractersticas todava, por lo que la emulacin parte de su funcionalidad. (Ver nota i al final). Algunos aspectos a observar en el diseo de sistemas de visin por computadoras son [10]: 1. Qu tipo de informacin se desea extraer de la imagen? 2. Cul es la forma de esta informacin en la imagen? 3. Qu conocimiento a priori se necesita para extraer esta informacin? 4. Cules procesos de cmputo se requieren? 5. Cuales son los requerimientos de representacin del conocimiento y de los datos? Las etapas fundamentales [6,9,13,14] en que se divide el desarrollo de sistemas de VC son: Pre-procesamiento, Segmentacin e Interpretacin. Durante el Pre-procesamiento se extraen caractersticas primitivas: cambios de intensidad y orientacin de elementos y bordes. Facilita las etapas posteriores. Las tareas realizadas son similares a las transformaciones del PDI. La Segmentacin tiene sus races en las preferencias exhibidas por los seres humanos para agrupar u organizar conjuntos de formas en el campo visual. Las preferencias de agrupacin estn basadas en proximidad, similitud y continuidad. Tienen que ver con discriminacin figura - fondo e ilusiones pticas. Estos mecanismos organizan la escena en unidades homogneas respecto a ciertas caractersticas, lo que constituye el comienzo de la interpretacin dependiente del dominio. Matemticamente, segmentar significa obtener una particin del conjunto de los pxeles en la imagen. Se extraen fronteras, regiones, orientacin de superficies, texturas y movimiento. Se aprovechan las variaciones de intensidad o los colores de las diferentes zonas de la imagen y se caracterizan las formas o apariencias de los objetos presentes. Adems se necesitan medios para representar su resultado de manera que faciliten la Interpretacin al capturar ideas importantes sobre las formas. Estas representaciones geomtricas deben soportar procesamientos complejos y generales: "simulacin" de los efectos de luz, movimiento etc.; y ser tiles para codificar el conocimiento adquirido. Entre las representaciones 2D mas empleadas se encuentran las de regiones (internas) y las de fronteras (externas). Entre las 3D: cilindros generalizados, de superficies y volumtricas. La forma [8,16] es la posicin relativa de todos los puntos que componen el borde o superficie externa de un objeto. Es una propiedad intrnseca de los objetos 3D y primaria para los sistemas de visin, al asociar la definicin de cada objeto a su forma y no a otras propiedades como su color. El reconocimiento de formas es una de las facilidades del sistema visual de los mamferos, y representar sus caractersticas, tal que puedan ser aprendidas y reconocidas otra vez, recolectadas y usadas, se dificulta por diversos factores.(Ver nota ii) Los algoritmos para manipular formas son complejos tpicos de investigacin. Casi siempre la representacin buena para un reconocimiento no lo es para otras computaciones. Derivar la forma del movimiento, la textura, la estereopsis o el sombreado de los objetos conduce a problemas matemticos no correctamente planteados, cuya solucin demanda mucha potencia de cmputo. Algunos descriptores de la forma usados con mucha frecuencia son [3,6,13,14]: rea, permetro, centroide, otros momentos de orden superior, nmero de Eler, etc.
-2-
La Interpretacin trata con objetos y relaciones entre ellos en dominios especficos del conocimiento para construir descripciones de la escena. En esta etapa se emplean comnmente los mtodos de la Inteligencia Artificial (IA) y del Reconocimiento de Patrones (RP); y se toma muy en cuenta el conocimiento de las restricciones fsicas. La organizacin de un sistema de visin es una jerarqua de modelos de fenmenos del mundo.[4] (Ver nota iii). Dichos modelos relacionales estn tomados de la experiencia de percepcin visual directa. Las representaciones pueden ser analgicas o proposicionales. Las analgicas permiten simular propiedades fsicas y geomtricas de los objetos. Las proposiciones son verdaderas o falsas respecto al mundo o a un modelo de este. Cada manera es til para propsitos diferentes. Algunas veces, el razonamiento que construyen sobre entidades geomtricas pudiera ser mejor para clculos analgicos, sin embargo las dificultades tcnicas pueden hacerlo imposible. Los sistemas de visin requieren potencia de cmputo que les hace costosos, por lo que slo se justifican cuando las condiciones de riesgo a la vida, fatiga humana o calidad lo demandan. Actualmente tienen mucha venta productos para vigilancia y seguridad de locales, edificios, carreteras, bosques etc.; sistemas para inspeccionar la calidad de los ms diversos productos; y sistemas para robots. RECONOCIMIENTO DE PATRONES El Reconocimiento de Patrones [6,16] es una teora general utilizada para clasificar un elemento acorde a rasgos caractersticos para su descripcin. Se emplean mtodos de decisin aplicados al espacio multidimensional de rasgos. Proporciona poderosas herramientas usadas con resultados muy positivos en Procesamiento de Seales, Procesamiento de Imgenes, Visin, Diagnstico de enfermedades, Prospeccin geolgica, etc. Las tareas fundamentales que se realizan son Seleccin de Caractersticas, Aprendizaje y Clasificacin. La Seleccin de Caractersticas reduce el nmero de rasgos a tomar en cuenta al mnimo indispensable que separa los objetos en clases diferentes. Primero se analizan aquellos que describen eficientemente los objetos y despus se encuentran cules inciden en el problema de manera determinante. Cuando el Aprendizaje es supervisado, el algoritmo de reconocimiento ubica en la clase adecuada a un grupo de objetos de entrenamiento. En este caso se conoce que el universo de objetos se agrupa en un nmero dado de clases y se poseen muestras (no todos) de al menos un objeto perteneciente a cada clase. El problema consiste en ubicar en la clase (agrupacin, cluster) apropiada cada nuevo objeto presentado al algoritmo de clasificacin. Algo muy diferente ocurre cuando la clasificacin es con aprendizaje no supervisado, conocido en la literatura anglosajona como cluster analysis . No se sabe como se agrupan los objetos, aunque se pueden presentar las variantes: por determinadas razones se conoce el nmero de clases ni siquiera se sabe el nmero de clases posibles. La clasificacin puede intentarse con el empleo de mtodos jerrquicos (por aglomeracin o divisin) o de reagrupamiento (particiones o solapamientos). La clasificacin con aprendizaje parcialmente supervisado aparece cuando hay una clase de objetos de la que no se posee ni una muestra. Se resuelve de manera similar a la clasificacin supervisada. Los Mtodos de Clasificacin ms empleados histricamente han sido estadsticos y sintcticos. Los estadsticos agrupan los objetos mediante discriminantes. Comnmente se utilizan mtodos paramtricos como la Regla de Bayes y no paramtricos como los Discriminantes lineales, Distancia mnima, Aproximacin lineal a pedazos (k vecinos mas cercanos), etc. Los modelos sintcticos realizan un reconocimiento utilizando gramticas de formas. Cada patrn se describe totalmente en trminos de un conjunto de sub-patrones, los cuales, a su vez, pueden describirse con patrones ms simples. Se establece una analoga jerarquizada (como un rbol) entre la estructura de los patrones y la sintaxis de un lenguaje, cuya gramtica y mtodos de anlisis sintctico se utilizan para clasificar los objetos.
-3-
TENDENCIAS ACTUALES El Procesamiento Digital de Imgenes y la Visin por Computadores han contribuido al desarrollo y dependen de novedosas tecnologas: Arquitectura de Computadoras; Microelectrnica (tecnologa de escala de integracin muy alta -VLSI- y de bloques -WSI- de semiconductores); mtodos de Inteligencia Artificial y Desarrollo de Algoritmos. Los principales avances en Microelectrnica son: procesadores ms potentes y baratos; memorias cada vez mayores, ms rpidas y baratas; e incremento en las capacidades de almacenamiento masivo que permiten digitalizar y guardar en soportes magnticos u pticos largas secuencias de imgenes. No obstante, la mayora de las aplicaciones mantienen requisitos fuertes en cuanto a medios especializados y dedicados de procesamiento. El principal cuello de botella [15] radica actualmente en que la capacidad del canal de transferencia de informacin por unidad de tiempo de la entrada / salida (ancho de banda) contina siendo muy estrecha y limita las posibilidades de transferencia masiva de informacin a travs del bus de datos de la computadora. Los especialistas en Microelectrnica afirman que est llegando al lmite la integracin de circuitos, as que los especialistas en Arquitectura de Computadoras, para buscar potencialidades de cmputo superiores, han acudido al uso de varios procesadores que trabajan cada uno con parte de los datos y /o con resultados intermedios de otros, intercambiando mensajes o compartiendo la memoria. La emulacin de las estructuras de Redes de Neuronas mediante dispositivos artificiales, latente desde las primeras computadoras, se presenta como otra alternativa favorecida por el desarrollo de circuitos VLSI, capaces de integrar un gran grupo de neuronas, con las consiguientes ventajas de paralelismo, facilidad de interconexin y simplicidad lgica de funcionamiento, lo que brinda perspectivas muy promisorias a los especialistas en imgenes. Tambin se ha intentado revitalizar las computadoras hbridas, ya que hay operaciones muy costosas en las digitales, que se ejecutan a la velocidad de la luz por medios pticos. Estas tcnicas no se han difundido masivamente por el elevado costo y los requisitos de fabricacin de las lentes necesarias. El desarrollo rpido de aplicaciones que implica el paradigma de la Programacin Orientada a Objetos influye notoriamente en la manera de solucionar problemas. El esquema clsico bajo el cual los especialistas en PDI y VC integraban sus algoritmos con medios tcnicos provistos de escasas funciones de biblioteca para su interfaz y construan productos mgicos, lo que llevaba a un control total sobre la aplicacin; est en sustitucin gracias a que las actuales herramientas permiten a los usuarios avispados, con cada vez menos nivel de especializacin, resolver sus propias tareas. Por supuesto, esto no excluye que se desarrollen algoritmos propios, que inclusive pueden representar innovaciones importantes para algunos problemas. No obstante, siempre ha sido la falta de validaciones adecuadas la que ha conducido a la poca generalizacin de algunos resultados obtenidos. UNA PROPUESTA DE APLICACIN EN CHILE La seleccin de frutas para su exportacin tiene una gran importancia econmica para el pas, debido a su volumen y a la necesidad de competir con productores de pases de mayor desarrollo tecnolgico. En la cosecha de 1994 [11], se exportaron 432 245 toneladas de manzanas. Se estima que por las mesas de seleccin pasaron cerca de 600 000 toneladas de frutas, lo que indica un rechazo total cercano al 30%. La mano de obra es el factor determinante en la calidad de la seleccin. En su productividad y eficiencia se concentra la rentabilidad del negocio, al intentar obtener una reduccin de los costos de produccin. Para dicha cosecha se contrataron unos 1200 obreros dedicados a la seleccin, con un costo en salarios estimado de 450 millones de pesos [2] durante los no menos de 5 meses que dur la misma. Incorporar tecnologa basada en Visin por Computadores a estas mesas de seleccin disminuira en un 80% la mano de obra y alcanzara atributos de calidad con mayor homogeneidad, debido a una clasificacin tipificada y totalmente acorde con las normas establecidas de los diversos daos. El empleo de esta alta tecnologa, lejos de ser un lujo, se convierte en una demanda imperiosa que elimina de dicho proceso la subjetividad humana asociada a la fatiga y / o a estados emocionales.
-4-
La Universidad Iberoamericana de Ciencia y Tecnologa (UNICIT) se ha propuesto desarrollar un sistema para analizar defectos de calidad en las manzanas, principalmente el golpe de sol, que representa, como promedio, un 15% de los rechazos en huerto y empaque. Este defecto se caracteriza por un cambio en la coloracin de la superficie del fruto que va desde un amarillo hasta un pardo oscuro y que cubre un rea importante de su piel.[12] De esta manera, se dotara al pas con un equipamiento que mejorara la calidad de la seleccin y aumentara la competitividad de las exportaciones nacionales. El costo total de la investigacin, desarrollo de prototipos y pruebas de explotacin es nfimo comparado con la erogacin anual en salarios que se hace para esta actividad en el pas; e incluso, es muy pequeo cuando se mide contra las cifras actuales de prdidas por deficiencias en la calidad del producto rechazado o exportado con daos no detectados.
Otro aspecto de extrema importancia es la proteccin de las investigaciones. Debe evitarse la divulgacin de algoritmos en eventos y publicaciones cientficas para preservar los secretos de empresa. Tambin se requiere que las invenciones sigan por cauces protegidos internacionalmente, lo que potenciar sus posibilidades con vistas a aumentar la competitividad en un mercado con amplias perspectivas. CONCLUSIONES Este trabajo present un breve esbozo sobre Procesamiento Digital de Imgenes, Visin por Computadores y Reconocimiento de Patrones, sus objetos de estudio, principales aplicaciones y tendencias actuales. Desarrollar un sistema para identificar automticamente defectos en la calidad de las manzanas de exportacin, principalmente el golpe de sol, es otra manera que tiene la Universidad Iberoamericana de Ciencia y Tecnologa de abordar los retos que las tecnologas de frontera lanzan a Chile para resolver sus necesidades prcticas. En esta investigacin, el trabajo recin comienza. BIBLIOGRAFA [1] Aranda Aboy, J.J. Sistemas para el Procesamiento Digital de Imgenes Ecocardiogrficas. Tesis elaborada para la obtencin del Grado de Doctor en Ciencias Tcnicas, ICID-ISPJAE, 1997 [2] Banco Central de Chile. Boletn Mensual No. 814, Diciembre 1995 [3] Ballard, D.H. y Brown, C.M. "Computer Vision" Ed. Prentice Hall, Inc. Englewood Cliffs, New Jersey 07632, 1982. [4] Cohen, P.R. y Feigenbaum, E.A. ( Editores). The Handbook of Artificial Intelligence", Vol. III, Ed. ADDISON-WESLEY PUBLISHING COMPANY, INC, 1989. [5] Coleccin de nmeros de la revista Advanced Imaging, PTN Publishing Co.; desde 1989 hasta 1998
-5-
[6] Gonzlez, R.C. y Woods, R.E. Digital Image Processing Ed. ADDISON-WESLEY PUBLISHING COMPANY, INC., 1993 [7] Gonzlez, R.C. Technology Innovation & Comercialization. En las Memorias del IIIer Taller Iberoamericano de Reconocimiento de Patrones. Ciudad de Mxico, marzo 23-27, 1998 pp 45-67. [8] Haralick, R.M.; Mackworth, A.K. y Tanimoto, S.L. Computer Vision Update Chapter XXIII. En "The Handbook of Artificial Intelligence", Vol. IV, Editado por Cohen, P.R. y Feigenbaum, E.A. Ed. ADDISON-WESLEY PUBLISHING COMPANY, INC., 1989. [9] Haralick, R.M. y Shapiro, L.G. Computer and Robot Vision Vols. I y II Ed. ADDISON-WESLEY PUBLISHING COMPANY, INC., 1993. [10] Hussain, Z. Digital Image Processing: Practical Applications of Parallel Processing Techniques. Ed. Ellis Horwood, 1991 [11] INE. Estadsticas Agropecuarias. Ao Agrcola 1993/1994 [12] INN. Norma Tcnica para Manzanas. 1993 [13] Pratt, W. Digital Image Processing 2nd Edition. Ed. John Wiley & Sons, Inc. 1991. [14] Rosenfeld, A. y Kak, A.C. Digital Picture Processing 2nd Edition. Ed. ACADEMIC PRESS, Inc. 1982. [15] Silver, S. Image Processing Computer Design, Vol. 34, No.10, pp 137-140, October, 1995. [16] Simon, J-C. El Reconocimiento de Formas Mediante Algoritmos. Ed. Masson, S.A., 1987
NOTAS:
i
Razones que dificultan "ensear" a las computadoras a ver: La dificultad para explicar el proceso de percepcin visual. Recordemos el proverbio: una imagen vale ms que mil palabras. (Y, de hecho, contiene mucha ms informacin!) No se puede recuperar toda la informacin de la escena slo de algunas caractersticas. La imagen digital resulta de factores tales como: superficie de los objetos, fuente de iluminacin y su direccin, luz ambiente, condiciones atmosfricas, propiedades del detector, etc. No puede apreciarse la contribucin particular de cada uno de ellos. La imagen proyecta a dos dimensiones una escena. La informacin de profundidad se colapsa, lo que implica restricciones. Para recuperar la escena se necesita informacin sobre tamao y posicin de los objetos. Interpretar requiere conocimiento previo del universo que se tiene en modelos: el dominio de tarea.
ii
Factores que dificultan el reconocimiento de formas por computador: Complejidad. La forma es ms subjetiva. Pueden representarse "explcitamente" slo con ciertos parmetros. An no est claro qu aspectos son importantes para el reconocimiento. Una representacin explcita y completa puede ser intratable computacionalmente. La introspeccin no ayuda. Los seres humanos disponemos de una gran parte del cerebro dedicada a reconocer formas. Esta importante actividad esta "alambrada" a un nivel inferior al de nuestra conciencia. De ah: Por qu es tan fcil reconocer una forma y tan difcil describirla? La respuesta parte de que no poseemos un lenguaje preciso para ellas, lo que puede argumentarse que se debe a la inaccesibilidad a nuestros algoritmos de procesamiento de formas y a sus estructuras de datos. La matemtica tradicional no ha tenido que ver, en s misma, con formas. Recientemente es que se ha definido el concepto de slido rgido y un conjunto de operaciones para stos. La disciplina es joven. Los seres humanos se comunican formas complejas a travs de palabras, gestos y dibujos 2D. Ningn esquema de los varios existe ntes tiene la capacidad de representar todas las formas y cada uno tiene sus ventajas y desventajas. Es muy reciente que con el auxilio de computadoras y herramientas de Diseo Asistido por Computadoras (CAD), los humanos comunicamos masivamente formas 3D.
iii
Partes integrantes de un sistema de visin diseado usando los mtodos de la Inteligencia Artificial: Estructuras de almacenamiento de informacin para representar el conocimiento. Mecanismos para el Acoplamiento (matching). Mecanismos de Inferencia: La Inferencia lgica clsica es una tcnica bien entendida y elegante de razonamiento, con buenas propiedades formales, aunque ocasionalmente restringida para duplicar el rango de procesamiento hum ano, por lo que la lgica borrosa (fuzzy) se presenta como herramienta alte rnativa para representar conocimientos con incertidumbre producto de datos incompletos y /o con ruido, como ocurre en los sistemas de visin. La inferencia se usa tanto para resolver problemas como para mantener criterios. q Mecanismos de Planificacin de actividades.
q q q
-6-
q q
Control. Aprendizaje: Problema muy difcil, del que se habla poco an en las investigaciones sobre visin. En los aos 90 se ha desarrollado una clase de algoritmos genticos, que em ulan el proceso evolutivo de seleccin natural: engendran un conjunto inicial de alternativas (fenotipos), las cuales producen generaciones de individuos debido al cruzamiento y la mutacin, de forma tal que sobreviven quienes mejores respuestas brindan al problema de visin concreto. Estos algoritmos se han usado fundamentalmente en segmentacin, pero se hace necesario una gran potencia de cmputo para obtener generaciones con capacidad de respuesta adecuada a un problema.
-7-

ProDigIma y VC

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

ProDigIma y VC

Cargado por

Copyright:

Formatos disponibles

PROCESAMIENTO DIGITAL DE IMGENES Y VISIN POR COMPUTADORES

Autor: Dr. Juan Jos Aranda Aboy RESUMEN

También podría gustarte