Está en la página 1de 12

UNIVERSIDAD DE SALAMANCA MASTER DE GEOTECNOLOGAS CARTOGRFICAS EN INGENIERA Y ARQUITECTURA

1. INTRODUCCIN AL ANLISIS DE IMAGEN

Diego Gonzlez Aguilera Departamento de Ingeniera Cartogrfica y del Terreno Escuela Politcnica Superior de vila

-1-

INDICE

1.1 Fundamentos bsicos de la imagen digital 1.2 Jerarqua en el Anlisis de Imagen

-2-

Tema 1: Introduccin al Anlisis de Imagen


La disciplina del Anlisis de Imagen constituye un amplio campo de estudio e investigacin en diversas disciplinas con mltiples aplicaciones. En este sentido, cartgrafos, fotogrmetras, matemticos, fsicos, informticos y dems, continan investigando en cuestiones que van desde la aplicacin de simples filtros lineales hasta la automatizacin del reconocimiento semntico de objetos. Los tres primeros temas de la asignatura pretenden ser un recorrido de carcter tericoprctico desde los fundamentos y tcnicas ms contrastadas en el procesamiento digital de imgenes hasta los ltimos avances del Anlisis de la Imagen en el contexto de la Geomtica. Este primer tema tiene como objetivo proporcionar una introduccin a los conceptos y fundamentos bsicos del Anlisis de la imagen.

1.1 Fundamentos bsicos de la imagen digital


Imagen Digital
La siguiente figura es un diagrama esquemtico de la obtencin de una imagen digital a partir del escaneado o digitalizacin de una fotografa. De esta manera la fotografa puede describirse como una funcin continua F(x,y), denominada imagen, donde las coordenadas x, y son variables espaciales y la funcin valor (amplitud) es la densidad. Esta funcin es adems el producto de dos funciones separadas: Una funcin es la de iluminacin I, mientras que la otra funcin describe las propiedades del objeto que est siendo iluminado, conocida como reflexin R. En realidad para poder obtener la imagen digital la funcin continua debe estar discretizada, tanto en las variables espaciales como en la amplitud. La funcin discreta resultante f(x,y) se denomina imagen digital. El proceso de discretizar las variables espaciales x, y se conoce como muestreo y la discretizacin de la amplitud g como cuantificacin. El elemento discreto x, y es el pxel (de las palabras inglesas picture x element) y g es un nivel de gris, denominado informalmente brillo. As pues una imagen digital puede expresarse por f (xi, yj, i=0,,N-1;j=0,.,M-1) siendo i, j la direccin del pxel, N el nmero de filas y M el nmero de columnas. La funcin imagen se escribe normalmente como f(x,y). Hay que tener en cuenta que las variables espaciales son valores discretos, usualmente valores enteros. La cuantizacin de la imagen asignar a cada localizacin discreta (x,y) un valor entero 2b, con b siendo valores de: 2, 4, 8, 12, 16 o 32 bits por pxel. De esta forma la resolucin radiomtrica describir el nmero de bits por pxeles en una imagen.

-3-

Un pxel es interpretado generalmente como una entidad cuadrada o rectangular a pesar de que el sensor que ha capturado la imagen tenga un campo de vista que no se corresponde con esas dimensiones. Sin embargo, una imagen digital es casi siempre presentada como un conjunto de pxeles homogneos de igual tamao. Finalmente, tambin podemos definir el concepto de imagen digital como: el archivo informtico resultante de una discretizacin de una imagen, natural o sinttica, en elementos de imagen, llamados pxeles.

Media y desviacin estndar


El nivel de gris medio ga, de una imagen y su desviacin estndar o tpica se determinan fcilmente mediante las expresiones:
F 1 C 1 1 x = 0 y = 0 g ( x, y ) F C F 1 C 1 1 = x = 0 y = 0 ( g ( x, y ) g a ) 2 F C

ga =

La media ga indica el brillo o luminosidad de una imagen mientras que la desviacin estndar es la medida del contraste, o lo que es igual la variacin de la informacin en la imagen. Un valor pequeo indica una imagen plana con poco contraste, es decir, una imagen con un contenido de informacin reducido, mientras que un valor alto ser indicativo de una imagen con grandes variaciones de contraste.

Resolucin geomtrica
Obviamente, cuanto ms pequeas sean las variables discretas x, y (tamao del pxel), mejor ser la resolucin geomtrica de la imagen, mayor ser el nmero de pxeles de la imagen y por lo tanto mejor ser su aproximacin a la funcin continua de la imagen original. Segn el teorema de muestreo se establece que el tamao ms pequeo del pxel puede ser algo menor que la mitad de la frecuencia ms alta de la funcin continua. Si se satisface esta condicin, la funcin continua se puede recomponer a partir de la funcin discreta, lo que equivale a decir que no hay prdida de informacin durante el proceso de discretizacin. Por tanto, la resolucin geomtrica de la imagen (tamao del pxel) estar directamente relacionada con el concepto de nmero de pxeles de una imagen. De forma que a mayor resolucin geomtrica mayor nmero de pxeles de una imagen. La siguiente tabla resume las necesidades de almacenamiento de las imgenes digitales para varios tamaos de pxeles, as como el nmero de pxeles que representa una fotografa area

-4-

(230x230mm). Los ejemplos se basan en que la cuantificacin de las imgenes se ha efectuado a 256 niveles diferentes de gris, es decir un pxel requiere un byte (8 bits).
Tamao de pxel (micras) 960 480 240 120 60 30 15 7.5 Nmero de pxeles 240x240 480x480 960x960 1920x1920 3840x3840 7680x7680 15360x15360 30720x30720 Almacenamiento necesario (sin comprimir) [Mb] 0.058 0.230 0.922 3.686 14.476 58.982 235.931 943.721

Tabla 1-1. Tamao del pxel (precisin geomtrica), nmero de pxeles (resolucin espacial) y requerimientos de memoria para una imagen digital correspondiente a una fotografa area.

El tamao de memoria que ocupa una imagen digital en binario viene dado por: N bits = M x N x p con G = 2p Unidades mltiplo: 1 byte= 8 bits, Kilobyte, Megabyte, Gigabyte Si la imagen fuese en color deberamos triplicar el tamao de la Tabla 1-1 por tres (3 luces RGB para cada pxel) Hay que advertir que las necesidades de almacenamiento disminuyen substancialmente con las tcnicas de compresin existente hoy en da. Los niveles de gris de imgenes de escenas naturales no son completamente aleatorios. De hecho existe una dependencia muy considerable de los pxeles vecinos. Por ejemplo, el algoritmo de compresin JPEG puede reducir la capacidad de almacenamiento a 1/3 sin prdida apreciable de la calidad de la imagen.

Resolucin radiomtrica
La resolucin radiomtrica describir el nmero de bits por pxeles en una imagen. La cuantizacin de una imagen ha de responder a la pregunta de cuntos niveles de gris son necesarios para representar el brillo?. La solucin est muy condicionada por consideraciones prcticas. Una variable que ocupa un byte (8 bits) alcanza 256 valores diferentes (28). Es ms que suficiente para representar los niveles de gris en fotografas en blanco y negro. Normalmente el ser humano no puede discriminar ms all de 50 tonos de gris. Sin embargo, no es conveniente usar seis bits para representar los niveles de gris. Teniendo en cuenta todas las consideraciones prcticas, un byte es mucho ms adecuado para almacenar el valor de gris de un pxel.

Muestreo y Cuantizacin
El proceso de conversin de una representacin continua en una discreta se conoce como digitalizacin o barrido. La funcin discreta es una imagen digital. Se obtiene por el muestreo de las variables espaciales y la cuantizacin de los niveles de gris (amplitud). El mtodo habitual para digitalizar una imagen es barrer la misma fila por fila, y muestrear cada una de las filas. El nmero de filas que se barran (m) y el nmero de pxeles que se muestreen por fila (n) determinarn la resolucin de la imagen digital (mxn), que viene a ser el grado de discernibilidad de detalles en la imagen. Obviamente, cuanto mayor es la resolucin de una imagen digital ms se aproxima esta al original.

-5-

El siguiente punto a tener en cuenta es la cuantizacin de cada una de las muestras. Si el muestreo representaba una digitalizacin en el espacio, la cuantizacin viene a ser una digitalizacin en la amplitud, entendiendo por amplitud el nivel de intensidad luminosa en cada punto. Al cuantificar cada pxel, por el simple hecho de limitar el nmero de bits, se reduce el nmero de valores existentes desde infinito hasta, en principio 2p posibles valores. Este es el proceso de conversin de una variable continua a otra discreta, donde entra cada dos valores consecutivos ya no hay otros infinitos entre medias. La calidad de la cuantizacin viene dada, fundamental mente, por el nmero de bits que se asignan a cada una de las muestras. Dado que los ordenadores digitales suelen trabajar, no con bits aislados sino con agrupaciones de ellos (bytes, kilobyte, megabyte, etc.), suele ser prctico utilizar un valor menor o igual de ellos, evitando que un pxel desborde, por ejemplo, de un byte en otro. Una vez definido el nmero de bits por pxel (llammosle p), la imagen final queda representada por un mapa tridimensional, de orden mxnxp, que a cada punto del espacio (mi,ni) le hace corresponder un nivel de intensidad luminosa definido por pi. Para ser utilizable para el anlisis de imagen por medio de un ordenador, una funcin imagen f(x,y) debe ser digitalizada tanto espacialmente como en su amplitud. La digitalizacin de las coordenadas espaciales (x,y) se denomina muestreo de la imagen y la digitalizacin de la amplitud se conoce bajo el nombre de cuantizacin del nivel de gris. Se supone que una imagen continua f(x,y) se describe de forma aproximada por una serie de muestras igualmente espaciadas organizadas en forma de una matriz NxM como se indica en la siguiente ecuacin, donde cada elemento de la matriz es una cantidad discreta:
f (0,0) f (1,0) . f ( x, y ) = . . f ( N 1,0) f (0,1) f (1,1) . . . . . . f (0, M 1) f (1, M 1) f ( N 1, M 1)

f ( N 1,1)

A cada elemento de la matriz se le puede denominar elemento de la imagen, pxel. La resolucin (el grado de detalle discernible) en una imagen de pende estrechamente de estos dos parmetros: muestreo y cuantificacin. Aunque no suele ser habitual, existe la posibilidad de mejorar la apariencia de la imagen a travs del empleo de un muestreo no uniforme o adaptativo, de forma que la resolucin espacial del muestreo vare en funcin de las caractersticas de la imagen. Por ejemplo realizando un muestreo fino en las proximidades de transiciones o detalles y un muestreo tosco en regiones suaves. Esto dara como resultado una malla de pxeles irregula y adaptativa.

Convolucin
Existen operaciones que tan slo se basan en la aplicacin de una funcin, ms o menos sencilla, sobre el valor de luminancia de cada uno de los pxeles de la imagen (o zona de la misma) a manipular. A continuacin se introducir el uso de la operacin de convolucin como herramienta bsica para las operaciones de filtrado y extraccin de caractersticas de la imagen (tema 2).

-6-

As, la operacin de convolucin se define matemticamente, para un caso bidimensional continuo como:

g ( x , y ) = h ( x , y ) f ( x, y ) =

h( x x' , y y' ) f ( x' , y' )dx' dy'

mientras que en el caso discreto (imgenes digitales) las integrales se transforman en sumatorios de la manera siguiente:

y (m, n) = h(m, n) x(m, n) = m '= n '= h(m m' , n n' ) x(m' , n' )

La convolucin se aplica realizando el producto ponderado de la matriz de convolucin con el entorno de un pxel, para cada pxel de la imagen (exceptuando, quizs aquellos que estn sobre el borde de la imagen). Grficamente el procedimiento se muestra en la siguiente figura, cuando se aplica al caso de la convolucin con una mscara de 3x3 elementos:

Pix = P'5

K P = K
9 i =1 9 i i =1 i

Posibles aplicaciones de la convolucin y que se estudiarn en el tema 2 son: el suavizado, gradientes y derivadas para la mejora o realce de una imagen y por supuesto su aplicacin para la extraccin de caractersticas.

Histograma
El histograma de una imagen es, bsicamente, una herramienta visual para el conocimiento de la misma. Con un simple vistazo puede proporcionarnos una idea muy aproximada de la distribucin de niveles de gris de la misma, el contraste que presenta, y algn mtodo ptimo para su mejora o compresin. Se define el histograma de una imagen como la curva que a lo largo de uno de sus ejes representa cada uno de los posibles niveles de gris, y en el otro la frecuencia relativa de aparicin del mismo en la imagen. Que la frecuencia de aparicin de cada nivel de gris se muestre en forma relativa (en porcentaje) se debe, fundamentalmente, al hecho de que el valor absoluto vara fuertemente en funcin del tamao de la imagen, y a que tambin lo hacen los valores absolutos mximos en funcin de ese valor. As, por ejemplo, para una imagen de 32x32 pxeles el mximo valor absoluto sera de 1024, mientras que en una de 256 x 256, el mismo ascendera hasta 65536. Un vistazo al histograma ofrece una idea rpida de cunto distribuidos se encuentran los niveles de gris en la imagen, aspecto asociado al concepto de contraste.

-7-

Clculo del histograma. Calcular el histograma de una imagen es algo tan sencillo como contar el nmero de apariciones de cada uno de los posibles niveles de gris presentes en la misma. Para ello, simplemente hay que contar la aparicin de cada nivel de gris y almacenar la cuenta en un vector. Modificaciones del histograma. Supngase que g1(x,y) es una imagen en la que se quieren modificar sus niveles de gris por medio de una transformacin T para obtener una imagen nueva g2(x,y). Se tiene

g 2 ( x , y ) = T [g 1 ( x , y ) ]
Ampliacin del contraste. En esta operacin, se modifican los niveles de gris para que tengan el rango ms amplio de valores posibles. Una ampliacin lineal, por ejemplo, viene definida por

g 2 ( x, y ) = [g1 ( x, y ) + t1 ]t 2
Los parmetros de transformacin t1, t2 pueden escogerse de tal modo que los niveles de gris en g2 estn comprendidos en los intervalos <g2min, g2max>. Sean g1min y g1max los niveles de gris mnimo y mximo de la imagen g1 (determinados a partir de su histograma). Los coeficientes de transformacin sern entonces:

-8-

t1 = g 2 t2 =

min

g1

min

g2 g2 max min g1 g1
max

min

No es necesario que la funcin de ampliacin sea lineal. Algunas veces, una ampliacin logartmica es ms conveniente para el observador. Sirva como ejemplo que el sistema de visin del ser humano percibe las diferencias de brillo segn una escala logartmica. Ecualizacin del histograma. La ecualizacin del histograma define una transformacin de niveles de gris g1 a niveles de gris g2 de tal manera que la distribucin de g2 es uniforme. La siguiente figura ilustra el procedimiento.

Supngase por un momento que la distribucin de los niveles de gris es continua. La figura anterior muestra el histograma de g1 en su posicin normal. El histograma de g2, h(g2) en la parte izquierda de la figura est girado 90. Se busca una funcin de transformacin tal que h(g2)=(FC)/n, donde F,C son el nmero de filas y columnas, y n el nmero de niveles de gris. Para lograrlo se divide el rea comprendida por debajo de la curva del histograma en n/(FC) partes iguales. La ecuacin siguiente expresa la condicin para la ecualizacin del histograma:

h( g 2 ) =

n h(r )dr F C 0

siendo r la variable muda de integracin. La integral es una funcin de distribucin acumulada. De lo que se deduce que la funcin de transformacin necesaria para obtener un histograma constante es la funcin de distribucin acumulada. En las imgenes digitales, los niveles de gris son discretos. La forma discreta de la funcin de distribucin acumulativa se obtiene simplemente sumando todos los niveles de gris. La figura siguiente muestra el efecto de la ecualizacin del histograma. La imagen original de la figura (a) tiene un contraste pobre, expresado claramente por el histograma (c). El histograma ecualizado (d) produce una representacin mejorada de la imagen, como se aprecia en (b).

-9-

Aunque el mtodo de la ecualizacin el histograma es muy til, no conduce por s mismo a las aplicaciones interactivas de mejora de la imagen. La razn de ello es que este mtodo slo es capaz de generar un nico resultado: una aproximacin a un histograma plano. Umbralizacin del histograma. Una solucin sencilla para segmentar una imagen consiste en definir rangos de valores de brillo que supuestamente correspondan a zonas importantes o significativas en la escena. Ha de acompaarse con la eleccin adecuada de unos valores de umbral acordes con los niveles de gris del histograma, seguido por la divisin de la imagen en regiones. La utilidad de la umbralizacin del histograma se demuestra ms adelante en la siguiente figura, la Figura (a) muestra una marca fiducial de esquina en una fotografa area. Para la realizacin de la orientacin interna es muy conveneiente la deteccin automtica de las marcas fiduciales. En un principio, se trata de detectar aquellos pxeles que contengan las marcas fiduciales. El histograma de la Figura (b) muestra tres grupos: los pxeles negros del fondo; los pxeles blancos de la marca fiducial y su entorno y los grises que conforman la escena circundante. La umbralizacin del histograma alrededor del valor 128 incluye las marcas fiduciales as como los pxeles de la escena (campo helado). Los pxeles del fondo de las marcas fiduciales, sin embargo, pueden umbralizarse fcilmente. La imagen segmentada en (c) se obtiene en dos pasos. En primer lugar se separan los pxeles negros del fondo del resto de la imagen y a continuacin se hace una segmentacin, pero ahora slo dentro de la regin oscura del fondo. El resultado mostrado en la Figura (c) contiene tres zonas. Tonos grises correspondientes al contenido de la escena, negro al fondo de la marca fiducial y blanco a la propia marca.

- 10 -

Especificacin del histograma. Aunque la aplicacin de una transformacin de entre las mostradas conlleva importantes modificaciones, beneficiosas en principio para la visualizacin de la imagen, el mtodo mostrado adolece de una cierta falta de versatilidad. Hay casos en que puede ser deseable especificar de forma interactiva la forma del histograma resultante, por ejemplo con el fin de resaltar determinados niveles de gris de la imagen. Esto es, precisamente, lo que se persigue con la operacin de especificacin del histograma.

1.2 Jerarqua en el Anlisis de Imagen


Antes de pasar a analizar los diferentes niveles en el Anlisis de Imagen conviene tener presente que el primer paso es la Adquisicin de la imagen digital, habitualmente realizado mediante cmaras digitales. Obtenida la imagen digital, el siguiente proceso sera el Preprocesamiento de la imagen con el objetivo bsico de mejorar la imagen de forma que se aumente las posibilidades de xito en los procesos posteriores. Tareas como mejorar el contraste, eliminar ruido o aislar regiones son algunos ejemplos. En una fase posterior estara la Segmentacin que consistira en extraer de una imagen sus partes ms representativas. La ltima etapa conllevara el Reconocimiento o la Interpretacin. El Reconocimiento es el proceso que asigna una etiqueta a un objeto basndose en la informacin proporcionada por sus descriptores. El Reconocimiento implica asignar significado a un conjunto de objetos reconocidos. Esta ltima tarea es la ms sofisticada y la que de hecho se encuentra en continua investigacin en lo que se ha dado en denominar como anlisis semntico de la imagen. Podemos dividir los diferentes procesos y tareas del Anlisis de Imagen en cuatro categoras resumidas en la Tabla 1-2. La clasificacin sigue el paradigma de la Visin Computacional. La Visin Computacional es la disciplina que se centra en la descripcin de la escena u objeto a partir de imgenes.
Categora Procesos, Algoritmos Almacenar, acceder, presentar Tareas Manipular imgenes digitales

- 11 -

NIVEL DE SISTEMA BAJO NIVEL MEDIO NIVEL ALTO NIVEL

imgenes en pantalla Mejorar o realzar imgenes Corresponder imgenes Agrupar, segmentar imgenes Comprender imgenes

Procesamiento de imgenes Extraer caractersticas simples Reconocimiento de objetos, Interpretacin de imgenes, Deteccin semntica

Tabla 1-2. Clasificacin de los niveles en el anlisis de imagen.

Nivel de sistema
La manipulacin de las imgenes digitales es una tarea bsica en cualquier disciplina. El tamao de las imgenes digitales que suelen usarse en disciplinas como la Fotogrametra y Teledeteccin plantea un reto a la hora de resolver adecuadamente las tareas de manipulacin como son el almacenamiento, la recuperacin y la visualizacin de imgenes. Por ejemplo, una fotografa area digitalizada con una resolucin de 10 m requiere una capacidad de almacenamiento de 450 Mb (sin comprimir).

Nivel bajo
El nivel de sistema proporciona la funcionalidad necesaria para que un ordenador pueda gestionar las imgenes. La funcionalidad bsica necesaria para las operaciones del procesado de imgenes se proporciona en el siguiente nivel, denominado aqu nivel bajo, en clara analoga con la visin primara de nivel bajo. Las tareas de procesamiento de imgenes permiten mejorar la apariencia de las mismas, por ejemplo, las modificaciones del histograma tales como la reduccin de contraste, mejora de la imagen etc.

Nivel medio
Tal y como se indica en la Tabla 1-2 las tareas tpicas de nivel medio son las encargadas de la extraccin de caractersticas bsicas de los objetos, tales como lneas, curvas o primitivas simples. Tareas como la agrupacin y la segmentacin pertenecen a este nivel y sirven como base de entrada para el siguiente nivel de reconocimiento de objetos.

Nivel alto
Para que una persona pueda responder adecuadamente a su entorno debe analizar, interpretar y comprender los estmulos visuales. Idealmente, esta misma hazaa puede ser llevada a cabo por un robot un vehculo autnomo. Para recoger algo de un recipiente moverse en medio de una aglomeracin, el robot debe reconocer el entorno por medio de los datos que le llegan del sensor y del contenido almacenado en la memoria. El resultado de la comprensin de la imagen es una interpretacin total de la escena. Por tanto la comprensin interpretacin de la imagen depende de la aplicacin.

- 12 -

También podría gustarte