Está en la página 1de 122

IDENTIFICACIN DE LOS DATOS DEL PROYECTO.

Tema y Ttulo: IMAGEN Y TELEVISIN. Anlisis de imgenes basado en correlacin de


imgenes
Autor: Eduardo Martn Pastor
Titulacin: Sonido e Imagen
Tutor: Jos Manuel Daz Lpez
Departamento: DIAC
Tribunal:
Presidente: Salvador Snchez Fernndez
Vocal: Jos Manuel Daz Lpez
Vocal Secretario: Jos Luis Rodrguez Vzquez

RESUMEN DEL PROYECTO


El objetivo principal del proyecto es la realizacin de una aplicacin en el programa
MATLAB.
En primer lugar, realizaremos un estudio terico relativo al tema de nuestro proyecto.
En nuestro caso como el tema es Imagen y Televisin, explicaremos de forma terica la
informacin principal acerca del Tratamiento Digital de la Imagen.
Una vez conocida las tcnicas principales utilizadas en el tratamiento digital,
realizaremos un estudio exhaustivo en las tcnicas actuales que existen acerca del
anlisis de imgenes. Daremos una breve explicacin mostrando en qu consiste esta
tcnica, los diferentes pasos que se llevan a cabo en una imagen para su anlisis,
explicando brevemente cada unos de ellos y enumerando algunas tcnicas para la
realizacin de cada una de ellas.
Tras esta primera parte, nos centraremos en las tcnicas de correlacin de imgenes
(DIC). Explicaremos como han surgido estas tcnicas, cual son sus principales
conceptos, sus inicios y las ventajas e inconvenientes que tienen.
Dentro de las diferentes tcnicas de correlacin de imgenes, explicaremos de forma
detallada la correspondencia por reas, ya que es la tcnica que vamos a utilizar para la
realizacin del proyecto. Explicaremos en qu consiste, y desarrollaremos tericamente
cual son los pasos que se deben realizar en las imgenes para realizar esta tcnica.
Explicaremos cual es su terminologa, y cules son los posibles defectos que puede
tener esta tcnica.
Finalmente, una vez estudiada la teora, realizaremos una sencilla aplicacin que nos
permita evaluar y encontrar las diferencias en una secuencia de imgenes. El programa
utilizado para este proyecto es MATLAB, que es un programa matemtico, utilizado
enormemente en el mbito de la ingeniera. Mediante esta aplicacin obtendremos dos
figuras, una de ellas donde veremos los vectores de movimiento que existen entre las
dos imgenes y la segunda, donde obtendremos el factor de correlacin que hay entre
las dos imgenes.

ABSTRACT OF MY PROJECT
The main objective of the project is the development of an application in MATLAB
program.
Firstly carry out a theoretical study on the topic of our project. In our case as the theme
is Picture and Television, we explain the main information about Digital Image
Processing.
Once known the main techniques used in digital images, we will make a study on
current techniques that exist about image analysis. We will give a brief explanation
showing what this technique is, the different steps that are performed on an image for
analysis, briefly explaining each of them and listing some techniques for performing
each.
After this first part, we will focus on the techniques of image correlation (DIC). We
explain how these techniques have emerged, which are the main concepts, the
beginning and the advantages and disadvantages they have.
There are different image correlation techniques. We will explain in detail the
correspondence areas, as it is the technique that we will use for the project. Explain
what it is, which is theoretically and we develop steps that must be performed on the
images for this technique. We explain what their terminology is, and what are the
possible defects that may have this technique.
Finally, having explored the theory images, we will make a simple application that
allows us to evaluate and find differences in a sequence of images. The program used
for this project is MATLAB, a mathematical program, widely used in the field of
engineering. Using this application will get two figures, one where we will see the
motion vectors between the two images and the second where we get the correlation
factor between the two images.

Anlisis de
imgenes
basado en
correlacin
de imgenes
Proyecto fin de
carrera
Eduardo Martn Pastor

Quiero dar las gracias a todas las


personas que me han ayudado durante
estos 5 aos de carrera, especialmente
a mi familia y amigos, que siempre han
estado a mi disposicin tanto en los
buenos como en los malos momentos.

Anlisis de imgenes basado en correlacin de imgenes


Contenido
1. Planteamiento del proyecto...................................................................................................... 1
2. Estudios previos ........................................................................................................................ 2
2.1 Teora tratamiento digital de la imagen (TDI) ..................................................................... 2
2.1.1 Definicin de la imagen digital ..................................................................................... 2
2.1.2 Sistema de procesamiento de imgenes ..................................................................... 5
2.1.3 Transformaciones ......................................................................................................... 7
3. Anlisis de imgenes ............................................................................................................... 46
3.1 Extraccin de caractersticas de una imagen .................................................................... 46
3.1.1 Caractersticas especiales de una imagen .................................................................. 46
3.1.2 Caractersticas de la transformada ............................................................................ 47
3.1.3 Deteccin de bordes, texturas y movimientos .......................................................... 48
3.1.4 Texturas ...................................................................................................................... 58
3.1.5 Deteccin de movimiento .......................................................................................... 60
3.2 Segmentacin de imgenes .............................................................................................. 60
3.2.1 Segmentacin basada en pxeles ............................................................................... 61
3.2.2 Segmentacin basada en bordes ............................................................................... 66
3.2.3 Segmentacin orientada a regiones........................................................................... 68
3.2.4 Segmentacin basada en texturas ............................................................................. 69
3.3 Transformaciones morfolgicas ........................................................................................ 69
3.3.1 Transformaciones morfolgicas en imgenes binarias .............................................. 70
3.3.2 Transformaciones morfolgicas en imgenes con varios niveles de gris .................. 77
3.4 Representacin y descripcin de contornos y regiones ................................................... 78
3.4.1 Representacin del contorno ..................................................................................... 78
3.4.2 Representacin de regiones ....................................................................................... 79
3.4.3 Descriptores de contornos ......................................................................................... 80
3.4.4 Descriptores de regiones............................................................................................ 81

Contenido

Anlisis de imgenes basado en correlacin de imgenes


4. Correlacin Digital de Imgenes (DIC)..................................................................................... 82
4.1 Introduccin ...................................................................................................................... 82
4.2 Antecedentes. ................................................................................................................... 82
4.3 Conceptos bsicos. ............................................................................................................ 82
4.4 Dificultades en la correspondencia de imgenes.............................................................. 84
4.5 Distorsiones geomtricas de las entidades de correspondencia ...................................... 86
4.6 Estrategias de correspondencia por reas ........................................................................ 87
4.6.1 Correlacin ................................................................................................................. 89
4.6.2 Correspondencia por mnimos cuadrados ................................................................. 91
4.6.3 Correspondencia basada en caractersticas ............................................................... 94
4.6.4 Correspondencia relacional........................................................................................ 99
5. Procedimiento Experimental................................................................................................. 105
6. Conclusiones.......................................................................................................................... 109
7. Objetivos conseguidos .......................................................................................................... 113
8. Bibliografa ............................................................................................................................ 114

Contenido

Anlisis de imgenes basado en correlacin de imgenes


1. Planteamiento del proyecto
Antes de introducirnos en el proyecto por completo, vamos a dar una pequea explicacin
acerca de los conceptos que vamos a aclarar y explicar.
En primer lugar, daremos una pequea definicin acerca del tratamiento digital de la imagen.
Explicaremos de forma resumida, las diferentes transformaciones que pueden sufrir las
imgenes y la forma de evitar estas.
A continuacin, una vez dada una breve pincelada sobre el tratamiento digital de la imagen,
nos centraremos en el anlisis de estas. Explicaremos que es y en qu consiste el anlisis de
imgenes y daremos a conocer los diferentes pasos en los que se divide esta tcnica,
explicando cada uno de ellos brevemente.
El siguiente paso ser adentrarnos en una tcnica de anlisis de imgenes. Desarrollaremos las
tcnicas basadas en la correlacin de imgenes, ms concretamente la tcnica de
correspondencia por reas, ya que es la que definiremos, explicaremos y nos servir de ayuda
tanto tericamente como prcticamente, para la realizacin de un programa sencillo que nos
permita evaluar y detectar cambios entre dos imgenes.
Para finalizar comentaremos como funciona nuestro programa y aportaremos una serie de
mejoras que se podran introducir en nuestro proyecto.

1. Planteamiento del proyecto

Pgina 1

Anlisis de imgenes basado en correlacin de imgenes


2. Estudios previos
2.1 Teora tratamiento digital de la imagen (TDI)
En los siguientes apartados se hace un repaso de los conceptos bsicos sobre Tratamiento
Digital de Imgenes.

2.1.1 Definicin de la imagen digital


En primer lugar, definiremos que es una imagen. Una imagen es la representacin de una
forma o de una entidad determinada. Para trabajar con ellas y realizarle todas las
transformaciones que creamos oportunas definimos la imagen matemticamente con la
siguiente funcin:
f(x,y)

(Ecuacin 1)

Siendo x e y, las coordenadas espaciales en el plano, y f, el brillo o nivel de gris en cualquier par
de las coordenadas anteriores.
Para nuestro proyecto, como herramientas vamos a trabajar con imgenes digitales
monocromas. Sobre ellas llevaremos a cabo las tcnicas y procesos que describiremos
posteriormente.

Ilustracin 1. Imagen con sus respectivos pxeles


Muestreo y cuantificacin
Una imagen puede ser continua tanto respecto a sus coordenadas x e y, como a su amplitud.
Para convertirla a forma digital, hay que digitalizarla en ambos sentidos.
Por ello podemos definir la imagen digital como una matriz cuyos ndices de fila y columna
identifican un punto de la imagen y el valor indica el nivel de gris en ese punto. A los
elementos que componen esta matriz se les denomina pixeles.

2. Estudios Previos

Pgina 2

Anlisis de imgenes basado en correlacin de imgenes


f (0, 0) f (0,1)..... f (0, M 1)

f (1, 0) f (1,1)..... f (1, M 1)

f ( x, y )
.....

.....

f ( N 1, 0) f ( N 1,1).... f ( N 1, M 1)

(Ecuacin 2)

El proceso de seleccionar un conjunto de valores finitos, discretos de una seal continua se


denomina muestreo (sampling) y los valores seleccionados se denominan muestras (samples).
Las muestras seleccionadas continan siendo continuas, es decir, tienen un valor real. El
proceso de discretizacin de estos valores se denomina cuantificacin y es el segundo paso en
el proceso de digitalizacin de una seal. El tercer y ltimo paso es la codificacin de los
resultados obtenidos.
Para concluir podemos asegurar, visto lo anterior, que la calidad de una imagen digital se
determina en gran manera por el nmero de muestras y niveles de gris utilizados en el
muestreo y cuantificacin.

Ilustracin 2. Muestreo y cuantificacin.


Parmetros de control de la calidad de una imagen
La calidad de una imagen se mide en funcin de dos tipos de parmetros: los relativos a la
extensin y los relativos a la intensidad o profundidad, conociendo esta ltima como la
capacidad de distinguir diferencias de intensidad y de color en un mismo punto.
Resolucin
Es la capacidad de un detector para discriminar detalles, concretamente, es la capacidad para
diferenciar dos puntos muy prximos antes de que se fundan en uno solo. Dado que las
imgenes digitales estn formadas por puntos discontinuos que se perciben como un continuo
a una determinada distancia, este parmetro tiene una vital importancia.
Numero de grises
La calidad de la imagen depende, como segundo factor principal, del nmero de valores de
intensidad que es capaz de representar. Existe diferencia si trabajamos con una imagen
acromtica o cromtica. Entendemos por imagen acromtica, a la compuesta por una escala
2. Estudios Previos

Pgina 3

Anlisis de imgenes basado en correlacin de imgenes


tonal de grises cuyo rango vara de 2, tal como un dibujo en blanco y negro (1 bit por pixel
(bpp)). El parmetro bpp representa la informacin con la que contamos y permite saber el
nmero de valores que nos proporcionar una imagen y que ser igual a 2n donde n es el valor
de bpp.
En el caso de las imgenes cromticas los parmetros que se tienen en cuenta son los 256
niveles de gris a travs de tres canales RGB (Red, Green, Blue), rojo, verde y azul.
Perturbaciones caractersticas de las imgenes y mtodos de correccin
Las perturbaciones tpicas que se producen en las imgenes son el ruido, las interferencias, las
manchas, las franjas, los bordes de colores, las prdidas o alteraciones de tono, intensidad o
saturacin. Estas perturbaciones tienen su origen en fallos del dispositivo que impiden una
respuesta adecuada. Las perturbaciones ms caractersticas de las seales digitales son el
contorneado, la pixelacin y el aliasing. La ms comn en las seales analgicas es el ruido
aunque tambin se produce en seales digitales.
Pixelacin y contorneado
La pixelacin y el contorneado son dos perturbaciones de las seales digitales que se producen
por insuficiencia de la resolucin en el primer caso y por insuficiencia del rango de
intensidades en el segundo. En la siguiente figura podemos ver un ejemplo de pixelacin y
contorneado. En la ilustracin se muestra un esquema que correspondera a una imagen
determinada (izquierda) de la que se han suprimido la mitad de las muestras (centro) lo que
producira un efecto de pixelacin, o la mitad de los valores (derecha) lo que producira un
efecto de contorneado.

Ilustracin 3. Prdida de calidad de una imagen (a) por insuficiente muestreo (b) y
cuantificacin (c).
Ruido
Es una seal no deseada que se introduce en un sistema de transmisin. Puede tener diversos
orgenes pero generalmente se consideran como errores de medicin superpuestos a la
imagen. Por ejemplo, el ruido de fondo es la agitacin de electrones presentes en el canal
antes del paso de los electrones propios de la seal. La nica forma de evitar el ruido es
disminuir la capacidad del canal.
La unidad de medida del ruido son los decibelios (dB) referidos a nmeros S/N. En general
todos los dispositivos introducen cierto grado de ruido a la imagen, tanto si se ha generado
internamente o se capta por algn dispositivo. Se distinguen dos grandes tipos de ruido:

2. Estudios Previos

Pgina 4

Anlisis de imgenes basado en correlacin de imgenes

El ruido determinado o no aleatorio se genera por un sistema concreto y tiene siempre


un aspecto similar: franjas o bandas o nubes de puntos de determinadas
caractersticas de tamao y orientacin. Se pueden filtrar y eliminar si se conoce su
patrn de recurrencia.

El ruido indeterminado o aleatorio se genera por diversas causas que no se pueden


identificar o corregir pues su distribucin es aleatoria y cambia con el tiempo. La nica
forma de eliminar este ruido es introducir filtros a la imagen.

Aliasing
Es la aparicin de fenmenos extraos que alteran notablemente el aspecto de la imagen
original, suprimiendo informacin relevante o alterando la existente hasta volverla equvoca.
Estos fenmenos se producen en el momento de la reconstruccin, por prdida o
modificacin, debido a que algunos de los componentes de la seal original estaban
comprendidos en frecuencias superiores al lmite de Nyquist y ha sido reconstruido en
frecuencias ms bajas.
Antialiasing
Son el conjunto de tcnicas que se utilizan para prevenir o disimular los defectos
comprendidos genricamente bajo la denominacin de aliasing.

2.1.2 Sistema de procesamiento de imgenes


Cuando hablamos de tratamiento digital de las imgenes abarcamos dos reas principales de
aplicacin. En primer lugar, el procesamiento de imgenes con la finalidad de mejorar la
informacin de modo que sea capaz de ser asimilada por observadores humanos, y el
procesamiento y anlisis de imgenes, con la finalidad de hacer que sean reconocidas por
computadores especializados.
Por procesamiento se entiende al conjunto de tcnicas y mtodos encaminados a mejorar una
imagen, con el fin de la independencia de su contenido, facilitar su posterior interpretacin.
Ejemplos de procesamiento son el tratamiento de radiografas para realzar zonas de inters, el
procesamiento de fotografas en mal estado para facilitar el reconocimiento de personas, etc.
Por anlisis de imgenes se alude al conjunto de tcnicas y mtodos encaminados a facilitar la
extraccin de la informacin contenida en ellas. La finalidad principal sera llegar a hacer eficaz
la visin por computador, es decir, conseguir que una mquina dotada de sensores pueda
reconocer fragmentos ms o menos grandes del espacio y los objetos que le rodean y ajustar
su conducta de acuerdo con esta informacin. El proceso implica la deteccin, la identificacin
y la comprensin de patrones que son relevantes en una aplicacin determinada. Un ejemplo
de anlisis de imgenes puede ser el uso de robots en cadenas de produccin que pueden
reconocer si un producto tiene defectos y debe ser retirado de la cadena, o el uso de robots en
procesos de fabricacin para reconocer formas caractersticas.
A continuacin, vamos a presentar de forma genrica, las etapas fundamentales de un sistema
de procesado de imgenes y una pequea descripcin de cada una de las etapas.
2. Estudios Previos

Pgina 5

Anlisis de imgenes basado en correlacin de imgenes


2.1.2.1 Adquisicin de la imagen
Consiste en la adquisicin mediante un conjunto de dispositivos de la imagen digital.
Estos dispositivos concretamente son un sensor de imgenes y un digitalizador. El
primero es un dispositivo fsico sensible a una determinada banda del espectro de
energa electromagntica (banda de rayos X, ultravioleta, visible o infarrojo) y que
produzca una seal elctrica de salida proporcional al nivel de energa detectado. El
segundo, el digitalizador, es un utensilio que se encarga de convertir la seal de salida
del sistema sensible a forma digital.
2.1.2.2 Almacenamiento
Consiste en proporcionar la capacidad de almacenamiento adecuada para la adquisicin
de la imagen. Es un reto importante en el diseo de los sistemas de tratamiento de
imgenes, ya que por ejemplo una imagen de 8 bit necesita un milln de bytes de
memoria. Dentro del almacenamiento tenemos tres categoras:

Almacenamiento a corto plazo: Para esto podemos utilizar la memoria del


ordenador, o bien externalizar esta operacin utilizando tarjetas de memoria
especializadas denominadas memorias temporales, que almacenan una o ms
imgenes a las que puede accederse con rapidez.

Almacenamiento en lnea: Para reutilizarla rpidamente.

Almacenamiento en archivo: Caracterizado por un acceso poco frecuente y un


almacenamiento pasivo.

2.1.2.3 Preprocesamiento
Durante esta fase se llevan a cabo una serie de acciones que tienen por finalidad facilitar
el trabajo posterior; acciones tales como eliminar ruidos o calibrar adecuadamente los
rangos monocromticos y cromticos, el contraste o la definicin de las diferentes reas.
2.1.2.4 Segmentacin
Se encarga de separar la imagen en sus partes constituyentes, con lo que entramos en el
dominio del anlisis y, con ello, en el ncleo de los problemas propios del procesamiento
de imgenes. La segmentacin supone la deteccin de puntos, lneas y bordes. A partir
de este momento, se busca identificar bordes continuos, fronteras y regiones. La
segmentacin depende por lo general de la aplicacin que dicta las propiedades visuales
de los elementos de inters cuya deteccin se busca. El mtodo ms general se basa en
la deteccin de discontinuidades y el problema ms general deriva de que las
discontinuidades resultan de bordes significativos.
2.1.2.5 Representacin y descripcin
Como resultado del proceso anterior, la imagen se habr diferenciado entre pixeles
correspondientes a bordes y pixeles correspondientes a regiones. Para que estos
2. Estudios Previos

Pgina 6

Anlisis de imgenes basado en correlacin de imgenes


procesos resulten ms adecuados se depender del contexto. Si lo que se busca es
diferenciar figuras de fondos, la segmentacin en bordes resultar ms adecuada, sin
embargo en el caso de identificar propiedades materiales ser preferible identificar
regiones. La representacin consiste fundamentalmente en una seleccin de
caractersticas que se realzan y se procesan para obtener datos adicionales dados
generalmente en forma numrica o mediante especificaciones acerca de la topologa de
la imagen.
2.1.2.6 Reconocimiento e interpretacin
Una vez realizada la descripcin de la imagen es posible comparar los datos obtenidos
con los datos contenidos en una base de datos y asignar etiquetas identificadoras a los
distintos elementos. Este proceso de asignacin se denomina reconocimiento. En
cambio por interpretacin se alude al paso final de asignar un significado a un conjunto
de objetos etiquetados.

2.1.3 Transformaciones
2.1.3.1 Interpolacin
Al realizar transformaciones afines a las imgenes se presentan cambios en la posicin
de los pixeles respecto a su posicin inicial en el plano imagen y por lo tanto se
requieren mtodos de interpolacin numrica para los valores de intensidad que se
asignarn a las nuevas posiciones en el plano imagen.
Relacionado con la imagen digital consiste en la creacin de nuevos pxeles a partir de
los existentes, de modo que la imagen resultante represente lo mismo que la original,
solo que con ms pxeles.
Hay tres tipos de interpolacin diferente:
1. Interpolacin del vecino ms cercano
Este es el algoritmo de interpolacin ms simple posible. La interpolacin del vecino
ms prximo selecciona el valor del pxel ms cercano redondeando las
coordenadas del punto de interpolacin deseado.
Aunque se trata de un mtodo sencillo provoca efectos indeseables en las
imgenes por lo que no se aconseja su uso para el suavizado de imgenes.
El proceso es el siguiente: se recorre pixel a pixel la imagen original y para cada
pixel crea varios iguales, segn la interpolacin que se realice, y los introduce en la
imagen definitiva.
2. Interpolacin bilineal
Es un mtodo algo ms sofisticado que el anterior. El algoritmo bilineal interpola a
partir de los cuatro pixeles adyacentes que rodean al punto deseado de

2. Estudios Previos

Pgina 7

Anlisis de imgenes basado en correlacin de imgenes


interpolacin. Se basa en obtener la solucin de los coeficientes de la siguiente
ecuacin:

u ( x, y ) = c1 x + c2 y + c3 xy + c4

(Ecuacin 3)

Donde u(x,y) representa la intensidad del pxel, y (x,y) la coordenada donde se


redefinir la intensidad del pxel.
Se obtienen los coeficientes usando la frmula anterior en los cuatro pxeles de la
vecindad que se pretende interpolar.
3. Interpolacin bicbica
Interpolan a partir de los diecisis pxeles de la imagen original adyacentes al pxel
sobre el que se quiere realizar la interpolacin. El valor de la intensidad aplicado al
pxel responde a:
3

u ( x, y ) = a ji xi y i

(Ecuacin 4)

j =0 i = 0

Donde los diecisis coeficientes aji se obtienen de las diecisis ecuaciones de la


forma anterior.
Como podemos observar la ecuacin de la interpolacin bicbica se convierte en la
bilineal cuando el trmino del sumatorio es de 0 a 1.
2.1.3.2 Tratamiento estadstico de imgenes
2.1.3.2.1 Brillo medio
En una imagen es la suma de todos los brillos dividido por el nmero total de
pxeles de la imagen.

=x=

1 255
u i n i
M N u =0

(Ecuacin 5)

Siendo M y N las dimensiones de la imagen, ui el valor de brillo de 0 a 255 y ni es el


nmero de pxeles que tienen ese valor de brillo
2.1.3.2.2 Varianza de una imagen
Valora la separacin existente entre los brillos de los pxeles y el valor medio
(elevado al cuadrado para no compensar variaciones positivas con negativas).

2 =

2. Estudios Previos

1
M N

[ x ( i, j ) ]

(Ecuacin 6)

i =1 j =1

Pgina 8

Anlisis de imgenes basado en correlacin de imgenes


2.1.3.2.3 Desviacin tpica
Es la raz cuadrada de la varianza.

Desviacin tpica

(Ecuacin 7)

2.1.3.2.4 Histograma
El histograma de una imagen es el grafico en el que se representan las veces que
aparece cada brillo. En el eje de abscisas del grfico se representa los distintos
brillos de la imagen y en el eje de ordenadas aparece la frecuencia relativa con la
que cada color aparece en la imagen. El histograma aporta informacin sobre el
brillo y el contraste de la imagen, pudiendo ser utilizado para ajustar estos
parmetros.
Un pico en nuestro histograma en el lado izquierdo indica un gran nmero de
pxeles que estn oscuros o negros, mientras que un pico en la parte derecha indica
un gran nmero de pxeles luminosos o blancos.

Ilustracin 4. Histograma de una imagen monocroma original y ecualizada.


Para convertir el histograma en una funcin de densidad de probabilidad, podemos
normalizarlo provocando que la variable representada haya sido escalada para
ajustarse a un rango entre 0 y 1. Para ello las ordenadas se dividen entre el nmero
total de pxeles.

2. Estudios Previos

Pgina 9

Anlisis de imgenes basado en correlacin de imgenes


Una forma de manipulacin del histograma es su ecualizacin que reduce
automticamente el contraste en las reas muy claras o muy oscuras de la imagen.
Consiste en una transformacin no lineal que considera la distribucin acumulativa
de la imagen original, para generar una imagen resultante cuyo histograma ser
aproximadamente uniforme. Obviamente esto no es posible debido a la naturaleza
discreta de los datos digitales de una imagen. Sin embargo, se consigue una
aproximacin al dispersar los picos del histograma de la imagen, dejando intactas
las partes ms bajas.
2.1.3.3 Operaciones de punto
Las operaciones orientadas al punto transforman a la imagen modificando un pxel a la
vez, sin importar el estado de los pxeles vecinos.

u[m,n]

v[m,n]

Ilustracin 5. Operaciones de punto


1. Stretching
Conocida como estiramiento o ampliacin de contraste se aplica en aquellas
imgenes con poco contraste. Una imagen con poco contraste es aquella en la que
los valores de los niveles de gris de los pxeles que la componen toman valores
prximos o iguales, haciendo difcil diferenciar a simple vista los valores entre unos
y otros. Esto lo podramos ver claramente en el histograma, ya que en una
pequea zona de niveles de pxeles habra mucha frecuencia de aparicin.
Para solucionar el problema tenemos que conseguir que todos los valores de los
pxeles que ocupan un entorno pequeo, pasen a ocupar un entorno ms grande
del rango dinmico total, lo cual equivale a estirar la parte del histograma donde
se concentran los valores de ms aparicin. La funcin a utilizar es la siguiente:

u + V0

v = f (u ) = ( u a ) + va
(u b) + v
b

2. Estudios Previos

0u<a
au<b

(Ecuacin 8)

bu<L
Pgina 10

Anlisis de imgenes basado en correlacin de imgenes

v
L
Vb

Va
0

Grfica 1
Se puede observar tres intervalos para los valores que toman los pixeles de u, la
cual es nuestra imagen original. Si tenemos un intervalo que abarca la mayor
frecuencia de aparicin, la pendiente de nuestra funcin deber ser mayor que la
unidad para que as se produzca un estiramiento.
En el caso de que un intervalo se estire, quiere decir que por otro lado, los otros
dos intervalos tienen que comprimirse, ya que el rango dinmico se mantiene
constante, es decir, siguen existiendo el mismo nmero de niveles (L+1). Esto
supone que un nmero de niveles de la variable u pasan a ocupar un nmero
menor de niveles de v.
En los niveles menos frecuentes, hay una prdida de informacin, pero no es
importante ya que la mayor parte de la informacin total se encuentra en el rango
de valores ms habituales.
2. Clipping
Se trata de un caso especial de la tcnica de ampliacin de contraste. Pueden
darse tres casos: recorte por la parte inferior, recorte por la parte superior y
recorte por ambos lados.

2. Estudios Previos

si u < a
v=0

v = f (u ) =
L (u a )
si u > a
v =
La

(Ecuacin 9)

si u < a
v=0

v = f (u ) =
L (u a )
si u > a
v =
La

(Ecuacin 10)

Pgina 11

Anlisis de imgenes basado en correlacin de imgenes


si u < a
v=0

L (u a )

v = f (u ) = v =
si a < u < b
L

si u > a
v = L
v
L

v
L

v
L

(Ecuacin 11)

Grfica 2. Relativas a las ecuaciones 9,10 y 11


El clipping sirve para ampliar de una forma drstica el contraste de un nmero
reducido de niveles de gris. Este rango de niveles suele situarse donde se desea
resaltar el contraste, permitiendo diferenciar los niveles que estn por encima y
por debajo de dicho rango. Estos niveles de gris corresponden a los que estn en el
intervalo que podemos observar en las funciones y su correspondiente ecuacin
[a,b]. En este caso, los niveles que estn por debajo del umbral a, pasan a valer
un nico valor, cero, mientras que los niveles que se encuentran por encima de
b, valgan el valor mximo, L. Por tanto podemos decir que una operacin de
clipping corresponde a un stretching donde los valores de niveles fuera del
intervalo [a,b] sufren la mxima compresin. Esta tcnica es muy buena para
reducir el ruido cuando se sabe que los valores de brillo caen en un cierto rango de
valores.
3. Umbralizacin.
Al igual que el clipping, se trata de un caso particular de ampliacin de contraste.
Mediante el proceso de umbralizacin, se divide el histograma de la imagen
usando un umbral nico. Dependiendo si el tipo de umbralizacin es superior,
inferior o binarizacin, algunos pixeles se forzaran a blanco, otros a negro y otros
se mantendrn.

Umbralizacin Inferior

Se respeta el brillo de los pxeles que alcanzan un determinado valor. Los que
tienen menor brillo que ese se colocan a blanco o a negro.

2. Estudios Previos

Pgina 12

Anlisis de imgenes basado en correlacin de imgenes


a b z b 1e az
para z a

p ( z ) = ( b 1) !
0
para z < a

(Ecuacin 12)

v
L

Grfica 3

Umbralizacin Superior

Se respeta el brillo de los pxeles que no alcanzan un determinado valor. Los que
tienen mayor brillo que ese se colocan a blanco o a negro.

v = u si u < a
v = f (u ) =
v = L si u > a

(Ecuacin 13)

v
L

Grfica 4

Binarizacin

Los pxeles cuyo nivel no superan el umbral se fuerzan a blanco y los que lo
superan, a negro. La imagen resultante de esta operacin ser una imagen binaria.
Esta binarizacin es muy interesante en ciertas aplicaciones ya que puede servir
para resaltar las partes brillantes de una imagen, que suelen corresponder a los
objetos situados sobre un fondo oscuro. Otra aplicacin bastante til de esta
operacin, es el tratamiento de imgenes que tienen carcter binario. Un ejemplo
de este tipo es un papel escrito, que al pasarlo por un scanner, puede que la
imagen obtenida no sea binaria debido a la iluminacin del fondo y al ruido
2. Estudios Previos

Pgina 13

Anlisis de imgenes basado en correlacin de imgenes


introducido por el sensor. Con la binarizacin podemos convertir dicha imagen no
binaria en una binaria.

v = 0 si u < a
v = f (u ) =
v = L si u > a
v
L

(Ecuacin 14)

Grfica 5
4. Slicing
Con el este proceso se resaltan zonas de la imagen con un brillo determinado. Lo
resaltado se puede mandar a blanco o a negro.
Esto se aplica cuando queremos destacar un determinado rango de niveles de gris
debido a que contiene informacin importante de la imagen.

Conservando el fondo:

si a < u < b
resto

L
v = f (u ) =
u

(Ecuacin 15)

v
L

Grfica 6

No conservando el fondo:

L
v = f (u ) =
u

2. Estudios Previos

si a < u < b
resto

(Ecuacin 16)

Pgina 14

Anlisis de imgenes basado en correlacin de imgenes


v
L

Grfica 7

No conservando el fondo, umbralizado:

L
v = f (u ) =
u

si a < u < b
(Ecuacin 17)

resto

v
L

Grfica 8
5. Complementacin
Tambin conocido como brillo negativo, y consiste en sustituir cada pxel de la
imagen por su complementario.

v = f (u ) = L u

(Ecuacin 18)

v
L

Grfica 9

2. Estudios Previos

Pgina 15

Anlisis de imgenes basado en correlacin de imgenes


6. Operacin logaritmo
A menudo el rango de dinmico de los pxeles de una imagen excede la capacidad
del dispositivo de visualizacin, por lo que hay muchos pxeles que no pueden ser
visualizados. Para solucionar este problema utilizamos la operacin logaritmo que
comprime el rango dinmico ajustando la constante para que el resultado sea el
esperado.

v = c log(1 + u )

(Ecuacin 19)

Otro ejemplo sera para mejorar el contraste en los niveles de gris ms bajos
comprimiendo el rango de valores ms altos, por lo que este procedimiento es
muy til para mejorar el contraste en imgenes oscuras.

v
L

0
Grfica 10

7. Operacin exponencial
Produce el efecto contrario a la operacin logartmica. Su utilidad es ampliar el
rango dinmico del dispositivo de salida y obtener una mejor definicin.
La funcin utilizada para cada pxel es:

v =10u / c 1

(Ecuacin 20)

v
L

Grfica 11
2. Estudios Previos

Pgina 16

Anlisis de imgenes basado en correlacin de imgenes


Como su funcin es contraria a la operacin logartmica, la operacin exponencial
la utilizaremos para mejorar el contraste en imgenes claras.
2.1.3.4 Operaciones aritmticas
1. Operaciones aritmticas con una imagen
- Operacin suma
En esta operacin le sumamos al brillo de cada pxel un valor constante,
incrementando el brillo de la imagen este determinado valor. Esto lo vemos
reflejado en el histograma que se desplaza, tantos pxeles como lo hayamos
desplazado la imagen.

R ( x, y ) = A ( x, y ) + a

(Ecuacin 21)

Debido a este desplazamiento pueden existir pxeles cuyo valor de brillo superen el
mximo soportado por el dispositivo de salida (overflow), por lo que habr que
recortar estos valores al mximo permitido por el dispositivo. Este hecho se conoce
como saturacin y supone una prdida de informacin con respecto a la imagen
original.

Grfica 12
- Operacin resta
En esta operacin le restamos el brillo de cada pxel un valor constante,
decrementando el brillo de la imagen este determinado valor. Esto lo vemos
reflejado en el histograma que se desplaza, tantos pxeles como lo hayamos
desplazado la imagen.

2. Estudios Previos

Pgina 17

Anlisis de imgenes basado en correlacin de imgenes

Grfica 13
- Operacin multiplicacin
Aumenta la intensidad de la imagen en un valor constante. El efecto de esta
operacin se muestra en el histograma, en el cual se produce un estiramiento hacia
la izquierda.

R ( x, y ) = b * A( x, y )

(Ecuacin 23)

v
L

Grfica 14

Tanto en la suma como en la multiplicacin, se aumenta el nivel de gris de los


pxeles, pero de forma distinta. En la suma, el valor constante indica el nmero de
niveles de grises a aumentar. Sin embargo, en la multiplicacin b significa el factor a
multiplicar. Por ejemplo si:

2. Estudios Previos

B =1
B=2
B=0.5
B<1

Ningn cambio
Se duplica el valor de gris. Los pxeles > 127 se saturan.
Se encoge a la mitad el histograma.
Sera la operacin divisin.

Pgina 18

Anlisis de imgenes basado en correlacin de imgenes


2. Operaciones aritmticas. Combinacin de imgenes
- Suma
Sumar dos imgenes da como resultado otra imagen que es una mezcla de ambas.

R ( x, y ) = A ( x, y ) + B ( x, y )

(Ecuacin 24)

Antes de sumar las imgenes tenemos que tener en cuenta la saturacin de la


imagen resultante, es conveniente reducir previamente el rango de las imgenes a
sumar. Para ello se dividen los valores de los pxeles entre el nmero de imgenes
que participan en la suma producindose una imagen media de las originales.

R ( x, y ) =

( A ( x , y ) + B ( x , y ))
2

(Ecuacin 25)

Como cada imagen se produce en instantes diferentes de tiempo, cada imagen


tiene diferentes patrones de ruido. Al hacer la media de todas ellas se obtiene
como resultado una imagen donde el ruido aleatorio ha sido atenuado. Esto es
debido a que esta media refuerza los valores de los pxeles que no varan en ambas
imgenes.

Ilustracin 6. Operacin aritmtica (Suma)

2. Estudios Previos

Pgina 19

Anlisis de imgenes basado en correlacin de imgenes


- Resta
Obtenemos una imagen que es la diferencia entre ambas. Esta tcnica es de gran
aplicacin en segmentacin y realce. Es una tcnica til para detectar el cambio
producido en dos imgenes que han sido captadas en dos instantes de tiempo
diferentes.
Como era de esperar puede ocurrir el caso contrario a la suma, en la que se
produzca la saturacin de los pxeles, pero en este caso en cero. Como en
procesamiento se utilizan pxeles con nmeros positivos podemos utilizar un
reescalado donde el valor ms negativo se corresponde con el 0 y el mximo con el
255 para la escala de grises de 0 a 255. Para ello aplicamos la siguiente funcin:

A( x, y )
B ( x, y )
R ( x, y ) =
+ 128
2
2

(Ecuacin 26)

Si solo queremos conocer la diferencia entre las imgenes, entonces como solucin
tomamos el valor absoluto de la resta.

R ( x, y ) = abs ( A ( x, y ) B ( x, y ))

(Ecuacin 27)

En este caso si los pxeles son negros, las imgenes son iguales, por el contrario
cuando ms clara es una zona ms se diferencias las imgenes.

Ilustracin 7. Operacin aritmtica (Resta)


- Producto
En primer lugar a la hora de multiplicar hay que escalar el resultado ya que la
multiplicacin de dos imgenes, producira una totalmente saturada.
2. Estudios Previos

Pgina 20

Anlisis de imgenes basado en correlacin de imgenes


R ( x, y ) =

A ( x , y ) * B ( x, y )
255

(Ecuacin 28)

El producto de imgenes puede ser usado para realizar una transformacin de


intensidad diferente para cada pxel.

Ilustracin 8. Operacin aritmtica (Multiplicacin)

- Divisin
La divisin es la operacin contraria a la multiplicacin, y por ello tambin debemos
realizar un escalado pero esta vez multiplicando por 255.

R ( x, y ) =

2. Estudios Previos

A( x, y )
*255
B ( x, y )

(Ecuacin 29)

Pgina 21

Anlisis de imgenes basado en correlacin de imgenes

Ilustracin 9. Operacin aritmtica (Divisin)


3. Operaciones lgicas
Estos operadores tienen sentido cuando al menos una de las imgenes es binaria y
acta como mscara de la otra, de manera que el nivel de negro (0) es FALSE y el
nivel de blanco (nivel mximo L-1) es TRUE.
Los principales operadores lgicos son:

AND
OR
XOR
NOT

2. Estudios Previos

Pgina 22

Anlisis de imgenes basado en correlacin de imgenes

Ilustracin 10. Operaciones lgicas


2.1.3.5 Introduccin de ruido
Entendemos el ruido en una imagen digital como cualquier valor de un pxel que no se
corresponde con la realidad. Siempre que se adquiere una imagen, sta est
contaminada por ruido. Suele ser debido a los equipos utilizados en la captacin de las
imgenes (ruido de cuantificacin de la imagen, efecto de niebla, etc) y al ruido aadido
en los tramos de transmisin (posibles interferencias o errores al transmitir los bits de
informacin).
1. Ruido uniforme
El ruido que afecta a la imagen sigue una distribucin uniforme. La probabilidad de
tomar cualquier valor de gris dentro de un intervalo definido es constante.

1
si a z b

p( z ) = b a
0
en otro caso

(Ecuacin 30)

Con valores de media y desviacin tpica:

2 =
2. Estudios Previos

a+b
2

(Ecuacin 31)

(b a)2
12

(Ecuacin 32)

Pgina 23

Anlisis de imgenes basado en correlacin de imgenes

Grfica 15
No es de los ms frecuentes, pero se utiliza mucho en las simulaciones.
2. Ruido gaussiano
La probabilidad de que el ruido valga z es:

1
p(z) =
e
2

( z )2
2 2

(Ecuacin 33)

p(z)

0
Grfica 16

Los parmetros que lo definen son la media () y la desviacin tpica ().


Con la distribucin anterior, aproximadamente el 70% de las veces el ruido se
encuentra comprendido entre los valores de (-) y (+) y aproximadamente el
95% de las veces el ruido se encuentra comprendido entre los valores de (-2) y
(+2).
Se caracteriza por tener un espectro de energa constante para todas las
frecuencias.
El ruido gaussiano tiene un efecto general en toda la imagen, es decir, la intensidad
de cada pxel de la imagen se ve alterada en cierta medida con respecto a la
intensidad en la imagen original.

2. Estudios Previos

Pgina 24

Anlisis de imgenes basado en correlacin de imgenes


3. Ruido exponencial
La probabilidad de que el ruido valga z es:

ae az para z a
p( z ) =
para z < a
0

(Ecuacin 34)

Con valores de media y desviacin tpica que vienen dadas por las siguientes
funciones:

1
a

2 =

1
a2

(Ecuacin 35)
(Ecuacin 36)

v
a

0
Grfica 17
4. Ruido sal y pimienta

Es causado principalmente por fallos en el funcionamiento de los sensores


encargados de capturar una imagen o por errores de tiempo cuando se produce el
proceso de digitalizacin de la misma.
Al momento de digitalizar la imagen este tipo de ruido generalmente toma valores
extremos en la imagen (cercanos a los valores de negro o muy cercanos a los
valores de blanco), esto es debido a que los impulsos de ruido pueden ser negativos
o positivos. Generalmente suelen suponerse que los valores de a y b se encuentran
saturados, ya sea en sus valores mximos o en sus valores mnimos cuando se
digitaliza la imagen.
La probabilidad de que el ruido valga z es:

2. Estudios Previos

Pgina 25

Anlisis de imgenes basado en correlacin de imgenes


Pa para z = a

p ( z ) = Pb para z = b
0 en otro caso

(Ecuacin 37)

p(z)
Pb
Impulso
Pa

z
Grfica 18
Si b>a, la intensidad aparecer como un punto blanco en la imagen y a aparecer
como un punto negro.
5. Ruido Rayleingh
La probabilidad de que el ruido valga z es:
( z a )
2

( z a)e b
p( z ) = b
para z a
0 para z < a

(Ecuacin 38)

El valor de la media y la desviacin tpica viene dada por:

=a+

2 =

2. Estudios Previos

(Ecuacin 39)

b(4 )
4

(Ecuacin 40)

Pgina 26

Anlisis de imgenes basado en correlacin de imgenes


p(z)

Rayleigh
Pa

Grfica 19
Este ruido suele generarse en el proceso de obtencin de las imgenes.
6. Ruido gamma
La probabilidad de que el ruido valga z es:

a b z b 1e az
para z a

p ( z ) = ( b 1) !
0
para z < a

(Ecuacin 41)

Con valores de media y desviacin tpica definidos por:

2 =

b
a

(Ecuacin 42)

b
a2

(Ecuacin 43)

5
4
3
2
1
5

10

15

20

Grfica 20
2. Estudios Previos

Pgina 27

Anlisis de imgenes basado en correlacin de imgenes


7. Ruido peridico
El ruido peridico se suele originar debido a una interferencia elctrica o
electromagntica durante la adquisicin de la imagen. Debido a sus caractersticas,
el ruido peridico puede reducirse significativamente mediante filtrado en el
dominio de la frecuencia, ya que el ruido peridico produce picos de frecuencia en
el espectro de Fourier que son fcilmente identificables.

2.1.3.6 Operaciones geomtricas


A diferencia de las operaciones aritmticas o la introduccin de ruido, en las
operaciones geomtricas no se modifican los brillos de los pxeles que componen las
imgenes, lo que s se modifica es la posicin donde se van a ubicar.

u[m,n]

v[m,n]

Ilustracin 11. Operaciones geomtricas

v[m, n] = u[ f 1(m, n), f 2(m, n)]

(Ecuacin 44)

El pxel de llegada se busca en algn punto de la imagen de entrada.


1. Simetra
Con la simetra, la imagen mantiene la colocacin de los pxeles en un eje mientras
los invierte en el otro. Si la inversin se realiza en el eje X la simetra ser horizontal
y si se hace en el eje Y, vertical.

En el caso horizontal (Mirror)


Esta consiste en intercambiar las columnas de una imagen.

2. Estudios Previos

Pgina 28

Anlisis de imgenes basado en correlacin de imgenes


x= x ; y= Y0 y

x 1 0 0 x
y = 0 1 Y y
0

1 0 0 1 1

Yo

(Ecuacin 45)

(Ecuacin 46)

Yo
y

Xo

Xo
x

Ilustracin 12
Tomando (x,y) como coordenadas en la imagen original e (x`,y`) como las
coordenadas en la imagen simtrica.

En el caso vertical (flip)


Esta consiste en intercambiar las filas de una imagen.

x= X 0 x; y= y
x 1 0
y = 0 1

1 0 0

X 0 x

0 y

1 1

(Ecuacin 47)

(Ecuacin 48)

Yo

Yo

Xo

Xo
x

x
Ilustracin 13

2. Estudios Previos

Pgina 29

Anlisis de imgenes basado en correlacin de imgenes


Tomando (x,y) como coordenadas en la imagen original e (x`,y`) como las
coordenadas en la imagen simtrica.
2. Traslaciones
Es una operacin geomtrica donde una posicin determinada de un pxel (x,y), se
desplaza a un nueva posicin empleando unos desplazamientos (x,y). Las
ecuaciones que muestran esta operacin son las siguientes:

x= x + x; y= y + y

(Ecuacin 49)

x 1 0 x x
y = 0 1 y y

1 0 0 1 1

(Ecuacin 50)

Yo

Yo
y

Ay

Ax

Xo

Xo
x

Ilustracin 14
3. Escalado
Es una operacin geomtrica que permite cambiar la escala de la imagen. Las
ecuaciones que describen esta operacin son las siguientes:

x= k1 x; y= k2 y

x k1
y = 0

1 0

2. Estudios Previos

0
k2
0

0 x

0 y

1 1

(Ecuacin 51)

(Ecuacin 52)

Pgina 30

Anlisis de imgenes basado en correlacin de imgenes


Yo

K1 Y 0

Yo
y

K1 X 0

Xo

Xo
x

Ilustracin 15
4. Rotacin.
Consiste en girar la imagen un ngulo definido. Un detalle a tener en cuenta es que
la imagen puede cambiar de tamao respecto a la original con este proceso.
Deducimos la relacin entre posiciones que es:

y0 = y0 cos + x0 sen
x0 = x0 cos + x0 sen

(Ecuacin 53)

Y de estas ecuaciones obtenemos la matriz de rotacin:

x cos
y = sen

sen x

cos y

(Ecuacin 54)

Si los nuevos ejes giran en sentido horario, la imagen gira en sentido anti horario y
viceversa. Para girar la imagen en sentido horario ser negativo.

x cos
y = sen

sen x

cos y

(Ecuacin 55)

Rotacin simple 90o


Al rotar cualquier imagen 90 o, se produce un reacomodo de pxeles. Por este
motivo si por ejemplo las dimensiones de la imagen original eran N y M, al
efectuar la rotacin, en la direccin contraria a las manecillas del reloj respecto
al centro de la imagen, se producir una transposicin y el nmero de
columnas ser M y el de filas N.

2. Estudios Previos

Pgina 31

Anlisis de imgenes basado en correlacin de imgenes


x cos
y = sen

1 0

sen
cos
0

x 0 1
y = 1 0

0
0 y =+90

1 0 0
1

0 x

0 x
0 y

1
1

(Ecuacin 56)

Ilustracin 16

Rotacin 180 o
Al rotar una imagen 180 o, obtenemos una imagen con las mismas dimensiones
que la original pero en sentido contrario.

x cos
y = sen

1 0

sen
cos
0

0 x
0 y

1
1

x 1 0 0 x

=+1800 y = 0 1 0 y


1 0 0 1 1

(Ecuacin 57)

Ilustracin 17

2. Estudios Previos

Pgina 32

Anlisis de imgenes basado en correlacin de imgenes

Rotacin libre directa


Si queremos rotar una imagen un ngulo utilizamos la misma ecuacin
descrita anteriormente.

Rotacin libre inversa


Para evitar tener pxeles sin valor asignado, es posible inventarse el valor del
pxel, en vez de la posicin. En resumen las posiciones son exactas, y los brillos
interpolados.

5. Inclinacin
La inclinacin transforma una regin rectangular en un romboide. Nos sirve para
simular una perspectiva.

2.1.3.7 Convolucin
1. Unidimensional
La convolucin de dos secuencias x[n] e y[n], es otra secuencia z[n] dada por la
expresin:

x [n] = x [ n] * y [ n] =

x [ n] * y [ n n]

< n < +

(Ecuacin 58)

n =

Si el tamao de x[n] es N1 y el de y[n] es N2, el tamao de z[n] es N1 + N2 1

x [ n ] = x [ n ] * y [ n ] = y [ n ] * x[ n]

(Ecuacin 59)

2. Bidimensional
La convolucin de dos secuencias bidimensionales x[m,n] e y[m,n] es otra secuencia
bidimensional z[m,n] dada por la expresin:

z[m, n] = x[m, n]* y[m, n] =

x[m, n] y[(m m), (n n)]

m = n =

< n < +
< m < +
N 1

X [ k ] = x[n]e

j 2

k
n
N

, k = 0,1, 2,.( N 1)

n=0

(Ecuacin 60)
2. Estudios Previos

Pgina 33

Anlisis de imgenes basado en correlacin de imgenes


Si el tamao de x[m,n] es [M1,N1] y el de y[m,n] es [M2,N2], el tamao de z[m,n] es
[(M1+M2-1),(N1+N2-1)]
2.1.3.8

Transformadas de la imagen

1. Transformada de Fourier unidimensional


La transformada de una secuencia x[n] es:

X ( ) = x[n]e jn

(Ecuacin 61)

Donde =2F/N, siendo N el nmero de valores de la secuencia x[n] para la variable


de periodo N para la variable F.
La transformada inversa ser:

1
jn
X ()e d
2 2

x [ n] =

(Ecuacin 62)

2. Transformada de Fourier bidimensional


La transformada de Fourier de una imagen x[m,n] es una funcin continua:

X ( 1 , 2 ) =

x[m, n]e

j1m j 2 m

(Ecuacin 63)

m = n =

Siendo 1=2F1/N y 2=2F2/N.


La transformada inversa ser:

X ( 1 , 2 ) =

X ( , ) e
( 2 )
1

jn

d1d 2

(Ecuacin 64)

22

3. Transformada discreta de Fourier unidimensional


La transformada de Fourier de una secuencia discreta genera una funcin continua.
La transformada discreta de Fourier genera una secuencia:
N 1

X [ K ] = x[n]e

j 2

k
n
N

, k = 0,1, 2,.( N 1)

(Ecuacin 65)

n=0

2. Estudios Previos

Pgina 34

Anlisis de imgenes basado en correlacin de imgenes


La transformada inversa ser:

x [ n] =

k
j 2 n
1 N 1
N
X
[
k
]
e
, n = 0,1, 2,.

N k =0

(Ecuacin 66)

4. Transformada discreta de Fourier Bidimensional


Para la secuencia bidimensional, x[m,n] su transformada discreta de Fourier es:
M 1 N 1

X [k , l ] = x[m, n]e

( j 2

l
k
M ) ( j 2 N )
N
M

(Ecuacin 67)

m = 0 n =0

0 < k < ( M 1), 0 < l > ( N 1)


Y la transformada inversa ser:

x [ m, n] =

1
MN

M 1 N 1

X [ k , l ] e

k
l
j 2 m j 2 n
m
n

(Ecuacin 68)

k =0 l =0

5. Propiedades de la transformada de Fourier


-

Linealidad

El espectro de la suma lineal de imgenes es igual a la suma lineal de los espectros.


Tenemos que:

TF { x1 [ m, n ]} = X 1[ k , l ]

(Ecuacin 69)

TF { x2 [ m, n ]} = X 2 [ k , l ]

(Ecuacin 70)

x [ m, n ] = ax1 [ m, n ] + bx2 [ m, n]

(Ecuacin 71)

X [ k , l ] = aX 1 [ k , l ] + bX 2 [ k , l ]

(Ecuacin 72)

Si:

Se cumple que:

2. Estudios Previos

Pgina 35

Anlisis de imgenes basado en correlacin de imgenes


-

Translacin

Teniendo que:

TF { x1 [ m, n ]} = X 1[ k , l ]

(Ecuacin 73)

x2 [ m, n ] = x1[( m m0 ) , ( n n0 )]

(Ecuacin 74)

X 2 [ k , l ] = X 1[ k , l ]e j 2m0 e j 2n0

(Ecuacin 75)

Si se desplaza x1:

Se cumple que:

Separabilidad

Mediante esta propiedad podemos calcular la transformada discreta de Fourier de


una funcin bidimensional como una multiplicacin de dos transformadas de
Fourier discretas, calculando primero una TFD sobre la variable de uno de los ejes y
al resultado multiplicarle por la TFD de la segunda imagen.

T ( x ) = T ( x1 ) * T ( x2 )
-

(Ecuacin 76)

Periodicidad

La transformada de una secuencia x[m,n] de tamao MxN es una funcin continua


y peridica. La transformada discreta de Fourier son muestras de la anterior, pero
solo se considera un periodo. El resto es repetido.
-

Simetra conjugada

La transformada de Fourier cumple:

X [ k , l ] = X * [ k , l ] X ( ) = x[n]e jn

(Ecuacin 77)

Centrado de la transformada

Los valores significativos suelen estar en los extremos. Al multiplicar la imagen por
(-1)m+n antes de la transformacin, implica el centrado de la transformada:

2. Estudios Previos

Pgina 36

Anlisis de imgenes basado en correlacin de imgenes


Si:

TF { f [ m, n ]} = F ( k , l )

TF f [ m, n ] ( 1)
-

m+n

} = F k M2 , l N2

(Ecuacin 78)

(Ecuacin 79)

Rotacin

Si rotamos una imagen su espectro tambin rota.


-

Convolucin

Si tenemos:

TF { x1 [ m, n ]} = X 1[ k , l ]

(Ecuacin 80)

TF { x2 [ m, n ]} = X 2 [ k , l ]

(Ecuacin 81)

x1 [ m, n ] * x2 [ m, n ] = X 1 [ k , l ] X 2 [ k , l ]

(Ecuacin 82)

TF { x1 [ m, n ]} = X 1 [ k , l ]

(Ecuacin 83)

TF { x2 [ m, n ]} = X 2 [ k , l ]

(Ecuacin 84)

x1 [ m, n ] x2 [ m, n ] = X 1 [ k , l ] * X 2 [ k , l ]

(Ecuacin 85)

Entonces:

Producto

Si tenemos:

Entonces:

Esta convolucin ha de ser circular porque el espectro es peridico no limitado.

2. Estudios Previos

Pgina 37

Anlisis de imgenes basado en correlacin de imgenes


-

Conservacin de la energa

| x | = | X |
2

xx = X X
-

(Ecuacin 86)
(Ecuacin 87)

Escalado en campo continuo

Si:

TF { f ( x, y )} es F ( wx , wy )

(Ecuacin 88)

Entonces:

TF { f ( x, y )} =
-

1 wx wy
F ,
ab a b

Escalado en campo discreto

xk X [kn]
2.1.3.9

(Ecuacin 89)

(Ecuacin 90)

Operaciones rea de filtros

En las operaciones de punto, cada pxel de salida depende slo de un pxel de entrada,
es decir, no tenamos en cuenta la relacin de vecindad entre pxeles.
En las operaciones de rea (filtrado espacial), el valor de un pxel depende de la
vecindad local de ese pxel.
Matemticamente podemos verlo en las siguientes funciones:
-

En operaciones de punto:

v [ m, n ] = f ( u [ m, n ]) v [ m, n ] = f (u1 [ m, n ] , u2 [ m, n ])

(Ecuacin 91)

En operaciones de rea:

v [ m, n ] = f ( u [ m k , n k ]) , u [ m, n ] , + u1[ m + k , n + k ]) (Ecuacin 92)

2. Estudios Previos

Pgina 38

Anlisis de imgenes basado en correlacin de imgenes


Un tipo interesante de operaciones de rea son las convoluciones discretas, que son
transformaciones en las que el valor del pxel resultante es una combinacin lineal de los
valores de los pxeles vecinos en la imagen. La matriz de los coeficientes de esta
combinacin lineal la denominamos mscara o ncleo de convolucin.
Matemticamente lo podramos reflejar as:
-

Sea a una mscara de convolucin.


Imagen de entrada u.
Imagen de salida v.
Algoritmo
Calcular la convolucin v=a u para cada pxel [m,n] de la imagen u haciendo:

v [ m, n ] = a [ k , l ] u[m k , n l ]

(Ecuacin 93)

Uno de los dilemas que nos surgen a la hora de convolucionar una imagen con una
mscara es qu hacer con los bordes. Esta situacin puede ser resuelta de estos cuatro
modos diferentes:
1. Asignar un cero en el resultado a los pxeles donde no cabe la mscara.
2. Suponer que los pxeles que se salen tienen un valor constante (normalmente
cero).
3. Modificar el valor en los pxeles que no caben (variar el multiplicador)
4. Suponer que la imagen se pliega por los extremos.
Segn apliquemos distintos operadores de convolucin es posible obtener diferentes
efectos en nuestra imagen:

Suavizado o difuminado de la imagen, reducir contrastes grandes en la imagen.


Perfilado: resaltar los contrastes. Es la operacin opuesta al suavizado.
Bordes: detectar zonas de variacin de la imagen.
Deteccin de cierto tipo de caractersticas, tales como esquinas, segmentos

As como el uso de las dos primeras es ms habitual en restauracin y mejora de


imgenes las dos ltimas suelen usarse ms en anlisis de imgenes.
1. Filtros suavizantes lineales
Cumplen una doble accin ya que difuminan la imagen (comportamiento filtro paso
bajo) y a su vez disminuyen el ruido en imgenes ruidosas.

2. Estudios Previos

Pgina 39

Anlisis de imgenes basado en correlacin de imgenes


Las mscaras de estos filtros se caracterizan por tener todos sus coeficientes
positivos, no como las mscaras de los filtros paso alto que presentan tanto
coeficientes positivos como negativos.
-

El filtro de media (aritmtica) es el operador de suavizado ms simple, este


considera la media de los pxeles en un entorno w x h centrado en un pxel
(x,y).

Ilustracin 18
La descripcin prctica de este proceso sera:
1. Superponemos la mscara sobre cada punto de la imagen.
2. Sumamos los productos de los coeficientes de la mscara y los valores de
los puntos de la imagen situados bajo esta.
Segn lo dicho hasta ahora podemos entender que el efecto de este filtro ser
de suavizado, ya que los pxeles vecinos se parecern debido a la mezcla que se
produce entre ellos. Al aplicar este filtro podremos observar como la imagen
se har borrosa y las transiciones fuertes se disolvern parcialmente.
Tambin debemos decir que cuanto mayor es el tamao de la mscara, mayor
es el efecto de difuminado de la imagen.
Las ventajas son que reduce el nmero de operaciones, adems respecto al
ruido, la potencia de este se reduce en un factor igual al nmero de pxeles
que abarca la mscara, as que cuanto mayor sea el tamao de la mscara,
mejor ser la relacin seal-ruido.
-

Suavizado direccional
Como el filtro de media distorsiona la informacin de los bordes, como
solucin para reducir el empaamiento se puede usar un filtro de promediado
direccional, que consiste en calcular las medias de regiones longitudinales a lo

2. Estudios Previos

Pgina 40

Anlisis de imgenes basado en correlacin de imgenes


largo de todas las direcciones posibles. De todas ellas, elegimos las ms
parecidas al valor del punto en la imagen de entrada.

Ilustracin 19. Suavizado direccional


-

Suavizado gaussiano
Consiste en aplicar un suavizado gaussiano donde se hace la media ponderada,
donde los pesos toman la forma de una campana de Gauss.

Ilustracin 20. Suavizado gaussiano


La varianza, s2, indica el nivel de suavizado. Si la varianza es grande la campana
ser ms ancha, por tanto el suavizado ser mayor. Si por el contrario la
varianza es pequea la campana ser ms estrecha y tendremos menos
suavizado.

2. Estudios Previos

Pgina 41

Anlisis de imgenes basado en correlacin de imgenes


Campana de gauss discreta
Para el clculo de la mascara gaussiana (1D), usemos las filas del tringulo de
Pascal de la forma siguiente:

Ilustracin 21. Campana de Gauss


Normalmente, el suavizado gaussiano se aplica en dos dimensiones. Los pesos
de la mscara dependen de la distancia al pxel central.
Campana de Gauss 2D

f ( x, y ) = e ( x

+ y 2 )/ x 2

(Ecuacin 94)

Ilustracin 22
Esto se puede simplificar teniendo en cuenta que el filtro gaussiano es
separable, y podemos obtener un suavizado 2D aplicando dos mscaras
gaussianas bidimensionales, una horizontal y otra vertical.

2. Estudios Previos

Pgina 42

Anlisis de imgenes basado en correlacin de imgenes

Ilustracin 23
En comparacin con el filtro de media para conseguir un mismo grado de
suavizado la mascara gaussiana debe ser de mayor tamao. A favor del efecto
del suavizado gaussiano podemos decir que su efecto es ms natural que el del
filtro de media, y por esto suele ser ms habitual en procesamiento y anlisis
de imgenes.

2. Filtros suavizantes no lineales


En las convoluciones, f es una combinacin lineal cualquiera. Pero tambin puede
ser interesante usar otras funciones no lineales.
-

Media geomtrica

v [ m, n] = 4 u [ m 1, n 1] u[m 1, n] u[m, n 1] u[m, n]

(Ecuacin 95)

Ilustracin 24. Media geomtrica


Su efecto es similar a la media geomtrica. Sin embargo todas las
transformaciones no lineales no son tiles e interesantes. Las que ms se
utilizan son la de mximo, mnimo y media.
-

Filtro de mximo

v [ m, n ] = max{u [ m k , n k ] , , u [ m, n ] , , u[ m + k , n + k ]} (Ecuacin 96)


Donde k es el radio y el tamao es 2k+1

2. Estudios Previos

Pgina 43

Anlisis de imgenes basado en correlacin de imgenes


El resultado de aplicar este filtro es un cierto efecto de difuminado y aclarado
de la imagen. Desaparecen los detalles ms oscuros.
Si el tamao es muy grande pueden ocurrir dos efectos. En primer lugar puede
producirse un efecto de cuadriculado, como el mximo se aplica en una zona
cuadrada, los pxeles muy claros generan un cuadrado uniforme alrededor. Y
en segundo lugar, pueden aparecer colores falsos, al aplicar el filtro puede
aparecen colores que no existen en la imagen original.
-

Filtro de mnimo

v [ m, n ] = min{u [ m k , n k ] , , u [ m, n ] , , u[m + k , n + k ]} (Ecuacin 97)

Donde k es el radio y el tamao es 2k+1.


Su efecto es parecido al mximo, pero tomando los valores menores, es decir,
los ms oscuros.
-

Filtro de mediana
Esta es una tcnica alternativa cuando el objetivo que queremos alcanzar es
ms la reduccin del ruido que el difuminado de la imagen.
Consiste en sustituir el valor del nivel de gris de cada punto de la imagen de
entrada por el valor mediano de los puntos que estn incluidos dentro de una
ventana entorno.

v [ m, n ] = mediana {u [ m k , n l ]} , para ( k , l )W

(Ecuacin 98)

Sobre este tipo de filtro debemos tener en cuenta que:


1. Este filtro no es lineal:

mediana {ax ( m, n ) + by ( m, n )} a mediana { x ( m, n )} + b mediana{ y ( m, n)}


(Ecuacin 99)
2. La supresin del ruido la realiza bien si es binario (compuesta de fuertes
componentes de pico).
3. Los resultados son pobres si el ruido tiene distribucin Gaussiana, o si el
nmero de pxeles de la ventana afectados por el ruido es ms de la
mitad.
2. Estudios Previos

Pgina 44

Anlisis de imgenes basado en correlacin de imgenes


La mediana produce un efecto suavizado, aunque ms abrupto en los bordes
que la media y el suavizado gaussiano. Pero el verdadero inters es la
eliminacin de ruido potencial.
3. Filtros agudizadores
Los filtros agudizadores como su propio nombre indica provocan el efecto de
agudizar los detalles finos (altas frecuencias) de la imagen. El objetivo de este realce
es destacar los detalles finos de una imagen o intensificar detalles que han sido
difuminados, bien sea por error o bien por efecto natural de modo de adquisicin
de la imagen. Son el efecto contrario a los filtros de suavizado.
Estos filtros destacan las variaciones en la imagen, bordes. Un borde es la frontera
entre dos regiones con propiedades de nivel de gris relativamente distintas.
En el apartado deteccin de bordes del tema anlisis de imgenes, hablaremos ms
concretamente de los operadores utilizados para la deteccin de estos.

2. Estudios Previos

Pgina 45

Anlisis de imgenes basado en correlacin de imgenes


3. Anlisis de imgenes
Se define como el estudio de las caractersticas de la imagen, con el fin de extraer
cualquier tipo de informacin adicional contenida en la imagen y que a simple vista es poco
evidente. Esta informacin puede ser de muy diversos tipos tales como medidas sobre la
imagen, reconocimiento de formas, etc.
El anlisis de imgenes abarca toda esa serie de procesos que permiten extraer
informacin de una imagen. Estos procesos los podemos resumir en los siguientes:
1. Extraccin de caractersticas globales de la imagen
- Deteccin de bordes, lneas y esquinas
- Texturas.
- Deteccin del movimiento.
2. Segmentacin de imgenes.
- Basada en Umbralizacin.
- Basada en extraccin de contornos.
- Orientada a regiones.
3. Transformaciones morfolgicas.
4. Representacin de contornos y regiones mediante informacin extrada de la imagen
segmentada.

3.1 Extraccin de caractersticas de una imagen


Atendiendo al medio de extraccin se van a clasificar en dos grandes grupos:
- Caractersticas espaciales de la imagen.
- Caractersticas de transformadas.

3.1.1 Caractersticas especiales de una imagen


Las caractersticas espaciales de un objeto pueden extraerse a partir de los niveles de gris que
presenta el objeto en la imagen (caractersticas de amplitud) o por medio de la distribucin
espacial de pxeles de dicho objeto, en funcin del resto de los de la imagen (caractersticas del
Histograma).
3.1.1.1 Caractersticas de amplitud
Caracterizamos el objeto mediante sus caractersticas fsicas. Por ejemplo en una
imagen obtenida con rayos X, la amplitud de los niveles de gris de sta, representa la
absorcin de las diferentes partes del cuerpo, lo que permite distinguir los tejidos, de
las partes seas, o bien distinguir zonas enfermas de los tejidos, de zonas que no lo
estn.
3. Anlisis de imgenes

Pgina 46

Anlisis de imgenes basado en correlacin de imgenes


Un objeto caracterizado por su amplitud puede ser fcilmente extrado de la imagen,
por ejemplo, determinando un umbral del nivel de gris, a partir del cual discernir el
objeto del fondo y as poder separarlos.
3.1.1.2 Caractersticas del histograma
Se basan en la observacin del histograma de una determinada regin de la imagen. El
histograma como hemos comentado anteriormente representa el nmero de pxeles
que poseen un determinado nivel de gris.
Para justificar la obtencin de estas caractersticas, se va a dividir cada valor del
histograma por el nmero total de pxeles, obteniendo as el histograma normalizado,
que representa la probabilidad de que un determinado nivel de gris aparezca en la
imagen. Se define esta probabilidad como:

numero de pxels con nivel de gris x


numero de pixels total dela regin
x = 0,1,., L 1

u ( x ) = Prob [u = x ] =

(Ecuacin 100)

El valor de L-1 representa el nivel de gris mximo posible y viene dado por el mximo
valor de cuantificacin asignado a la escala de grises.
A partir del histograma obtenemos caractersticas de una variable aleatoria, como la
dispersin, la media, la varianza etc. Otras caractersticas importantes son la mediana y
la moda.
El proceso sera el siguiente: Se elige un tamao de ventana para la aplicacin del
clculo y dependiendo del efecto deseado, se sustituye el valor de cada pxel por el
valor de la media, moda o varianza de la ventana centrada en l, obteniendo as otra
imagen con el efecto deseado o el valor de la caracterstica extrada.
El histograma es utilizado, en la umbralizacin de imgenes, para extraer el valor
umbral y as binarizar la imagen para su segmentacin.

3.1.2 Caractersticas de la transformada


Son aquellas caractersticas obtenidas a partir de la transformada de una determinada imagen.
En muchas ocasiones una transformacin a un dominio concreto puede proporcionar gran
informacin acerca de la imagen.
Como la imagen es una funcin discreta, para obtener estas caractersticas se utiliza la
transformada discreta de Fourier descrita en apartados anteriores. A partir de ella se pueden
calcular las respuestas en frecuencia que presentan determinadas formas. Generalmente las
altas frecuencias se emplean para detectar contornos, y las lneas aisladas que aparecen en la
imagen transformada aportan informacin sobre la orientacin del objeto en la imagen.

3. Anlisis de imgenes

Pgina 47

Anlisis de imgenes basado en correlacin de imgenes


La utilidad de estas transformadas es identificar objetos y orientaciones en una imagen
desconocida, conociendo las transformadas de Fourier de ciertas figuras como cuadrados,
rectngulos, etc.

3.1.3 Deteccin de bordes, texturas y movimientos


Los bordes constituyen una de las caractersticas ms importantes que se pueden encontrar en
una imagen ya que delimitan los objetos que en ella se encuentran. Los bordes se definen
como cambios locales significativos de luminancia en la imagen, que generalmente estn
asociados a una discontinuidad. Debido a su localizacin pueden dividirse en:
-

Bordes con transiciones abruptas, en los que hay grandes cambios de luminancia entre
pxeles adyacentes.

Bordes con transiciones progresivas, en los que los cambios de luminancia son
progresivos y la variacin entre pxeles adyacentes no es grande.

Tambin se pueden clasificar segn su discontinuidad en:


-

Bordes de salto, donde la luminancia cambia de valor a un lado y a otro de la


discontinuidad.

Bordes de lnea, donde la luminancia cambia volviendo en poco espacio a su valor


inicial

Las tcnicas empleadas en la deteccin de bordes tienen como objetivo localizar en la imagen
los pxeles en los que se produce una variacin de luminancia, empleando operadores
derivativos. Estos son bsicamente dos: Operadores de primera derivada o Gradiente y
Operadores de segunda derivada o Laplacianos. Los primeros buscan grandes picos en la
variacin mientras que los segundos, buscan pasos de respuesta positiva a negativa y viceversa
o sea el paso por cero.

3. Anlisis de imgenes

Pgina 48

Anlisis de imgenes basado en correlacin de imgenes

Ilustracin 25. Primera y segunda derivada unidimensional de f.


3.1.3.1 Operadores tipo gradiente
Es esencialmente una operacin de deteccin de cambios locales significativos de
luminancia. Estos cambios estn asociados con un pico local de la primera derivada
(ver figura anterior). El equivalente en una imagen bidimensional es el gradiente.
Localizando los puntos donde el gradiente es elevado, se sabr donde se han
producido las mximas variaciones de luminancia, por tanto donde estarn los bordes.
Se define el operador gradiente aplicado a una imagen como:

f ( x, y ) = [Gx , Gy ] = [

f f
, ]
x y

(Ecuacin 101)

Indica que el gradiente queda determinado conociendo las derivadas parciales de la


direcciones ortogonales x e y. Su mdulo y direccin vendrn dado por:

| f |= Gx2 + G y2

(Ecuacin 102)

G
f = tan g 1 y
Gx

(Ecuacin 103)

La direccin del gradiente es perpendicular al borde. Para evitar el clculo


computacional, el mdulo se suele aproximar con:
3. Anlisis de imgenes

Pgina 49

Anlisis de imgenes basado en correlacin de imgenes


| f |=| Gx | + | G y |

(Ecuacin 104)

Como la imagen es una funcin discreta, se aproxima el concepto de derivada a


espacios discretos. Esta aproximacin no es ms que la diferencia finita entre pxeles
vecinos. Por ello la expresin del gradiente ser:

f ( x, y ) = [Gx , Gy ] = [

f f
, ]
x y

(Ecuacin 105)

Esto mismo se puede expresar a partir de sus mscaras de convolucin, una que realiza
la derivada en la direccin x, y la otra en la direccin y:

1 1
1 0
Hx =
Hy =

0 0
1 0
Ilustracin26. Mscaras de convolucin
Estas mscaras son muy sensibles al ruido por lo que se han desarrollado otros
operadores con mscaras de mayor orden que veremos a continuacin.
El proceso del clculo de la imagen gradiente se resume en la siguiente figura:

Ilustracin 27. Proceso clculo de la imagen gradiente


El resultado obtenido es una imagen g(x,y) cuyos puntos valen el mdulo del gradiente
de la imagen original. Dada esta imagen se suele considerar que un pxel forma parte
de un borde si su valor est entre el 10% de los valores ms altos. El valor umbral a
partir del cual un pxel se considera borde es calculado observando el histograma de la
imagen gradiente. El resultado es una imagen binaria I(x,y), que representar los
bordes que aparecen en la imagen original y que se puede expresar:

1 si g(x,y) >umbral
I ( x, y ) =
0 en otro caso
3. Anlisis de imgenes

(Ecuacin 106)

Pgina 50

Anlisis de imgenes basado en correlacin de imgenes


3.1.3.1.1 Operador de Roberts
Es uno de los ms antiguos. Al usar mscaras de tamao 2x2 utiliza pocos pxeles para
aproximar el gradiente hacindolo muy sensible al ruido.

1 0
0 1
Hx =
Hy =

0 1
1 0
Ilustracin 28. Operadores Roberts
3.1.3.1.2 Operador de Prewitt
Este operador utiliza mscaras de 3x3:

1 0 1
1 1

H x = 1 0 1 H y = 0
0

1 0 1
1 1

Ilustracin29. Operadores de Prewitt


3.1.3.1.3 Operador de Sobel
Igual que el operador de Prewitt, con la excepcin que le da ms peso a los pxeles ms
cercanos al centro de las mscaras. Las mscaras sern las siguientes:

1 0 1
1 2

H x = 2 0 2 H y = 0
0

1 0 1
1 2

Ilustracin 30. Operador de Sobel


3.1.3.1.4 Operador Isotrpico (de Frei-Chen)
Se diferencia del anterior en los valores cercanos al centro donde aparece un valor
intermedio. Vanse las mscaras:

Hx = 2

0
0
0

1 2

2 Hy = 0
0

1
2
1

Ilustracin 31. Operador de Frei-Chen

3. Anlisis de imgenes

Pgina 51

Anlisis de imgenes basado en correlacin de imgenes


3.1.3.1.5 Operadores tipo comps
Son operadores que miden el gradiente en cualquier direccin(en intervalos de 45o), y
la nica ventaja que presentan respecto a los otros es que para calcular el gradiente
slo se necesita usar una matriz de una determinada direccin en vez de dos como en
los operadores gradiente generales. Los operadores comps para una plantilla 3x3 son:

Ilustracin 32. Operadores tipo Comps


Estos operadores permiten calcular la variacin de luminancia de los pxeles de una
imagen en cualquier direccin, con lo que, para determinados casos son ms efectivos
que los clculos convencionales, pues evitan el tener que calcular la direccin del
gradiente y su mdulo a partir de las componentes ortogonales calculadas. Su
desventaja es que para un punto hay que calcular el gradiente en todas las direcciones.
La forma de manejar estos operadores es la siguiente: Se calculan los gradientes en las
ocho posibles direcciones, y se toma como valor del gradiente el valor del mximo
gradiente direccional. Matemticamente se puede expresar de la siguiente forma:
Se llama gK(x,y) al gradiente comps en la direccin =/2 + k/4, donde k=0,,7. El
gradiente en la posicin (x,y) es:

g ( x, y ) = mx { g k ( x, y )}

3. Anlisis de imgenes

(Ecuacin 107)

Pgina 52

Anlisis de imgenes basado en correlacin de imgenes


3.1.3.2 Operadores tipo laplaciano
El laplaciano de una funcin bidimensional f(x,y), es el resultado de aplicar un
operador derivativo de segundo orden y se puede escribir as:

2 f 2 f
f = 2 + 2
x
y
2

(Ecuacin 108)

Como se hizo con el gradiente, hay que hacer una aproximacin discreta de la segunda
derivada, utilizando las ecuaciones en diferencias centradas en la posicin (i,j):

2 f
= f (i + 1, j ) 2 f (i, j ) + f (i 1, j )
x 2

(Ecuacin 109)

2 f
= f (i, j + 2) 2 f (i, j + 1) + f (i, j )
y 2

(Ecuacin 110)

Combinando estas dos ecuaciones en un nico operador se obtendra la mscara 1 de


la siguiente figura:

Ilustracin 33.Operador de tipo Laplaciano


Se observa en la figura anterior, que el valor central toma el valor positivo de la suma
de todos los pxeles que le rodean, por lo que la suma de los coeficientes de la mscara
es cero, luego si se aplica a una regin de pxeles constante, el resultado ser nulo.
Detecta un borde cuando la salida del operador realiza una transicin por cero. Es un
operador muy sensible al ruido por lo que se utiliza como paso intermedio para el
operador Marr-Hildred.
3.1.3.3 Operadores gradientes estocsticos
Al igual que los operadores laplacianos y de gradiente, son operadores que se basan en
el diseo de mscaras de extraccin de bordes, teniendo en cuenta la presencia de

3. Anlisis de imgenes

Pgina 53

Anlisis de imgenes basado en correlacin de imgenes


ruido. Para entenderlo mejor, se va a considerar un modelo de borde cuya transicin
se produce en un solo pxel.

Ilustracin 34. Gradientes estocsticos


Para detectar un borde en una localizacin P se calcula el gradiente horizontal de la
siguiente forma:

g1 (i, j ) = f f (i, j 1) f b (i, j + 1)

(Ecuacin 111)

Donde los valores de ff(i,j) y fb(i,j) son las aproximaciones anterior y posterior
respectivamente de f(i,j), considerando el ruido de dos ventanas de tamao W cada
una, a ambos lados del pxel donde se calcula la existencia de borde. Estas
estimaciones pueden ser calculadas de la siguiente forma:

f f (i, j ) =

a ( k , l ) v (i k , j l )

(Ecuacin 118)

( k ,l )W

Donde v(i,j) es la imagen, f(i,j) sumada con ruido aleatorio y a(k,l) son los coeficientes
del filtro. Adems, debe especificarse la relacin seal ruido (SNR) que se pretende
obtener. Esto puede ser expresado a travs de mscaras que dependan de la SNR
pretendida. En la figura siguiente vemos algunas de estas mscaras:

3. Anlisis de imgenes

Pgina 54

Anlisis de imgenes basado en correlacin de imgenes

Ilustracin 35. Operadores gradientes estocsticos


3.1.3.4 Operadores derivados de Gausianas
Se trata de un operador detector de bordes, al igual que los tres anteriores.
3.1.3.4.1 Laplaciana de Gausiana
Tambin llamado operador Marr-Hildred o de Cruce por cero. Parte del principio de
que para detectar un borde de salto, la primera derivada de la funcin imagen debe
tener un mximo en ese punto, y a la vez la segunda derivada debe presentar un cruce
por cero en ese mismo punto. Como el operador Laplaciano es muy sensible al ruido se
debe suavizar previamente la imagen antes de aplicar la segunda derivada. El filtro
empleado debe cumplir dos condiciones:
-

El filtro debe ser local, y tomar informacin nicamente de los puntos cercanos
al que se va a analizar

Debe ser paso banda, para reducir el nmero de frecuencias en las que se
puede producirse el cambio.

La distribucin Gausiana optimiza ambas condiciones. El filtro de suavizado gausiano


viene dado por:

G ( x, y ) = ce

x2 + y 2
2 2

(Ecuacin 112)

Donde c es una constante de normalizacin y es la desviacin tpica, x e y son la


coordenadas de la imagen.
Primero se convoluciona la imagen con la Gausiana G(x,y) y a continuacin se le aplica
al resultado la Laplaciana:

H ( x, y ) = 2 (G ( x, y)* f ( x, y ))

(Ecuacin 113)

Este es el operador Marr-Hildreth o LoG.


3. Anlisis de imgenes

Pgina 55

Anlisis de imgenes basado en correlacin de imgenes


La ventaja de este operador, frente a los dems operadores de bordes, es que se tiene
en cuenta una mayor rea de pxeles lejanos, influencia que viene determinada por .
A continuacin, se van a ver unas mscaras que aproximan la forma gausiana, para
distintas .

Ilustracin 36. Operadores de Marr-Hildreth


3.1.3.4.2 Detector de Canny
Su objetivo es la deteccin de todos los bordes, consiguiendo que la distancia entre el
pixel obtenido como borde y el borde real debe ser lo ms pequea posible.
Estas condiciones se expresan matemticamente de la siguiente manera:

SNR =

n0

f ( x)dx
(Ecuacin 114)

f ( x)dx

A f (0)

Localizacin =
n0

(Ecuacin 115)

f ( x)dx

f 2 ( x)dx

Dis tan cia =


f 2 ( x)dx

(Ecuacin 116)

Con el detector de Canny se busca la optimizacin del producto de la relacin seal


ruido por la localizacin, as como el cumplimento de la tercera condicin. El detector
que cumple con lo anteriormente expuesto es la derivada primera de una Gausiana, es
decir un operador que es combinacin de un filtro Gaussiano con una aproximacin de
gradiente.
3. Anlisis de imgenes

Pgina 56

Anlisis de imgenes basado en correlacin de imgenes


3.1.3.5 Medida de la calidad de un detector de bordes
El comportamiento de los operadores se diferencia en el comportamiento que tienen
cuando hay presencia de ruido. Evidentemente aquellos que toman en consideracin
el ruido como son los operadores gausianos y los estocsticos ofrecern mejores
resultados.
Si se llama n0 al nmero total de pxeles que forman el borde y n1 al nmero de pxeles
que son errneamente considerados como borde, debido a la presencia de ruido en la
imagen, el error de deteccin es:

P=

n1
n0

(Ecuacin 117)

Otra forma de medir el error de deteccin es la siguiente:

P=

ND
1
1

max( N1 , N D ) i =1 1 + d i2

(Ecuacin 118)

Donde:
di= menor distancia del borde i-simo al borde ideal.
= constante positiva.
Ni= nmero ideal de pxeles de borde.
Nd= nmero total de pxeles detectados.
3.1.3.6 Deteccin de lneas
La deteccin de lneas se puede considerar como una extensin de la deteccin de
bordes, ya que para ello se emplean cuatro mscaras en distintas direcciones. Las
mscaras podran ser las siguientes:

Ilustracin 37. Deteccin de lneas

3. Anlisis de imgenes

Pgina 57

Anlisis de imgenes basado en correlacin de imgenes


La primera mscara detectara lneas horizontales, la segunda, lneas que forman un
ngulo de 45o y la tercera y la cuarta, lneas verticales y con ngulo de -45o
respectivamente.
3.1.3.7 Deteccin de esquinas
Existen cuatro mtodos para su deteccin:
-

El primero, se basa en detectar los bordes de los objetos y buscar aquellos


puntos en los que la curvatura del borde vare bruscamente.

Mtodo de Tomasi y Kanade consistente en determinar partes de la imagen


que tienen un elevado gradiente horizontal y vertical al mismo tiempo.

Mtodo de Kitchen y Rosendfeld est basado en la variacin de la direccin del


gradiente

Mtodo Susan, que parte de una imagen con varios niveles de gris.

3.1.4 Texturas
Las texturas se definen como patrones visuales homogneos que se observan en ciertos tipos
de materiales como pueden ser madera, tela, piedras. Dependen del grado de resolucin de
la imagen, puesto que una imagen puede ofrecer un aspecto homogneo a cierta distancia y
sin embargo no parecerlo o tener otra textura.
La extraccin de esta caracterstica va a tener importancia en la segmentacin de imgenes
mediante texturas as como en la descripcin de regiones. El anlisis de texturas se puede
realizar por dos procedimientos:
- Anlisis Estadstico, donde se analizan los estadsticos de primer orden o
superiores, de los niveles de gris o de otra propiedad de una determinada zona de la
imagen.
- Anlisis Frecuencial, donde se realiza el estudio a partir de la transformada de Fourier.
3.1.4.1 Anlisis estadstico de texturas
3.1.4.1.1 Estadsticos de primer orden
Como en el apartado de caractersticas del histograma, a partir de l podemos obtener
propiedades que nos dan informacin sobre la textura de la imagen. Algunas de estas
son la media, que nos da una estimacin del nivel de gris de la textura o la desviacin
tpica que indica la media de la dispersin respecto al valor de la media.

3. Anlisis de imgenes

Pgina 58

Anlisis de imgenes basado en correlacin de imgenes


3.1.4.1.2 Estadsticos de segundo orden
Hay dos tipos de estadsticos de segundo orden empleados, los obtenidos a partir de
Matrices de coocurrencia y los Estadsticos de las diferencias.
3.1.4.1.2.1 Matrices de coocurrencia
Se obtienen calculando la probabilidad condicional P, la cual indica que dos
propiedades aparezcan separadas por una distancia . Para el caso particular
de los niveles de gris, la matriz de coocurrencia estara formada por los
elementos Pr, (i,j) describiendo la frecuencia de aparicin de dos pxeles con
niveles de gris i,j en una determinada ventana, separados una distancia r en la
direccin . Como encontrar matrices de coocurrencia para cada es
prohibitivo, se suele limitar el clculo a una serie de ngulos 0o, 45o, 90o, 135o y
al valor de r=1 pixel.
3.1.4.1.2.2 Estadsticos de las diferencias
Se obtienen a partir de la distribucin de probabilidad P(k) de los valores
pertenecientes a los pxeles intermedios, entre lo que estn separados por una
distancia . Esta distribucin se define de la siguiente forma:
L

P (k ) = P (i, j )
i =1 j =1

(Ecuacin 119)

| i j |= k
3.1.4.2 Anlisis frecuencial de texturas
Se realiza a partir de la transformada de Fourier. Teniendo en cuenta que la
trasformada de Fourier de la imagen f(x,y) es F(u,v) su mdulo ser:

P(u, v) =| F (u, v) |2

(Ecuacin 120)

Tomando coordenadas polares se obtienen dos distribuciones, la primera indicar el


tamao de la textura dominante y la segunda la direccin de esta:
L/2

P ( r ) = 2 P ( r , )

(Ecuacin 121)

r =0

L/ 2

P ( ) = 2 P (r , )
r =0

3. Anlisis de imgenes

(Ecuacin 122)
Pgina 59

Anlisis de imgenes basado en correlacin de imgenes


3.1.5 Deteccin de movimiento
Los movimientos detectados pueden ser debidos a movimiento de la cmara, movimientos de
los objetos, a cambios en la iluminacin o a cambios en la forma o tamao de los objetos.
Suponiendo la cmara inmvil, la iluminacin constante y los objetos rgidos, uno de los
mtodos ms simples para la deteccin de movimiento es el basado en la diferencia de
imgenes.
Se parte de una secuencia de imgenes f(x,y,t) y la imagen que indicar el campo de
velocidades entre los instantes t0 y t1 ser:

1 si |f(x,y,t 0 ) f ( x, y, t1 ) | T
Ftot1 ( x, y ) =
0 en otro caso

(Ecuacin 123)

Los mtodos presentados tienen la ventaja de ser sencillos, sin embargo tienen varios
inconvenientes: la cmara debe estar fija y la imagen resultado indica zonas en las que existe
movimiento, pero no cuantifica ni la magnitud ni la direccin.
Existen dos grandes grupos de mtodos de obtencin del campo de velocidades, que
solucionan los problemas anteriores.
-

El primero busca una serie de caractersticas en la primera imagen para


encontrar su correspondencia en la segunda.

El segundo grupo de mtodos pretende la obtencin de un mapa denso del campo


de velocidades (flujo ptico). Es decir, buscar en un entorno, la zona ms
parecida en la segunda imagen, dependiendo de sus variaciones espaciales y
temporales.

3.2 Segmentacin de imgenes


Una vez extradas las caractersticas de una imagen, el siguiente paso es la particin de la
imagen para su posterior reconocimiento e interpretacin. Por tanto podemos decir que la
segmentacin consiste en separar los objetos localizados en un entorno, sobre la base de una
o varias de las caractersticas obtenidas en el proceso de extraccin.
La segmentacin se basa en tres propiedades:
-

Similitud: Los pxeles de un elemento tienen valores parecidos de alguna


propiedad.

Discontinuidad: Los objetos destacan del entorno, teniendo unos bordes


definidos.

Conectividad: Los pxeles pertenecientes a un mismo objeto deben ser contiguos y


estar agrupados.

3. Anlisis de imgenes

Pgina 60

Anlisis de imgenes basado en correlacin de imgenes


Se puede decir que las tcnicas de segmentacin se basan en el cumplimiento de una de estas
propiedades o combinacin de ellas, dando lugar a la bsqueda de partes uniformes de la
imagen o de lo contrario, partes donde se produce un cambio.
En funcin de lo anterior los mtodos de segmentacin se agruparan en tres grupos:
-

Segmentacin basada en pxeles(o en umbralizacin)

Segmentacin basada en bordes.

Segmentacin basada en Regiones.

3.2.1 Segmentacin basada en pxeles


Tiene en cuenta el nivel de gris de un pxel, para decidir si l mismo pertenece o no al objeto
de inters. Para ellos, se debe encontrar el rango de niveles de gris que caracterizan dicho
objeto, teniendo en cuenta la similitud, lo que requiere entonces la obtencin y el anlisis del
histograma de la imagen.
El objetivo de ste mtodo, es el de encontrar de una manera ptima los valores
caractersticos de la imagen que establecen la separacin del objeto de inters, con respecto a
las regiones que no pertenecen al mismo, es decir encontrar los valores de niveles de gris ms
apropiados a tomar como umbrales.
Este mtodo tambin es conocido como la segmentacin basada en Umbralizacin, ya que se
convierte una imagen con varios niveles de gris a una nueva con solo dos (imagen binaria), de
manera que los objetos quedan separados del fondo. La umbralizacin se basa en que los
pxeles de un determinado objeto tienen el mismo nivel de gris.
A continuacin mostramos la funcin que define la imagen umbralizada segn el caso de que
se trate:
Cuando el valor buscado es mayor que el umbral,

1 si T f(x,y)
g ( x, y ) =
0 en otro caso

(Ecuacin 124)

1 si T f(x,y)
g ( x, y ) =
0 en otro caso

(Ecuacin 125)

Cuando es menor que el umbral,

Cuando los objetos pertenecen a un intervalo:

3. Anlisis de imgenes

Pgina 61

Anlisis de imgenes basado en correlacin de imgenes


1 si Ta f(x,y) Tb
g ( x, y ) =
0 en otro caso

(Ecuacin 126)

3.2.1.1 Mnimo entre mximos


Si la imagen constar del objeto y del fondo, el histograma en el caso ideal tendra dos
nicos valores de gris. Como en la vida real existir ruido, se tendr algo parecido a
picos, por tanto puede suponerse que el umbral ser el valor mnimo entre esos dos
mximos. En el histograma se debe buscar el nivel de gris que tiene un valor mximo
para los dos mximos, y despus se busca el valor mnimo entre ambos valores.
3.2.1.2 Medidas iterativas
Suponiendo que el histograma puede asemejarse a dos gausianas con igual desviacin
tpica, tomamos como el punto de cruce el valor intermedio de las dos medias. Al
desconocer su valor se har una suposicin y por un mtodo iterativo se ir acercando
al valor real. Para ello se supone que la media del objeto es el valor ms alto y el de
fondo, el ms bajo (o viceversa), se toma por tanto el valor de cruce como el nivel de
gris medio de la imagen. A partir de este valor se divide el histograma en dos partes de
las que se obtienen sus medias. Se elige el nuevo valor y se vuelven a obtener las dos
medias. Si son distintas se obtiene un nuevo valor para la umbralizacin, si no, se para.
3.2.1.3 Mtodo de Otsu para la determinacin del umbral
Al igual que las medidas iterativas, este mtodo tambin supone que el histograma es
la suma de dos gausianas, aunque ahora las desviaciones tpicas pueden ser distintas.
El umbral debe minimizar la suma ponderada de cada una de las varianzas de los
objetos presentes, ya que se supone que conforme las gausianas se aproximan ms al
histograma real, las desviaciones sern menores.
Para determinar los coeficientes se toman las probabilidades de cada uno de los
objetos. As si el umbral es t se tiene que las probabilidades son:

q1 (t ) = P (i )

(Ecuacin 127)

i =1

q2 (t ) =

P(i)

i = t +1

(Ecuacin 128)

Las medias:

1 (t ) = i
i =1

3. Anlisis de imgenes

P(i)
q1 (t )

(Ecuacin 129)

Pgina 62

Anlisis de imgenes basado en correlacin de imgenes


2 (t ) =

P(i)

i q (t )

i =t +1

(Ecuacin 130)

Y las varianzas:
t

12 = (i 1 (t )) 2
i =1

22 =

(i (t ))
2

i = t +1

(Ecuacin 131)

P(i)
q1 (i)
2

P(i)
q2 (i )

(Ecuacin 132)

Siendo entonces la varianza ponderada:

W2 = q1 (t ) 12 + q2 (t ) 22

(Ecuacin 133)

Se recorre todo el rango de los niveles de gris calculndose el valor anterior y se elige
aquel umbral que minimice esta varianza.
3.2.1.4 Mtodo de Kittle- Illingoworth
Se parte de nuevo de dos gausianas de medias 12 y desviaciones 12 con unas
proporciones q1 y q2. Este mtodo se basa en minimizar la siguiente expresin:

J = P (i ) log
i =1

P (i )
f (i )

(Ecuacin 134)

Siendo:

1 1


q1
2
f (i ) =
e
2

1 i 2


q2
2
+
e
2

(Ecuacin 135)

Donde P(i) representa la probabilidad de que aparezca un valor de nivel de gris en el


histograma de la imagen y f(i) es la probabilidad de que aparezca un valor de nivel de
gris suponiendo que el histograma es la suma de dos gausianas.
J representa el error al tomar f(i) en vez del histograma P(i) y por tanto hay que
encontrar el valor que lo minimice.

3. Anlisis de imgenes

Pgina 63

Anlisis de imgenes basado en correlacin de imgenes


3.2.1.5 Uso de la entropa. Mtodo de Pum
La entropa se define como:

H = pi log( pi )

(Ecuacin 136)

El mtodo pretende maximizar la suma de dos entropas cada una correspondiente a


las dos gausianas. Lo que equivale a maximizar:

f (t ) =

H
Ht
log Pt
log(1 Pt )
+ 1 t
H T log(max( P0 , P1 ,....Pt )) H T log(max( Pt +1 , Pt + 2 ,....PN ))

(Ecuacin 137)

Siendo:
N

H T = Pi log( pi )

(Ecuacin 138)

i =0
t

H t = pi log( pi )

(Ecuacin 139)

i=0

Pt = Pi

(Ecuacin 140)

i =0

3.2.1.6 Uso de la entropa. Mtodo de Kapur


Se define la probabilidad de que un pxel pertenezca a un nivel de gris de la siguiente
forma:

p (i )
PT

p (i )
1 PT

(Ecuacin 141)

Con lo que las entropas quedaran de la siguiente manera:


t

H t =
i=0

P
Pi
log i
PT
PT

P
Pi
log i
i = 0 1 PT
1 PT

(Ecuacin 142)

H T =

(Ecuacin 143)

Al igual que el mtodo anterior hay que maximizar la suma de las dos entropas:

H t + HT

3. Anlisis de imgenes

(Ecuacin 144)

Pgina 64

Anlisis de imgenes basado en correlacin de imgenes


3.2.1.7 Umbralizacin recursiva
En el caso de que la imagen tuviera ms de dos niveles de grises dominantes, para
detectar los objetos se empleara cualquiera de los mtodos vistos anteriormente
realizando la separacin del histograma en dos. Posteriormente se analizara cada uno
de los histogramas individualmente, para ver si es necesario aplicar una nueva
umbralizacin o no. El proceso se repite hasta que no se necesita realizar ninguna
umbralizacin ms.
3.2.1.8 Umbralizacin basada en el color
El color de cada uno de los puntos de la imagen est definido por tres componentes
RGB. Para identificar los puntos de un determinado color en la imagen se comprueba
que los niveles de sus tres componentes corresponden a los del color buscado. La
funcin que expresa una umbralizacin por color es la siguiente:

1 R a f r ( x, y ) Rb
1 G f ( x, y ) G

v
b
g ( x, y ) = a
1 B a f a ( x, y ) Bb
0 en cualquier caso

(Ecuacin 145)

Donde fr(x,y), fg(x,y) y fb(x,y) son las funciones que dan los niveles de rojo, verde y azul
de cada uno de los puntos de la imagen. Se hara la umbralizacin para cada una de
ellas y a partir de los resultados individuales, operados a travs de la operacin lgica
AND se obtendran los pxeles que cumplen la condicin para ese color ya que los
pxeles que interesan son lo que han pasado la umbralizacin para las tres
componentes.
Al cambiar la iluminacin existe un problema en el espacio RGB ya que cambian los
niveles de cada componente. Para solucionar este problema trabajaremos
relacionando las componentes ya que si una componente sube o disminuye por efecto
de la iluminacin, las otras lo harn en la misma proporcin, por lo que sus cocientes
sern constantes. La nueva funcin ser de la siguiente forma:

1 R a f r ( x, y ) Rb

1 G f g ( x, y ) G
a
b

f r ( x, y )
g ( x, y ) =
1 B f a ( x, y ) B
a
b

f r ( x, y )

0 en cualquier caso

3. Anlisis de imgenes

(Ecuacin 146)

Pgina 65

Anlisis de imgenes basado en correlacin de imgenes


3.2.1.9 Histogramas laterales
Esta tcnica utiliza los histogramas laterales, en los que se suman los valores de los
pxeles por columnas y por filas. Sern tiles para determinar en qu zona se
encuentran los objetos.
3.2.1.10 Umbralizacin Adaptativa
Las imgenes en las que la iluminacin no sea constante, presentan el problema de
que puntos que pertenezcan al mismo objeto, presenten distintos valores en sus
niveles de gris. Para separar el objeto del fondo, se divide la imagen en varias
subimgenes de dimensiones n x mi dnde se supone que los cambios de la
iluminacin no son fuertes. A cada una de las subimgenes se aplicara alguno de los
mtodos anteriores para que el umbral se vaya adaptando a los cambios de
iluminacin.
3.2.1.11 Etiquetado
Con el etiquetado conseguimos la separacin de los objetos que mediante la
umbralizacin no hayan podido ser distinguidos entre s, ya que todos tienen el mismo
nivel de gris. Consiste en ir asignando etiquetas a los pxeles, mirando si los contiguos
tienen el mismo valor o no. Si lo tienen la etiqueta ser igual y si no ser diferente.

3.2.2 Segmentacin basada en bordes


Se basan en realizar la bsqueda del valor mximo del gradiente sobre cada lnea que forma la
imagen. Cuando un mximo es encontrado, un algoritmo de trazado trata de seguir el mximo
del gradiente alrededor del objeto, hasta encontrar de nuevo el punto inicial, para luego
buscar el prximo mximo en el gradiente.
Parten de los bordes encontrados en la imagen por los detectores, ya que estos ltimos por si
solos no pueden unir los bordes, puesto que estn afectados por el ruido de la imagen y
adems hay partes que no son detectadas.
Existen diferentes mtodos para la segmentacin que difieren en la estrategia para la
construccin del contorno, as como en la cantidad de informacin previa que se incorpora en
el mtodo. A continuacin mostramos alguno de estos mtodos.
3.2.2.1 Conectividad
La extraccin de contornos puede ser entendida como la unin de los bordes que se
encuentren conectados. Un pxel se dice que est conectado cuando tiene alguna
propiedad comn con los pxeles de su entorno.
3.2.2.2 Seguimiento del contorno
Los mtodos de seguimiento del contorno, trazan los contornos ordenando los puntos
de tipo borde sucesivos. Un ejemplo de algoritmo es el siguiente:

3. Anlisis de imgenes

Pgina 66

Anlisis de imgenes basado en correlacin de imgenes


1. Comenzar dentro de una regin cualquiera; por ejemplo, por el primer pxel
encontrado en la regin al hacer un rastreo por filas.
2. Girar a la izquierda y pasar al pxel siguiente, si esta dentro de esta misma
regin, en caso contrario girar a la derecha y pasar al pxel siguiente.
3. Continuar hasta que se llegue al punto del que se parti.
3.2.2.3 Unin de bordes y bsqueda heurstica en Grafos
Se puede entender el contorno como un camino, que se forma a travs de un grafo
construido uniendo los elementos bordes. Suponiendo que un grafo con nodos en las
posiciones xk, k=1,2,.. se forma desde el nodo A al B; una funcin de evaluacin (xk)
da el valor del camino de A a B cuando pasa por el nodo xk. Los algoritmos de
bsqueda heurstica, examina los sucesores del nodo de salida A y seleccionan el que
maximiza la funcin (x). El nodo seleccionado se convierte ahora en el nodo de salida
y se repite el proceso hasta alcanzar B. La sucesin de nodos seleccionada constituye el
contorno.
3.2.2.4 Programacin dinmica
El mtodo anterior, solamente nos aseguraba el camino ptimo entre dos nodos
consecutivos, pero no que este fuera el camino ptimo global. Para resolver este
problema aparecen los mtodos de programacin dinmica. Estos mtodos se basan
en el principio de optimizacin de Bellman, el cual dice que el camino ptimo entre
dos puntos dados de un camino, es tambin ptimo entre dos puntos cualquiera que
se encuentre en l.
Para aplicar esta idea a la extraccin de contornos, se va a suponer que se ha
convertido el mapa de los puntos que son bordes de una imagen, en un grafo de N
nodos. La funcin de evaluacin ser la siguiente:

K =1

K =2

K =2

S ( x1 , x2 ,...., N ) = | g ( xk ) | a | ( x k ) ( xk 1 ) | d ( xk , xk 1 )

(Ecuacin 147)

Donde xk, K=1,., N representan los nodos, es decir los pxeles pertenecientes al
borde; d(x,y) es la distancia entre dos nodos x e y. |g(xk)|, (xk) son el mdulo y el
ngulo del gradiente de nodo en la posicin xk; y los parmetros y son constantes
no negativas. Teniendo en cuenta esta definicin, se dice que el camino que conecta
los N nodos, es ptimo cuando la funcin S sea mxima.

( xN , N ) = mx {S ( x1 ,..., xN , N )}

3. Anlisis de imgenes

(Ecuacin 148)

Pgina 67

Anlisis de imgenes basado en correlacin de imgenes


3.2.2.5 Relajacin de bordes
Este mtodo tiene en cuenta los bordes vecinos para la elaboracin del contorno.
Todas las propiedades de una imagen junto con la posibilidad de existencia de ms
bordes, se evalan iterativamente con ms precisin hasta que el contexto de los
bordes queda claro. Se basa en la fuerza de los bordes en una vecindad local
especificada, aumentando o disminuyendo la confianza de cada borde. Un borde dbil
posicionado entre dos bordes fuertes, proporciona un ejemplo de contexto, es
altamente probable que este borde dbil entre ellos sea parte de un contorno. Si, por
otra parte, un borde, incluso uno fuerte no tiene contexto que lo soporte, puede que
no forme parte de ningn contorno.
3.2.2.6 La transformada de Hough
Se basa en la informacin que suministra toda la imagen. La transformada de Hough
hace una transformacin de los puntos de la imagen a un espacio de parmetros de
dimensin n (adecuada a la forma geomtrica buscada) a partir del cual, en funcin del
valor de los parmetros ms repetido, determina la forma geomtrica en cuestin. En
el espacio transformado, en cada punto se acumular un valor entero,
correspondiente al nmero de votos, que indicar la presencia de esa forma
geomtrica en la imagen.

3.2.3 Segmentacin orientada a regiones


3.2.3.1 Segmentacin de regiones por clasificacin
Se utilizan los niveles de gris presentes en la imagen para obtener una particin del
espacio. Se asocia a cada pxel, la clase de nivel de gris a la cual pertenece. Las regiones
son definidas por los conjuntos de pxeles conexos pertenecientes a una misma clase.
La segmentacin por clasificacin utiliza el histograma como utensilio para la
clasificacin de los distintos brillos. Es un mtodo eficaz, si la clasificacin permite
definir, las diferentes regiones homogneas de la imagen.
3.2.3.2 Segmentacin por crecimiento de regiones
Las regiones deben ser homogneas maximales, donde esto ltimo significa que los
criterios de homogeneidad a partir de los cuales se forman las regiones no se seguirn
cumpliendo tras la unin de una regin con alguna de sus adyacentes.
3.2.3.3 Unin de regiones
Considera a cada pxel como una regin. Obviamente estas regiones sern
homogneas pero no necesariamente maximales por lo que el proceso deber
repetirse hasta que las regiones sean maximales. El mtodo se puede describir:

Definir una segmentacin inicial que cumpla el criterio de homogeneidad.

Definir un criterio para unir regiones adyacentes.

3. Anlisis de imgenes

Pgina 68

Anlisis de imgenes basado en correlacin de imgenes

Unir las regiones adyacentes, si cumplen el criterio de unin. Para cuando no


puedan unirse dos regiones sin romper el criterio de homogeneidad.

El proceso por tanto se puede resumir como que la descripcin de una regin se
compara con la de otra adyacente. Si coinciden, se unen las regiones y se computa el
nuevo descriptor de la regin. En caso contrario, las regiones se marcan como que no
pueden unirse y el proceso contina.

3.2.3.4 Unin de regiones por agregacin de pxeles


El crecimiento de regiones es un procedimiento que agrupa pxeles o subregiones en
regiones mayores. Las regiones crecen mediante la agregacin de pxeles similares
respecto a la propiedad utilizada para la segmentacin. El punto de partida es un
conjunto de pxeles semilla, es decir los pxeles sobre los cuales se evalan los dems, y
a partir de los cuales se hace crecer la regin, aadiendo a dichos pxeles semilla,
aquellos vecinos que tienen propiedades similares (nivel de gris, color y textura).
3.2.3.5 Separacin y unin de regiones
Consiste en subdividir la imagen inicialmente en un conjunto de regiones disjuntas y
luego unirlas o separarlas en un intento de que todas ellas:
1.
2.
3.
4.
5.

Cubran la imagen completa.


Cada una de ellas est conectada.
Sus intersecciones dos a dos, sea el conjunto vaco.
Que algn criterio de homogeneidad sea cumplido en cada regin.
Que la unin de dos cualesquiera de ellas no cumpla algn criterio de
homogeneidad.

3.2.4 Segmentacin basada en texturas


Utiliza las propiedades explicadas en el apartado 3.2, para realizar la particin de las imgenes.
Pudiendo optar por una aproximacin estadstica con sus correspondientes propiedades
diferenciadoras entre unas partes y otras, o por una aproximacin por frecuencias, definiendo
el contenido local en frecuencias de una determinada regin.

3.3 Transformaciones morfolgicas


Debido a la segmentacin, obtenemos de la imagen los elementos constituyentes ms
importantes. Estos son objetos que presentan defectos inherentes al proceso de
segmentacin, como ruido o pxeles ms clasificados, por lo que se hace necesario un posterior
procesado para solventar este problema. Este proceso consiste en la aplicacin de
transformaciones morfolgicas que son aquellas que modifican la forma o estructura de dichos
objetos, de forma que se simplifican los datos de la imagen, y se preserven las caractersticas
esenciales eliminando los aspectos irrelevantes. A continuacin vamos a ver las

3. Anlisis de imgenes

Pgina 69

Anlisis de imgenes basado en correlacin de imgenes


transformaciones aplicadas tanto a imgenes binarias como a imgenes con varios niveles de
gris.
Para la realizacin de estas transformaciones vamos a recordar ciertas operaciones bsicas
sobre conjuntos. Para ello nos basaremos en dos conjuntos A y B en un espacio E, con
elementos a y b pertenecientes a A y B respectivamente.

Inclusin. A est incluido en B, A B


Complemento: AC contiene los elementos que no pertenecen a A.
Unin: son todos los elementos pertenecientes a uno de los conjuntos.

A B = { x | x A x B}

(Ecuacin 149)

Interseccin: son los elementos comunes a ambos conjuntos.

A B = { x | x A y x B}

(Ecuacin 150)

A = { x | x = a, para todo a A }

(Ecuacin 151)

A B = A BC

(Ecuacin 152)

Reflexin:

Diferencia entre A y B

Traslacin: Un conjunto A es trasladado un vector v cuando cada uno de los elementos


de a sufre esa traslacin.

Av = { x | x = a + v, para todo a A}

(Ecuacin 153)

Dos operaciones basadas en la traslacin, son la suma y resta de Minkowski:


Suma de Minkowski: A B =

A
xB

Resta de Minkowki: AB =

(Ecuacin 154)

A
xB

(Ecuacin 155)

Donde la suma es la unin, y la resta la interseccin del conjunto A y el B trasladado su origen


a cada elemento de A

3.3.1 Transformaciones morfolgicas en imgenes binarias


En una imagen binaria, los pxeles con valor 1 se corresponden con pxeles de la imagen,
mientras que los pxeles con valor 0 sern considerados como puntos pertenecientes al fondo.

3. Anlisis de imgenes

Pgina 70

Anlisis de imgenes basado en correlacin de imgenes


Este tipo de transformaciones requiere la utilizacin de un elemento estructural, con cierta
forma y tamao, con el que se ir probando la imagen y cuantificando el modo en que est
contenido en la misma.

Ilustracin 38
La forma de operar con un elemento estructural es la siguiente:

Elegir un elemento estructural adecuado

Desplazar B por todas las posiciones del espacio E en el que se encuentra el conjunto a
estudiar A: Bx B( x , y )

En cada posicin comprobar si la unin, la interseccin o la inclusin de A con B, est


dentro de A.
Los puntos con respuesta afirmativa formarn parte de un nuevo conjunto que ser en
este caso la imagen transformada.

Considerando el conjunto A como la imagen sobre la que se realiza la transformacin y el


conjunto B como el elemento estructural describiremos las principales operaciones
morfolgicas.
3.3.1.1 Erosin
Consiste en una reduccin de algn elemento de la imagen original, es decir la
degradacin de uno de los campos 0 1 pertenecientes a la imagen binaria. Un punto
del campo a, seguir perteneciendo al mismo si esta rodeado de puntos iguales a l,
sino pasar a formar parte del otro campo.
Se define la erosin de A por B como: ( A, B ) = { x | Bx A}

3. Anlisis de imgenes

Pgina 71

Anlisis de imgenes basado en correlacin de imgenes

Ilustracin 39
Para realizar la erosin habra que recorrer la imagen pxel a pxel, y en cada pxel a su
vez recorrer todo el elemento estructural, por ello se dar la definicin de la erosin,
en funcin de la Resta de Minkowski, ms fcil de implementar:

AB = Ab
bB

(Ecuacin 156)

Con esta definicin se considera la erosin como la interseccin de todas las


traslaciones de A por los puntos b pertenecientes a la reflexin de B (B).
3.3.1.1.1 Propiedades

Antiextensiva: si el elemento se encuentra dentro de un elemento estructural


la erosin tiene el efecto de encoger la imagen de entrada, obteniendo una
imagen incluida dentro de la original. De no ser as se puede llegar a un
resultado que no tiene nada que ver con la imagen original.
Si B contiene al origen, AB A

(Ecuacin 157)

Invariante a traslaciones

Ax B = ( AB ) x

(Ecuacin 158)

ABx = ( AB ) x

(Ecuacin 159)

A C AB CB

(Ecuacin 160)

Creciente:

La interseccin es distributiva con respecto a la erosin:

( A C )B = ( AB ) (CB )

3. Anlisis de imgenes

(Ecuacin 161)

Pgina 72

Anlisis de imgenes basado en correlacin de imgenes

La unin no es distributiva con respecto a la erosin:

( A C )B ( AB ) (CB )

(Ecuacin 162)

3.3.1.2 Dilatacin
Es el crecimiento progresivo de uno de los campos. Si un elemento del campo que
crece tiene un vecino del campo contrario, este ltimo se convierte al campo que se
dilata. Si el vecino es del mismo campo el elemento no se altera.
Se define la dilatacin de A por B como: ( A, B ) = { x | Bx A 0}

Ilustracin 40
La dilatacin se expresa en funcin de la Suma de Minkowski. De esta forma, queda
expresada como la unin de traslaciones de A por los elementos de B.

A B = Ax

(Ecuacin 162)

xB

3.3.1.2.1 Propiedades

Conmutativa:

A B = B A

(Ecuacin 163)

A ( B C ) = ( A B) C

(Ecuacin 164)

Asociativa:

Invariante a traslaciones:

Ax B = ( A B ) x

(Ecuacin 165)

Una traslacin en la imagen puede compensarse en el elemento estructural,


tomando este ltimo trasladado en la direccin opuesta:
(Ecuacin 166)
A B = A B
x

3. Anlisis de imgenes

Pgina 73

Anlisis de imgenes basado en correlacin de imgenes

Creciente:

A C A B C B

Extensiva: Si el origen se encuentra dentro del elemento estructural, la


dilatacin agranda la imagen de entrada, obteniendo una imagen que incluye a
la original. De no ser as, la imagen resultante puede no incluir a la imagen
original.
Si B contiene al origen A B A

(C B) A = ( A B) ( A C )

(Ecuacin 168)

La unin es distributiva con respecto a la dilatacin.

( A B) C = ( A C ) ( B C )

(Ecuacin 167)

(Ecuacin 169)
(Ecuacin 170)

La interseccin no es distributiva con respecto a la dilatacin, pero cumple:

( A B) C ( A C ) ( B C )

(Ecuacin 170)

A ( B C ) ( A B) ( A C )

(Ecuacin 171)

Dualidad entre erosin y dilatacin: Son duales cuando la negacin de una


formulacin empleada en el primero es igual a la misma formulacin
empleando el segundo operador en la variable negada. Se podra resumir, en
que lo que un conjunto hace al objeto el otro lo hace al fondo.

( AB)C = AC B

(Ecuacin 171)

( A B)C = AC B

(Ecuacin 172)

3.3.1.3 Acierta o falla (hit or miss)


Se aplica de la siguiente forma:
A partir del elemento estructural B se forma el conjunto Bx, que es ese mismo
elemento estructural desplazado para todo elemento x A .Se considera Bx formado
por dos subconjuntos Bx1 y Bx2, correspondiendo el primero a los elementos del objeto
y el segundo a los del fondo. Un punto pertenece a Acierta o Falla, si y slo si Bx1 est
incluido en A y Bx2 est incluido en AC, es decir:

A B = { x | Bx1 A; Bx 2 AC }

3. Anlisis de imgenes

(Ecuacin 173)

Pgina 74

Anlisis de imgenes basado en correlacin de imgenes


Esta transformacin indica donde coincide exactamente el elemento estructural B en
el conjunto A.
3.3.1.4 Apertura (Opening)
Consiste en una erosin, seguida de una dilatacin, empleando el mismo elemento
estructural.

A B = ( AB ) B

(Ecuacin 174)

El efecto ser el suavizado de los contornos de los objetos, rotura de enlaces delgados,
y descomposicin de objetos, entre otros efectos.
3.3.1.5 Cierre (Closing)
Consiste en una dilatacin, seguida de una erosin.

A B = ( A B)B

(Ecuacin 175)

Tiende a suavizar el contorno de la imagen de entrada, rellenando roturas y pequeos


agujeros y completando espacios del contorno.
Las operaciones morfolgicas que vamos a comentar posteriormente, son transformaciones
basadas en las operaciones bsicas vistas anteriormente y que se utilizan principalmente para
la deteccin de bordes o preprocesamiento.
3.3.1.6 Extraccin del contorno
Se obtiene el contorno de un conjunto A, denotndose (A), erosionando A por B y
realizando posteriormente la diferencia entre A y su erosin:

( A) = A ( AB)

(Ecuacin 176)

As obtendremos el contorno interior del conjunto A. En cambio utilizando la dilatacin


se puede obtener el contorno exterior de la siguiente forma:

P( A) = ( A B) A

(Ecuacin 177)

3.3.1.7 Relleno de regiones


Utilizando operaciones morfolgicas se quiere rellenar el interior de un contorno.

3. Anlisis de imgenes

Pgina 75

Anlisis de imgenes basado en correlacin de imgenes


3.3.1.8 Extraccin de componentes conexas
Se pretende extraer las componentes conexas contenidas en un conjunto A, es decir,
obtener los elementos conectados entre si de dicho conjunto. Para conseguir nuestro
objetivo seguimos un proceso iterativo basado en la dilatacin.
3.3.1.9 Envolvente convexa (convex hulll)
Es la regin ms pequea que contiene al objeto, de forma que dos puntos
cualesquiera pertenecientes a dicha envolvente pueden conectarse a travs de una
lnea recta, perteneciendo a la regin todos los puntos de ella. Para conseguir la
envolvente convexa de un conjunto hay que utilizar un procedimiento, basado en
transformaciones acierta o falla iterativas.
3.3.1.10 Adelgazamiento (Thinning)
El adelgazamiento de un conjunto A por un elemento estructural B se define en
funcin de la transformacin acierta o falla de la siguiente forma:

AB = A ( A B) = A ( A B)C

(Ecuacin 178)

3.3.1.11 Engrosamiento (Thickening)


El engrosamiento es el dual morfolgico del adelgazamiento y se define de la forma
siguiente:

A() B = A ( A B)

(Ecuacin 179)

3.3.1.12 Esqueletizacin (Skeletonization)


Por esqueletizacin se entiende la obtencin del esqueleto de una regin (objeto), que
no es ms que una representacin en forma de grafo de dicha regin. Una de sus
caractersticas es que pequeas variaciones de la regin se traducen en grandes
variaciones en su esqueleto, lo que resulta particularmente til para detectar
pequeos defectos en piezas y en sistemas para el control de calidad. El esqueleto de
un conjunto A, denotado S(A) se puede escribir como:
L

S ( A) = S k ( A)
k =0

(Ecuacin 180)

Con:
K

S k ( A) = {( AkB ) [( AkB) B ]}

(Ecuacin 181)

k =0

3. Anlisis de imgenes

Pgina 76

Anlisis de imgenes basado en correlacin de imgenes


3.3.1.13 Eliminacin de ramas (Pruning)
Tras un proceso de adelgazamiento o de esqueletizacin, el esqueleto suele presentar
unas ramificaciones acompaando al tronco principal, que no aportan informacin
acerca del objeto y adems suelen dificultar su identificacin, por ello se hace
necesario un proceso de poda (pruning) o eliminacin de ramas.
3.3.1.14 Eliminacin de ruido
Tras la segmentacin de una imagen habr pxeles pertenecientes al objeto que en
realidad pertenezcan al fondo, y viceversa. Con erosiones y dilataciones se puede
solventar el problema eliminando los huecos de los objetos y los puntos ruidosos del
fondo. La expresin que explica este proceso es la siguiente:

X 4 = ((( AB) B) B)B

(Ecuacin 182)

Lo que equivale a una apertura seguida de un cierre:

X 4 = ( A B) B

(Ecuacin 183)

3.3.2 Transformaciones morfolgicas en imgenes con varios niveles


de gris
Se trata de extender las transformaciones morfolgicas vistas anteriormente a imgenes con
distintos niveles de gris.
3.3.2.1 Dilatacin
La dilatacin de una imagen con varios niveles de gris f(x,y) por un elemento
estructural b(x,y), que ahora es una funcin, se define:

( f b)( s, t ) = mx { f ( s x, t y ) + b( x, y ) | ( s x, t y ) D f ; ( x, y ) Db } (Ecuacin 184)


Donde Df es el dominio de la imagen f(x,y) y Db el del elemento estructural. Con los
dominios se asegura que las dos imgenes coincidan en algn punto.
3.3.2.2 Erosin
La erosin para imgenes con varios niveles de gris se define como:

( f b)( s, t ) = mx { f ( s + x, t + y ) b( x, y ) | ( s + x, t + y ) D f ; ( x, y ) Db }

(Ecuacin 185)

Donde Df es igualmente el dominio de la imagen f(x,y) y Db el del elemento estructural.

3. Anlisis de imgenes

Pgina 77

Anlisis de imgenes basado en correlacin de imgenes


3.3.2.3 Apertura y cierre
Son las mismas que para imgenes binarias.
La apertura de f por b:

f b = ( f b) b

(Ecuacin 186)

Igualmente el cierre de f por b:

( f b) C = f C b

(Ecuacin 187)

3.4 Representacin y descripcin de contornos y regiones


Una vez que la imagen ha sido segmentada en regiones y en algunos casos corregidos los
errores cometidos en dicha segmentacin mediante transformaciones morfolgicas, es
necesario representar y describir dichos pxeles, mediante unas caractersticas que se
obtendrn a partir de esas regiones, para que puedan ser procesados posteriormente.
Una regin se puede representar de dos maneras, representado su contorno o representando
el interior de la regin. El que se represente de una forma o de otra va a depender del tipo de
caractersticas que se quiera extraer. En general si se trata de caractersticas geomtricas se
representar el contorno y si son caractersticas fsicas se representar la regin.

3.4.1 Representacin del contorno


3.4.1.1 Cdigos cadena
Los cdigos cadena representan contornos mediante una sucesin de segmentos
conectados de una longitud y direccin dada.
3.4.1.2 Curvas -S
Este mtodo es similar al de los cdigos cadena. Pero en este caso se codifica el ngulo
de los vectores tangentes en cada punto del contorno, en funcin de la longitud de
arco S de contorno. El ngulo est referenciado al ngulo de la tangente en el punto
origen del contorno (ngulo cero), de forma que la curva -S empieza y termina en
cero. Tiene las siguientes ventajas:

Es invariante a traslaciones.
Las limitaciones en los ngulos posibles slo estn condicionadas por el
mtodo de segmentacin utilizado.
Es invariante a rotaciones.

3. Anlisis de imgenes

Pgina 78

Anlisis de imgenes basado en correlacin de imgenes


3.4.1.3 Aproximaciones poligonales
Estos mtodos aproximan el contorno mediante un polgono, es decir, representan
tramos curvos mediante tramos lineales. De esta forma hacen corresponder
segmentos de lnea al contorno, almacenando slo los parmetros de esos segmentos
de lnea en lugar de los puntos discretos del contorno.
3.4.1.4 Mtodo de firmas
En general una firma es una representacin uni-dimensional de un contorno bidimensional y se puede generar de varias formas.

3.4.2 Representacin de regiones


La forma de un objeto puede representarse directamente por la regin que ocupa en la
imagen, de manera que se construye una imagen binaria con la siguiente expresin:

1 si (x,y) pertenece a la regin


f ( x, y ) =
0 en caso contrario

(Ecuacin 188)

Para representar dicha regin de forma ms efectiva existen una serie de mtodos, de los
cuales vamos a ver algunos a continuacin.
3.4.2.1 Cdigos de longitud variable
Una regin o imagen binaria pude ser vista como una sucesin en la que se alternan
series de ceros y unos. Si se considera que el objeto, codificado con unos, ocupa en la
mayora de los casos un espacio en la imagen inferior al que ocupa el fondo. Si se
codifica exclusivamente las cadenas de unos consecutivos se minimizarn el espacio de
memoria ocupado por la imagen. De esta forma, se codificar el comienzo de las
cadenas de unos y la longitud de esas cadenas.
3.4.2.2 Proyecciones
Una regin puede representarse por sus proyecciones. En general, la proyeccin de
una imagen sobre una recta consiste en obtener para cada punto de ella, el nmero de
pixeles que pertenecen a la perpendicular que pasa por ese punto.

3. Anlisis de imgenes

Pgina 79

Anlisis de imgenes basado en correlacin de imgenes


3.4.3 Descriptores de contornos
Son un conjunto de nmeros producidos para describir la forma de un objeto. Estos nmeros
se calculan mediante el clculo de algunas caractersticas en particular. Es posible que la forma
del objeto no se pueda describir de forma completa a partir de los descriptores, pero estos
deben ser suficientemente diferentes para poder distinguir objetos con distintas formas.
3.4.3.1 Longitud de un contorno
Se obtiene contando el nmero de pxeles del contorno. Si el contorno viene
codificado con cdigos cadena, se sumarn los componentes horizontales, los
verticales y los diagonales multiplicados por 21/2.
3.4.3.2 Dimetro de un contorno
Se define como:

Diam(C ) = mx[ D ( pi , p j )]

(Ecuacin 189)

Donde D es la distancia entre dos puntos del contorno C y pi y pj, dos puntos
pertenecientes al contorno. La lnea que une los dos puntos del dimetro llamada eje
mayor del contorno tambin es un descriptor til.
3.4.3.3 Esquinas
La curvatura a lo largo del borde de un objeto se define:
2

d2 y d2x
| k (t ) | = 2 + 2
dt dt
2

(Ecuacin 190)

Son declarados esquinas aquellos puntos donde la funcin k(t) toma valores elevados,
quedando as el objeto definido por sus esquinas.
3.4.3.4 Descriptores de Fourier
Consiste en el clculo de la transformada de Fourier de un conjunto de pxeles.
Considerando el significado de la transformada, si hay contenido en alta frecuencia
significa que hay cambios rpidos en la coordenada correspondiente y que si hay
contenido en baja frecuencia significa que el contorno vara de forma suave. Dicho de
otra forma, las componentes de baja frecuencia capturan la forma general del
contorno y las de alta frecuencia capturan los detalles. Esto implica que si se realiza un
filtrado paso bajo de los descriptores de Fourier de un contorno sera equivalente a
suavizar este contorno.

3. Anlisis de imgenes

Pgina 80

Anlisis de imgenes basado en correlacin de imgenes


3.4.4 Descriptores de regiones
Se encargan de caracterizar una regin resultante de una segmentacin, cumpliendo los
mismos requisitos que los descriptores de contornos en cuanto a que deben ser invariantes.
3.4.4.1 rea
El rea de una regin vendr dada por la siguiente ecuacin:
M 1 N 1

A = f ( x, y )
x =0 y =0

(Ecuacin 191)

Donde f(x,y) es la imagen binaria.


3.4.4.2 Permetro
El permetro P est constituido por el nmero de pxeles exteriores de la regin, es
decir los del contorno.
3.4.4.3 Compacticidad
Refleja el empaquetamiento de la regin y se define como el permetro al cuadrado
partido por el rea:

C=

P2
A

(Ecuacin 192)

Al ser un descriptor sin dimensiones es insensible a cambios de escala y salvo errores


de redondeo debido a la rotacin, es invariante ante la rotacin.
3.4.4.4 Descriptores topolgicos
Indican de una forma sencilla alguna idea sobre la forma de la regin, por ejemplo:

El nmero de agujeros en la regin (H).


El nmero de componentes conectados, es decir partes separadas que forman
la regin (C).
El nmero de Euler, que es la diferencia entre los dos anteriores (E=C-H)

3.4.4.5 Texturas
Algunas regiones pueden ser descritas como en el apartado referente a texturas,
donde fueron obtenidas a partir de mtodos estadsticos o frecuenciales.

3. Anlisis de imgenes

Pgina 81

Anlisis de imgenes basado en correlacin de imgenes


4. Correlacin Digital de Imgenes (DIC)
4.1 Introduccin
La correspondencia de elementos homlogos pertenecientes a diferentes imgenes se
encuentra en continuo desarrollo por parte de disciplinas como el Anlisis de Imagen, la Visin
Computacional y la Fotogrametra. Sin embargo, la dificultad depende de los diferentes
campos, desde los casos ms favorables como los de la Fotogrametra tradicional
estereoscpica, hasta casos de gran dificultad de cmputo como los implementados en
aplicaciones de Fotogrametra de Rango Cercano o Visin Computacional donde existen
grandes diferencias en las condiciones geomtricas y radiomtricas de las imgenes. Por tanto,
podemos afirmar que el problema de la correspondencia de imgenes matching es una
lnea de investigacin en continua evolucin.
Dedicaremos este tema a conocer ms en profundidad la tcnica de correspondencia de
imgenes: desde la asignacin de la relacin entre dos puntos, hasta los acercamientos que
combinan varias estrategias con objeto de establecer una correspondencia entre un punto o
elemento de la imagen y una categora cartogrfica ms o menos abstracta.

4.2 Antecedentes.
Remontndonos a los primeros trabajos relacionados con este tema, la correspondencia de
imgenes o matching de imgenes tiene una larga historia. Los primeros experimentos datan
de los aos cincuenta, especialmente con Hobrough (1959) que plante una solucin de
naturaleza analgica, en la que los correladores, realizados mediante hardware comparaban
los niveles de gris de dos imgenes. Wild Heerbrugg, entonces el fabricante lder en equipos
fotogrmetricos, present un correlador en el congreso de la ISPRS en 1968, que a pesar de su
innovacin no tuvo mucho xito, ya que no era muy flexible ni exacto.
Desde los primeros aos de los setenta hasta mediados de los ochenta, la investigacin relativa
a la correspondencia de imgenes se centr en las tcnicas de la correlacin digital. Kreiling
(1976) fue uno de los primeros pioneros en aplicar correlacin digital para generar Modelos
Digitales de Elevacin (MDE) y ortofotos digitales. Los intentos continuaron aadiendo tcnicas
de correlacin a los instrumentos (Helava, 1978) y (Hoborough, 1978), sin embargo, no se
encontr una solucin universal a pesar del esfuerzo realizado. Todo esto produjo que los
investigadores de muy diversas disciplinas no dieran crdito a la facilidad con que una persona
encontraba puntos homlogos y la dificultad tan enorme de que la misma tarea la realizase un
ordenador. Hoy, se sabe que la visin estereoscpica natural no utiliza la correlacin de niveles
de gris tal y como fue puesto de manifiesto por Grimson (1981) y Horn (1983). Como puede
observarse, esto pone de manifiesto la subestimacin de la complejidad de las tareas visuales
que las personas resuelven con gran facilidad.

4.3 Conceptos bsicos.


No existe una terminologa estandarizada en lo que se refiere a la correspondencia de
imgenes, y en ocasiones esto produce una fuerte barrera entre las diferentes disciplinas que
participan en la correlacin. Debido a esto, a continuacin repasaremos algunos conceptos
bsicos en la correspondencia de imgenes:
4. Correlacin Digital de Imgenes

Pgina 82

Anlisis de imgenes basado en correlacin de imgenes


- Entidad homloga o conjugada
Es un trmino ms genrico qu punto homlogo. Se denominan entidades conjugadas
a las imgenes del espacio objeto, que incluyen puntos, lneas y superficies.
-

Entidad de correspondencia
Es la parte de la imagen (primitivas), que se compara con primitivas de otras imgenes
para buscar entidades homlogas. Las primitivas incluyen niveles de gris, elementos
extrados y descripciones simblicas.
- ndice de semejanza
Es una medida cuantitativa de lo buena que es la correspondencia de las entidades
entre s. En su forma ms simple puede ser el coeficiente de correlacin cruzado o la
desviacin tpica en la correspondencia por mnimos cuadrados. Cuanto mayor es este
valor, mayor es la correspondencia entre imgenes.
- Mtodo de correspondencia
Calcula el ndice de semejanza entre entidades homlogas. Habitualmente la
descripcin del mtodo se aade tras el nombre de la entidad de correspondencia, por
ejemplo correspondencia por reas, correspondencia basada en caractersticas y
correspondencia relacional (simblica).
- Estrategia de correspondencia
Se utiliza para referirse al esquema en el cual nos vamos a basar, para obtener la
solucin del problema de correspondencia de imgenes. Abarca el anlisis del entorno
de correspondencia, la seleccin del mtodo para la misma y el correspondiente
control de calidad de la ejecucin.

A continuacin, vamos a relacionar los conceptos anteriores con los tres mtodos de
correspondencia ms conocidos.
La correspondencia por reas se asocia con la correspondencia entre niveles de gris, es decir se
compara la distribucin del nivel de gris en pequeas reas de la imagen, denominadas teselas
o facetas de imagen, y la semejanza se calcula mediante tcnicas de correlacin o de mnimos
cuadrados.
La correspondencia basada en caractersticas se usa fundamentalmente en la Visin
Computacional. Con objeto de determinar las caractersticas homlogas se comparan los
bordes u otros elementos derivados de las imgenes originales. La semejanza, por ejemplo en
la forma, carcter y fuerza de los bordes se mide mediante una funcin de costo.
El tercer mtodo, correspondencia simblica, se refiere a aquellos mtodos que comparan
descripciones simblicas de las imgenes y miden la semejanza mediante una funcin de
4. Correlacin Digital de Imgenes

Pgina 83

Anlisis de imgenes basado en correlacin de imgenes


costo. Las descripciones simblicas pueden referirse a niveles de gris, o a caractersticas
derivadas. Pueden realizarse en forma de grafos, rboles, redes semnticas, por mencionar
slo unas pocas posibilidades. La correspondencia simblica no se basa estrictamente en las
propiedades geomtricas de semejanza, en contraste con los otros mtodos. Compara las
propiedades topolgicas, en lugar de utilizar la forma o la posicin como criterio de semejanza.
Es importante tener presente que el trmino correspondencia de imgenes hace mencin no
slo a un par de imgenes sino tambin a la posibilidad de trabajar con mltiples imgenes.
En trminos generales, la exposicin de un problema de correspondencia de imgenes puede
plantearse de la siguiente forma:
1. Seleccionar en una imagen la entidad de correspondencia.
2. Buscar en la otra imagen su entidad conjugada (correspondiente).
3. Calcular la posicin de la entidad correspondiente en el espacio objeto.
4. Valorar la calidad de la correspondencia.
Obviamente la segunda fase es la ms difcil de resolver y la que propicia un contexto de
investigacin ms intenso a muy diversos niveles.

4.4 Dificultades en la correspondencia de imgenes.


A la hora de la localizacin automtica de puntos homlogos pueden surgir varios problemas:
- Vastedad de la bsqueda
Que se produce cuando se calcula el ndice de semejanza entre las entidades de
correspondencia para toda la imagen. Por ejemplo, en el caso de imgenes de alta
resolucin 8 megapxeles (4000 x 2000 pxeles) el tiempo de computo puede
dispararse. De ah la necesidad de incorporar restricciones geomtricas y estrategias
que permitan reducir dicho espacio de manera eficiente y robusta.
- Ambigedad
Que se produce si la entidad de correspondencia no es suficientemente caracterstica
(nica). La solucin pasar por la seleccin de ms entidades de correspondencia
nicas.
-

Mal condicionamiento
Una imagen se caracteriza por su debilidad geomtrica y radiomtrica. Esta debilidad
se concreta en la posibilidad de que al buscar el punto homlogo exista.

Una solucin inexistente


Puede no haber punto homlogo debido a ocultaciones, desplazamientos por relieve,
diferencias radiomtricas, etc

4. Correlacin Digital de Imgenes

Pgina 84

Anlisis de imgenes basado en correlacin de imgenes


-

Una solucin mltiple


Puede haber ms de una solucin (aparentes) en el caso de patrones repetitivos
asociadas a cultivos, edificaciones, etc

Una solucin inestable


La solucin puede quedar afectada por condiciones geomtricas o radiomtricas de
manera que en diversas imgenes pueden detectarse puntos homlogos distintos
(para un mismo punto de referencia).
Particularmente, Kasser en su estudio de la correspondencia de imgenes identifica la
siguiente serie de problemas en la imagen, que debilitan la capacidad de encontrar
puntos homlogos:
-

Zonas con pobreza radiomtrica o patrones repetitivos. En este segundo caso,


pueden emplearse mscaras ms grandes, no alineadas con la direccin de
modulacin del patrn repetitivo, o imgenes complementarias.

Zonas ocultas. Por ejemplo, en zonas urbanas, el punto homlogo puede no ser
visible y sin embargo, la mscara de correlacin dar un mximo. Es necesario el
empleo de ms imgenes y / o ampliar el recubrimiento.

Prdidas de recubrimiento por relieve o prdida del caso normal. Pendientes


pronunciadas y / o lneas de ruptura que dan lugar a deformaciones de las
mscaras de correlacin.

Iluminacin diferencial debido a los cambios en la posicin relativa de los vectores


fuente de iluminacin, normal a la superficie, eje de toma. Pueden aparecer zonas
saturadas radiomtricamente debido a comportamientos especulares de la
superficie.

Objetos mviles, sombras desplazadas en el caso de imgenes de satlite con


estereoscopia transversal respecto de la rbita.

La introduccin de estas restricciones es un paso importante para convertir la correspondencia


de imgenes en un problema bien definido. Las restricciones pueden ser vistas como una
informacin adicional acerca de los parmetros, y en este sentido la informacin adicional es
conocimiento acerca del proceso de correspondencia.
En resumen, el problema de la correspondencia de imgenes es doble: en primer lugar se debe
obtener una aproximacin lo suficientemente buena y posteriormente descubrir el justo
trmino entre las hiptesis planteadas y las restricciones impuestas a la solucin por un lado y
mantener la generalidad por otro.

4. Correlacin Digital de Imgenes

Pgina 85

Anlisis de imgenes basado en correlacin de imgenes


4.5 Distorsiones geomtricas de las entidades de correspondencia
Diferencia de escala entre las dos imgenes. Se produce cuando la correlacin se lleva a cabo
con un par de imgenes con diferente escala. Al proyectarse las dos teselas sobre la superficie
plana, los pxeles interiores ya no resultan conjugados puesto que aparecen referidos a
distintas posiciones dentro del espacio objeto.

Ilustracin 41
Diferencia de ngulos de rotacin entre las dos imgenes. Efecto causado por la diferencias de
rotacin entre las imgenes, debido a que una de las imgenes rota alrededor de un eje y la
otra alrededor de otro distinto.

Ilustracin 42
Distorsin geomtrica causada por la inclinacin. Como se observa en la figura una inclinacin
de la superficie provoca un acortamiento o reduccin de la misma. Al inclinarse ms la
superficie, llega a alcanzarse un ngulo crtico para el que no se ve la imagen derecha,
llegndose a la situacin de oclusin. Observando la figura se evidencia otra consecuencia
producida por la inclinacin de la superficie: la resolucin decrece en la direccin
perpendicular al eje de rotacin.

4. Correlacin Digital de Imgenes

Pgina 86

Anlisis de imgenes basado en correlacin de imgenes

Ilustracin 43
Distorsin geomtrica debida al relieve. Como se vio antes, las teselas imgenes de posiciones
homlogas se proyectan sobre la tesela superficial montaosa. Como podemos observar en la
siguiente figura, los pxeles individuales no son conjugados ni siquiera en el caso de un par
estereoscpico estrictamente vertical.

Ilustracin 44
Se han analizado el efecto de las distorsiones geomtricas sobre las teselas de la imagen que
se usan como entidades en la correspondencia por reas. Generalmente, el mtodo de
correspondencia por reas no se ve afectado por las distorsiones de relieve, sin embargo son
muchos ms sensibles a la mayora de distorsiones geomtricas. Por ejemplo, la
correspondencia de bordes es tremendamente sensible a las distorsiones geomtricas.
Cualquier variacin en la posicin del punto de vista provocar que el borde sufra
desplazamiento e incluso deformacin lo que complicar su correspondencia.

4.6 Estrategias de correspondencia por reas


En la correspondencia por reas las entidades son los niveles de gris. La idea de este mtodo
es comparar la distribucin de niveles de gris de una pequea subimagen, denominada tesela
imagen, con su correspondiente en la otra imagen. A continuacin introduciremos la
terminologa a usar.
4. Correlacin Digital de Imgenes

Pgina 87

Anlisis de imgenes basado en correlacin de imgenes


Se conoce como patrn o ventana patrn, a la tesela imagen que permanece en una posicin
fija en una de las imgenes. Se entiende por ventana de bsqueda la zona del espacio de
bsqueda dentro de la que se comparan las teselas imagen (llamadas ventanas de
correspondencia) con el patrn, comparacin que se realiza utilizando distintos criterios para
calcular el ndice de semejanza. Los dos ms conocidos son la correlacin cruzada y la
correspondencia por mnimos cuadrados. La posicin y tamao de la ventana de bsqueda
puede determinarse, acotarse, en funcin de alguna restriccin geomtrica.
La correspondencia entre dos pxeles se establece a partir de la correlacin (grado de
semejanza) de los niveles de gris correspondientes a los pxeles pertenecientes a sendas
mscaras (matrices) centradas sobre los pxeles candidatos.
A partir de un pxel que acta como referencia (dato) en una imagen, cuya mscara no se
mueve, se busca en la otra imagen o imgenes, el pxel o pxeles, cuya mscara ofrece el mayor
nivel de correlacin.
Tiene un carcter geomtrico, es decir, no es invariante a la geometra de la mscara. La
tcnica funciona adecuadamente siempre y cuando exista una regularidad geomtrica entre
las dos zonas de la imagen.

Ilustracin 45
Independientemente del clculo utiliza para el ndice de semejanza, a continuacin vamos a
tratar una serie de conceptos que debemos tener claros.
-

Posicin del patrn


El aspecto de la eleccin del centro del patrn puede parecer superficial, sin embargo
no lo es. En teora el centro del patrn podra situarse dentro de un rea que fuera la
mitad del tamao del patrn y menor que la imagen, pero un anlisis ms cuidadoso
indicara que hay que ser ms selectivo a la hora de aceptar dichos lmites. La
correspondencia por reas puede fallar en determinadas condiciones. Sirvan como
ejemplos: la colocacin del patrn en zonas que presentan oclusin en la otra imagen,
la seleccin de un rea de baja relacin seal ruido, la eleccin de un rea con
patrones repetidos, la ubicacin en un rea con lneas de ruptura

4. Correlacin Digital de Imgenes

Pgina 88

Anlisis de imgenes basado en correlacin de imgenes


-

Tamao del patrn


El tamao del patrn y de la ventana de correspondencia son dos parmetros
importantes. Al aumentar el tamao, normalmente aumenta la unicidad de la funcin
de niveles de gris, pero tambin lo hacen los problemas de distorsin geomtrica por
lo que se debe encontrarse una solucin de compromiso, por ejemplo calculando un
ndice de unicidad para distintos tamaos del patrn, que sirva para controlar una
ubicacin til del mismo.

Posicin y tamao de la ventana de bsqueda


La posicin de la ventana de bsqueda es crucial, ya que la correspondencia por reas
necesita aproximaciones muy buenas. Su tamao no obstante, no juega un papel
importante porque la aproximacin limita el tamao a unos pocos pxeles. Una
estrategia de correspondencia basada en el mtodo jerrquico asegura la obtencin de
buenas aproximaciones.

Criterios de tolerancia
Deben analizarse los factores que aparecen en la medida de la semejanza, entre el
patrn y la ventana de correspondencia. El criterio de aceptacin cambia, incluso
dentro de la misma imagen, por lo que los valores umbral u otros deberan definirse
localmente, umbrales adaptativos.

Control de calidad
El control de la calidad incluye una valoracin de la precisin y de la exactitud de las
posiciones homlogas o conjugadas. Adems debe estudiarse la consistencia de los
puntos correspondientes, incluyendo su adecuacin a las expectativas o el
conocimiento sobre el espacio objeto.

4.6.1 Correlacin
La idea es medir el grado de semejanza del patrn con la ventana de correspondencia
calculando el factor de correlacin cruzado.
El coeficiente de correlacin se define como:

LR
L R

(Ecuacin 193)

Si est normalizado se verifica -1 1. En la ecuacin anterior los trminos se definen como:


LR,

covarianza de las teselas de imagen L (izquierda) y R (derecha).

L,

desviacin tpica o estndar de la tesela de imagen L (patrn).

R,

desviacin tpica de la tesela de la imagen R (ventana de correspondencia).

4. Correlacin Digital de Imgenes

Pgina 89

Anlisis de imgenes basado en correlacin de imgenes


Si se introducen las funciones imagen gL(x,y) gR(x,y) para las teselas de imagen izquierda y
derecha (en este caso el patrn y la ventana de correspondencia) y se notan en la forma de gL,
gR se obtienen las siguientes ecuaciones de definicin:

L =

R =

LR


=
n

i =1

j =1

gL


=
i =1

j =1

gR


=
i =1

j =1

g L ( xi , yi )

nm

g R ( xi , yi )

nm

i =1

j =1

( g L ( xi , yi ) g L ) 2

n m 1

i =1

j =1

( g R ( xi , yi ) g R ) 2

n m 1

(( g R ( xi , yi ) g R ) 2 ( g L ( xi , yi ) g L ) 2 )
n m 1

(Ecuacin 194)

(Ecuacin 195)

(Ecuacin 196)

(Ecuacin 197)

(Ecuacin 198)

El factor de correlacin cruzado se determina dentro del espacio de bsqueda para cada
posicin f,c de la ventana de correspondencia. El problema siguiente es determinar qu
posicin u,v proporciona el mximo factor de correlacin.
El factor de correlacin mximo cruzado normalizado toma valores en el intervalo [-1, 1]. Se
obtiene un valor igual a la unidad si el patrn y la ventana de correlacin son idnticos. Si no
existe correlacin entre las dos teselas de imagen, es decir si no hay coincidencia en absoluto,
entonces =0. El valor =-1 indicara una correlacin inversa, como en el caso de la diapositiva
y el negativo de la misma imagen.
Si se reduce la ventana de bsqueda en base a alguna restriccin geomtrica, los valores de
los factores de correlacin pueden ser dibujados entonces en un grfico como el de la
ilustracin 46. El mximo se halla ajustando un polinomio, por ejemplo una parbola, a los
valores de correlacin. Se hace notar que el mximo raramente coincide con los valores
enteros de la direccin o posicin del pxel.

4. Correlacin Digital de Imgenes

Pgina 90

Anlisis de imgenes basado en correlacin de imgenes

Ilustracin 46
Procedimiento
El procedimiento descrito a continuacin describe los pasos generales en una
correspondencia por reas con la correlacin como ndice de semejanza.
1. Seleccionar el centro del patrn de la imagen.
2. Determinar las ubicaciones aproximadas de las posiciones homlogas en la otra
imagen.
3. Determinar tanto para el patrn como para la ventana de correlacin los tamaos
mnimos que cumple con el criterio de unicidad. Elegir el mayor de los dos valores
como tamao de la ventana para la posicin actual de correspondencia.
4. Calcular los coeficientes de correlacin f,c con la ecuacin anterior para todas las
posiciones f,c de la ventana de correlacin en la ventana de bsqueda.
5. Analizar los factores de correlacin. Debe alcanzarse un valor umbral mnimo para
que la correspondencia sea vlida. Adems del mximo debe determinarse ste
de modo inequvoco como un ndice de la calidad de medida.
6. Repetir los pasos 2-5 para una nueva posicin del patrn hasta que se haya hecho
la correspondencia en todas las posiciones.
7. Analizar los resultados de la correspondencia con una visin global para
determinar la consistencia y la compatibilidad con el conocimiento a priori de la
escena o imagen.

4.6.2 Correspondencia por mnimos cuadrados


Las primeras experiencia de correspondencia por mnimos cuadrados (LSM) las presentaron los
investigadores a comienzos de los aos ochenta, por ejemplo (Ackermann, 1984); (Grn,
1985); (Grn y Baltsavias, 1987); (Frstner, 1982, 1986); (Rosenholm, 1987); (Thurgood y
Mikhail, 1982). La idea en la correspondencia por mnimos cuadrados es minimizar las
diferencias en los niveles de gris entre el patrn y la ventana de correspondencia, motivo por
el que la posicin y la forma de la ventana de correspondencia son parmetros que han de
determinarse en el proceso de ajuste. Es decir, la forma y posicin de la ventana de
correspondencia cambian hasta que las diferencias de nivel de gris entre la ventana deformada
y el patrn (constante o fijo) alcancen un mnimo. Si bien el concepto de mover la ventana de
correspondencia hasta encontrar la posicin conjugada u homloga es sencillo de entender, la
modificacin del aspecto puede no ser tan obvia a primera vista. Despus de tratar sobre las
distintas distorsiones geomtricas producidas por el desconocimiento de los parmetros de
4. Correlacin Digital de Imgenes

Pgina 91

Anlisis de imgenes basado en correlacin de imgenes


orientacin, la inclinacin de la superficie, el relieve, etc., parece evidente que debe cambiar la
forma de la ventana de correspondencia para que todos los pxeles de la misma sean
conjugados de los que les corresponden en el patrn.
Supngase que la ventana de correspondencia est centrada exactamente en la posicin
conjugada. Las diferencias de niveles de gris entre los pxeles correspondientes del patrn y la
ventana de correspondencia se deben a distintos factores, entre los que se detallan:
-

Las diferencias de reflectancia e iluminacin entre las dos imgenes.


La propia cmara.
El proceso de revelado fotogrfico y de barrido o escaneado en el caso de fotografas
digitalizadas.
La distorsin geomtrica de la teselacin regular de la imagen causada por la
orientacin, la inclinacin de la superficie, el relieve.

El proceso habitual sigue los siguientes pasos:


Modelo aleatorio
Expresa que entre la funcin imagen (su mscara de niveles de gris) de referencia,
sobre el pxel (x,y), y la funcin imagen candidata (su mscara de niveles de gris) para
establecer el punto homlogo sobre el pxel (x,y), existe una discrepancia residual que
sigue una distribucin gaussiana y, por tanto, susceptible de minimizacin.

F ( x , y ) + v = G ( x, y )

(Ecuacin 199)

p (v) N (v;0; v )

(Ecuacin 200)

Modelo funcional radiomtrico


Expresa que entre las dos funciones existe una variacin sistemtica reducible
generalmente a un modelo lineal: variacin de brillo (r0) y de contraste (r1).

F ( x , y ) + v = G ( x, y )r1 r0

(Ecuacin 201)

Modelo funcional geomtrico


Expresa que el entorno de los dos puntos de las imgenes (las mscaras) cuyos valores
radiomtricos se comparan pueden estar relacionados mediante una transformacin
lineal (afn) y, por tanto, que el valor de la imagen observado G(x0, y0) se puede
relacionar con el terico ideal G(x, y) a travs de dicha transformacin lineal.

F ( x , y ) + v = G (ax0 + by0 + x + cx0 + dy0 + y )r1 + r0

x x0 y0 0 0 1 0
y = 0 0 x y 0 1

0
0

4. Correlacin Digital de Imgenes

(Ecuacin 202)

(Ecuacin 203)

Pgina 92

Anlisis de imgenes basado en correlacin de imgenes


La tarea a realizar consiste en la estimacin de los parmetros radiomtricos r0, r1 y
geomtricos (a, b, c, d, x, y) mediante la minimizacin de
. Una vez linealizado
el modelo mediante el desarrollo en serie de Taylor y las correspondientes
aproximaciones iniciales llegamos a:

r0
r
1
da

db
[ F ( x , y ) G( x, y )] + v = 1 G 0 ( x, y) Gx x Gx y Gy x Gy y Gx Gy
dd

de
x

y
(Ecuacin 204)
donde los trminos Gx y Gy representan las derivadas parciales y discretizadas de la
imagen en la direccin X y en la direccin Y, respectivamente. Es decir, los trminos Gx
se obtienen restando dos a dos los niveles de gris de dos columnas contiguas de la
mscara y los trminos Gy se obtienen restando dos a dos los niveles de gris de dos
filas adyacentes contiguas de la mscara. Una mscara de n x n pxeles permite formar
un sistema de (n-1) x (n-1) ecuaciones.
El modelo puede y suele si suponemos que:
-

Se ha llevado a cabo un procesado previo de las imgenes de manera que han


eliminado las discrepancias radiomtricas. Es decir, se han determinado los
parmetros r0 y r1.

Las aproximaciones iniciales son suficientemente buenas o las imgenes


suficientemente parecidas entre s (poco relieve y caso normal) como para
suponer que no hay giros ni cambios de escala a nivel local. Es decir supone
conocidos los coeficientes de la transformacin afn.

[ F ( x , y ) G ( x, y)] + v = Gx

x
Gy
y

(Ecuacin 205)

Como en el caso de la correspondencia por reas esta estrategia es de carcter


geomtrico y local. Exige una suficientemente buena aproximacin inicial. Da
precisiones subpxel. Es ms flexible que la correspondencia por reas.
Procedimiento de ajuste
La correspondencia por mnimos cuadrados no es un problema de ajuste lineal, y por
tanto hay que buscar una solucin iterativa. Sin embargo, hay algunas diferencias con
el ciclo iterativo habitual. La primera iteracin se inicia para una posicin aproximada
4. Correlacin Digital de Imgenes

Pgina 93

Anlisis de imgenes basado en correlacin de imgenes


de la ventana de correspondencia. Con la matriz reseada anteriormente se calculan
los coeficientes de la matriz de diseo del sistema y los parmetros incgnita de la
transformacin.
Despus del muestreo comienza la siguiente iteracin y se repite el ciclo hasta que se
cumpla el criterio de convergencia. Se utiliza un nmero mximo de iteraciones como
tope en caso de que se produzca una falta de convergencia o, lo que es peor, exista
divergencia. En circunstancias normales se satisface antes el criterio de variaciones
poco significativas de los parmetros que el del mximo nmero de iteraciones. El
punto homlogo o conjugado del centro del patrn es el centro de la ventana de
correspondencia despus de haber sido transformada a su forma y posicin finales.
El procedimiento de correspondencia por mnimos cuadrados puede resumirse en los
siguientes pasos:
1. Seleccionar el centro del patrn en una imagen.
2. Determinar las posiciones aproximadas para la ventana de correspondencia.
3. Determinar el tamao mnimo del patrn y de la ventana de correspondencia que
satisfagan los criterios de unicidad. Seleccionar el mayor de los dos valores como
tamao de la ventana.
4. Iniciar a primera iteracin con la ventana de correspondencia en la posicin
aproximada.
5. Transformar la ventana de correspondencia y determinar los valores de gris para
la teselacin (remuestreo).
6. Repetir la secuencia de ajuste y remuestreo hasta que se alcance los criterios de
convergencia.
7. Valorar la calidad del punto homlogo.
8. Repetir los pasos 1-7 para una nueva posicin del patrn.
Como se mencion anteriormente deben realizarse los ajustes radiomtricos como,
por ejemplo, una ecualizacin del histograma, antes del proceso de correspondencia
de cara a evitar la presencia de ms incgnitas en el modelo matemtico.
En resumen, la correspondencia por mnimos cuadrados, es una tcnica que pretende,
por una parte, contrarrestar las limitaciones geomtricas de la tcnica de
correspondencia por reas (para lo que concede cierta flexibilidad a la mscara) y, al
mismo tiempo, ajustar (mediante el procedimiento mnimo cuadrtico) la
correspondencia por debajo del pxel. La tcnica se basa en la minimizacin de las
discrepancias de los niveles de gris entre la mscara de referencia y la mscara de
correlacin.

4.6.3 Correspondencia basada en caractersticas


La correspondencia basada en caractersticas utiliza como entidades homlogas caractersticas
o elementos obtenidos de los niveles de gris de la imagen original, entre lo que se encuentran
puntos, bordes y regiones. Las caractersticas que se usan con ms frecuencia son los bordes y
los puntos (puntos de inters).

4. Correlacin Digital de Imgenes

Pgina 94

Anlisis de imgenes basado en correlacin de imgenes


La correspondencia basada en caractersticas se hizo popular al final de los setenta en la Visin
Computacional, cuando se cay en la cuenta de que la prodigiosa capacidad estereoscpica
humana se basa ms en buscar bordes o lmites conjugados (Grimson, 1981; Horn, 1983).
Una vez estos elementos son extrados, es necesario asignarles una serie de atributos de
posicin, de forma, orientacin, gradiente, longitud, curvatura, de topologa, etc. Finalmente
debe compararse el grado de similitud existente entre los atributos de los elementos o de las
relaciones mediante funciones de coste. Para ello debe acometerse una tarea de bsqueda a
travs de los registros estructurados de la imagen.
Estas herramientas presentan un carcter ms abstracto (no son funcin inmediata de la
geometra y la radiometra) y global (afectan a toda la imagen). En esta media son ms
invariantes al relieve y la orientacin.
4.6.3.1 Extraccin de caractersticas
La extraccin de caractersticas es un proceso monocular, que se realiza de modo
independiente en cada una de las imgenes. Aunque en el apartado Anlisis de
imgenes ya hemos hablado sobre ellas, a continuacin realizaremos un breve repaso
sobre las tcnicas ms empleadas en este contexto.
Puntos de inters
La extraccin de distintos puntos en una imagen o en una tesela imagen tiene como
idea bsica la identificacin de zonas de gran varianza, reas que son potencialmente
tiles para la correspondencia. El proceso de extraccin se realiza mediante un
operador de inters, y aquellos puntos que tienen caractersticas diferenciadas se
denominan puntos de inters.
Moravec (1976) desarrollo un operador de inters que meda las diferencias de una
tesela imagen con relacin a sus alrededores. Acta calculando las varianzas de
pequeas reas y umbralizando las mismas local y globalmente.
El operador de inters de Frstner es invariante con la rotacin y ofrece una precisin
subpxel, (Frstner, 1986); (Frstner y Glch, 1987). Con l pueden identificarse
diferentes caractersticas o elementos puntuales, tales como esquinas y elementos
superpuestos a la imagen original.
Deteccin de bordes
Existen numerosos operadores de borde, cada uno con sus propias caractersticas
distintivas, y muy a menudo la eleccin de uno frente a otro se toma por preferencia
personal o por la propia experiencia. La deteccin de bordes implica la identificacin
de los pxeles de borde y el agrupamiento de los pxeles de borde origina los llamados
contornos de borde.
Los bordes se corresponden con diferencias de luminosidad en las imgenes, que
pueden ser bruscas (borde marcado o definido) o pueden aparecer sobre un rea
mayor (borde suave). En teora un operador de borde debera ser capaz de identificar
bordes suaves y definidos. Como habitualmente los bordes aparecen en cualquier
4. Correlacin Digital de Imgenes

Pgina 95

Anlisis de imgenes basado en correlacin de imgenes


orientacin, se necesita un operador que sea independiente de la direccin. Pero la
deteccin de las diferencias de luminosidad supone conocer o determinar las
derivadas o, en el caso de funciones discretas como las imgenes digitales, las
diferencias de orden n.
4.6.3.2 Correspondencia a travs de puntos de inters
La correspondencia por reas constituye la manera ms fcil de hacer corresponder
puntos de inters. La determinacin de puntos de inters tuvo como motivacin
original la bsqueda de teselas de imagen con informacin suficiente para que la
correlacin tuviera posibilidades de xito. Como se vio anteriormente, las teselas de
imagen con intensidad uniforme producan una funcin de correlacin plana sin un
mximo claro, por lo que las reas citadas deben evitarse.
El concepto de correspondencia de puntos de inters se muestra en la siguiente figura.
En el par estereoscpico aparecen los puntos de inters extrados mediante un
operador de Frstner. La plantilla est centrada en uno de ellos, en este caso en la
imagen derecha. Ahora, con el mtodo descrito en la seccin anterior se calcula la
ventana de bsqueda en la otra imagen, en la que se encuentran varios puntos de
inters. Se centra en todos estos puntos la ventana de correspondencia y se calculan
los coeficientes de correlacin. Se considera normalmente como punto conjugado del
centro de la plantilla, a aquel punto al que corresponde mayor factor de correlacin.
Se repite el procedimiento hasta que se ha centrado la plantilla en todos los puntos de
inters de la imagen derecha.

Ilustracin 47

4.6.3.3 Correspondencia segn puntos de inters


Esta forma de realizar la correspondencia de puntos de inters es una aproximacin
lgica a la correspondencia por reas, en la que la plantilla se sita en posiciones con
4. Correlacin Digital de Imgenes

Pgina 96

Anlisis de imgenes basado en correlacin de imgenes


una funcin de imagen distintiva y no en posiciones arbitrarias. Persisten, no obstante,
inconvenientes asociados a las lneas de ruptura, ocultamientos o sombras,
acortamientos. Es ms, no todos los puntos de inters tienen su punto
correspondiente de inters en la otra imagen, como demuestra la misma figura. A
pesar de todo, el coeficiente de correlacin puede superar el umbral para dar por
vlida una correspondencia, lo que producira una actuacin incorrecta, y por
consiguiente debe realizarse un control posterior, que permita identificar posibles
correspondencias errneas. Como una alternativa a la correlacin cruzada, puede
aplicarse mnimos cuadrados.
4.6.3.4 Correspondencia de los pxeles de borde
Supngase que se quiere hacer corresponder el pxel de borde remarcado de la tesela
de imagen izquierda de la figura. Lo primero que hay que hacer es determinar la
ventana de bsqueda en la tesela de imagen derecha, su centro y dimensiones.
Aunque se supone que las imgenes estn normalizadas, la bsqueda no puede
reducirse estrictamente a la lnea bipolar, sino que debe incluir algunas filas por
encima y por debajo de la misma.

Ilustracin 48: Correspondencia de borde. Se selecciona el pxel de borde en el centro


del crculo de la imagen izquierda y se predice la ventana de bsqueda (el rectngulo
de la imagen derecha). La altura de la ventana de bsqueda es de 3 pxeles por encima
y por debajo de la lnea epipolar para permitir los desplazamientos verticales. La
longitud depende de la incertidumbre de la cota (profundidad) del pxel de borde
homlogo.
A mayor nmero de correspondencias potenciales halladas, la dificultad para
determinar la correcta aumenta. Por lo tanto la cuestin bsica es cuntas
posibilidades se tendrn de media y cmo puede modificarse dicho nmero para
alcanzar un mximo. El nmero de pasos o cruces por cero depende del tamao del
operador LoG (Laplaciano + Gaussiana).
La seleccin del pxel homlogo correcto entre un conjunto de correspondencias
posibles se rige por el principio de la continuidad a lo largo de las discontinuidades. El
borde marca una discontinuidad en los niveles de gris en toda su dimensin. Los
bordes pueden corresponderse con lmites de objetos reales que normalmente son
continuos, o al menos lo son a trozos. Por tanto la paralaje a lo largo de los bordes
correspondientes cambia de forma gradual y en muy pocas ocasiones bruscamente.
Una posible forma de trabajar es calcular todas las paralajes posibles entre el pxel que
4. Correlacin Digital de Imgenes

Pgina 97

Anlisis de imgenes basado en correlacin de imgenes


se quiere hacer corresponder y las correspondencias posibles. Estudiando el
histograma de todas las paralajes posibles puede encontrarse fcilmente la paralaje
predominante. La presencia de ms de un mximo indicara una discontinuidad a lo
largo del borde. Si en este mtodo se incluye un anlisis de tendencias del histograma
se logra una mejora sobre lo anterior que podran reflejar cambios graduales de la
paralaje.
Por ltimo, otros atributos de borde adicionales, que no se han considerado en la
primer correspondencia, pueden ayudar cuando se presentan asociaciones ambiguas
que el anlisis del histograma es incapaz de resolver. Como por ejemplo el valor del
atributo fuerza del borde. Es improbable que un borde que aparece ntido o marcado
en una imagen est borroso en la otra.
Por el mismo motivo, es bastante improbable que un borde sea el conjugado de varios.
Por lo tanto, la asociacin de pxeles del mismo borde favorecera ms la resolucin de
las ambigedades.
4.6.3.5 Parametrizacin de bordes. Mtodo -s
El mtodo -s constituye un acercamiento a la correspondencia de bordes en base a
una parametrizacin en el espacio de parmetros -s, siendo la orientacin del
borde a travs de la derivada funcin gradiente y s su longitud. El resultado es
invariante respecto a la posicin del borde y conlleva una pequea traslacin con
respecto a la rotacin del borde.
En la ilustracin 49 aparecen ejemplos de funciones en la representacin cartesiana
tradicional x,y as como en la representacin -s. A las lneas rectas en el dominio
espacial le corresponden lneas rectas horizontales en el dominio -s (la derivada es
constante), El valor de las lneas horizontales es proporcional a la orientacin de la
lnea recta, como se ve en (a). Los crculos se representan por lneas rectas de
pendiente proporcional a la curvatura como ilustra en (c). Una rotacin en el dominio
espacial supone un desplazamiento vertical en la representacin -s. (b) es una
versin rotada de (a). Anlogamente (d) es una versin rotada de (c).
Los ejemplos representados en la figura aclaran las ventajas de la representacin -s
en la correspondencia de contornos de borde. Por un lado la representacin es
invariante con respecto a la posicin del borde en la imagen. Una rotacin entre las
dos imgenes supone una simple traslacin o desplazamiento de la posicin cero.
Adems se reduce en uno el grado de la lnea original.
Los bordes se representan como una secuencia de pxeles de borde, por ejemplo unos
cdigos en cadena. El comienzo del borde viene dado por las coordenadas imagen,
pero los siguientes pxeles estn relacionados con el anterior por la direccin. El cdigo
en cadena es la primera diferencia de la representacin lineal discreta
(correspondiente a la primera derivada de la representacin continua). Por lo tanto la
representacin discreta -s es en esencia una representacin de un cdigo en cadena.
Se usa la representacin -s en la correspondencia de formas por su capacidad para la
extraccin de elementos o caractersticas formales distintas. Un ejemplo de
4. Correlacin Digital de Imgenes

Pgina 98

Anlisis de imgenes basado en correlacin de imgenes


caracterstica de forma distinta es el cambio de curvatura. En trminos de formas, las
lneas rectas son francamente aburridas, mientras que las lneas con cambios de
curvatura frecuentes ofrecen una gran riqueza de informacin sobre la forma. Cmo
puede explicitarse dicha informacin para explicitarla en la correspondencia de
bordes?
Supngase dividida o segmentada la curva -s en una sucesin de lneas rectas. Como
los segmentos de lneas horizontales se corresponden con lneas rectas en el dominio
x,y con una orientacin igual a y las lneas rectas con pendiente son arcos circulares,
la divisin o segmentacin de las curvas -s supone una segmentacin curvilnea en el
dominio espacial. Del anlisis de la curva -s segmentada pueden deducirse o
extraerse caractersticas o elementos de forma. Los vrtices indican los cambios de
curvatura y los bordes con formas similares se caracterizan por vrtices similares.

Ilustracin 49. Ejemplo de lneas en el dominio x y junto con su representacin en el


dominio -s.

4.6.4 Correspondencia relacional


El mtodo -s de correspondencia tratado con anterioridad tiene una caracterstica comn:
entidades de correspondencia individuales se comparan con entidades en la otra imagen de
una en una. Por ejemplo, se selecciona un contorno de borde en una imagen y se compara con
los bordes existentes en la ventana de bsqueda de la otra imagen, buscando una semejanza
en la forma. Se repite el proceso de moda ms o menos independiente para todos los bordes.
Una vez hecha de esta forma la correspondencia de todas las entidades, se selecciona la
correspondencia ms probable de entre todas las posibles mediante un procedimiento
separado que asegura la consistencia local y global partiendo de supuestos a priori sobre la
superficie en el espacio objeto.

4. Correlacin Digital de Imgenes

Pgina 99

Anlisis de imgenes basado en correlacin de imgenes

Ilustracin 50
La incorporacin de las relaciones entre entidades mejora el procedimiento de
correspondencia, con lo que podemos hablar de correspondencia de caractersticas
relacionales, correspondencia por reas relacional o bien simplemente correspondencia
relacional.
La correspondencia relacional proporciona un mecanismo para considerar las relaciones entre
las entidades de correspondencia. Puede definirse como la bsqueda de la mejor
representacin entre dos descripciones relacionales (Vosselman, 1982). Este esquema de
correspondencia ms general ha sido desarrollado por investigadores en Visin
Computacional, por ejemplo (Shapiro y Haralick, 1987) y (Boyer y Kalk, 1998) presentndose
en forma de etiquetado o clasificacin consistente, relajacin y correspondencia estructural.
En aplicaciones fotogramtricas se ha usado con xito en los ltimos tiempos la
correspondencia relacional, (Vosselman, 1994), (Zilberstein, 1992), (Cho, 1996) y (Wang, 1996).
En la correspondencia relacional deben considerarse tres aspectos igualmente importantes: la
descripcin, la funcin de evaluacin y el rbol de bsqueda.
4.6.4.1 Descripcin de las primitivas y relaciones
Los elementos bsicos de la descripcin relacional se denominan primitivas y se
caracterizan por sus atributos. Prcticamente cualquier puede ser una primitiva. En la
aplicacin de correspondencia de imgenes, las primitivas son las entidades de
correspondencia. Tmese el ejemplo de los bordes. En la siguiente figura hay dos
bordes dibujados. Supngase que se dividen los bordes en partes curvilneas, por
ejemplo con el mtodo -s descrito anteriormente. La longitud de n segmento y su
curvatura son atributos que describen adecuadamente la primitiva. Se tiene:

i = {centroide( xi , yi ), longitud (li ), curvatura(ci ), arco( i )} (Ecuacin 206)

4. Correlacin Digital de Imgenes

Pgina 100

Anlisis de imgenes basado en correlacin de imgenes


Conjunto 1

p4

Conjunto 2

q4

q9

p3

q6

q5

q10

q3

p2

p5

q8

q7

q2
q11

p1

q1

Ilustracin 51: Ejemplo de correspondencia relacional. La figura de la izquierda tiene


dos contornos de borde segmentados (conjunto 1). La figura de la derecha tienes tres
contornos (conjunto 2). La mejor representacin entre los dos conjuntos se encuentra
mediante un rbol de bsqueda.
Adems de la longitud, l, la posicin del centroide (xi, yi) y el ngulo i, correspondiente
a la longitud del arco, puede aadirse informacin adicional, como por ejemplo la
fuerza o firmeza del borde, el signo del mismo, incluso quiz informacin espectral,
aadiendo un conjunto de atributos ms enriquecido, en funcin del esquema
utilizado en la deteccin del borde. Sea un borde caracterizado como fuerte, un crculo
cerrado de radio conocido, rojo y positivo. Pueden encontrarse cientos de bordes para
hacerlos corresponder, de los cuales slo algunos son cerrados, unos pocos tienen un
radio pequeo y muchos son rojos. A mayor riqueza de la descripcin, mayor facilidad
en la correspondencia. Debera sealarse que la correspondencia puede realizarse
solamente con la descripcin de las primitivas. Los atributos deberan guardarse en un
vector, denominado vector de caractersticas, que es precisamente lo descrito en la
seccin anterior bajo el nombre de correspondencia basada en caractersticas.
Retmese de nuevo el problema de la introduccin de relaciones entre las primitivas.
En el sencillo ejemplo dibujado en la figura anterior la conexin es una relacin til,
que especifica simplemente qu segmentos estn unidos o conectados. Por ejemplo 2
est unido a 1; 5 no lo est, etc. Un ejemplo de interrelacin entre bordes podra
referirse a la posicin de 5 con respecto a las primitivas que forman el otro borde, que
puede expresarse de distintas formas. Al tratar un borde hay un sentido que es la
izquierda o la derecha del borde. Si se empieza con 1 y se sigue hasta 4 (basndose
en la conectividad), la primitiva 5 siempre estara a la izquierda. Podra introducirse
tambin una distancia, por ejemplo entre centroides. Para especificar un poco ms, la
relacin debe restringirse slo a los vecinos prximos. Se termina as con la potente
relacin de vecino.
Las relaciones se describen con el nombre de la relacin un juego de tuplas de
relacin:

(conexin)({ p2 , p1} , { p3 , p2 } , { p4 , p3 })

4. Correlacin Digital de Imgenes

(Ecuacin 207)

Pgina 101

Anlisis de imgenes basado en correlacin de imgenes


(conexin)({ p5 , p1} , { p5 , p2 } , { p5 , p3 })

(Ecuacin 208)

La relacin de vecino puede tener atributos. La distancia y la posicin (izquierda,


derecha) son atributos muy tiles, como se coment antes. Pueden combinarse
aadiendo un signo a la distancia. Una distancia negativa podra significar, por
ejemplo, que la primitiva est a la izquierda de la primitiva (con la que est conectada).

(vecino) { p5 , p1} , (dis tan cia 18)

(Ecuacin 209)

{ p , p } , (dis tan cia 12)

(Ecuacin 210)

4.6.4.2 Funcin de evaluacin


Se entiende por correspondencia de imgenes la comparacin entre dos imgenes y la
determinacin de una serie de caractersticas o detalles correspondientes,
denominados entidades. En la correspondencia relacional las entidades son las
descripciones de las primitivas y las relaciones entre ellas. La comparacin entre este
tipo de relaciones se lleva a cabo mediante una funcin de evaluacin. Por lo general
se supone que los atributos y las tuplas relacionales son independientes unas de otras.
En ese caso la medida de la semejanza entre dos descripciones relacionales se
determina sumando un nmero (costo), que expresa el grado de falta de semejanza
entre las descripciones.
La funcin de costo es cero si las dos descripciones relacionales son idnticas. Como
esta situacin raramente se presenta, hay que trabajar con la medida de la falta de
semejanza. La funcin de costo se estima bien por una medida de distancia o bien por
un mtodo probabilstico. Como ejemplo de medida de distancia puede tomarse la
diferencia absoluta entre los atributos, tanto para las primitivas como para las tuplas
relacionales. Sin embargo este mtodo sencillo tiene problemas. En primer lugar,
algunos atributos como el color son simblicos. Cmo se determina la funcin de
costo entre el rojo y el prpura? En segundo trmino los atributos tienen diferentes
unidades, por ejemplo ngulos, pxeles o milmetros cuadrados. El ltimo problema
puede resolverse normalizando los valores de los atributos de modo que todos varen
en el mismo rango de [0, 1].
Como recomiendan (Boyer y Kak, 1988), es preferible el mtodo probabilstico cuando
se trabaja con atributos de naturaleza simblica, como el color, la forma (recta, curva)
y la topologa (arriba, izquierda). En este caso, la funcin de probabilidad condicional
mide la correspondencia entre las primitivas y relaciones de dos descripciones
relacionales. Cunto ms parecidas sean las dos descripciones, ms prxima a la
unidad estar la funcin de probabilidad. Realmente lo que se computa como medida
del costo es el logaritmo negativo de la funcin de probabilidad condicional.
Vosselman amplia ms este mtodo al proponer una funcin de valor que estima el
apoyo que proporcionan a la representacin los atributos de las correspondiente
primitivas y tuplas relacionales (Vosselman, 1982).
4. Correlacin Digital de Imgenes

Pgina 102

Anlisis de imgenes basado en correlacin de imgenes


4.6.4.3 rbol de bsqueda
Despus del establecimiento de la descripcin relacional de las entidades de
correspondencia y la forma de medir el grado de semejanza, es necesario ejecutar un
esquema de correspondencia. La forma ms comn de encontrar la solucin es
mediante un rbol de bsqueda. En la Visin Computacional e Inteligencia Artificial, se
utilizan con xito tres mtodos de bsqueda (Bender, 1996).
Los rboles estn formados por nodos y arcos, que comienzan en un nodo raz, y
descienden a travs de los nodos antecesores, hasta los nodos hoja. La conexin entre
dos nodos se realiza a travs de arcos. Las primitivas {1, 2,., n} de una descripcin
relacional se denominan unidades y las primitivas de la descripcin que se quiere hacer
corresponder, es decir {q1, q2,,qn} se llaman etiquetas. La dimensin o profundidad
del rbol se define por el mximo camino con el menor curso.
El principio se ilustra en la siguiente figura. Las unidades son las primitivas de los dos
contornos de borde de la figura anterior y las etiquetas son las primitivas del segundo
conjunto. La dimensin del rbol es cinco. Se comienza expandiendo el rbol en el
primer nivel asociando unidades con etiquetas compatibles. Es decir 1 se compara con
{q1, q2,., qn}. Resulta que q3, q4, q8 tienen atributos similares y por lo tanto estas tres
etiquetas se convierten en los nodos del primer nivel. Los tres nodos se expanden en el
segundo nivel mediante la unidad de correspondencia 2. Actuando de esta manera a
travs de todas las unidades se obtiene un rbol con 120 nodos hoja que representa el
espacio de bsqueda de este problema de correspondencia, PQ.
Cada camino desde la raz a una hoja constituye una solucin. Obviamente la mayora
de las 120 soluciones son incorrectas geomtricamente. Cmo se determina la
solucin ms probable? Supngase que se determina el costo para cada
correspondencia unidad/etiqueta basndose en las diferencias entre atributos. La
suma de los costes a lo largo de un camino da el coste total. El camino con coste
mnimo representa la solucin ptima.
Hasta aqu slo se ha utilizado la descripcin de las primitivas y la correspondencia, ya
descrita, es simplemente correspondencia basada en caractersticas, realizada
mediante el uso de un rbol de bsqueda (en oposicin por ejemplo al mtodo -s). El
siguiente paso considera las relaciones entre las primitivas. Volviendo al primer nivel
debera considerarse cualquier relacin binaria (p1, p2). Existe la relacin conexin de
p2 con p1 y se debera permitir aadir al rbol las etiquetas que tuvieran la misma
relacin. En otras palabras, de las cinco etiquetas originales que se corresponden con
p2, slo una satisface la relacin de conexin y como resultado slo se expande un
nodo.
Considerando la relacin conexin en todos los nodos, se obtienen tres soluciones
como muestra la figura anterior. El costo de la solucin q4, q5, q6, q7, q10 ser el mayor
porque difieren ms los atributos entre unidades y etiquetas que en las otras

4. Correlacin Digital de Imgenes

Pgina 103

Anlisis de imgenes basado en correlacin de imgenes


posibilidades, lo que resulta evidente comparando los contornos de la figura, donde la
diferencia de forma entre los dos contornos es obvia.
Cul de las dos soluciones restantes es ms probable? Como los costos son similares,
la respuesta concluyente se obtiene usando ms informacin adicional, utilizando la
relacin vecino que an no se ha empleado. La etiqueta q10, emparejada con la unidad
p5, slo puede asociarse al camino q8, q7, q6, q5, q10 debido a la relacin vecino de p5
con p1, p2, p3. Este ejemplo tan simple demuestra claramente que puede lograrse una
correspondencia nica PQ introduciendo las relaciones adecuadas.

p1

p2

p3

q3
q9

p5

q5
q11

q5

q11

q2 q7

q1

p4

q4

q7 q7

q11

q10

q7
q2

q6

q5

q9

q10

q11

q7

q6

q1

q7

q9

q2

q5 q9

q6

q2

q5

q2

q5

q11

q1

q9

q11

q10

Ilustracin 52

Ilustracin 52: El rbol corresponde al ejemplo dibujado en la figura anterior. El


conjunto de primitivas p1, p5 (unidades) se compara con el conjunto q1,q11
(etiquetas). Se aceptan las correspondencias en funcin de las similitudes entre
atributos. nicamente satisfacen las relaciones entre las unidades aquellos nodos que
se expanden posteriormente. Por ejemplo p1 y p2 tienen una relacin de conexin. De
todas las correspondencias posibles para p2, slo q2 en la rama izquierda, satisface la
relacin con q3. Igualmente en el camino central, slo puede expandirse q5.

4. Correlacin Digital de Imgenes

Pgina 104

Anlisis de imgenes basado en correlacin de imgenes


5. Procedimiento Experimental
Una vez conocida la teora necesaria para la realizacin de nuestro proyecto, vamos a explicar
brevemente el objetivo y desarrollo de este. El objetivo principal es la elaboracin de un
programa que nos permita de forma sencilla evaluar y encontrar diferencias existentes entre
dos imgenes utilizando el mtodo de correlacin de imgenes. El programa utilizado para la
realizacin de nuestro proyecto es el MATLAB.
MATLAB es un lenguaje de alto funcionamiento que integra tanto computacin como
visualizacin y programacin. Debido a su entorno fcil de usar, los problemas y soluciones se
expresan con la notacin matemtica ms sencilla posible. Entre los usos de este programa se
encuentran los siguientes:

Matemtica y computacin.

Desarrollo de algoritmos.

Anlisis de datos, exploracin y visualizacin.

Desarrollo de aplicaciones.

Como elemento bsico, MATLAB utiliza la matriz, ya que tiene una caracterstica fundamental,
que es que no necesita dimensionamiento. A causa de esto, resuelve problemas en una
fraccin de tiempo similar al que se gastara escribiendo un programa en cualquier tipo de
lenguaje de programacin.
Su nombre proviene de Matriz Laboratorio o Laboratorio de Matrices. Se ha desarrollado
durante muchos aos debido a las aportaciones realizadas por muchos usuarios en los
entornos universitarios, ya que MATLAB es la herramienta estndar para cursos avanzados e
introductorios en matemticas, ingeniera y ciencia. En cuanto al mbito profesional, MATLAB
es utilizado en la industria como herramienta de alta productividad, desarrollo y anlisis.
El sistema MATLAB consiste en cinco partes principales:
-

Entorno de desarrollo
Se trata del conjunto de herramientas que permiten usar las funciones y archivos
del programa. Algunas de estas herramientas son interfaces grficas de usuario
que incluyen desde el escritorio de MATLAB o la ventana de comandos a algunas
libreras, que van desde funciones elementales como la suma, hasta funciones ms
complejas como la inversin de matrices.

El lenguaje MATLAB
Es un lenguaje de alto nivel que permite la programacin a pequea escala para la
creacin rpida de programas, hasta programacin a gran escala para la realizacin
de aplicaciones complejas. Se trata de un lenguaje intrprete de comandos, es
decir, es capaz de procesar de un modo secuencial una serie de comandos
previamente definidos, obteniendo el resultado inmediatamente.

5. Procedimiento experimental

Pgina 105

Anlisis de imgenes basado en correlacin de imgenes


-

Grficas.
Permite la visualizacin de grficas y vectores as como la posibilidad de incluir
leyendas en ellas, explicando y comentando lo que ocurre en estas. Su
visualizacin es tanto en 2 como en 3 dimensiones.

Interfaces Externas.
Se tratan de un conjunto de libreras que permiten que un programa en el lenguaje
MATLAB, interacte con programas escritos en C o FORTRAN.

Ayuda para MATLAB


El programa dispone de una gran documentacin tanto impresa como en lnea que
permite conocer todas las caractersticas del programa. La ayuda online se obtiene
en la barra de herramientas, pulsando en la ventana Ayuda de MATLAB, o a
travs del comando help, introducindolo en la ventana de comandos.

Una vez conocidos los puntos principales del lenguaje y del programa a utilizar, vamos a
explicar a continuacin el funcionamiento de nuestro programa:
En primer lugar, introducimos las dos imgenes que vamos a comparar. Una de ellas la
utilizaremos como Imagen Patrn, mientras que la otra ser la Imagen de Bsqueda. Como
hemos comentado anteriormente la estrategia de clculo de correspondencias que utiliza
nuestra aplicacin es la correspondencia por reas. A continuacin comentaremos las
transformaciones y clculos que realiza nuestra aplicacin.
Una vez introducidas las dos imgenes, el programa divide la Imagen Patrn en facetas. Debido
a que las imgenes introducidas pueden tener distintas dimensiones, tanto pares como
impares, utilizamos facetas de distintas dimensiones, con el objetivo de perder el mnimo de
informacin posible. Por este motivo, disponemos de 5 facetas, (2,2), (3,3), (4,4), (5,5) y (7,7).
Para que el usuario elija la faceta que ms le convengan y en la cual pierda menos informacin,
una vez elegidas las dos imgenes, se muestra en pantalla unos mensajes dicindonos cuantas
columnas y filas no evala nuestra aplicacin utilizando una faceta u otra.

Ilustracin 53. Mensajes de aviso de prdida de informacin

5. Procedimiento experimental

Pgina 106

Anlisis de imgenes basado en correlacin de imgenes

Ilustracin 54. Imagen dividida en facetas (Seleccionada primera faceta, ej. Faceta(3,3))
Una vez obtenida la primera faceta patrn, la aplicacin almacena de ella, la media aritmtica
de los pxeles que forman la faceta y la posicin exacta del pxel central (o ancla), que ser
diferente dependiendo de si utilizamos una faceta par o una faceta impar. En las pares, el pxel
central se sita en la parte inferior derecha de la faceta, mientras que en las impares, el pxel
central se sita en el medio de la faceta.

Ilustracin 55. Facetas (5,5) y (4,4) con su respectivos anclas


Una vez obtenida la faceta patrn, tenemos que buscar en la imagen de bsqueda la faceta
correspondiente. La bsqueda de esta faceta no se hace en la imagen completa, sino que se
evala en un rea cercana a la posicin de la faceta patrn. Concretamente para obtener la
faceta de bsqueda, cogemos las coordenadas de la faceta patrn y determinamos un rea
que corresponde a una faceta por encima de la faceta patrn, una faceta por debajo y una
faceta tanto por la parte izquierda como por la parte derecha de la faceta patrn.

5. Procedimiento experimental

Pgina 107

Anlisis de imgenes basado en correlacin de imgenes

Ilustracin 56. Ejemplo de la obtencin del rea de bsqueda (Faceta 3x3).


Una vez determinado el rea, se recorre este pxel por pxel y por cada faceta de bsqueda se
calcula el factor de correlacin correspondiente con su faceta patrn. El clculo de este factor
se calcula utilizando la siguiente frmula:

LR
L R

(Ecuacin 211)

El rea de bsqueda se recorre entero, y solo se guarda en la matriz el valor de la faceta que
tenga mayor correspondencia con la faceta patrn, es decir, que se guarda el valor mximo.

Ilustracin 57. Faceta de bsqueda recorriendo el rea de bsqueda (Faceta 3x3).


Una vez recorrida toda el rea de bsqueda, se evala la siguiente faceta patrn y se vuelve a
repetir el mismo proceso. El programa termina cuando la Imagen Patrn se recorre por
completo y obtenemos una matriz con los valores mximos de correlacin concretos de cada
faceta. Esta matriz no tiene el mismo tamao de las imgenes sino que depende del tamao
5. Procedimiento experimental

Pgina 108

Anlisis de imgenes basado en correlacin de imgenes


de las facetas elegidas y de las dimensiones de la Imagen Patrn. Por ejemplo, si disponemos
de una Imagen Patrn de 80x80 pxeles y elegimos una faceta de (4,4), la matriz resultante
tendr unas dimensiones de 20x20. En la posicin (1,1), estar el valor de la primera faceta
patrn, en la posicin (1,2) el de la segunda y as sucesivamente.
Con la informacin guardada, es decir, con la matriz de correlacin obtenida y con la posicin
relativa de los pxeles centrales en cada faceta, nuestra aplicacin proceder a la presentacin
de resultados de dos formas diferentes.
En la primera representacin obtenemos una imagen con un tamao reducido, dependiendo
de la faceta utilizada, donde se muestran como los pxeles se han desplazado mediante lneas
que unen las coordenadas del pxel central de la faceta patrn con las coordenadas del pxel
central de su correspondencia.

Ilustracin 58. Vectores de movimiento de una imagen de 80x80.


La segunda representacin, al igual que en la primera el tamao es reducido con respecto a las
imgenes introducidas al principio de la aplicacin. Esta representacin muestra una imagen
con diferentes colores, asignando a cada faceta un color segn un porcentaje de
desplazamiento con respecto a un desplazamiento mximo, es decir, muestra diferentes
colores por faceta patrn dependiendo si el valor del factor de correlacin es grande o
pequeo. Este grafico tiene 4 variantes segn el factor obtenido. En la siguiente tabla aparecen
los correspondientes colores segn su factor de correlacin.

5. Procedimiento experimental

Pgina 109

Anlisis de imgenes basado en correlacin de imgenes


FC (Factor de
Correlacin)

-1 < FC < -0.8

-0.8 < FC < 0

0 < FC < 0.8

0.8 < FC < 1

Color

Azul Oscuro

Azul Cyan

Amarillo

Rojo

Ilustracin 58. Facetas con su color correspondiente debido a su FC (Imagen 80x80).

5. Procedimiento experimental

Pgina 110

Anlisis de imgenes basado en correlacin de imgenes


6. Conclusiones
Para concluir quiero exponer las principales conclusiones que he obtenido durante la
realizacin del proyecto.
Como primer punto importante me gustara destacar la constante evolucin que ha tenido el
tratamiento digital de imgenes, debido en gran parte a la mejora de los dispositivos de
captacin y la velocidad de los procesadores.
El estudio realizado sobre el anlisis de imgenes me ha aportado gran cantidad de
informacin que desconoca, ya que el estudio por mi parte de esta materia haba sido muy
superficial y sin adentrarme en profundidad en el tema. Adems, he podido observar la
cantidad de campos en los que es til el tratamiento de imgenes como es la industria, la
biomedicina o la seguridad.
En cuanto al desarrollo de la aplicacin, me ha servido de gran ayuda las prcticas en
asignaturas como TDI (Tratamiento Digital de la Imagen) o sistemas de Televisin, ya que en
estas ya me haba familiarizado con el uso del programa MATLAB. An as he de afirmar que he
tenido numerosos problemas ya que aunque haba trabajado con el programa el
desconocimiento de muchos comandos y la sintaxis tan peculiar de MATLAB, me han
ocasionado algn problema.
Sin embargo, aunque la misin del proyecto se ha conseguido satisfactoriamente, me gustara
dar a conocer una serie de problemas que me han surgido y que podran mejorarse en un
futuro. El principal problema que veo a esta aplicacin, es el rendimiento que tiene. Esto se
debe en gran parte a que MATLAB es un programa interpretado, es decir que la ejecucin del
programa se traduce o interpreta comando por comando en tiempo de ejecucin a un
lenguaje intermedio o lenguaje mquina o a travs de una mquina virtual, por lo que su
funcionamiento es bastante tedioso y hablando de rapidez, es lento en comparacin con un
programa compilado. A continuacin muestro una tabla resumen, en la que se ve la duracin
que tiene el programa para imgenes con diferentes dimensiones:
Tamao de la
Imagen

40 x 40 pxeles

80 x 80 pxeles

100 x 100
pxeles

128 x 128
pxeles

Tiempo clculo
Factor de
Correlacin

81 segundos

1365 segundos

3379 segundos

9508 segundos

1,35 minutos

22,75 minutos

56,31 minutos

158 minutos

Tabla 1. Tiempo clculo Factor de Correlacin (Faceta 4x4)


Por este motivo, la principal mejora que encuentro para este proyecto es la realizacin del
mismo utilizando un programa compilado. Estos programas trabajan de la siguiente forma, una
vez que el programa est escrito, este se traduce a partir de su cdigo fuente y por medio de
un compilador, a un archivo ejecutable que pueda ser utilizado por cualquier plataforma, es
decir, un lenguaje compilado es aquel traducido por el propio ordenador y en el cual las
instrucciones generadas son interpretadas directamente por la mquina.

6. Conclusiones

Pgina 111

Anlisis de imgenes basado en correlacin de imgenes


Otro aspecto a mejorar y que tambin ocasionara cambios en el rendimiento del programa es
la optimizacin de cdigo. Como ya he dicho anteriormente, mi familiaridad con el programa
MATLAB es conocida pero breve, por este motivo considero que con una optimizacin del
cdigo utilizando los comandos de los que dispone el programa con mayor utilidad y sin utilizar
tantos bucles, se podra conseguir una mejora en el rendimiento de la aplicacin.
Tambin se podra mejorar la presentacin de resultados. Aunque en las figuras que
obtenemos podemos ver claramente los aspectos destacados de la aplicacin y la presentacin
de resultados cumplen los aspectos pedidos en el proyecto, si quiero destacar que se poda
mejorar haciendo la parte grfica ms vistosa y cmoda para el usuario.
Sin embargo, un aspecto muy importante a mejorar y que tiene gran repercusin en los
resultados obtenidos, son los valores que pueden tomar las facetas, tanto patrn como la de
bsqueda. Por ejemplo, puede pasar que una faceta sea uniforme completamente, lo que
produce que al calcular el factor de correlacin en MATLAB, obtenemos NaN (Not a number)
como resultado. Ejemplo:

4
4

Si disponemos la siguiente faceta patrn: 4

4
4

4 4 4 4
4 4 4 4
4 4 4 4 Si sustituimos los valores en las

4 4 4 4
4 4 4 4

ecuaciones 196, 197, 198, obtenemos lo siguiente:

LR
0
= NaN
L R 0

Por esta razn, para tener menor probabilidad de que aparezcan estos errores, lo mejor es
utilizar facetas ms grandes. Para imgenes de 256 x 256 pxeles, podemos utilizar fcilmente
facetas de 10x10 15x15.
En conclusin, la mejora del proyecto es fundamentalmente utilizar de forma ms eficaz el
lenguaje MATLAB e ir actualizando el proyecto en cuanto surjan nuevas tcnicas de procesado,
ya que el anlisis de imgenes es un campo en continua evolucin.

6. Conclusiones

Pgina 112

Anlisis de imgenes basado en correlacin de imgenes


7. Objetivos conseguidos
Al inicio del proyecto como objetivos principales se nos marcaba realizar una estudio terico
de las diferentes tcnicas de anlisis de imgenes, centrndonos con mayor profundidad y
mayor detenimiento en la correlacin digital de imgenes, ms concretamente en la
correspondencia por reas. Una vez realizado este estudio, se nos peda realizar un programa
en lenguaje MATLAB, usando estas tcnicas.
Tras realizar el proyecto, podemos finalizar que se han conseguido los objetivos marcados en
un principio, ya que durante todo este documento hemos realizado un exhaustivo anlisis
sobre el tratamiento digital de la imagen, centrndonos en el anlisis que era nuestro principal
objetivo. Los conocimientos sobre estas tcnicas, junto con el conocimiento del lenguaje
MATLAB, me han permitido realizar la ltima parte de los objetivos, es decir, la realizacin de
una pequea aplicacin sencilla en la cual pudiramos evaluar y detectar las diferencias y
variaciones entre dos imgenes, mostrndose el resultado de forma grfica.

7. Objetivos Conseguidos

Pgina 113

Anlisis de imgenes basado en correlacin de imgenes


8. Bibliografa
-

Apuntes de la asignatura Tratamiento Digital de la Imagen impartida por Alfonso


Martn Marcos y Jos Manuel Daz Lpez.

Proyecto fin de carrera: Control de movimiento basado en Imgenes. Camilo


Vzquez Herrero. Febrero 2012.

Proyecto fin de carera: Anlisis de Imgenes. Carlos Martn Vallinas. 2001.

Anlisis de deformaciones en probetas planas mediante correlacin digital de


imgenes. E. Lpez-Alba, F.A. Daz, R. Dorado, R. Lpez-Garca.
http://ww.uclm.es/actividades/2010/CongresolM/pdf/cdartculos/109.pdf

Lenguajes compilados vs Lenguajes interpretados.


http://www.buenastareas.com/ensayos/Lenguajes-Interpretados-Vs-LenguajesCompilados-Desidia/3427582.html

Apuntes de Fotogrametra II. Universidad de Extremadura. Apartado 8.2: Principio de


la correlacin de imgenes.
http://es.scribd.com/doc/36263964/98/Principio-de-la-correlacion-de-imagenes

Tutorial de Matlab.
http://www.usc.es/gir/docencia_files/tdd/tutorial_matlab.pdf

Tutorial de Matlab. Antonio Souto Iglesias.


http://canal.etsin.upm.es/web_cnum/main_matlab.pdf

Teora de la Imagen Digital. Javier Monedero. 2008-2009.


http://es.scribd.com/doc/67565862/15/Perturbaciones-caracteristicas-y-metodos-decorreccion

8. Bibliografa

Pgina 114

Anlisis de imgenes basado en correlacin de imgenes

Pgina 115

También podría gustarte