Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ABSTRACT OF MY PROJECT
The main objective of the project is the development of an application in MATLAB
program.
Firstly carry out a theoretical study on the topic of our project. In our case as the theme
is Picture and Television, we explain the main information about Digital Image
Processing.
Once known the main techniques used in digital images, we will make a study on
current techniques that exist about image analysis. We will give a brief explanation
showing what this technique is, the different steps that are performed on an image for
analysis, briefly explaining each of them and listing some techniques for performing
each.
After this first part, we will focus on the techniques of image correlation (DIC). We
explain how these techniques have emerged, which are the main concepts, the
beginning and the advantages and disadvantages they have.
There are different image correlation techniques. We will explain in detail the
correspondence areas, as it is the technique that we will use for the project. Explain
what it is, which is theoretically and we develop steps that must be performed on the
images for this technique. We explain what their terminology is, and what are the
possible defects that may have this technique.
Finally, having explored the theory images, we will make a simple application that
allows us to evaluate and find differences in a sequence of images. The program used
for this project is MATLAB, a mathematical program, widely used in the field of
engineering. Using this application will get two figures, one where we will see the
motion vectors between the two images and the second where we get the correlation
factor between the two images.
Anlisis de
imgenes
basado en
correlacin
de imgenes
Proyecto fin de
carrera
Eduardo Martn Pastor
Contenido
Contenido
Pgina 1
(Ecuacin 1)
Siendo x e y, las coordenadas espaciales en el plano, y f, el brillo o nivel de gris en cualquier par
de las coordenadas anteriores.
Para nuestro proyecto, como herramientas vamos a trabajar con imgenes digitales
monocromas. Sobre ellas llevaremos a cabo las tcnicas y procesos que describiremos
posteriormente.
2. Estudios Previos
Pgina 2
f ( x, y )
.....
.....
f ( N 1, 0) f ( N 1,1).... f ( N 1, M 1)
(Ecuacin 2)
Pgina 3
Ilustracin 3. Prdida de calidad de una imagen (a) por insuficiente muestreo (b) y
cuantificacin (c).
Ruido
Es una seal no deseada que se introduce en un sistema de transmisin. Puede tener diversos
orgenes pero generalmente se consideran como errores de medicin superpuestos a la
imagen. Por ejemplo, el ruido de fondo es la agitacin de electrones presentes en el canal
antes del paso de los electrones propios de la seal. La nica forma de evitar el ruido es
disminuir la capacidad del canal.
La unidad de medida del ruido son los decibelios (dB) referidos a nmeros S/N. En general
todos los dispositivos introducen cierto grado de ruido a la imagen, tanto si se ha generado
internamente o se capta por algn dispositivo. Se distinguen dos grandes tipos de ruido:
2. Estudios Previos
Pgina 4
Aliasing
Es la aparicin de fenmenos extraos que alteran notablemente el aspecto de la imagen
original, suprimiendo informacin relevante o alterando la existente hasta volverla equvoca.
Estos fenmenos se producen en el momento de la reconstruccin, por prdida o
modificacin, debido a que algunos de los componentes de la seal original estaban
comprendidos en frecuencias superiores al lmite de Nyquist y ha sido reconstruido en
frecuencias ms bajas.
Antialiasing
Son el conjunto de tcnicas que se utilizan para prevenir o disimular los defectos
comprendidos genricamente bajo la denominacin de aliasing.
Pgina 5
2.1.2.3 Preprocesamiento
Durante esta fase se llevan a cabo una serie de acciones que tienen por finalidad facilitar
el trabajo posterior; acciones tales como eliminar ruidos o calibrar adecuadamente los
rangos monocromticos y cromticos, el contraste o la definicin de las diferentes reas.
2.1.2.4 Segmentacin
Se encarga de separar la imagen en sus partes constituyentes, con lo que entramos en el
dominio del anlisis y, con ello, en el ncleo de los problemas propios del procesamiento
de imgenes. La segmentacin supone la deteccin de puntos, lneas y bordes. A partir
de este momento, se busca identificar bordes continuos, fronteras y regiones. La
segmentacin depende por lo general de la aplicacin que dicta las propiedades visuales
de los elementos de inters cuya deteccin se busca. El mtodo ms general se basa en
la deteccin de discontinuidades y el problema ms general deriva de que las
discontinuidades resultan de bordes significativos.
2.1.2.5 Representacin y descripcin
Como resultado del proceso anterior, la imagen se habr diferenciado entre pixeles
correspondientes a bordes y pixeles correspondientes a regiones. Para que estos
2. Estudios Previos
Pgina 6
2.1.3 Transformaciones
2.1.3.1 Interpolacin
Al realizar transformaciones afines a las imgenes se presentan cambios en la posicin
de los pixeles respecto a su posicin inicial en el plano imagen y por lo tanto se
requieren mtodos de interpolacin numrica para los valores de intensidad que se
asignarn a las nuevas posiciones en el plano imagen.
Relacionado con la imagen digital consiste en la creacin de nuevos pxeles a partir de
los existentes, de modo que la imagen resultante represente lo mismo que la original,
solo que con ms pxeles.
Hay tres tipos de interpolacin diferente:
1. Interpolacin del vecino ms cercano
Este es el algoritmo de interpolacin ms simple posible. La interpolacin del vecino
ms prximo selecciona el valor del pxel ms cercano redondeando las
coordenadas del punto de interpolacin deseado.
Aunque se trata de un mtodo sencillo provoca efectos indeseables en las
imgenes por lo que no se aconseja su uso para el suavizado de imgenes.
El proceso es el siguiente: se recorre pixel a pixel la imagen original y para cada
pixel crea varios iguales, segn la interpolacin que se realice, y los introduce en la
imagen definitiva.
2. Interpolacin bilineal
Es un mtodo algo ms sofisticado que el anterior. El algoritmo bilineal interpola a
partir de los cuatro pixeles adyacentes que rodean al punto deseado de
2. Estudios Previos
Pgina 7
u ( x, y ) = c1 x + c2 y + c3 xy + c4
(Ecuacin 3)
u ( x, y ) = a ji xi y i
(Ecuacin 4)
j =0 i = 0
=x=
1 255
u i n i
M N u =0
(Ecuacin 5)
2 =
2. Estudios Previos
1
M N
[ x ( i, j ) ]
(Ecuacin 6)
i =1 j =1
Pgina 8
Desviacin tpica
(Ecuacin 7)
2.1.3.2.4 Histograma
El histograma de una imagen es el grafico en el que se representan las veces que
aparece cada brillo. En el eje de abscisas del grfico se representa los distintos
brillos de la imagen y en el eje de ordenadas aparece la frecuencia relativa con la
que cada color aparece en la imagen. El histograma aporta informacin sobre el
brillo y el contraste de la imagen, pudiendo ser utilizado para ajustar estos
parmetros.
Un pico en nuestro histograma en el lado izquierdo indica un gran nmero de
pxeles que estn oscuros o negros, mientras que un pico en la parte derecha indica
un gran nmero de pxeles luminosos o blancos.
2. Estudios Previos
Pgina 9
u[m,n]
v[m,n]
u + V0
v = f (u ) = ( u a ) + va
(u b) + v
b
2. Estudios Previos
0u<a
au<b
(Ecuacin 8)
bu<L
Pgina 10
v
L
Vb
Va
0
Grfica 1
Se puede observar tres intervalos para los valores que toman los pixeles de u, la
cual es nuestra imagen original. Si tenemos un intervalo que abarca la mayor
frecuencia de aparicin, la pendiente de nuestra funcin deber ser mayor que la
unidad para que as se produzca un estiramiento.
En el caso de que un intervalo se estire, quiere decir que por otro lado, los otros
dos intervalos tienen que comprimirse, ya que el rango dinmico se mantiene
constante, es decir, siguen existiendo el mismo nmero de niveles (L+1). Esto
supone que un nmero de niveles de la variable u pasan a ocupar un nmero
menor de niveles de v.
En los niveles menos frecuentes, hay una prdida de informacin, pero no es
importante ya que la mayor parte de la informacin total se encuentra en el rango
de valores ms habituales.
2. Clipping
Se trata de un caso especial de la tcnica de ampliacin de contraste. Pueden
darse tres casos: recorte por la parte inferior, recorte por la parte superior y
recorte por ambos lados.
2. Estudios Previos
si u < a
v=0
v = f (u ) =
L (u a )
si u > a
v =
La
(Ecuacin 9)
si u < a
v=0
v = f (u ) =
L (u a )
si u > a
v =
La
(Ecuacin 10)
Pgina 11
L (u a )
v = f (u ) = v =
si a < u < b
L
si u > a
v = L
v
L
v
L
v
L
(Ecuacin 11)
Umbralizacin Inferior
Se respeta el brillo de los pxeles que alcanzan un determinado valor. Los que
tienen menor brillo que ese se colocan a blanco o a negro.
2. Estudios Previos
Pgina 12
p ( z ) = ( b 1) !
0
para z < a
(Ecuacin 12)
v
L
Grfica 3
Umbralizacin Superior
Se respeta el brillo de los pxeles que no alcanzan un determinado valor. Los que
tienen mayor brillo que ese se colocan a blanco o a negro.
v = u si u < a
v = f (u ) =
v = L si u > a
(Ecuacin 13)
v
L
Grfica 4
Binarizacin
Los pxeles cuyo nivel no superan el umbral se fuerzan a blanco y los que lo
superan, a negro. La imagen resultante de esta operacin ser una imagen binaria.
Esta binarizacin es muy interesante en ciertas aplicaciones ya que puede servir
para resaltar las partes brillantes de una imagen, que suelen corresponder a los
objetos situados sobre un fondo oscuro. Otra aplicacin bastante til de esta
operacin, es el tratamiento de imgenes que tienen carcter binario. Un ejemplo
de este tipo es un papel escrito, que al pasarlo por un scanner, puede que la
imagen obtenida no sea binaria debido a la iluminacin del fondo y al ruido
2. Estudios Previos
Pgina 13
v = 0 si u < a
v = f (u ) =
v = L si u > a
v
L
(Ecuacin 14)
Grfica 5
4. Slicing
Con el este proceso se resaltan zonas de la imagen con un brillo determinado. Lo
resaltado se puede mandar a blanco o a negro.
Esto se aplica cuando queremos destacar un determinado rango de niveles de gris
debido a que contiene informacin importante de la imagen.
Conservando el fondo:
si a < u < b
resto
L
v = f (u ) =
u
(Ecuacin 15)
v
L
Grfica 6
No conservando el fondo:
L
v = f (u ) =
u
2. Estudios Previos
si a < u < b
resto
(Ecuacin 16)
Pgina 14
Grfica 7
L
v = f (u ) =
u
si a < u < b
(Ecuacin 17)
resto
v
L
Grfica 8
5. Complementacin
Tambin conocido como brillo negativo, y consiste en sustituir cada pxel de la
imagen por su complementario.
v = f (u ) = L u
(Ecuacin 18)
v
L
Grfica 9
2. Estudios Previos
Pgina 15
v = c log(1 + u )
(Ecuacin 19)
Otro ejemplo sera para mejorar el contraste en los niveles de gris ms bajos
comprimiendo el rango de valores ms altos, por lo que este procedimiento es
muy til para mejorar el contraste en imgenes oscuras.
v
L
0
Grfica 10
7. Operacin exponencial
Produce el efecto contrario a la operacin logartmica. Su utilidad es ampliar el
rango dinmico del dispositivo de salida y obtener una mejor definicin.
La funcin utilizada para cada pxel es:
v =10u / c 1
(Ecuacin 20)
v
L
Grfica 11
2. Estudios Previos
Pgina 16
R ( x, y ) = A ( x, y ) + a
(Ecuacin 21)
Debido a este desplazamiento pueden existir pxeles cuyo valor de brillo superen el
mximo soportado por el dispositivo de salida (overflow), por lo que habr que
recortar estos valores al mximo permitido por el dispositivo. Este hecho se conoce
como saturacin y supone una prdida de informacin con respecto a la imagen
original.
Grfica 12
- Operacin resta
En esta operacin le restamos el brillo de cada pxel un valor constante,
decrementando el brillo de la imagen este determinado valor. Esto lo vemos
reflejado en el histograma que se desplaza, tantos pxeles como lo hayamos
desplazado la imagen.
2. Estudios Previos
Pgina 17
Grfica 13
- Operacin multiplicacin
Aumenta la intensidad de la imagen en un valor constante. El efecto de esta
operacin se muestra en el histograma, en el cual se produce un estiramiento hacia
la izquierda.
R ( x, y ) = b * A( x, y )
(Ecuacin 23)
v
L
Grfica 14
2. Estudios Previos
B =1
B=2
B=0.5
B<1
Ningn cambio
Se duplica el valor de gris. Los pxeles > 127 se saturan.
Se encoge a la mitad el histograma.
Sera la operacin divisin.
Pgina 18
R ( x, y ) = A ( x, y ) + B ( x, y )
(Ecuacin 24)
R ( x, y ) =
( A ( x , y ) + B ( x , y ))
2
(Ecuacin 25)
2. Estudios Previos
Pgina 19
A( x, y )
B ( x, y )
R ( x, y ) =
+ 128
2
2
(Ecuacin 26)
Si solo queremos conocer la diferencia entre las imgenes, entonces como solucin
tomamos el valor absoluto de la resta.
R ( x, y ) = abs ( A ( x, y ) B ( x, y ))
(Ecuacin 27)
En este caso si los pxeles son negros, las imgenes son iguales, por el contrario
cuando ms clara es una zona ms se diferencias las imgenes.
Pgina 20
A ( x , y ) * B ( x, y )
255
(Ecuacin 28)
- Divisin
La divisin es la operacin contraria a la multiplicacin, y por ello tambin debemos
realizar un escalado pero esta vez multiplicando por 255.
R ( x, y ) =
2. Estudios Previos
A( x, y )
*255
B ( x, y )
(Ecuacin 29)
Pgina 21
AND
OR
XOR
NOT
2. Estudios Previos
Pgina 22
1
si a z b
p( z ) = b a
0
en otro caso
(Ecuacin 30)
2 =
2. Estudios Previos
a+b
2
(Ecuacin 31)
(b a)2
12
(Ecuacin 32)
Pgina 23
Grfica 15
No es de los ms frecuentes, pero se utiliza mucho en las simulaciones.
2. Ruido gaussiano
La probabilidad de que el ruido valga z es:
1
p(z) =
e
2
( z )2
2 2
(Ecuacin 33)
p(z)
0
Grfica 16
2. Estudios Previos
Pgina 24
ae az para z a
p( z ) =
para z < a
0
(Ecuacin 34)
Con valores de media y desviacin tpica que vienen dadas por las siguientes
funciones:
1
a
2 =
1
a2
(Ecuacin 35)
(Ecuacin 36)
v
a
0
Grfica 17
4. Ruido sal y pimienta
2. Estudios Previos
Pgina 25
p ( z ) = Pb para z = b
0 en otro caso
(Ecuacin 37)
p(z)
Pb
Impulso
Pa
z
Grfica 18
Si b>a, la intensidad aparecer como un punto blanco en la imagen y a aparecer
como un punto negro.
5. Ruido Rayleingh
La probabilidad de que el ruido valga z es:
( z a )
2
( z a)e b
p( z ) = b
para z a
0 para z < a
(Ecuacin 38)
=a+
2 =
2. Estudios Previos
(Ecuacin 39)
b(4 )
4
(Ecuacin 40)
Pgina 26
Rayleigh
Pa
Grfica 19
Este ruido suele generarse en el proceso de obtencin de las imgenes.
6. Ruido gamma
La probabilidad de que el ruido valga z es:
a b z b 1e az
para z a
p ( z ) = ( b 1) !
0
para z < a
(Ecuacin 41)
2 =
b
a
(Ecuacin 42)
b
a2
(Ecuacin 43)
5
4
3
2
1
5
10
15
20
Grfica 20
2. Estudios Previos
Pgina 27
u[m,n]
v[m,n]
(Ecuacin 44)
2. Estudios Previos
Pgina 28
x 1 0 0 x
y = 0 1 Y y
0
1 0 0 1 1
Yo
(Ecuacin 45)
(Ecuacin 46)
Yo
y
Xo
Xo
x
Ilustracin 12
Tomando (x,y) como coordenadas en la imagen original e (x`,y`) como las
coordenadas en la imagen simtrica.
x= X 0 x; y= y
x 1 0
y = 0 1
1 0 0
X 0 x
0 y
1 1
(Ecuacin 47)
(Ecuacin 48)
Yo
Yo
Xo
Xo
x
x
Ilustracin 13
2. Estudios Previos
Pgina 29
x= x + x; y= y + y
(Ecuacin 49)
x 1 0 x x
y = 0 1 y y
1 0 0 1 1
(Ecuacin 50)
Yo
Yo
y
Ay
Ax
Xo
Xo
x
Ilustracin 14
3. Escalado
Es una operacin geomtrica que permite cambiar la escala de la imagen. Las
ecuaciones que describen esta operacin son las siguientes:
x= k1 x; y= k2 y
x k1
y = 0
1 0
2. Estudios Previos
0
k2
0
0 x
0 y
1 1
(Ecuacin 51)
(Ecuacin 52)
Pgina 30
K1 Y 0
Yo
y
K1 X 0
Xo
Xo
x
Ilustracin 15
4. Rotacin.
Consiste en girar la imagen un ngulo definido. Un detalle a tener en cuenta es que
la imagen puede cambiar de tamao respecto a la original con este proceso.
Deducimos la relacin entre posiciones que es:
y0 = y0 cos + x0 sen
x0 = x0 cos + x0 sen
(Ecuacin 53)
x cos
y = sen
sen x
cos y
(Ecuacin 54)
Si los nuevos ejes giran en sentido horario, la imagen gira en sentido anti horario y
viceversa. Para girar la imagen en sentido horario ser negativo.
x cos
y = sen
sen x
cos y
(Ecuacin 55)
2. Estudios Previos
Pgina 31
sen
cos
0
x 0 1
y = 1 0
0
0 y =+90
1 0 0
1
0 x
0 x
0 y
1
1
(Ecuacin 56)
Ilustracin 16
Rotacin 180 o
Al rotar una imagen 180 o, obtenemos una imagen con las mismas dimensiones
que la original pero en sentido contrario.
x cos
y = sen
1 0
sen
cos
0
0 x
0 y
1
1
x 1 0 0 x
=+1800 y = 0 1 0 y
1 0 0 1 1
(Ecuacin 57)
Ilustracin 17
2. Estudios Previos
Pgina 32
5. Inclinacin
La inclinacin transforma una regin rectangular en un romboide. Nos sirve para
simular una perspectiva.
2.1.3.7 Convolucin
1. Unidimensional
La convolucin de dos secuencias x[n] e y[n], es otra secuencia z[n] dada por la
expresin:
x [n] = x [ n] * y [ n] =
x [ n] * y [ n n]
< n < +
(Ecuacin 58)
n =
x [ n ] = x [ n ] * y [ n ] = y [ n ] * x[ n]
(Ecuacin 59)
2. Bidimensional
La convolucin de dos secuencias bidimensionales x[m,n] e y[m,n] es otra secuencia
bidimensional z[m,n] dada por la expresin:
m = n =
< n < +
< m < +
N 1
X [ k ] = x[n]e
j 2
k
n
N
, k = 0,1, 2,.( N 1)
n=0
(Ecuacin 60)
2. Estudios Previos
Pgina 33
Transformadas de la imagen
X ( ) = x[n]e jn
(Ecuacin 61)
1
jn
X ()e d
2 2
x [ n] =
(Ecuacin 62)
X ( 1 , 2 ) =
x[m, n]e
j1m j 2 m
(Ecuacin 63)
m = n =
X ( 1 , 2 ) =
X ( , ) e
( 2 )
1
jn
d1d 2
(Ecuacin 64)
22
X [ K ] = x[n]e
j 2
k
n
N
, k = 0,1, 2,.( N 1)
(Ecuacin 65)
n=0
2. Estudios Previos
Pgina 34
x [ n] =
k
j 2 n
1 N 1
N
X
[
k
]
e
, n = 0,1, 2,.
N k =0
(Ecuacin 66)
X [k , l ] = x[m, n]e
( j 2
l
k
M ) ( j 2 N )
N
M
(Ecuacin 67)
m = 0 n =0
x [ m, n] =
1
MN
M 1 N 1
X [ k , l ] e
k
l
j 2 m j 2 n
m
n
(Ecuacin 68)
k =0 l =0
Linealidad
TF { x1 [ m, n ]} = X 1[ k , l ]
(Ecuacin 69)
TF { x2 [ m, n ]} = X 2 [ k , l ]
(Ecuacin 70)
x [ m, n ] = ax1 [ m, n ] + bx2 [ m, n]
(Ecuacin 71)
X [ k , l ] = aX 1 [ k , l ] + bX 2 [ k , l ]
(Ecuacin 72)
Si:
Se cumple que:
2. Estudios Previos
Pgina 35
Translacin
Teniendo que:
TF { x1 [ m, n ]} = X 1[ k , l ]
(Ecuacin 73)
x2 [ m, n ] = x1[( m m0 ) , ( n n0 )]
(Ecuacin 74)
X 2 [ k , l ] = X 1[ k , l ]e j 2m0 e j 2n0
(Ecuacin 75)
Si se desplaza x1:
Se cumple que:
Separabilidad
T ( x ) = T ( x1 ) * T ( x2 )
-
(Ecuacin 76)
Periodicidad
Simetra conjugada
X [ k , l ] = X * [ k , l ] X ( ) = x[n]e jn
(Ecuacin 77)
Centrado de la transformada
Los valores significativos suelen estar en los extremos. Al multiplicar la imagen por
(-1)m+n antes de la transformacin, implica el centrado de la transformada:
2. Estudios Previos
Pgina 36
TF { f [ m, n ]} = F ( k , l )
TF f [ m, n ] ( 1)
-
m+n
} = F k M2 , l N2
(Ecuacin 78)
(Ecuacin 79)
Rotacin
Convolucin
Si tenemos:
TF { x1 [ m, n ]} = X 1[ k , l ]
(Ecuacin 80)
TF { x2 [ m, n ]} = X 2 [ k , l ]
(Ecuacin 81)
x1 [ m, n ] * x2 [ m, n ] = X 1 [ k , l ] X 2 [ k , l ]
(Ecuacin 82)
TF { x1 [ m, n ]} = X 1 [ k , l ]
(Ecuacin 83)
TF { x2 [ m, n ]} = X 2 [ k , l ]
(Ecuacin 84)
x1 [ m, n ] x2 [ m, n ] = X 1 [ k , l ] * X 2 [ k , l ]
(Ecuacin 85)
Entonces:
Producto
Si tenemos:
Entonces:
2. Estudios Previos
Pgina 37
Conservacin de la energa
| x | = | X |
2
xx = X X
-
(Ecuacin 86)
(Ecuacin 87)
Si:
TF { f ( x, y )} es F ( wx , wy )
(Ecuacin 88)
Entonces:
TF { f ( x, y )} =
-
1 wx wy
F ,
ab a b
xk X [kn]
2.1.3.9
(Ecuacin 89)
(Ecuacin 90)
En las operaciones de punto, cada pxel de salida depende slo de un pxel de entrada,
es decir, no tenamos en cuenta la relacin de vecindad entre pxeles.
En las operaciones de rea (filtrado espacial), el valor de un pxel depende de la
vecindad local de ese pxel.
Matemticamente podemos verlo en las siguientes funciones:
-
En operaciones de punto:
v [ m, n ] = f ( u [ m, n ]) v [ m, n ] = f (u1 [ m, n ] , u2 [ m, n ])
(Ecuacin 91)
En operaciones de rea:
2. Estudios Previos
Pgina 38
v [ m, n ] = a [ k , l ] u[m k , n l ]
(Ecuacin 93)
Uno de los dilemas que nos surgen a la hora de convolucionar una imagen con una
mscara es qu hacer con los bordes. Esta situacin puede ser resuelta de estos cuatro
modos diferentes:
1. Asignar un cero en el resultado a los pxeles donde no cabe la mscara.
2. Suponer que los pxeles que se salen tienen un valor constante (normalmente
cero).
3. Modificar el valor en los pxeles que no caben (variar el multiplicador)
4. Suponer que la imagen se pliega por los extremos.
Segn apliquemos distintos operadores de convolucin es posible obtener diferentes
efectos en nuestra imagen:
2. Estudios Previos
Pgina 39
Ilustracin 18
La descripcin prctica de este proceso sera:
1. Superponemos la mscara sobre cada punto de la imagen.
2. Sumamos los productos de los coeficientes de la mscara y los valores de
los puntos de la imagen situados bajo esta.
Segn lo dicho hasta ahora podemos entender que el efecto de este filtro ser
de suavizado, ya que los pxeles vecinos se parecern debido a la mezcla que se
produce entre ellos. Al aplicar este filtro podremos observar como la imagen
se har borrosa y las transiciones fuertes se disolvern parcialmente.
Tambin debemos decir que cuanto mayor es el tamao de la mscara, mayor
es el efecto de difuminado de la imagen.
Las ventajas son que reduce el nmero de operaciones, adems respecto al
ruido, la potencia de este se reduce en un factor igual al nmero de pxeles
que abarca la mscara, as que cuanto mayor sea el tamao de la mscara,
mejor ser la relacin seal-ruido.
-
Suavizado direccional
Como el filtro de media distorsiona la informacin de los bordes, como
solucin para reducir el empaamiento se puede usar un filtro de promediado
direccional, que consiste en calcular las medias de regiones longitudinales a lo
2. Estudios Previos
Pgina 40
Suavizado gaussiano
Consiste en aplicar un suavizado gaussiano donde se hace la media ponderada,
donde los pesos toman la forma de una campana de Gauss.
2. Estudios Previos
Pgina 41
f ( x, y ) = e ( x
+ y 2 )/ x 2
(Ecuacin 94)
Ilustracin 22
Esto se puede simplificar teniendo en cuenta que el filtro gaussiano es
separable, y podemos obtener un suavizado 2D aplicando dos mscaras
gaussianas bidimensionales, una horizontal y otra vertical.
2. Estudios Previos
Pgina 42
Ilustracin 23
En comparacin con el filtro de media para conseguir un mismo grado de
suavizado la mascara gaussiana debe ser de mayor tamao. A favor del efecto
del suavizado gaussiano podemos decir que su efecto es ms natural que el del
filtro de media, y por esto suele ser ms habitual en procesamiento y anlisis
de imgenes.
Media geomtrica
(Ecuacin 95)
Filtro de mximo
2. Estudios Previos
Pgina 43
Filtro de mnimo
Filtro de mediana
Esta es una tcnica alternativa cuando el objetivo que queremos alcanzar es
ms la reduccin del ruido que el difuminado de la imagen.
Consiste en sustituir el valor del nivel de gris de cada punto de la imagen de
entrada por el valor mediano de los puntos que estn incluidos dentro de una
ventana entorno.
v [ m, n ] = mediana {u [ m k , n l ]} , para ( k , l )W
(Ecuacin 98)
Pgina 44
2. Estudios Previos
Pgina 45
Pgina 46
u ( x ) = Prob [u = x ] =
(Ecuacin 100)
El valor de L-1 representa el nivel de gris mximo posible y viene dado por el mximo
valor de cuantificacin asignado a la escala de grises.
A partir del histograma obtenemos caractersticas de una variable aleatoria, como la
dispersin, la media, la varianza etc. Otras caractersticas importantes son la mediana y
la moda.
El proceso sera el siguiente: Se elige un tamao de ventana para la aplicacin del
clculo y dependiendo del efecto deseado, se sustituye el valor de cada pxel por el
valor de la media, moda o varianza de la ventana centrada en l, obteniendo as otra
imagen con el efecto deseado o el valor de la caracterstica extrada.
El histograma es utilizado, en la umbralizacin de imgenes, para extraer el valor
umbral y as binarizar la imagen para su segmentacin.
3. Anlisis de imgenes
Pgina 47
Bordes con transiciones abruptas, en los que hay grandes cambios de luminancia entre
pxeles adyacentes.
Bordes con transiciones progresivas, en los que los cambios de luminancia son
progresivos y la variacin entre pxeles adyacentes no es grande.
Las tcnicas empleadas en la deteccin de bordes tienen como objetivo localizar en la imagen
los pxeles en los que se produce una variacin de luminancia, empleando operadores
derivativos. Estos son bsicamente dos: Operadores de primera derivada o Gradiente y
Operadores de segunda derivada o Laplacianos. Los primeros buscan grandes picos en la
variacin mientras que los segundos, buscan pasos de respuesta positiva a negativa y viceversa
o sea el paso por cero.
3. Anlisis de imgenes
Pgina 48
f ( x, y ) = [Gx , Gy ] = [
f f
, ]
x y
(Ecuacin 101)
| f |= Gx2 + G y2
(Ecuacin 102)
G
f = tan g 1 y
Gx
(Ecuacin 103)
Pgina 49
(Ecuacin 104)
f ( x, y ) = [Gx , Gy ] = [
f f
, ]
x y
(Ecuacin 105)
Esto mismo se puede expresar a partir de sus mscaras de convolucin, una que realiza
la derivada en la direccin x, y la otra en la direccin y:
1 1
1 0
Hx =
Hy =
0 0
1 0
Ilustracin26. Mscaras de convolucin
Estas mscaras son muy sensibles al ruido por lo que se han desarrollado otros
operadores con mscaras de mayor orden que veremos a continuacin.
El proceso del clculo de la imagen gradiente se resume en la siguiente figura:
1 si g(x,y) >umbral
I ( x, y ) =
0 en otro caso
3. Anlisis de imgenes
(Ecuacin 106)
Pgina 50
1 0
0 1
Hx =
Hy =
0 1
1 0
Ilustracin 28. Operadores Roberts
3.1.3.1.2 Operador de Prewitt
Este operador utiliza mscaras de 3x3:
1 0 1
1 1
H x = 1 0 1 H y = 0
0
1 0 1
1 1
1 0 1
1 2
H x = 2 0 2 H y = 0
0
1 0 1
1 2
Hx = 2
0
0
0
1 2
2 Hy = 0
0
1
2
1
3. Anlisis de imgenes
Pgina 51
g ( x, y ) = mx { g k ( x, y )}
3. Anlisis de imgenes
(Ecuacin 107)
Pgina 52
2 f 2 f
f = 2 + 2
x
y
2
(Ecuacin 108)
Como se hizo con el gradiente, hay que hacer una aproximacin discreta de la segunda
derivada, utilizando las ecuaciones en diferencias centradas en la posicin (i,j):
2 f
= f (i + 1, j ) 2 f (i, j ) + f (i 1, j )
x 2
(Ecuacin 109)
2 f
= f (i, j + 2) 2 f (i, j + 1) + f (i, j )
y 2
(Ecuacin 110)
3. Anlisis de imgenes
Pgina 53
(Ecuacin 111)
Donde los valores de ff(i,j) y fb(i,j) son las aproximaciones anterior y posterior
respectivamente de f(i,j), considerando el ruido de dos ventanas de tamao W cada
una, a ambos lados del pxel donde se calcula la existencia de borde. Estas
estimaciones pueden ser calculadas de la siguiente forma:
f f (i, j ) =
a ( k , l ) v (i k , j l )
(Ecuacin 118)
( k ,l )W
Donde v(i,j) es la imagen, f(i,j) sumada con ruido aleatorio y a(k,l) son los coeficientes
del filtro. Adems, debe especificarse la relacin seal ruido (SNR) que se pretende
obtener. Esto puede ser expresado a travs de mscaras que dependan de la SNR
pretendida. En la figura siguiente vemos algunas de estas mscaras:
3. Anlisis de imgenes
Pgina 54
El filtro debe ser local, y tomar informacin nicamente de los puntos cercanos
al que se va a analizar
Debe ser paso banda, para reducir el nmero de frecuencias en las que se
puede producirse el cambio.
G ( x, y ) = ce
x2 + y 2
2 2
(Ecuacin 112)
H ( x, y ) = 2 (G ( x, y)* f ( x, y ))
(Ecuacin 113)
Pgina 55
SNR =
n0
f ( x)dx
(Ecuacin 114)
f ( x)dx
A f (0)
Localizacin =
n0
(Ecuacin 115)
f ( x)dx
f 2 ( x)dx
(Ecuacin 116)
Pgina 56
P=
n1
n0
(Ecuacin 117)
P=
ND
1
1
max( N1 , N D ) i =1 1 + d i2
(Ecuacin 118)
Donde:
di= menor distancia del borde i-simo al borde ideal.
= constante positiva.
Ni= nmero ideal de pxeles de borde.
Nd= nmero total de pxeles detectados.
3.1.3.6 Deteccin de lneas
La deteccin de lneas se puede considerar como una extensin de la deteccin de
bordes, ya que para ello se emplean cuatro mscaras en distintas direcciones. Las
mscaras podran ser las siguientes:
3. Anlisis de imgenes
Pgina 57
Mtodo Susan, que parte de una imagen con varios niveles de gris.
3.1.4 Texturas
Las texturas se definen como patrones visuales homogneos que se observan en ciertos tipos
de materiales como pueden ser madera, tela, piedras. Dependen del grado de resolucin de
la imagen, puesto que una imagen puede ofrecer un aspecto homogneo a cierta distancia y
sin embargo no parecerlo o tener otra textura.
La extraccin de esta caracterstica va a tener importancia en la segmentacin de imgenes
mediante texturas as como en la descripcin de regiones. El anlisis de texturas se puede
realizar por dos procedimientos:
- Anlisis Estadstico, donde se analizan los estadsticos de primer orden o
superiores, de los niveles de gris o de otra propiedad de una determinada zona de la
imagen.
- Anlisis Frecuencial, donde se realiza el estudio a partir de la transformada de Fourier.
3.1.4.1 Anlisis estadstico de texturas
3.1.4.1.1 Estadsticos de primer orden
Como en el apartado de caractersticas del histograma, a partir de l podemos obtener
propiedades que nos dan informacin sobre la textura de la imagen. Algunas de estas
son la media, que nos da una estimacin del nivel de gris de la textura o la desviacin
tpica que indica la media de la dispersin respecto al valor de la media.
3. Anlisis de imgenes
Pgina 58
P (k ) = P (i, j )
i =1 j =1
(Ecuacin 119)
| i j |= k
3.1.4.2 Anlisis frecuencial de texturas
Se realiza a partir de la transformada de Fourier. Teniendo en cuenta que la
trasformada de Fourier de la imagen f(x,y) es F(u,v) su mdulo ser:
P(u, v) =| F (u, v) |2
(Ecuacin 120)
P ( r ) = 2 P ( r , )
(Ecuacin 121)
r =0
L/ 2
P ( ) = 2 P (r , )
r =0
3. Anlisis de imgenes
(Ecuacin 122)
Pgina 59
1 si |f(x,y,t 0 ) f ( x, y, t1 ) | T
Ftot1 ( x, y ) =
0 en otro caso
(Ecuacin 123)
Los mtodos presentados tienen la ventaja de ser sencillos, sin embargo tienen varios
inconvenientes: la cmara debe estar fija y la imagen resultado indica zonas en las que existe
movimiento, pero no cuantifica ni la magnitud ni la direccin.
Existen dos grandes grupos de mtodos de obtencin del campo de velocidades, que
solucionan los problemas anteriores.
-
3. Anlisis de imgenes
Pgina 60
1 si T f(x,y)
g ( x, y ) =
0 en otro caso
(Ecuacin 124)
1 si T f(x,y)
g ( x, y ) =
0 en otro caso
(Ecuacin 125)
3. Anlisis de imgenes
Pgina 61
(Ecuacin 126)
q1 (t ) = P (i )
(Ecuacin 127)
i =1
q2 (t ) =
P(i)
i = t +1
(Ecuacin 128)
Las medias:
1 (t ) = i
i =1
3. Anlisis de imgenes
P(i)
q1 (t )
(Ecuacin 129)
Pgina 62
P(i)
i q (t )
i =t +1
(Ecuacin 130)
Y las varianzas:
t
12 = (i 1 (t )) 2
i =1
22 =
(i (t ))
2
i = t +1
(Ecuacin 131)
P(i)
q1 (i)
2
P(i)
q2 (i )
(Ecuacin 132)
W2 = q1 (t ) 12 + q2 (t ) 22
(Ecuacin 133)
Se recorre todo el rango de los niveles de gris calculndose el valor anterior y se elige
aquel umbral que minimice esta varianza.
3.2.1.4 Mtodo de Kittle- Illingoworth
Se parte de nuevo de dos gausianas de medias 12 y desviaciones 12 con unas
proporciones q1 y q2. Este mtodo se basa en minimizar la siguiente expresin:
J = P (i ) log
i =1
P (i )
f (i )
(Ecuacin 134)
Siendo:
1 1
q1
2
f (i ) =
e
2
1 i 2
q2
2
+
e
2
(Ecuacin 135)
3. Anlisis de imgenes
Pgina 63
H = pi log( pi )
(Ecuacin 136)
f (t ) =
H
Ht
log Pt
log(1 Pt )
+ 1 t
H T log(max( P0 , P1 ,....Pt )) H T log(max( Pt +1 , Pt + 2 ,....PN ))
(Ecuacin 137)
Siendo:
N
H T = Pi log( pi )
(Ecuacin 138)
i =0
t
H t = pi log( pi )
(Ecuacin 139)
i=0
Pt = Pi
(Ecuacin 140)
i =0
p (i )
PT
p (i )
1 PT
(Ecuacin 141)
H t =
i=0
P
Pi
log i
PT
PT
P
Pi
log i
i = 0 1 PT
1 PT
(Ecuacin 142)
H T =
(Ecuacin 143)
Al igual que el mtodo anterior hay que maximizar la suma de las dos entropas:
H t + HT
3. Anlisis de imgenes
(Ecuacin 144)
Pgina 64
1 R a f r ( x, y ) Rb
1 G f ( x, y ) G
v
b
g ( x, y ) = a
1 B a f a ( x, y ) Bb
0 en cualquier caso
(Ecuacin 145)
Donde fr(x,y), fg(x,y) y fb(x,y) son las funciones que dan los niveles de rojo, verde y azul
de cada uno de los puntos de la imagen. Se hara la umbralizacin para cada una de
ellas y a partir de los resultados individuales, operados a travs de la operacin lgica
AND se obtendran los pxeles que cumplen la condicin para ese color ya que los
pxeles que interesan son lo que han pasado la umbralizacin para las tres
componentes.
Al cambiar la iluminacin existe un problema en el espacio RGB ya que cambian los
niveles de cada componente. Para solucionar este problema trabajaremos
relacionando las componentes ya que si una componente sube o disminuye por efecto
de la iluminacin, las otras lo harn en la misma proporcin, por lo que sus cocientes
sern constantes. La nueva funcin ser de la siguiente forma:
1 R a f r ( x, y ) Rb
1 G f g ( x, y ) G
a
b
f r ( x, y )
g ( x, y ) =
1 B f a ( x, y ) B
a
b
f r ( x, y )
0 en cualquier caso
3. Anlisis de imgenes
(Ecuacin 146)
Pgina 65
3. Anlisis de imgenes
Pgina 66
K =1
K =2
K =2
S ( x1 , x2 ,...., N ) = | g ( xk ) | a | ( x k ) ( xk 1 ) | d ( xk , xk 1 )
(Ecuacin 147)
Donde xk, K=1,., N representan los nodos, es decir los pxeles pertenecientes al
borde; d(x,y) es la distancia entre dos nodos x e y. |g(xk)|, (xk) son el mdulo y el
ngulo del gradiente de nodo en la posicin xk; y los parmetros y son constantes
no negativas. Teniendo en cuenta esta definicin, se dice que el camino que conecta
los N nodos, es ptimo cuando la funcin S sea mxima.
( xN , N ) = mx {S ( x1 ,..., xN , N )}
3. Anlisis de imgenes
(Ecuacin 148)
Pgina 67
3. Anlisis de imgenes
Pgina 68
El proceso por tanto se puede resumir como que la descripcin de una regin se
compara con la de otra adyacente. Si coinciden, se unen las regiones y se computa el
nuevo descriptor de la regin. En caso contrario, las regiones se marcan como que no
pueden unirse y el proceso contina.
3. Anlisis de imgenes
Pgina 69
A B = { x | x A x B}
(Ecuacin 149)
A B = { x | x A y x B}
(Ecuacin 150)
A = { x | x = a, para todo a A }
(Ecuacin 151)
A B = A BC
(Ecuacin 152)
Reflexin:
Diferencia entre A y B
Av = { x | x = a + v, para todo a A}
(Ecuacin 153)
A
xB
Resta de Minkowki: AB =
(Ecuacin 154)
A
xB
(Ecuacin 155)
3. Anlisis de imgenes
Pgina 70
Ilustracin 38
La forma de operar con un elemento estructural es la siguiente:
Desplazar B por todas las posiciones del espacio E en el que se encuentra el conjunto a
estudiar A: Bx B( x , y )
3. Anlisis de imgenes
Pgina 71
Ilustracin 39
Para realizar la erosin habra que recorrer la imagen pxel a pxel, y en cada pxel a su
vez recorrer todo el elemento estructural, por ello se dar la definicin de la erosin,
en funcin de la Resta de Minkowski, ms fcil de implementar:
AB = Ab
bB
(Ecuacin 156)
(Ecuacin 157)
Invariante a traslaciones
Ax B = ( AB ) x
(Ecuacin 158)
ABx = ( AB ) x
(Ecuacin 159)
A C AB CB
(Ecuacin 160)
Creciente:
( A C )B = ( AB ) (CB )
3. Anlisis de imgenes
(Ecuacin 161)
Pgina 72
( A C )B ( AB ) (CB )
(Ecuacin 162)
3.3.1.2 Dilatacin
Es el crecimiento progresivo de uno de los campos. Si un elemento del campo que
crece tiene un vecino del campo contrario, este ltimo se convierte al campo que se
dilata. Si el vecino es del mismo campo el elemento no se altera.
Se define la dilatacin de A por B como: ( A, B ) = { x | Bx A 0}
Ilustracin 40
La dilatacin se expresa en funcin de la Suma de Minkowski. De esta forma, queda
expresada como la unin de traslaciones de A por los elementos de B.
A B = Ax
(Ecuacin 162)
xB
3.3.1.2.1 Propiedades
Conmutativa:
A B = B A
(Ecuacin 163)
A ( B C ) = ( A B) C
(Ecuacin 164)
Asociativa:
Invariante a traslaciones:
Ax B = ( A B ) x
(Ecuacin 165)
3. Anlisis de imgenes
Pgina 73
Creciente:
A C A B C B
(C B) A = ( A B) ( A C )
(Ecuacin 168)
( A B) C = ( A C ) ( B C )
(Ecuacin 167)
(Ecuacin 169)
(Ecuacin 170)
( A B) C ( A C ) ( B C )
(Ecuacin 170)
A ( B C ) ( A B) ( A C )
(Ecuacin 171)
( AB)C = AC B
(Ecuacin 171)
( A B)C = AC B
(Ecuacin 172)
A B = { x | Bx1 A; Bx 2 AC }
3. Anlisis de imgenes
(Ecuacin 173)
Pgina 74
A B = ( AB ) B
(Ecuacin 174)
El efecto ser el suavizado de los contornos de los objetos, rotura de enlaces delgados,
y descomposicin de objetos, entre otros efectos.
3.3.1.5 Cierre (Closing)
Consiste en una dilatacin, seguida de una erosin.
A B = ( A B)B
(Ecuacin 175)
( A) = A ( AB)
(Ecuacin 176)
P( A) = ( A B) A
(Ecuacin 177)
3. Anlisis de imgenes
Pgina 75
AB = A ( A B) = A ( A B)C
(Ecuacin 178)
A() B = A ( A B)
(Ecuacin 179)
S ( A) = S k ( A)
k =0
(Ecuacin 180)
Con:
K
S k ( A) = {( AkB ) [( AkB) B ]}
(Ecuacin 181)
k =0
3. Anlisis de imgenes
Pgina 76
(Ecuacin 182)
X 4 = ( A B) B
(Ecuacin 183)
( f b)( s, t ) = mx { f ( s + x, t + y ) b( x, y ) | ( s + x, t + y ) D f ; ( x, y ) Db }
(Ecuacin 185)
3. Anlisis de imgenes
Pgina 77
f b = ( f b) b
(Ecuacin 186)
( f b) C = f C b
(Ecuacin 187)
Es invariante a traslaciones.
Las limitaciones en los ngulos posibles slo estn condicionadas por el
mtodo de segmentacin utilizado.
Es invariante a rotaciones.
3. Anlisis de imgenes
Pgina 78
(Ecuacin 188)
Para representar dicha regin de forma ms efectiva existen una serie de mtodos, de los
cuales vamos a ver algunos a continuacin.
3.4.2.1 Cdigos de longitud variable
Una regin o imagen binaria pude ser vista como una sucesin en la que se alternan
series de ceros y unos. Si se considera que el objeto, codificado con unos, ocupa en la
mayora de los casos un espacio en la imagen inferior al que ocupa el fondo. Si se
codifica exclusivamente las cadenas de unos consecutivos se minimizarn el espacio de
memoria ocupado por la imagen. De esta forma, se codificar el comienzo de las
cadenas de unos y la longitud de esas cadenas.
3.4.2.2 Proyecciones
Una regin puede representarse por sus proyecciones. En general, la proyeccin de
una imagen sobre una recta consiste en obtener para cada punto de ella, el nmero de
pixeles que pertenecen a la perpendicular que pasa por ese punto.
3. Anlisis de imgenes
Pgina 79
Diam(C ) = mx[ D ( pi , p j )]
(Ecuacin 189)
Donde D es la distancia entre dos puntos del contorno C y pi y pj, dos puntos
pertenecientes al contorno. La lnea que une los dos puntos del dimetro llamada eje
mayor del contorno tambin es un descriptor til.
3.4.3.3 Esquinas
La curvatura a lo largo del borde de un objeto se define:
2
d2 y d2x
| k (t ) | = 2 + 2
dt dt
2
(Ecuacin 190)
Son declarados esquinas aquellos puntos donde la funcin k(t) toma valores elevados,
quedando as el objeto definido por sus esquinas.
3.4.3.4 Descriptores de Fourier
Consiste en el clculo de la transformada de Fourier de un conjunto de pxeles.
Considerando el significado de la transformada, si hay contenido en alta frecuencia
significa que hay cambios rpidos en la coordenada correspondiente y que si hay
contenido en baja frecuencia significa que el contorno vara de forma suave. Dicho de
otra forma, las componentes de baja frecuencia capturan la forma general del
contorno y las de alta frecuencia capturan los detalles. Esto implica que si se realiza un
filtrado paso bajo de los descriptores de Fourier de un contorno sera equivalente a
suavizar este contorno.
3. Anlisis de imgenes
Pgina 80
A = f ( x, y )
x =0 y =0
(Ecuacin 191)
C=
P2
A
(Ecuacin 192)
3.4.4.5 Texturas
Algunas regiones pueden ser descritas como en el apartado referente a texturas,
donde fueron obtenidas a partir de mtodos estadsticos o frecuenciales.
3. Anlisis de imgenes
Pgina 81
4.2 Antecedentes.
Remontndonos a los primeros trabajos relacionados con este tema, la correspondencia de
imgenes o matching de imgenes tiene una larga historia. Los primeros experimentos datan
de los aos cincuenta, especialmente con Hobrough (1959) que plante una solucin de
naturaleza analgica, en la que los correladores, realizados mediante hardware comparaban
los niveles de gris de dos imgenes. Wild Heerbrugg, entonces el fabricante lder en equipos
fotogrmetricos, present un correlador en el congreso de la ISPRS en 1968, que a pesar de su
innovacin no tuvo mucho xito, ya que no era muy flexible ni exacto.
Desde los primeros aos de los setenta hasta mediados de los ochenta, la investigacin relativa
a la correspondencia de imgenes se centr en las tcnicas de la correlacin digital. Kreiling
(1976) fue uno de los primeros pioneros en aplicar correlacin digital para generar Modelos
Digitales de Elevacin (MDE) y ortofotos digitales. Los intentos continuaron aadiendo tcnicas
de correlacin a los instrumentos (Helava, 1978) y (Hoborough, 1978), sin embargo, no se
encontr una solucin universal a pesar del esfuerzo realizado. Todo esto produjo que los
investigadores de muy diversas disciplinas no dieran crdito a la facilidad con que una persona
encontraba puntos homlogos y la dificultad tan enorme de que la misma tarea la realizase un
ordenador. Hoy, se sabe que la visin estereoscpica natural no utiliza la correlacin de niveles
de gris tal y como fue puesto de manifiesto por Grimson (1981) y Horn (1983). Como puede
observarse, esto pone de manifiesto la subestimacin de la complejidad de las tareas visuales
que las personas resuelven con gran facilidad.
Pgina 82
Entidad de correspondencia
Es la parte de la imagen (primitivas), que se compara con primitivas de otras imgenes
para buscar entidades homlogas. Las primitivas incluyen niveles de gris, elementos
extrados y descripciones simblicas.
- ndice de semejanza
Es una medida cuantitativa de lo buena que es la correspondencia de las entidades
entre s. En su forma ms simple puede ser el coeficiente de correlacin cruzado o la
desviacin tpica en la correspondencia por mnimos cuadrados. Cuanto mayor es este
valor, mayor es la correspondencia entre imgenes.
- Mtodo de correspondencia
Calcula el ndice de semejanza entre entidades homlogas. Habitualmente la
descripcin del mtodo se aade tras el nombre de la entidad de correspondencia, por
ejemplo correspondencia por reas, correspondencia basada en caractersticas y
correspondencia relacional (simblica).
- Estrategia de correspondencia
Se utiliza para referirse al esquema en el cual nos vamos a basar, para obtener la
solucin del problema de correspondencia de imgenes. Abarca el anlisis del entorno
de correspondencia, la seleccin del mtodo para la misma y el correspondiente
control de calidad de la ejecucin.
A continuacin, vamos a relacionar los conceptos anteriores con los tres mtodos de
correspondencia ms conocidos.
La correspondencia por reas se asocia con la correspondencia entre niveles de gris, es decir se
compara la distribucin del nivel de gris en pequeas reas de la imagen, denominadas teselas
o facetas de imagen, y la semejanza se calcula mediante tcnicas de correlacin o de mnimos
cuadrados.
La correspondencia basada en caractersticas se usa fundamentalmente en la Visin
Computacional. Con objeto de determinar las caractersticas homlogas se comparan los
bordes u otros elementos derivados de las imgenes originales. La semejanza, por ejemplo en
la forma, carcter y fuerza de los bordes se mide mediante una funcin de costo.
El tercer mtodo, correspondencia simblica, se refiere a aquellos mtodos que comparan
descripciones simblicas de las imgenes y miden la semejanza mediante una funcin de
4. Correlacin Digital de Imgenes
Pgina 83
Mal condicionamiento
Una imagen se caracteriza por su debilidad geomtrica y radiomtrica. Esta debilidad
se concreta en la posibilidad de que al buscar el punto homlogo exista.
Pgina 84
Zonas ocultas. Por ejemplo, en zonas urbanas, el punto homlogo puede no ser
visible y sin embargo, la mscara de correlacin dar un mximo. Es necesario el
empleo de ms imgenes y / o ampliar el recubrimiento.
Pgina 85
Ilustracin 41
Diferencia de ngulos de rotacin entre las dos imgenes. Efecto causado por la diferencias de
rotacin entre las imgenes, debido a que una de las imgenes rota alrededor de un eje y la
otra alrededor de otro distinto.
Ilustracin 42
Distorsin geomtrica causada por la inclinacin. Como se observa en la figura una inclinacin
de la superficie provoca un acortamiento o reduccin de la misma. Al inclinarse ms la
superficie, llega a alcanzarse un ngulo crtico para el que no se ve la imagen derecha,
llegndose a la situacin de oclusin. Observando la figura se evidencia otra consecuencia
producida por la inclinacin de la superficie: la resolucin decrece en la direccin
perpendicular al eje de rotacin.
Pgina 86
Ilustracin 43
Distorsin geomtrica debida al relieve. Como se vio antes, las teselas imgenes de posiciones
homlogas se proyectan sobre la tesela superficial montaosa. Como podemos observar en la
siguiente figura, los pxeles individuales no son conjugados ni siquiera en el caso de un par
estereoscpico estrictamente vertical.
Ilustracin 44
Se han analizado el efecto de las distorsiones geomtricas sobre las teselas de la imagen que
se usan como entidades en la correspondencia por reas. Generalmente, el mtodo de
correspondencia por reas no se ve afectado por las distorsiones de relieve, sin embargo son
muchos ms sensibles a la mayora de distorsiones geomtricas. Por ejemplo, la
correspondencia de bordes es tremendamente sensible a las distorsiones geomtricas.
Cualquier variacin en la posicin del punto de vista provocar que el borde sufra
desplazamiento e incluso deformacin lo que complicar su correspondencia.
Pgina 87
Ilustracin 45
Independientemente del clculo utiliza para el ndice de semejanza, a continuacin vamos a
tratar una serie de conceptos que debemos tener claros.
-
Pgina 88
Criterios de tolerancia
Deben analizarse los factores que aparecen en la medida de la semejanza, entre el
patrn y la ventana de correspondencia. El criterio de aceptacin cambia, incluso
dentro de la misma imagen, por lo que los valores umbral u otros deberan definirse
localmente, umbrales adaptativos.
Control de calidad
El control de la calidad incluye una valoracin de la precisin y de la exactitud de las
posiciones homlogas o conjugadas. Adems debe estudiarse la consistencia de los
puntos correspondientes, incluyendo su adecuacin a las expectativas o el
conocimiento sobre el espacio objeto.
4.6.1 Correlacin
La idea es medir el grado de semejanza del patrn con la ventana de correspondencia
calculando el factor de correlacin cruzado.
El coeficiente de correlacin se define como:
LR
L R
(Ecuacin 193)
L,
R,
Pgina 89
L =
R =
LR
=
n
i =1
j =1
gL
=
i =1
j =1
gR
=
i =1
j =1
g L ( xi , yi )
nm
g R ( xi , yi )
nm
i =1
j =1
( g L ( xi , yi ) g L ) 2
n m 1
i =1
j =1
( g R ( xi , yi ) g R ) 2
n m 1
(( g R ( xi , yi ) g R ) 2 ( g L ( xi , yi ) g L ) 2 )
n m 1
(Ecuacin 194)
(Ecuacin 195)
(Ecuacin 196)
(Ecuacin 197)
(Ecuacin 198)
El factor de correlacin cruzado se determina dentro del espacio de bsqueda para cada
posicin f,c de la ventana de correspondencia. El problema siguiente es determinar qu
posicin u,v proporciona el mximo factor de correlacin.
El factor de correlacin mximo cruzado normalizado toma valores en el intervalo [-1, 1]. Se
obtiene un valor igual a la unidad si el patrn y la ventana de correlacin son idnticos. Si no
existe correlacin entre las dos teselas de imagen, es decir si no hay coincidencia en absoluto,
entonces =0. El valor =-1 indicara una correlacin inversa, como en el caso de la diapositiva
y el negativo de la misma imagen.
Si se reduce la ventana de bsqueda en base a alguna restriccin geomtrica, los valores de
los factores de correlacin pueden ser dibujados entonces en un grfico como el de la
ilustracin 46. El mximo se halla ajustando un polinomio, por ejemplo una parbola, a los
valores de correlacin. Se hace notar que el mximo raramente coincide con los valores
enteros de la direccin o posicin del pxel.
Pgina 90
Ilustracin 46
Procedimiento
El procedimiento descrito a continuacin describe los pasos generales en una
correspondencia por reas con la correlacin como ndice de semejanza.
1. Seleccionar el centro del patrn de la imagen.
2. Determinar las ubicaciones aproximadas de las posiciones homlogas en la otra
imagen.
3. Determinar tanto para el patrn como para la ventana de correlacin los tamaos
mnimos que cumple con el criterio de unicidad. Elegir el mayor de los dos valores
como tamao de la ventana para la posicin actual de correspondencia.
4. Calcular los coeficientes de correlacin f,c con la ecuacin anterior para todas las
posiciones f,c de la ventana de correlacin en la ventana de bsqueda.
5. Analizar los factores de correlacin. Debe alcanzarse un valor umbral mnimo para
que la correspondencia sea vlida. Adems del mximo debe determinarse ste
de modo inequvoco como un ndice de la calidad de medida.
6. Repetir los pasos 2-5 para una nueva posicin del patrn hasta que se haya hecho
la correspondencia en todas las posiciones.
7. Analizar los resultados de la correspondencia con una visin global para
determinar la consistencia y la compatibilidad con el conocimiento a priori de la
escena o imagen.
Pgina 91
F ( x , y ) + v = G ( x, y )
(Ecuacin 199)
p (v) N (v;0; v )
(Ecuacin 200)
F ( x , y ) + v = G ( x, y )r1 r0
(Ecuacin 201)
x x0 y0 0 0 1 0
y = 0 0 x y 0 1
0
0
(Ecuacin 202)
(Ecuacin 203)
Pgina 92
r0
r
1
da
db
[ F ( x , y ) G( x, y )] + v = 1 G 0 ( x, y) Gx x Gx y Gy x Gy y Gx Gy
dd
de
x
y
(Ecuacin 204)
donde los trminos Gx y Gy representan las derivadas parciales y discretizadas de la
imagen en la direccin X y en la direccin Y, respectivamente. Es decir, los trminos Gx
se obtienen restando dos a dos los niveles de gris de dos columnas contiguas de la
mscara y los trminos Gy se obtienen restando dos a dos los niveles de gris de dos
filas adyacentes contiguas de la mscara. Una mscara de n x n pxeles permite formar
un sistema de (n-1) x (n-1) ecuaciones.
El modelo puede y suele si suponemos que:
-
[ F ( x , y ) G ( x, y)] + v = Gx
x
Gy
y
(Ecuacin 205)
Pgina 93
Pgina 94
Pgina 95
Ilustracin 47
Pgina 96
Pgina 97
Pgina 98
Pgina 99
Ilustracin 50
La incorporacin de las relaciones entre entidades mejora el procedimiento de
correspondencia, con lo que podemos hablar de correspondencia de caractersticas
relacionales, correspondencia por reas relacional o bien simplemente correspondencia
relacional.
La correspondencia relacional proporciona un mecanismo para considerar las relaciones entre
las entidades de correspondencia. Puede definirse como la bsqueda de la mejor
representacin entre dos descripciones relacionales (Vosselman, 1982). Este esquema de
correspondencia ms general ha sido desarrollado por investigadores en Visin
Computacional, por ejemplo (Shapiro y Haralick, 1987) y (Boyer y Kalk, 1998) presentndose
en forma de etiquetado o clasificacin consistente, relajacin y correspondencia estructural.
En aplicaciones fotogramtricas se ha usado con xito en los ltimos tiempos la
correspondencia relacional, (Vosselman, 1994), (Zilberstein, 1992), (Cho, 1996) y (Wang, 1996).
En la correspondencia relacional deben considerarse tres aspectos igualmente importantes: la
descripcin, la funcin de evaluacin y el rbol de bsqueda.
4.6.4.1 Descripcin de las primitivas y relaciones
Los elementos bsicos de la descripcin relacional se denominan primitivas y se
caracterizan por sus atributos. Prcticamente cualquier puede ser una primitiva. En la
aplicacin de correspondencia de imgenes, las primitivas son las entidades de
correspondencia. Tmese el ejemplo de los bordes. En la siguiente figura hay dos
bordes dibujados. Supngase que se dividen los bordes en partes curvilneas, por
ejemplo con el mtodo -s descrito anteriormente. La longitud de n segmento y su
curvatura son atributos que describen adecuadamente la primitiva. Se tiene:
Pgina 100
p4
Conjunto 2
q4
q9
p3
q6
q5
q10
q3
p2
p5
q8
q7
q2
q11
p1
q1
(conexin)({ p2 , p1} , { p3 , p2 } , { p4 , p3 })
(Ecuacin 207)
Pgina 101
(Ecuacin 208)
(Ecuacin 209)
(Ecuacin 210)
Pgina 102
Pgina 103
p1
p2
p3
q3
q9
p5
q5
q11
q5
q11
q2 q7
q1
p4
q4
q7 q7
q11
q10
q7
q2
q6
q5
q9
q10
q11
q7
q6
q1
q7
q9
q2
q5 q9
q6
q2
q5
q2
q5
q11
q1
q9
q11
q10
Ilustracin 52
Pgina 104
Matemtica y computacin.
Desarrollo de algoritmos.
Desarrollo de aplicaciones.
Como elemento bsico, MATLAB utiliza la matriz, ya que tiene una caracterstica fundamental,
que es que no necesita dimensionamiento. A causa de esto, resuelve problemas en una
fraccin de tiempo similar al que se gastara escribiendo un programa en cualquier tipo de
lenguaje de programacin.
Su nombre proviene de Matriz Laboratorio o Laboratorio de Matrices. Se ha desarrollado
durante muchos aos debido a las aportaciones realizadas por muchos usuarios en los
entornos universitarios, ya que MATLAB es la herramienta estndar para cursos avanzados e
introductorios en matemticas, ingeniera y ciencia. En cuanto al mbito profesional, MATLAB
es utilizado en la industria como herramienta de alta productividad, desarrollo y anlisis.
El sistema MATLAB consiste en cinco partes principales:
-
Entorno de desarrollo
Se trata del conjunto de herramientas que permiten usar las funciones y archivos
del programa. Algunas de estas herramientas son interfaces grficas de usuario
que incluyen desde el escritorio de MATLAB o la ventana de comandos a algunas
libreras, que van desde funciones elementales como la suma, hasta funciones ms
complejas como la inversin de matrices.
El lenguaje MATLAB
Es un lenguaje de alto nivel que permite la programacin a pequea escala para la
creacin rpida de programas, hasta programacin a gran escala para la realizacin
de aplicaciones complejas. Se trata de un lenguaje intrprete de comandos, es
decir, es capaz de procesar de un modo secuencial una serie de comandos
previamente definidos, obteniendo el resultado inmediatamente.
5. Procedimiento experimental
Pgina 105
Grficas.
Permite la visualizacin de grficas y vectores as como la posibilidad de incluir
leyendas en ellas, explicando y comentando lo que ocurre en estas. Su
visualizacin es tanto en 2 como en 3 dimensiones.
Interfaces Externas.
Se tratan de un conjunto de libreras que permiten que un programa en el lenguaje
MATLAB, interacte con programas escritos en C o FORTRAN.
Una vez conocidos los puntos principales del lenguaje y del programa a utilizar, vamos a
explicar a continuacin el funcionamiento de nuestro programa:
En primer lugar, introducimos las dos imgenes que vamos a comparar. Una de ellas la
utilizaremos como Imagen Patrn, mientras que la otra ser la Imagen de Bsqueda. Como
hemos comentado anteriormente la estrategia de clculo de correspondencias que utiliza
nuestra aplicacin es la correspondencia por reas. A continuacin comentaremos las
transformaciones y clculos que realiza nuestra aplicacin.
Una vez introducidas las dos imgenes, el programa divide la Imagen Patrn en facetas. Debido
a que las imgenes introducidas pueden tener distintas dimensiones, tanto pares como
impares, utilizamos facetas de distintas dimensiones, con el objetivo de perder el mnimo de
informacin posible. Por este motivo, disponemos de 5 facetas, (2,2), (3,3), (4,4), (5,5) y (7,7).
Para que el usuario elija la faceta que ms le convengan y en la cual pierda menos informacin,
una vez elegidas las dos imgenes, se muestra en pantalla unos mensajes dicindonos cuantas
columnas y filas no evala nuestra aplicacin utilizando una faceta u otra.
5. Procedimiento experimental
Pgina 106
Ilustracin 54. Imagen dividida en facetas (Seleccionada primera faceta, ej. Faceta(3,3))
Una vez obtenida la primera faceta patrn, la aplicacin almacena de ella, la media aritmtica
de los pxeles que forman la faceta y la posicin exacta del pxel central (o ancla), que ser
diferente dependiendo de si utilizamos una faceta par o una faceta impar. En las pares, el pxel
central se sita en la parte inferior derecha de la faceta, mientras que en las impares, el pxel
central se sita en el medio de la faceta.
5. Procedimiento experimental
Pgina 107
LR
L R
(Ecuacin 211)
El rea de bsqueda se recorre entero, y solo se guarda en la matriz el valor de la faceta que
tenga mayor correspondencia con la faceta patrn, es decir, que se guarda el valor mximo.
Pgina 108
5. Procedimiento experimental
Pgina 109
Color
Azul Oscuro
Azul Cyan
Amarillo
Rojo
5. Procedimiento experimental
Pgina 110
40 x 40 pxeles
80 x 80 pxeles
100 x 100
pxeles
128 x 128
pxeles
Tiempo clculo
Factor de
Correlacin
81 segundos
1365 segundos
3379 segundos
9508 segundos
1,35 minutos
22,75 minutos
56,31 minutos
158 minutos
6. Conclusiones
Pgina 111
4
4
4
4
4 4 4 4
4 4 4 4
4 4 4 4 Si sustituimos los valores en las
4 4 4 4
4 4 4 4
LR
0
= NaN
L R 0
Por esta razn, para tener menor probabilidad de que aparezcan estos errores, lo mejor es
utilizar facetas ms grandes. Para imgenes de 256 x 256 pxeles, podemos utilizar fcilmente
facetas de 10x10 15x15.
En conclusin, la mejora del proyecto es fundamentalmente utilizar de forma ms eficaz el
lenguaje MATLAB e ir actualizando el proyecto en cuanto surjan nuevas tcnicas de procesado,
ya que el anlisis de imgenes es un campo en continua evolucin.
6. Conclusiones
Pgina 112
7. Objetivos Conseguidos
Pgina 113
Tutorial de Matlab.
http://www.usc.es/gir/docencia_files/tdd/tutorial_matlab.pdf
8. Bibliografa
Pgina 114
Pgina 115