0 Cap2 Transformaciones

Captulo 2
Representacin de imgenes digitales
2.1 Representacin de una imagen digital: matrices vinculadas.

Vamos a considerar un modelo de imagen simple segn el cual la imagen viene dada por una funcin
de intensidad luminosa bidimensional f(x,y), donde el valor f(x,y) nos da la intensidad luminosa de la
imagen en el punto (x,y). Como la luz es una forma de energa, f(x,y)[0, ).
La imagen percibida por una persona procede de la luz reflejada por los objetos que la
componen. La intensidad luminosa f(x,y) se puede caracterizar por dos componentes:
a) La cantidad de luz incidente en la escena visualizada (iluminacin), que representaremos
por i(x,y)[0, ). Esta componente viene determinada por la fuente luminosa. Por ejemplo, el nivel
de iluminacin en una oficina comercial es de unas 100 candelas-pies.
b) La cantidad de luz reflejada por los objetos de la escena (capacidad reflectora), que
representaremos por r(x,y)[0,1], donde el valor 0 representa absorcin total y el valor 1 reflexin
total. Esta componente viene determinada por las caractersticas de los objetos de la escena. Por
ejemplo, el acero tiene 0.65 y la nieve 0.93.
Aqu el trmino imagen se refiere a la funcin bidimensional f(x,y) que representa la
intensidad luminosa en el punto (x,y), y viene dada por
f(x,y)=i(x,y) r(x,y)
Para procesar una imagen por ordenador se debe discretizar (digitalizar) tanto espacialmente
como en intensidad luminosa. La digitalizacin de la coordenada espacial (x,y) se llama muestreo de
la imagen y la digitalizacin de la intensidad luminosa se llama cuantificacin del tono de gris.
Llamaremos tono o nivel de gris de una imagen monocromtica en el punto (x,y) a la
intensidad luminosa de la misma el punto (x,y). El nivel de gris estar comprendido entre un valor
mnimo Lmin y un valor mximo Lmax. Al intervalo [Lmin, Lmax] lo llamaremos la escala de gris.
Para obtener la digitalizacin de una imagen analgica se realiza un muestreo sobre ella
utilizando una rejilla o plano cuadriculado, donde cada regin es representada por un punto (pxel)
cuyo nivel de gris es el valor, de un conjunto finito de valores, que mejor representa a los tonos de
gris de dicha regin. Si la imagen es rectangular y la rejilla cuadriculada se obtiene un conjunto de
MN valores discretos que corresponden a los tonos de gris de cada uno de los pxeles obtenidos por
el proceso de muestreo, expresados por la siguiente matriz:
f (1, N ) ... f (m, N ) ... f (M , N )

... ... ... ... ...
f (1, n) ... f (m, n) ... f ( M , n)

... ... ... ... ...
f (1,1) f (m,1) f ( M ,1)
... ...
en la que hemos utilizado una representacin cartesiana en lugar de matricial, pues m representa la
columna y n la fila.
Por lo tanto, una imagen digital es una funcin cuyo dominio es un conjunto discreto
D = {(i,j) : i=1,2,...,M, j=1,2,...,N }
y cuyo rango es el conjunto
R = {0, 1, 2,..., L-1 }.
Los valores de M y N y el nmero L de niveles de gris suelen ser potencias de 2 para facilitar su
representacin binaria.
Por lo tanto, hemos pasado a una nueva imagen, la imagen digital, donde sus tonos de gris
son valores que pertenecen al conjunto discreto {0, 1, 2,...,L-1}, que es una discretizacin del
intervalo original [Lmin, Lmax] de tonos de gris de la imagen analgica. Para representar los L tonos de
gris necesitamos B bits, siendo L=2B. Por ejemplo, para 256 tonos de gris necesitamos 8 bits de
manera que el vector binario (0,0,0,0,0,0,0,0) representa al negro y (1,1,1,1,1,1,1,1) al blanco. De
esta forma la imagen puede venir dada por un vector binario (de ceros y unos), donde los L primeros
valores binarios corresponden al tono de gris del primer pxel de la imagen y as sucesivamente. El
nmero de bits requeridos para almacenar una imagen digitalizada es MNB. Como la
representacin matricial anterior es una aproximacin a una imagen continua, conforme mayores
sean los valores de los parmetros M,N y L, se conseguir una mejor resolucin (grado de detalle en
la percepcin de la imagen).
Como una imagen suele ocupar bastante memoria y en muchas aplicaciones slo vamos a
analizar zonas concretas de la imagen, que llamaremos zonas o regiones de inters, ROI (Region of
Interes), que sern submatrices, necesitamos una representacin matricial especial que especifique la
posicin de la submatriz de inters en la imagen completa. As vamos a asociar a cada imagen una
matriz vinculada. Una matriz MN cuyos elementos son nmeros reales o asteriscos (cuando no se
conoce el tono de gris del pxel correspondiente), de la forma
a11 ... a1 j ... a1s

... ... ... ... ...
a ... aij ... ais
i1
... ... ... ... ...
a ... a rj ... a rs
r1 p ,q
donde los indicadores p y q son nmeros enteros que especifican la posicin de a11 en la cuadrcula
de la imagen (abscisa q y ordenada p), se dice que es una matriz vinculada asociada a una imagen. El
smbolo asterisco se le asigna a cada pxel que tenga un tono de gris desconocido, debido, por
ejemplo, a que el sensor que recoge la imagen no nos da informacin de l.
Por lo tanto, una matriz vinculada es:

a) Una matriz cuyos elementos aijR{*}
b) Un indicador (p,q) que especifica la posicin del primer elemento de la matriz en la
rejilla utilizada en la digitalizacin de la imagen.
Una imagen puede venir representada de la forma siguiente:
3
2 3 5 2
1 3 3 3 1
0 1 0 2 7
-1
-2
... -1 0 1 2 3 4 5 6 7 8 ...
y una matriz vinculada asociada a ella, puede ser:
3 5 * 2 *

* 3 3 3 1
* 1 0 2 7

* * * * * 0,2
donde utilizamos el indicador p=0 y q=2, para expresar que el primer elemento, a11= 3, ocupa la
posicin (0,2) en la cuadrcula (considerada en el plano cartesiano).
Obsrvese que la imagen anterior tambin se puede representar por una matriz vinculada de
tamao 35, si prescindimos de la cuarta fila, es decir, por una matriz que tiene una fila menos. As,
dada una imagen cualquiera, siempre podemos encontrar una representacin minimal para una matriz
vinculada, es decir, por aquella que tenga el mnimo nmero de filas y columnas.
Una medida de la cantidad de informacin de una matriz vinculada MN, es la densidad de
informacin, que representaremos por d, y se define como el nmero de elementos de la matriz, que
son nmeros reales, es decir, que no son *, dividido por el nmero total de elementos. As, d=l
significa que no hay asteriscos, y la imagen, por tanto, ocupa toda la matriz, en cuyo caso diremos
que la matriz est saturada.
2.2 Relaciones bsicas entre pxeles.

A continuacin vamos a estudiar algunas caractersticas topolgicas de los pxeles. El entorno
vertical y horizontal de tamao 5 del pxel p, de coordenadas (i,j), viene dado por el conjunto de 5
pxeles de coordenadas,
(i+1,j), (i-1,j), (i,j), (i,j+1), (i,j-1),
y lo representaremos por N5(p).
El entorno diagonal de tamao 5 del pxel p, de coordenadas (i,j), viene dado por el conjunto
de pxeles de coordenadas,
(i+1,j+1), (i-1,j-1), (i,j), (i-l,j+1), (i+1,j-1),
y lo representaremos por ND(p); el conjunto de pxeles N5(p)ND(p) es un entorno de tamao 9 del
pxel p y lo representaremos por N9(p).
Para estudiar la relacin entre pxeles vamos a tener en cuenta su proximidad espacial y su
similitud en los niveles de gris. Por ello para establecer si dos pxeles estn conectados tenemos que
ver si son adyacentes en algn sentido y si sus niveles de gris son similares (con respecto a algn
criterio de similaridad). Sea V el conjunto de valores de los tonos de gris utilizado para definir la
conectividad (V va a ser un conjunto de nmeros "prximos" y correlativos). Por ejemplo, V puede
ser el conjunto de nmeros del 16 al 22. As podemos definir tres tipos de conectividad (figura 2.2):
a) Conectividad de tipo 5: los pxeles p y q con valores en V estn conectados si qN5(p)

b) Conectividad de tipo 9: los pxeles p y q con valores en V estn conectados si qND(p)
c) Conectividad de tipo mixto: los pxeles p y q con valores en V estn conectados si:
i) qN5(p)

ii) qND(p) y el conjunto N5(p)ND(q) no tiene pxeles con niveles de gris que
pertenezcan a V.
Obsrvese que la conectividad de tipo mixto es una modificacin de la conectividad de tipo 9,
que se introduce para eliminar las conexiones con caminos mltiples que se pueden obtener en la
conectividad de tipo 9.
0 1 1 0 1 1 0 1 1
0 1 0 0 1 0 0 1 0
0 0 1 0 0 1 0 0 1
(a) (b) (c)

Figura 2.1. (a) Conectividad de tipo 5; (b) conectividad de tipo 9 y (c) conectividad mixta.
En la parte (a) de la figura 2.1 aparecen conectados del pixel del centro los pxeles de un entorno de
tipo 5, tomando V={ l }; en la parte (b) de la figura 2.1 aparecen conectados del pixel del centro los
pxeles de un entorno de tipo 9, tomando V={ l } y en la parte (c) aparecen conectados los pxeles de
un entorno de tipo mixto, tomando V={1}.
Se dice que el pxel p es adyacente al pxel q, si los dos estn conectados. El tipo de
adyacencia se corresponder con el tipo de conectividad. Dos subconjuntos de pxeles (imgenes) S1
y S2 se dice que son adyacentes si algn pxel de S1 es adyacente con algn pxel de S2.
Un camino desde el pxel p, con coordenadas (x0,y0), al pxel q, con coordenadas (xn, yn),
es una sucesin de diferentes pxeles con coordenadas
(x0,y0), (x1,y1) ,..., (xn-1,yn-1), (xn,yn),
donde (xi,yi) es adyacente a (xi-1,yi-l ), es decir, adyacentes consecutivamente. Diremos que la longitud
de este camino es n.
Si p y q son pxeles de un subconjunto S, entonces diremos que p est conectado con q en S, si
existe un camino de p a q formado slo por pxeles de S. Para cualquier pxel p de S, el conjunto de
pxeles de S que estn conectados con p se dice que es una componente conexa de S.
La capacidad de asignar diferentes niveles a varias componentes conectadas, disjuntas entre si,
de una imagen es de vital importancia en el anlisis automtico de imgenes.
2.4 Operaciones aritmticas, geomtricas, lgicas y vectoriales.

Las operaciones aritmticas que se pueden realizar con imgenes son las mismas que las que se
realizan con nmeros reales, vectores y matrices.
La suma de dos imgenes, f y g, se realiza sumando los valores de los pxeles que tienen la
misma posicin en la rejilla, es decir:
f (i, j ) + g (i, j ) si f (i, j ), g (i, j ) R
[SUM ( f , g )](i, j ) =
* si f (i, j ) g (i, j ) es *
La multiplicacin de dos imgenes, f y g, se realiza multiplicando los valores de los pxeles que
tienen la misma posicin en la rejilla, es decir:
f (i, j ) g (i, j ) si f (i, j ), g (i, j ) R

[MULT ( f , g )](i, j ) =
* si f (i, j ) g (i, j ) es *
El mximo de dos imgenes f y g, MAX(f,g), se obtiene calculando el mximo de los valores

de los pxeles que tienen la misma posicin. Anlogamente para el mnimo, MIN(f,g). El mximo
de dos imgenes ser una imagen formada por los pxeles ms claros y el mnimo por los ms
oscuros.
La multiplicacin de una imagen f por un escalar t se realiza multiplicando el valor de cada
pxel por el escalar:
t f (i, j ) si f (i, j ) *
[ESCALAR(t; f )](i, j ) =
* si f (i, j ) = *
donde t es un nmero real.
La opuesta de la imagen f se define como:
f (i, j ) si f (i, j ) *
[ ( f )](i, j ) =
* si f (i, j ) = *
Obsrvese que es un caso particular de ESCALAR para t = -1.
La inversa de una imagen se define como:
1 / f (i, j ) si f (i, j ) * y f (i, j ) 0
[INV ( f )](i, j ) =
* en otro caso
La traslacin de una imagen f, i pxeles hacia la derecha y j pxeles hacia arriba, se define
como:
a11 a12 ... a1n a11 a12 ... a1n

a 21 a 22 ... a 2 n a 21 a 22 ... a 2 n
f = . . . TRAS ( f ; i, j ) = . . .

. . . . . .

a m1 a m 2 ... a mn r ,t a m1 a m 2 ... a mn r +i ,t + j
[TRAS(f;i,j)])u,v)=f(u-i,v-j)
Como se puede apreciar, los valores apq no cambian, slo cambia la localizacin de cada
elemento en la rejilla:
TRAS(f;i,j) = (apq)r+i, t+j
La rotacin o giro de una imagen, sobre el punto de la rejilla (0,0), puede ser de 90, 180, 270
y 360 grados. El resultado de la rotacin de 90 grados (en el sentido de las agujas del reloj) de una
imagen f cuya matriz vinculada correspondiente es una matriz mn, y cuyo indicador de posicin en
la rejilla es (r,t), viene dado por una matriz vinculada nm cuyo indicador de posicin en la rejilla es
(-t,r+m-1). Al operador rotacin de 90 grados lo vamos a llamar NOVENTA(f). Este operador,
definido punto a punto quedara:
[NOVENTA(f)](i,j) = f(-j,i)
si la rotacin es en el sentido de las agujas del reloj, y
[NOVENTA(f)](i,j) = f(j,-i)
si el giro es en el sentido contrario a las agujas del reloj.
Para realizar una rotacin de 1800 basta con aplicar primero una rotacin de 90o , y sobre ella
aplicar otra nueva rotacin de 900; es decir, aplicar dos veces este operador y, por tanto, lo
representaremos por NOVENTA2 . Aplicando otra rotacin de 900 sobre esta ltima, obtenemos una
rotacin final de 2700 de la imagen original.
A partir de una imagen tambin se le puede obtener su imagen simtrica con respecto a un eje
(imagen especular), por ejemplo, de 450, 1350 de 1800, que es como si la hubiramos desplazado
pero dndole la vuelta, de forma que queda como la imagen formada en un espejo. Por ejemplo, una
vuelta de 1350, viene definida por la siguiente transformacin:
[FLIP(f )](i, j)=f (-j, -i)
y en trminos de las matrices vinculadas, sera
a11 a12 ... a1n a11 a12 ... a1n

a 21 a 22 ... a 2 n a 21 a 22 ... a 2 n
. . .
FLIP . . .

. . . . . .

a m1 a m 2 ... a mn r ,t a m1 a m 2 ... a mn t , r
Vamos a estudiar algunas operaciones del tipo base de datos como la operacin de
SELECCIN, que consiste en seleccionar la parte de la imagen que est dentro de una determinada
ventana W,
W={ (i,j): h i < h+r , k < j k+s}
El operador SELECCION depende de la imagen y de cuatro parmetros, que son: el tamao

de la ventana, rs y la localizacin (h,k) de la primera columna y de la primera fila de la imagen de
salida, es decir:
f (i, j ) para (i, j ) W
[SELECT ( f ; m, n, h, k )](i, j ) =
* en otro caso
Veamos ahora la operacin de EXTENSION. Dadas dos imgenes f y g, la operacin de

EXTENSION de la imagen f, mediante la imagen g, viene definida de la siguiente forma:
f (i, j ) si f (i, j ) *
[ EXTENSION ( f , g )] (i, j ) = g (i, j )
en otro caso
Mediante la composicin de estos operadores bsicos podemos construir nuevos operadores

que llamaremos de alto nivel. Por ejemplo, el operador EXTSUMA(f,g), se puede definir como:
SUMA( f , g ) en D f D g

EXTSUMA( f , g ) = f en D f D g
g en D g D f

donde Df es el dominio de la imagen f (conjunto de puntos (x,y), cuyo nivel de gris es un nmero
real) y Dg es el dominio de la imagen g. Tambin se puede expresar como la siguiente composicin:
EXTSUMA(f,g) = EXTENSION [ EXTENSION ( SUMA(f,g), g), f]
Obsrvese como el dominio del resultado de aplicar el operador EXTSUMA a las imgenes f y g, es
la unin de los dominios de f y g, mientras que el dominio de aplicar el operador SUMA a las
imgenes f y g, es la interseccin de los dominios de f y g.
Hasta ahora, las transformaciones que hemos utilizado, tenan como entrada una imagen y como
salida otra, es decir, eran de imagen a imagen. Adems, una imagen vena dada por una matriz
vinculada. Ahora, vamos a considerar la imagen como un vector tridimensional definido por las
localizaciones absolutas (i,j) y por los niveles de gris f(i,j) de los pxeles correspondientes, de manera
que vamos a considerar la imagen constituida por el DOMINIO y por el RANGO. El DOMINIO
viene constituido por h pares ordenados:
D = [(i1,j1), (i2,j2) ,...., ( ih,jh)]
y el RANGO viene dado por el conjunto de los h valores de gris correspondientes:
R = [y1, y2, ..., yh] donde yk=f(ik,jk).
Veamos ahora algunas transformaciones estructurales que nos permitirn crear nuevas imgenes y
obtener imgenes binarias. Se define el operador estructural CREAR de la siguiente forma:
si (i, j ) = (i k , j k )
[CREAR( D, R)](i, j ) =
yk
* en otro caso
El operador UMBRAL se define para producir una imagen binaria con slo dos niveles de
gris, 1 (blanco) y 0 (negro). Este operador se aplica a la imagen y depende de un parmetro t,
llamado umbral, y viene definido de la siguiente forma:
1 si f (i, j ) t
[UMBRAL( f ; t )](i, j ) = 0 si f (i, j ) < t
* f (i, j ) = *
si
Uno de los mtodos ms usuales de extraer una figura o una caracterstica de particular
inters de una imagen (como puede ser un borde), es aplicando el mtodo de la umbralizacin. El
operador UMBRAL produce una imagen en blanco y negro, en la que el objeto de inters puede ser
negro y el fondo blanco. As pues, este operador transforma una imagen digital en una imagen
binaria.
Para estudiar las propiedades del operador UMBRAL, se puede establecer una relacin de
orden sobre imgenes que tienen el mismo dominio. Se dice que una imagen g es menor o igual que
la imagen h, si g y h tienen el mismo dominio D y para cada pxel (i,j) D, el nivel de gris de g es
menor o igual que el de h. Es decir,
g(i,j) h(i,j), (i,j) D
As,
1) Si g h UMBRAL(g;t) UMBRAL(h;t).
2) Si t s UMBRAL(g;s) UMBRAL(g;t).
La propiedad 1) expresa que el UMBRAL de una imagen ms luminosa conduce a una imagen
ms luminosa.
La propiedad 2) expresa que la umbralizacin de la misma imagen con un umbral ms alto,

conduce a una imagen menos luminosa.
Otra operacin parecida a la anterior es la TRUNCACION, que se define como:
f (i, j ) si f (i, j ) t
[TRUNCAR( f ; t )](i, j ) = 0 si f (i, j ) < t
* f (i, j ) = *
si
Obsrvese que TRUNCAR(f ; t)=MULT[f , UMBRAL(f ; t)].
Anlogamente, se definen los siguientes operadores:

1 si f (i, j ) = t
[IGUAL( f ; t )](i, j ) = 0 si f (i, j ) t y f (i, j ) *
* f (i, j ) = *
si
1 si f (i, j ) > t
[MAYOR( f ; t )](i, j ) = 0 si f (i, j ) t
* f (i, j ) = *
si
Veamos ahora algunas operaciones vectoriales. Se define el operador PIXSUM como

PIXSUM ( f ) = f (i, j ) .
( i , j )D f
El operador MEDIA se define de la siguiente forma:

PIXSUM ( f )
MEDIA( f ) =
CARD( F )
donde CARD(f) es el tamao de la imagen (nmero de pxeles).
Se define el operador PRODUCTO ESCALAR de las imgenes f y g como:
f (i, j ) g (i, j ) si f y g tienen el mismo dominio

PRESC ( f , g ) = ( i , j )D
* si f y g tienen el distinto dominio
Se define la NORMA Eucldea de una imagen de la siguiente forma:
NORMA( f ) = f = PRESC ( f , f )
Un vector de imgenes es una coleccin ordenada de n imgenes, que denotaremos por:

f = (f1, f2, ... , f n)
donde fk es la imagen k, y
f(i,j) = (f1(i, j), f2(i,j),...,fn(i,j)),
siendo fk(i,j) el nivel de gris del pxel (i,j) de la imagen k, k=1,2,...,n.
Sobre este vector se pueden realizar las mismas operaciones que con vectores, pero teniendo en
cuenta que algunas de sus componentes pueden ser *. Se puede definir una norma (magnitud del
vector) de la misma manera que en los espacios vectoriales. As, el operador MAG0(f) corresponde
a la norma L (norma de Tchebycheff), que viene dado por
f (i, j )
= max{ f 1 (i, j ) , f 2 (i, j ) ,..., f n (i, j ) }
Anlogamente, se define el operador MAG1(f), que corresponde a la norma L1 (norma
rectangular) de la siguiente forma:
f (i, j ) 1 = f 1 (i, j ) + f 2 (i, j ) + ... + f n (i, j )
y el operador MAG2(f), que corresponde a la norma L2 (norma eucldea):
f (i, j ) 2
[
= f 1 (i, j ) 2 + f 2 (i, j ) + ... + f n (i, j )
2
]
2 1/ 2
2.4. Filtros lineales de promedio (mscaras o plantillas)

Un entorno del pxel (i,j), de tamao (2m+1) (2n+1), es el conjunto de pxeles que viene definido
como:
N(2m+1)(2n+1)(i, j) = { (r, s) ZZ : i-m r i + m, j - n s j + n }
Una mscara (o plantilla) g de tamao (2m+1)(2n+1) es una matriz de tamao (2m+1)(2n+1)

cuyo elemento central corresponde al origen de coordenadas (representado por g(0,0)) y todos sus
elementos son nmeros reales. Es decir,
g ( m, n) ... g (m, n)
g (0, n) ...

... ... ... ...
...

g g ( m,0) ... g (0,0) ... g (m,0)

... ... ... ... ...
g ( m, n) ... g (0, n) ... g (m, n)

Dado un entorno N(i ,j) del pxel (i ,j), de tamao (2m+1) (2n+1), podemos superponer sobre
l una plantilla (mscara) del mismo tamao (se hace coincidir el centro de la mscara con el pxel
(i, j)) y sustituir el nivel de gris f(i, j) de dicho pxel por una suma ponderada de los niveles de gris de
los pxeles del entorno con los valores correspondientes de la mscara, es decir, por la expresin:
f * (i, j ) = g (r, s) f (i + r , j + s)
( r , s )N
Si hacemos h=i+r y k=j+s entonces tambin se puede expresar como

f * (i, j ) = g (h i, k j ) f (h, k ) ,
( h , k )Z Z
pues los valores de la mscara g(r,s) son iguales a cero para (r,s)N(i,j) y los valores de la imagen
f(h, k) son tambin iguales a cero para (h,k)Df. Obsrvese que la expresin anterior es la operacin
de convolucin entre las funciones f y g. Esta transformacin se conoce con el nombre de filtro
lineal de promedio. En otras palabras, dada una mscara g y una imagen f, se define el operador
FILTRO de la siguiente forma:
[FILTRO( f ; g )](i, j ) = g (r , s) [TRAS ( f ; r , s)](i, j )

( r , s )N
Tambin se puede decir que este operador es un filtro lineal de promedio mvil, pues realiza un
promedio con los valores de su entorno (ponderados con los coeficientes correspondientes de la
mscara) para cada uno de los pxeles de la imagen. Obsrvese que el operador FILTRO tiene como
entrada dos imgenes (la imagen original y la mscara), y como salida una sola imagen (la imagen
filtrada).
Cuando todos los valores de la mscara son no negativos y adems suman uno (PIXSUM(M)=1)
decimos que se trata de un filtro de paso baja. Si se aplica el operador FILTRO de paso baja, la
imagen obtenida es una imagen ms suavizada (se han reducido las fluctuaciones en los niveles de
gris), pues en la imagen filtrada, la intensidad de gris de cada pxel es una media ponderada de las
intensidades de los pxeles de su entorno. Por ello se dice que se ha utilizado un filtro de paso baja,
ya que atena o elimina las altas frecuencias, es decir, las grandes variaciones en los tonos de gris de
los pxeles, y deja pasar a travs del filtro slo las bajas frecuencias, es decir, no modifica (o apenas
modifica) las pequeas variaciones. Como consecuencia la imagen filtrada es ms borrosa ya que se
ha atenuado el contraste o diferencia entre los niveles de gris de pxeles adyacentes. Adems, como
PIXSUM(M) = 1, la imagen filtrada tiene la misma luminosidad que la imagen original. Por lo tanto
una ventaja de este tipo de filtro es que atena los ruidos de alta frecuencia a cambio de introducir
borrosidad en la imagen (falta de contraste).
Cuando una mscara tiene valores negativos y positivos y la suma total es cero
(PIXSUM(M)=0) decimos que se trata de una mscara o filtro de paso alta. Estos filtros destacan
y acentan las grandes variaciones entre los tonos de gris de los pxeles (dejan pasar las componentes
de alta frecuencia) y atenan o eliminan las pequeas diferencias (componentes de baja frecuencia).
Es decir, el resultado neto de un filtro de paso alta es destacar slo aquellos pxeles en cuyo entorno
hay grandes diferencias en los tonos de gris y que corresponde, por tanto, a los ejes, los bordes, los
contornos y otros detalles que configuran la forma de los objetos de la imagen, a costa de
incrementar los ruidos. Como PIXUM(M)=0, los niveles de gris de la nueva imagen sern positivos
o negativos y prximos a cero en los entornos con poca variacin en los niveles de gris. La
intensidad luminosa media de la imagen ser igual a cero. Si aplicamos a la nueva obtenida el
operador valor absoluto y despus el operador umbral obtenemos una imagen binaria donde los
pxeles que corresponden a ejes aparecen con valor 1 y el resto con valor cero.
Cuando se desea detectar los ejes o bordes de una imagen se utilizar un filtro de paso alta,
como por ejemplo:
0 1 0

1 4 1
0 1 0

Con ello se consigue que cuando el entorno de un pxel tenga los mismos niveles de gris (entorno
constante) o valores prximos de niveles de gris (entorno con pequeas fluctuaciones), entonces al
aplicarle una mscara con PIXSUM = 0, el valor de salida del pxel ser 0 prximo a 0, pues no
hay contraste significativo entre los pxeles del entorno al que se ha aplicado la mscara M. Por el
contrario, si en el entorno hay diferencia significativa entre los niveles de gris, el valor de salida del
pxel podr no ser prximo a cero, marcando as las diferencias. Por lo tanto, cuando se utiliza una
mscara con coeficientes positivos y negativos, y PIXSUM = 0, se resaltan las grandes diferencias
entre los niveles de gris de los pxeles del entorno (altas frecuencia) y se eliminan las pequeas
fluctuaciones en los niveles de gris (bajas frecuencias). As, una mscara con coeficientes negativos
y positivos y con PIXSUM = 0 es un filtro de paso alta.
La imagen obtenida por una mscara de paso alta se puede obtener tambin como la diferencia
entre la imagen original y la imagen filtrada con una mscara de paso baja.
Los filtros de promedio mvil pueden ser:

a) Invariantes en el espacio, en cuyo caso, la imagen filtrada se obtiene de la aplicacin de la
misma mscara a cada uno de los pxeles la imagen, o
b) Variables en el espacio, cuando el filtro se realiza mediante la aplicacin de una coleccin
de mscaras, de manera que a subconjuntos diferentes de pxeles se le aplican mscaras
diferentes.
2.5. Filtros no lineales

Dado un entorno N(i, j) del pxel (i ,j), de tamao (2m+1) (2n+1), podemos sustituir su tono del
gris por el valor mnimo de los tonos de gris de los pxeles de su entorno. Esto hace el operador
mnimo (MIN) que viene definido por la expresin:
[MIN(f, N)](i, j) = Min { f(r, s): (r,s)N(I ,j) }.
La imagen resultante tiene menor luminosidad y suele ser ms homognea que la imagen original. Su
utilizacin nos puede ayudar, por ejemplo, a corregir la desigual iluminacin de una imagen.
Anlogamente podemos definir el operador mximo (MAX) mediante la expresin:

[MAX(f, N)](i, j) = Max { f(r ,s): (r,s)N(i ,j) }
Otro operador no lineal es el filtro MEDIANA que viene definido como:

[MEDIANA(f, N)](i,j) = Mediana{ f(r ,s): (r,s)N(I ,j) }
Este filtro nos permitir eliminar o atenuar los ruidos puntuales o granulares de las imgenes,
siempre que el porcentaje de pxeles con ruido en el entorno sea menor que la mitad de los elementos
del entorno.
2.6. Filtros de tipo Gradiente

Si f(x, y) es una funcin de valores reales de dos variables reales, las derivadas parciales f/x y
f/y nos dan la tasa de cambio instantnea en las direcciones del eje de abscisas y del eje de
ordenadas respectivamente. Con el fin de estudiar las tasas de cambio de los niveles de gris vamos a
definir los operadores basados en diferencias. Definiremos el operador DIFERENCIA en la direccin
de x, DX, como:
[DX ( f )](i, j ) = f (i, j ) f (i 1, j )
y anlogamente, el operador diferencia en la direccin del eje de ordenadas es:
[DY ( f )](i, j ) = f (i, j ) f (i, j 1) .
El operador DX mide la diferencia entre el valor de gris de un pxel y el de su adyacente sobre el eje
X. As, en una imagen podremos apreciar si la iluminacin de la misma va de claro a oscuro (o
de oscuro a claro) en la direccin horizontal, segn que los valores de los elementos de DX sean
positivos o negativos, y cuantificar dicha variacin. Como los ejes verticales vienen caracterizados
por una variacin de la iluminacin en la direccin del eje X, podemos detectarlos mediante dicho
operador. Utilizando el operador DX con los operadores ABS y UMBRAL se podrn obtener los ejes
horizontales en una imagen binaria (blanco y negro).
f DX ABS UMBRAL EJE_VERT(f,,t)

t
Figura 2.6.1. Diagrama del operador EJE_VER(f,t).
De manera anloga, mediante la aplicacin del operador DY, se puede apreciar la variacin de
arriba a abajo, o de abajo a arriba, de la iluminacin de la imagen y se pueden detectar ejes
horizontales, usando el operador compuesto EJE_HOR(f ,t).
Es importante resaltar que estos operadores, DX y DY, se pueden contemplar como filtros de
promedio mvil. En efecto, consideremos las mscaras
1
D1 = ( -1 1) y D 2 = ,
1
en las que subrayamos el valor de la mscara que corresponde al pxel (i,j). As,
[FILTRO(f;Dl)](i,j) = [(-1) f(i-1,j)] + [1 f(i,j)]
= f(i,j) - f(i-1,j)
= [DX(f)](i,j),
y anlogamente si tomamos la mscara D2, se obtiene DY.
Para obtener los bordes de una figura elptica se usa conjuntamente DX y DY, de forma que el
operador resultante sea independiente de la orientacin (isotrpico). Se define el GRADIENTE de
una imagen digital como el vector imagen:
GRAD(f) = (DX(f), DY(f))
y el operador gradiente viene dado por la expresin:
[GRAD(f)](i,j) = ([DX(f)](i,j),[DY(f)](i,j)
Obsrvese que el gradiente tiene una nica imagen de entrada y dos imgenes de salida. Como
el gradiente es un vector se le puede aplicar una norma, que nos mide la magnitud del gradiente.
As, los operadores MAG0(GRAD(f)), MAG1(GRAD(f)) y MAG2(GRAD(f)) son el resultado de
aplicarle a una imagen el operador GRAD(f) y luego MAG0(f), MAG1(f) y MAG2(f),
respectivamente. El operador MAG2(GRAD(f)) es isotrpico (es decir, invariante a giros).
Hasta ahora, hemos observado la variacin slo en un sentido, es decir, con respecto al pxel de
la izquierda. Si tenemos en cuenta el pxel de la izquierda y el de la derecha obtenemos el operador
DIFERENCIA SIMTRICA en la direccin del eje X
[SIMDX(f)](i ,j) = ( [DX(f)](i, j) + [DY(f)](i, j) )/2
= [f(i+l,j) - f(i-l,j)] / 2
y anlogamente el operador DIFERENCIA SIMTRICA en la direccin del eje Y,
[SIMDY(f)](i,j) = [f(i,j+1) - f(i,j-1)] / 2.
Obsrvese que estos operadores pueden ser vistos como filtros, considerando las mscaras:
1/ 2

S1 = ( 1/2 0 1/2) y S2 = 0
1/ 2

Definimos ahora el GRADIENTE SIMETRICO como el vector imagen
SIMGRAD(f) = (SIMDX(f), SIMDY(f)),
y el operador gradiente simtrico viene dado por el operador compuesto MAG0(SIMGRAD(f)).
Estas expresiones se puede generalizar y obtener el operador diferencia de Prewitt, que contempla
los cambios en seis pxeles:
[PREWDX(f)](i,j) = ( [DX(f)](i+l,j+1) + [DX(f)](i,j+1) + [DX(f)](i+l,j) +

[DX(f)](i,j) + [DX(f)](i+l,j-1) + [DX(f)](i,j-l) )/6
= [ f(i+l,j+l) + f(i+l,j) + f(i+l,j-l) - f(i-l,j+l) - f(i-1,j) - f(i-l,j-l)) ]/6.
Tambin se puede expresar este operador en trminos de la mscara de Prewitt:
1 0 1

PREW 1 = 1 0 1
1 0 1

y por tanto,
PREWDX(f) = ESCALAR[1/6; FILTRO(f;PREW1)]
Este filtro permite detectar ejes verticales. De forma anloga, se define este operador en la direccin
del eje de ordenadas mediante la mscara:
1 1 1

PREW 2 = 0 0 0
1 1 1

y por tanto,
PREWDY(f) = ESCALAR[1/6; FILTRO(f;PREW2)]
que detecta ejes horizontales.
Utilizando el operador diferencia de Prewitt, definimos el operador gradiente de Prewitt:
PREWGRAD(f) = (PREWDX(f) , PREWDY(f))
Para cuantificar el vector, aplicaremos una norma, y con ello, obtenemos los operadores
PREWMAG0(f), PREWMAG1(f) y PREWMAG2(f).
Otro operador que promedia los valores de gris de los mismos pxeles pero con pesos diferentes
viene dado por las mscaras de Sobel:
1 0 1 1 2 1

SOB1 = 2 0 2 , SOB 2 = 0 0 0
1 0 1 1 2 1

y el operador diferencia de Sobel en cada direccin viene dado por:
SOBDX(f) = ESCALAR[1/8; FILTRO(f;SOB1)]

SOBDY(f) = ESCALAR[1/8; FILTRO(f;SOB2)]
El gradiente de Sobel viene dado por el vector:

SOBGRAD(f) = (SOBDX(f), SOBDY(f)).
Como puede observarse, el gradiente de Sobel utiliza el factor 2 para ponderar dos pxeles. Se
puede generalizar este operador utilizando el factor y en lugar de dividir por 8, se dividir por,
(4+2).
Otro operador gradiente de la imagen comnmente empleado es el gradiente de Roberts. Este
operador pondera los pxeles que estn en la direccin de 450 y -450. As, las mscaras de Roberts
son:
1 0 0 1
ROB1 = , ROB2 = .
0 1 -1 0
El operador gradiente cruzado de Roberts viene dado por la expresin:
2
[ROBGRAD( f )](i, j ) = [ f (i, j ) f (i 1, j + 1)] , 2 [ f (i, j + 1) f (i 1, j )]
2 2
El factor 2 /2 resulta del hecho de que la distancia que hay entre estos pxeles es 2.
En muchas imgenes aparecen figuras o patrones definidos por alguna forma de homogeneidad
con respecto al resto de los pxeles, bien por los niveles de gris o por las propiedades de textura de la
imagen. As, una figura puede aparecer destacada por sus niveles de gris ms blancos frente a un
fondo ms oscuro. Utilizando el operador UMBRAL podemos destacar la figura. Sin embargo, hay
imgenes ms complejas, en las que el ojo distingue perfectamente los objetos y con el operador
UMBRAL se confunden. Esto ocurre si una de las figuras es ms clara que el fondo y la otra ms
oscura.
Vamos a analizar las diferencias en el contraste local mediante la deteccin de ejes. Un eje es
una zona de demarcacin o transicin entre dos regiones que difieren segn alguna medida de
homogeneidad (como el nivel de gris). Una arista se puede presentar de dos formas:
1) Como el borde entre dos regiones diferentes, siendo cada una de estas regiones homogneas
con respecto a algn criterio de homogeneidad.
2) Como un arco delgado que destaque sobre el fondo.
Para la deteccin de aristas tomaremos como entrada al proceso una imagen y como salida una
imagen de aristas. La manera ms adecuada de producir una imagen de aristas es basndose en los
cambios o variaciones de la homogeneidad en los niveles de gris. Esto se puede realizar aplicando
algn operador GRADIENTE a la imagen original, despus se le aplica el operador MAGNITUD a
las imgenes de salida, y, finalmente, se aplica el operador UMBRAL a la imagen resultante, con un
valor umbral apropiado, para separar aquellos pxeles cuya magnitud del gradiente es mayor. La
bondad del resultado obtenido depender de los operadores GRADIENTE y UMBRAL utilizados.
La metodologa a seguir en la deteccin de los ejes o aristas depende slo de las magnitudes relativas
de los gradientes dentro de la imagen, y, por lo tanto, la multiplicacin escalar por factores (1/6 en el
gradiente de Prewitt y un 1/8 en el gradiente de Sobel) no juega ningn papel relevante. As, la
metodologa a seguir consiste en aplicar algn operador de magnitud al resultado del operador
gradiente:
(FILTRO(f;M1), FILTRO(f;M2))
donde la expresin Ml puede ser DX, PREW1, SOB1 o ROB1, y despus se aplica a la imagen
resultante el operador UMBRAL.
Para la obtencin de una imagen binaria en la que poder detectar claramente las aristas o bordes
de los objetos utilizaremos operadores del tipo: PREWEJE0(f; t), PREWEJE1(f; t), PREWEJE2(f; t),
ROBEJE0(f; t), ROBEJE1(f; t), ROBEJE2(f; t), donde, por ejemplo:
PREWEJE0(f;t) = UMBRAL [MAG0 [ PREWGRAD(f)] ; t]
Adems de utilizar las mscaras que detectan los cambios en las direcciones verticales y
horizontales, o, como en el caso del gradiente de Robert, en las direcciones de 450 y -450, podemos
utilizar mscaras que tengan en cuenta los cambios en todas las direcciones que son mltiplos de 450.
Como hay ocho direcciones diferentes, en cada filtrado se utilizarn ocho mscaras. As, por
ejemplo, las ocho mscaras de Prewitt seran:
1 1 1 1 1 1 1 1 1

1 2 1 1 2 1 1 2 1
1 1 1 1 1 1 1 1 1

1 1 1 NO N NE 1 1 1

1 2 1 E O 1 2 1
1 1 SO 1 1 1
1 S SE
1 1 1 1 1 1 1 1 1

1 2 1 1 2 1 1 2 1
1 1 1 1 1 1
1 1 1
2.7. Matrices de relacin espacial

Se trata ahora de estudiar las relaciones espaciales entre los pxeles con tonos de gris parecidos. Una
relacin espacial de parmetros (r, s) viene dada por la siguiente aplicacin entre pxeles:
R(r,s) : (i, j) (i+r, j+s),
donde r y s son dos nmeros enteros.
Si consideramos el entorno N8(i,j), podemos establecer 8 relaciones diferentes, segn el pxel
del entorno que le asociemos al pxel (i,j). As, representaremos por R(1,0) la relacin
(i ,j) (i+1 ,j)
y continuando en el sentido contrario de las agujas del reloj, la relacin R(1,-1) es:
(i, j) (i+1 ,j-1)
Dada una relacin R, representaremos por hR(p, q) el nmero de pares de pxeles (i,j) y (i,j)
tales que:
1. (i,j)R(i,j) , es decir, (i,j) est relacionado con (i,j)

2. f(i,j) = p y f(i,j) = q
Se define la matriz de relacin espacial asociada a la relacin R entre pxeles como la matriz
LL cuyo elemento (p,q) viene dado por hR(p, q), es decir la matriz
hR (0,0) ... hR (0, s ) ... hR (0, L 1)

... ... ... ... ...

h ( f ; R ) = h R ( r ,0 ) ... hR ( r , s ) ... hR (r , L 1) .

... ... ... ... ...
h ( L 1,0) ... hR ( L 1,0) ... hR ( L 1, L 1)
R
donde se supone que el rango de los niveles de gris viene dado por el conjunto {0, 1, 2,...,L-1}.
El anlisis de un conjunto de estas matrices, correspondientes a un conjunto de relaciones
espaciales, nos dar, generalmente, informacin sobre las aristas y sobre la textura de la imagen
original. Una textura es una regin de la imagen que presentan una cierta regularidad estadstica, de
manera que est construida a partir de una misma ventana, llamada txel, cuya repeticin sucesiva,
sujeta a pequeas variaciones estadsticas, genera la imagen texturada.
Para evitar problemas en el tiempo de computacin y de almacenaje, se suelen considerar slo

conjuntos reducidos de relaciones de adyacencia.
EJEMPLOS:
a) Consideremos la siguiente imagen cuyo rango de niveles de gris es el conjunto {0,1}:

1 0 1 0 1

0 1 0 1 0
1 0 1 0 1

0 0
1 0 1
Si utilizamos la relacin espacial R(2,0) obtenemos la siguiente matriz de relacin espacial:
6 0

0 6
Como los elementos de la matriz principal acaparan todos los valores positivos (no nulos) ya que los
dems son cero, es decir, los tonos de gris de los pares de pxeles de la relacin son iguales, lo que
nos indica la existencia de una textura generada por dicha relacin. Si deseamos buscar una textura
mas gruesa utilizaramos una relacin con mayor separacin como, por ejemplo, la relacin R20, que
nos conduce a la siguiente matriz de relacin espacial:
0 4

4 0
que nos indica que no hay textura segn dicha relacin, ya que los valores no nulos no estn
mayoritariamente sobre la diagonal principal.
Si utilizamos la relacin espacial R(1,1) obtenemos la siguiente matriz de relacin espacial:

4 0

0 4
que nos indica que no hay aristas de 45 ya que todos los elementos de fuera de la diagonal
principal son nulos.
b) Consideremos ahora la siguiente imagen cuyo rango de niveles de gris es el conjunto
{0,1,2,3,4}:
4 0 4 0 4 1

0 3 0 4 1 3
f =
4 1 4 1 3 0

0 3
4 0 3 0
Si consideramos la relacin R (1,1) obtenemos la siguiente matriz de relacin espacial:

3 2 0 0 0

1 2 0 0 0
0 0 0 0 0

0 0 0 2 1
0 0 0 1 3

donde se puede observar como los valores positivos estn entorno a la diagonal principal, lo que
refleja el hecho de que hay muy pocas fluctuaciones en los tonos de gris en la direccin de 450, es
decir, ausencia de ejes de 45.
Anlogamente, para la relacin espacial R(1,0) se obtiene la matriz de relacin espacial,

0 0 0 3 4

0 0 0 2 1
0 0 0 0 0

3 0 0 0 0
3 4 0 0 0

que indica muchas altas variaciones (horizontales) entre los tonos de gris de un pxel y su vecino de
la derecha, y eso ocurre cuando hay aristas verticales, pero en este caso slo podemos hablar de
pequeas aristas verticales ya que no tienen continuidad y se van alternando.
Por lo tanto, para saber si hay aristas verticales podemos utilizar la relacin R(1,0). Para saber si
hay aristas horizontales la relacin R(0,1) y para las aristas de 45 la relacin R(1,1). Bastar con
observar el valor de los elementos de la matriz de relacin espacial cuyo ndice (p, q) superan un
cierto valor umbral. Finalmente, para saber si puede haber una textura tenemos que utilizar la
relacin espacial adecuada y observar los elementos que estn entorno a la diagonal principal que
debern corresponder a valores altos con respecto a los dems trminos.
2.8 Transformaciones de imgenes en el dominio de las frecuencias: La
transformada de Fourier discreta
Jean Baptiste Joseph Fourier present en 1807 sus resultados sobre la propagacin y difusin del
calor en el Instituto de Francia en los cuales propona que una seal peridica se poda representar
mediante series sinusoidales. Por ejemplo, una onda cuadrada se puede representar de forma
aproximada por la funcin sen(x) ms el armnico (1/3)sen(3x) como se muestra en la figura 2.2. Si
utilizamos 5 armnicos, la funcin
f(x)=sen(x)+(1/3)sen(3x)/3+(1/5)sen(5x)+(1/7)sen(7x)+(1/9)sen(9x)
representa todava mejor a la onda cuadrada (figura 1). De aqu se deduce que una onda cuadrada se
puede describir como una composicin de sinusoides que varan en frecuencia y amplitud, es decir,
cualquier seal es una composicin de seales de diferentes frecuencias. Las seales de audio sern
unidimensionales mientras que las imgenes sern seales bidimensionales. La frecuencia espacial
de una imagen se refiere a la tasa de cambio de la intensidad luminosa de los pxeles. As, para
estudiar la composicin de las frecuencias de una seal es conveniente analizarla en el dominio de
las frecuencias donde se muestra la magnitud de las diferentes componentes de frecuencias.
Figura 2.2. Representacin mediante armnicos de una onda cuadrada.
La transformada de Fourier de una funcin f(x,y) viene dada por la expresin:

T(f(x,y) )= F (u , v) =

f ( x, y )e 2i ( xu + yv ) dxdy
donde i = 1 es la unidad imaginaria y eix = cos( x) + i sen( x) . Es una descomposicin de la

imagen en estructuras peridicas. Las variables u y v se llaman frecuencias absolutas. Tambin se
pueden utilizar las variables 1=2u y 2=2y, que se llaman frecuencias angulares.
La transformada de Fourier de una funcin puede no existir. Un conjunto tpico de condiciones para
su existencia es el siguiente:
a) Que f(x,y) sea integrable
b) Que tenga, a lo sumo, un nmero finito de discontinuidades y un nmero finito de mximos
o mnimos en cualquier rectngulo finito
c) Que no tenga discontinuidades infinitas.
Dicha funcin trata con nmeros complejos, por lo tanto, tendr una parte real R(u,v) y una parte
imaginaria I(u,v). Su magnitud, que llamaremos espectro de Fourier, ser
F (u, v) = R 2 (u, v) + I 2 (u, v)

y su ngulo de fase (figura 2.3)
I (u , v)
(u, v) = arctang
R(u , v)
As,
F (u, v) = F (u, v) e i (u ,v )
F(u,v)
Figura 2.3. Representacin del ngulo de fase.
La magnitud depender de la amplitud de las ondas seno y coseno que la configuran y la fase de la
fase de las mismas. Al cuadrado del espectro de Fourier se le llama potencia (tambin densidad
espectral).
La transformada de Fourier tiene inversa y viene dada por la expresin (teorema de inversin de
Fourier)

T-1(F(u,v))= f ( x, y ) =
F (u, v)e 2i ( xu + yv ) dudv
As podemos interpretar la transformada de Fourier como los coeficientes de ponderacin en las

diferentes frecuencias de las funciones exponenciales complejas (patrones sinusoidales) que nos dan
un valor de la funcin f(xo,yo) como lmite de estas sumas ponderadas.
La transformada de Fourier tiene dos propiedades interesantes para el anlisis de imgenes:
a) Es un operador lineal, es decir
T(af(x,y)+bg(x,y))=aT(f(x,y))+bT(g(x,y)), aR, bR,
b) La transformada de Fourier de una convolucin de funciones es el producto de las
transformadas de Fourier de cada funcin.
En efecto, se define la convolucin de las funciones f y g mediante la expresin:

f g ( x, y ) = f ( s, t ) g ( x s, y t )dsdt

Se demuestra fcilmente que

T ( f g ( x, y )) = T ( f ( x, y ))T ( g ( x, y ) = F (u , v )G (u , v )
Ejemplos:
1. Sea
M si x a
f ( x) =
0 si x > a
La transformada de Fourier es la siguiente:

F (u ) = f ( x)e 2iux dx

a
= Me 2iux dx
a
a
e 2iux
= M
2iu a
e 2iua e 2iua 1
=M u
2i
sen( 2ua )
=M
u
sen(2ua )
= 2aM
2ua
= 2aMsenc ( 2ua ) .
Su representacin grfica para M=1 y a=2 se muestra en la figura 2.4. Los puntos de corte con el eje
de abscisas son {...,-1/a,-1/(2a), 1/(2a), 1/a,...}. Se observa que es una funcin real pues la funcin
original es simtrica con respecto al eje de ordenadas.
-a a
(a) (b)
Figura 2.4. a) Funcin constante en [-a, a]. b) Transformada de Fourier
2. La transformada de Fourier de la funcin Delta de Dirac.

Un concepto importante en el procesado de la seal es el de fuente puntual, pues cualquier imagen se
puede considerar como una suma de fuentes puntuales. La transformacin mediante un operador de
una fuente puntual se llama funcin de esparcimiento. Una fuente puntual es el lmite de una
sucesin de imgenes cuyos valores no nulos se van concentrando sucesivamente en un punto del
espacio, manteniendo su nivel total de luminosidad. Por ejemplo, consideremos la siguiente sucesin
de imgenes:
n si x 1/(2n), y 1/(2n)
n ( x, y ) =
0 en otro caso
Dicha funcin vale 1 en un cuadrado centrado en el origen y de lado 1/n. Se verifica que

n ( x, y )dxdy = 1, n = 1,2,...
Aunque dicha integral existe para todo entero positivo n, sin embargo la funcin n(x,y) no tiene
lmite cuando n tiende a infinito. Vamos a tratar a dicho lmite como si existiera y lo llamaremos
funcin Delta de Dirac, que representaremos por (x,y).
De manera anloga al ejemplo anterior se obtiene la transformada de Fourier de la funcin n(x,y):

sen(u / n) sen(v / n)
T(n(x,y))=
u / n v / n
Tomaremos como transformada de Fourier (generalizada) de la funcin Delta de Dirac el lmite de la
expresin anterior que vale 1,
lim T(n(x,y))=1.
n
Una tercera propiedad de la transformada de Fourier de la que haremos uso es la siguiente:

c)

f ( x, y ) ( x a, y b)dxdy = f (a, b)
Como hemos visto, la transformada de Fourier se aplica sobre funciones definidas en R2. Sin
embargo, las imgenes digitales estn definidas sobre valores enteros, es decir, (x,y)ZZ. Por ello
vamos a utilizar una nueva transformada, que es un caso particular de la anterior, a la que
llamaremos transformada de Fourier discreta. La transformada de Fourier discreta de la imagen
{f(m,n): m=0,1,...,M-1, n=0,1,...,N-1} de tamao MN viene dada por la expresin:
um vn
1 M 1 N 1 2i +
F (u, v) =
MN m=0 n=0
f ( m, n ) e M N
, u=0,1,...,M-1, v=0,1,...,N-1.
El valor de esta funcin en el origen nos da la intensidad luminosa media por pxel, es decir,
M 1 N 1
1
F (0,0) =
MN
f (m, n)
m =0 n =0
Nos va a permitir descomponer una imagen digital en sus componentes peridicas. Se puede
demostrar que la transformacin inversa es:
M 1 N 1 um vn
2i +
f (m, n) = F (u, v)e M N
, m=0,1,...,M-1, n=0,1,...,N-1.
u =0 v =0
Para la representacin del espectro de Fourier, es decir, de |F(u,v)|, como una imagen digital, suele
ser mejor representar la funcin D(u,v)=clog(1+|F(u,v)|), donde c es una constante de escala, y
evitamos as que la imagen obtenida sea prcticamente blanca.
Ejemplo:
Vamos a determinar la transformada de Fourier discreta de una imagen digital que es un filtro de
pasa baja, es decir, la imagen digital cuyo elemento central, (2,2), est sobre el origen de
coordenadas:
0 1/ 6 0
1 / 6 1 / 3 1 / 6

0 1 / 6 0
La transformada de Fourier discreta viene dada por la expresin:
1 1 2i
0 u 1v ( 1) u 0 v 0u 0 v 1u 0 v 0 u ( 1) v
+ 1 2i + 1 2i + 1 2i + 1 2i +
F (u, v) = e 3 3
+ e 3 3
+ e 3 3
+ e 3 3+ e 3 3

9 6 6 6 6 6
=
54
e[
1 2iv / 3
+ e 2iv / 3 + 1 + e 2iu / 3 + e 2iu / 3 ]
=
1
[1 + cos(2u / 3) + cos(2v / 3)]
54
Hay que resaltar que la imagen la hemos considerado centrada en el origen, y por tanto, m=-1,0,1 y
n=-1,0,1. Su representacin grfica se muestra en la figura 2.5.
Figura 2.5. Transformada de Fourier de F(u,v).

0 Cap2 Transformaciones

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

0 Cap2 Transformaciones

Cargado por

Copyright:

Formatos disponibles

Captulo 2

Representacin de imgenes digitales

2.1 Representacin de una imagen digital: matrices vinculadas.

Por lo tanto, una matriz vinculada es:

y una matriz vinculada asociada a ella, puede ser:

2.2 Relaciones bsicas entre pxeles.

a) Conectividad de tipo 5: los pxeles p y q con valores en V estn conectados si qN5(p)

(a) (b) (c)

2.4 Operaciones aritmticas, geomtricas, lgicas y vectoriales.

f (i, j ) g (i, j ) si f (i, j ), g (i, j ) R

El mximo de dos imgenes f y g, MAX(f,g), se obtiene calculando el mximo de los valores

a11 a12 ... a1n a11 a12 ... a1n

a11 a12 ... a1n a11 a12 ... a1n

El operador SELECCION depende de la imagen y de cuatro parmetros, que son: el tamao

Veamos ahora la operacin de EXTENSION. Dadas dos imgenes f y g, la operacin de

Mediante la composicin de estos operadores bsicos podemos construir nuevos operadores

EXTSUMA(f,g) = EXTENSION [ EXTENSION ( SUMA(f,g), g), f]

La propiedad 2) expresa que la umbralizacin de la misma imagen con un umbral ms alto,

Obsrvese que TRUNCAR(f ; t)=MULT[f , UMBRAL(f ; t)].

Anlogamente, se definen los siguientes operadores:

Veamos ahora algunas operaciones vectoriales. Se define el operador PIXSUM como

El operador MEDIA se define de la siguiente forma:

donde CARD(f) es el tamao de la imagen (nmero de pxeles).

Se define el operador PRODUCTO ESCALAR de las imgenes f y g como:

f (i, j ) g (i, j ) si f y g tienen el mismo dominio

Se define la NORMA Eucldea de una imagen de la siguiente forma:

Un vector de imgenes es una coleccin ordenada de n imgenes, que denotaremos por:

y el operador MAG2(f), que corresponde a la norma L2 (norma eucldea):

2.4. Filtros lineales de promedio (mscaras o plantillas)

Una mscara (o plantilla) g de tamao (2m+1)(2n+1) es una matriz de tamao (2m+1)(2n+1)

Si hacemos h=i+r y k=j+s entonces tambin se puede expresar como

[FILTRO( f ; g )](i, j ) = g (r , s) [TRAS ( f ; r , s)](i, j )

Los filtros de promedio mvil pueden ser:

2.5. Filtros no lineales

Anlogamente podemos definir el operador mximo (MAX) mediante la expresin:

Otro operador no lineal es el filtro MEDIANA que viene definido como:

2.6. Filtros de tipo Gradiente

f DX ABS UMBRAL EJE_VERT(f,,t)

[PREWDX(f)](i,j) = ( [DX(f)](i+l,j+1) + [DX(f)](i,j+1) + [DX(f)](i+l,j) +

Tambin se puede expresar este operador en trminos de la mscara de Prewitt:

Utilizando el operador diferencia de Prewitt, definimos el operador gradiente de Prewitt:

PREWGRAD(f) = (PREWDX(f) , PREWDY(f))

SOBDX(f) = ESCALAR[1/8; FILTRO(f;SOB1)]

El gradiente de Sobel viene dado por el vector:

2.7. Matrices de relacin espacial

R(r,s) : (i, j) (i+r, j+s),

donde r y s son dos nmeros enteros.

Si consideramos el entorno N8(i,j), podemos establecer 8 relaciones diferentes, segn el pxel

(i ,j) (i+1 ,j)

(i, j) (i+1 ,j-1)

1. (i,j)R(i,j) , es decir, (i,j) est relacionado con (i,j)

hR (0,0) ... hR (0, s ) ... hR (0, L 1)

Para evitar problemas en el tiempo de computacin y de almacenaje, se suelen considerar slo

a) Consideremos la siguiente imagen cuyo rango de niveles de gris es el conjunto {0,1}:

Si utilizamos la relacin espacial R(1,1) obtenemos la siguiente matriz de relacin espacial:

Si consideramos la relacin R (1,1) obtenemos la siguiente matriz de relacin espacial:

Anlogamente, para la relacin espacial R(1,0) se obtiene la matriz de relacin espacial,

Figura 2.2. Representacin mediante armnicos de una onda cuadrada.

La transformada de Fourier de una funcin f(x,y) viene dada por la expresin:

donde i = 1 es la unidad imaginaria y eix = cos( x) + i sen( x) . Es una descomposicin de la

F (u, v) = R 2 (u, v) + I 2 (u, v)

Figura 2.3. Representacin del ngulo de fase.

As podemos interpretar la transformada de Fourier como los coeficientes de ponderacin en las