Gustavo Roitman
14 de noviembre de 2010
1.. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
6.. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Apendice 92
local del parametro x, o en alg un tipo de filtrado sobre la senal medida. De acuerdo a
esta clasificacion, se pueden distinguir dos grandes clases de esquemas de observacion, el
esquema centralizado y el esquema descentralizado.
El total de las mediciones {z1 . . . zK } puede ser a su vez ordenado en un u nico vector
M
z < , y la relacion que existe entre los vectores x e z es aquella que surge de modelar
las caractersticas de los dispositivos sensores, mediante las leyes fsicas y curvas que los
describen. Dicha relacion puede representarse mediante una funcion h() : <N 7 <M .
Teniendo en cuenta tambien el ruido que afecta a las observaciones, y suponiendo que el
mismo es aditivo, se puede formular el siguiente modelo de observacion:
z = h(x) + , (2.1)
donde es un vector de dimension M que contiene los ruidos asociados a todas las
mediciones. En funcion del criterio de estimacion que se utilice para la confeccion de la
regla de fusion se requerira conocer, con mayor o menor detalle, las caractersticas de la
funcion h() y del ruido . En la bibliografa, este esquema de fusion en el que solo se
dispone de las mediciones z, es tambien denominado measurement fusion.
Es importante notar que dependiendo de las dimensiones de los vectores x e z se tienen
problemas distintos, desde el punto de vista de la informacion disponible. A saber, si la
cantidad de mediciones disponibles (M ) es menor que la cantidad de parametros a estimar
(N ) se tiene un problema indeterminado (o subdeterminado). Ademas, dependiendo de
la forma de la funcion h(), podra ocurrir que para M N se tenga un problema
indeterminado (falta de informacion), determinado (ni falta ni exceso de informacion) o
sobredeterminado (existe redundancia). Tambien es importante analizar los efectos del
2. Fusi
on de datos: Modelos, criterios e hipotesis 7
z1 y1 = g1(z1)
z2 y2 = g2(z2)
x .. .. F xF
zK yK = gK (zK )
donde cada valor de k es un instante de tiempo, siendo f () una funcion que representa
la evolucion del sistema, u(k) una eventual variable de control y w(k) un ruido propio
del proceso dinamico. Por su parte, un esquema de observacion adecuado a este modelo
dinamico sera
zi (k) = hi (x(k)) + vi (k) con i = 1, . . . , K , (2.3)
donde el subndice i representa que hay una ecuacion de observacion por cada dispositivo
sensor. Ordenando las observaciones de todos los sensores en un u nico vector, puede
2. Fusi
on de datos: Modelos, criterios e hipotesis 8
donde
% % %
f f f
F(k) = , D(k) = , C(k) = . (2.9)
x u w
x=x(k) u=u(k) w=E[w(k)]
En las linealizaciones, las derivadas se calculan para un entorno de cada vector al instante
k, dado por x(k), u(k). En el caso de la derivada respecto de w, se puede adoptar como
punto de reposo el valor medio de w(k).
2. Fusi
on de datos: Modelos, criterios e hipotesis 9
Una de las desventajas de este metodo de estimacion es que solo considera al maximo
absoluto de la funcion de densidad a posteriori, sin dar importancia a los maximos locales
que pudiera presentar una densidad multimodal. Por otra parte, este metodo requiere
de la b
usqueda de un maximo lo cual implica, en general, la implementacion de alg un
algoritmo de maximizacion.
Minimo error cuadr atico medio (MMSE) Muchos criterios de estimacion surgen
de definir una funcion costo (loss function), que cuantifique la cercana de la estimacion
al valor de x que dio origen a las observaciones. A cada estimacion se puede asociar un
x
), que tpicamente aumenta cuando la distancia entre x
costo L(x, x y x crece, y la forma
de medir el costo asociado a la estimacion x para todos los posibles valores que asume la
variable aleatoria x es a traves del calculo de la siguiente expectacion (perdida media o
expected loss): Z
)] =
E [L(x, x ) p(x)dx .
L(x, x (2.12)
x
Para el caso en que la estimacion se basa en un conjunto de mediciones z, la expresion
(2.12) pasa a tomar la siguiente forma:
Z
)|z] =
E [L(x, x ) p(x|z)dx ,
L(x, x (2.13)
x
A los estimadores derivados de la definicion de una funcion costo se los suele denominar
estimadores Bayes ([3]).
En particular, el criterio de mnimo error cuadratico medio (MMSE) surge de adoptar
una funcion costo denominada error cuadratico, dada por L(x, x k2 , y por lo
) = kx x
tanto la estimacion optima es aquella que cumple:
k2 |z .
M M SE = arg mn E kx x
x (2.15)
x
su parte, en el caso mas general, la estimacion de mnimo error cuadratico medio consiste
en un proceso de integracion.
Si la optimizacion de la expresion (2.15) se limita a soluciones en que la estimacion
sea una funcion afn de las observaciones, el problema admite una solucion cerrada. El
problema se plantea del siguiente modo:
k22 |z ,
M M SE = arg mn E kx x
x (2.17)
=Bz+u
x
Mnimo error absoluto medio Este criterio adopta como funcion costo al valor abso-
) = kx x
luto del error: L(x, x k2 . Es posible demostrar que la solucion a la minimizacion
de esta funcion costo es, para el caso unidimensional, la mediana de x de acuerdo a la
funcion de densidad de probabilidad a posteriori.
Este criterio practicamente no se utiliza, debido a la complejidad asociada al hecho
de que la funcion costo no es derivable, y que la definicion de mediana no es u nica para
casos en que x tiene dimension mayor a uno.
donde
(z) = (h(x) + ) . (2.28)
Esta u dependera de
ltima expresion aclara el hecho de que la forma en que la estimacion x
las muestras estara ntimamente relacionada con el modelado que se haga del esquema de
observacion.
Cuando las funciones h() y () son linealizadas se tiene un problema de minimizacion
que admite una solucion cerrada, y que se analiza en el captulo 3.
2. Fusi
on de datos: Modelos, criterios e hipotesis 13
Las curvas de performance (PD vs. PF ) para el caso descentralizado se acercan mas
a las curvas del caso centralizado cuanto mas desbalanceados esten los sensores, en
terminos de relacion se
nal a ruido. En el caso extremo de que un sensor tenga relacion
senal a ruido nula, se tiene coincidencia entre el desempe no de ambos esquemas.
As como Tenney y Sandell concentraron su analisis mayormente en reglas de deteccion
locales, el trabajo publicado por Chair y Varshney ([5]) en el ano 1986 concentra su analisis
en una regla de fusion de dichas decisiones locales. En este segundo trabajo se generaliza el
esquema de observacion a una cantidad arbitraria de sensores, y tambien se realiza un test
de hipotesis binario (H0 vs. H1 ). Se supone que los detectores locales ya estan dise
nados,
y que se conocen sus probabilidades de error individuales. El criterio de optimizacion es
el de mnima probabilidad de error global.
Algunas caractersticas de la regla de fusion dise
nada son:
Se deriva una regla de fusion que contempla los resultados de todas las detecciones
locales, sin descartar a ninguna.
Las decisiones locales influyen en la decision centralizada de acuerdo a sus niveles
de confiabilidad. Aquellos detectores que tienen mayor confiabilidad (mayor PD y
menor PF ) son los mas influyentes, y los detectores con menor confiabilidad son los
que menos influyen en la decision centralizada.
El problema mas general, tal como se lo describe al comienzo de esta seccion, con
cantidades arbitrarias de sensores {z1 , . . . , zK } e hipotesis marias {x1 , . . . , xm }, se trata
en el trabajo publicado por Sadjadi ([6]). Se resuelve el problema para una funcion de
costos generica, y se obtienen las ecuaciones que conducen a las regiones de decision
para la deteccion optima. Al igual que en el primer trabajo mencionado, el desarrollo
esta orientado a determinar reglas de decision locales, que optimicen el desempe no global
mediante una funcion de costos unica.
estructuras entre las imagenes. La asociacion consiste en decidir si las mediciones que se
observan provienen de un mismo conjunto de parametros o no. Por ejemplo, en aplicaciones
de radar, es com un que cada sensor observe puntos que corresponden a trayectorias de
moviles distintos. La asociacion, en ese caso, consiste en decidir cuales observaciones
corresponden a la trayectoria de un mismo movil. En muchos casos, la registracion y la
asociacion son pasos necesarios previos a la fusion de los datos. La tecnica propuesta en
[12] se basa en un modelo dinamico, como los mencionados anteriormente, y en un criterio
de optimizacion basado en Maximum-Likelihood.
(z) = Bz + u . (2.29)
z1 = x + 1 (3.1)
z2 = x + 2 , (3.2)
siendo i ruidos de cualquier tipo, con media nula y matriz de covarianza conocida:
1
E =0 (3.3)
2
1
E 1 2 = . (3.4)
2
xF = 1 z1 + 2 z2 + u , (3.5)
22 = E (z2 x)2 = E 22
22 12 12 12
xFBAU E = z1 + z2 . (3.15)
12 + 22 212 12 + 22 212
12 22 12
2
F2 BAU E = , (3.16)
12 + 22 212
3. Fusion BAUE 21
y para averiguar si esta varianza resulta menor o mayor que 12 y 22 , se plantea la siguiente
desigualdad, para luego desarrollarla y validarla:
F2 BAU E 12
12 22 12 2
2 2
12
1 + 2 212
12 22 122
14 + 12 22 212 12
2
0 14 212 12 + 12
0 (12 12 )2
Esta u ltima expresion se cumple siempre, es decir para cualquier par de valores de 12 y
12 , lo cual indica que siempre se cumple que F2 BAU E 12 . Trabajando de forma analoga
se llega a que F2 BAU E 22 .
Es interesante, ademas de verificar esta mejora de la varianza, analizar que forma
toman la regla de fusion BAUE y su varianza frente a condiciones particulares del prob-
lema.
22 12
xFBAU E = 2 z1 + 2 z2 (3.17)
1 + 22 1 + 22
Este resultado indica que si las mediciones tienen varianzas diferentes, se pondera con
mayor peso la medicion de menor varianza, y con menor peso la de mayor varianza. Es
decir que por mas imprecisa que sea alguna de las mediciones, la regla de fusion BAUE
nunca decide desecharla por completo. Estas dos ideas son consistentes con los resultados
de los trabajos mencionados en la seccion 2.3.
Bajo esta condicion de descorrelacion, la varianza de la regla de fusion resulta ser
12 22
F2 BAU E = . (3.18)
12 + 22
que indica, para cada valor de , cuan parecido es FBAU E a 1 . En la Fig. 3.2 muestra un
grafico donde se traza este cociente como funcion de . Este grafico puede interpretarse
del siguiente modo. En el caso en que 1 = 2 (es decir, = 1) el desvo estandar de la
3. Fusion BAUE 22
Bajo esta condicion, los ruidos estan totalmente correlacionados y tienen igual varianza,
con lo cual las observaciones son estadsticamente iguales, y la estrategia de fusion no
hace ninguna distincion entre las observaciones a la hora de hacer la combinacion lineal.
La fusion resulta igual a cualquiera de las observaciones, y por lo tanto tiene la misma
varianza, F2 BAU E = 12 = 22 .
3. Fusion BAUE 23
En primera medida se observa que al realizar una fusion de datos se gana precision
respecto de las mediciones originales. Esta mejora se manifiesta en la varianza de la
fusion, F2 BAU E . Dependiendo de las relaciones entre las varianzas de las mediciones,
de la cantidad de mediciones utilizadas y de su grado de correlacion, se logran
distintos niveles de mejora.
Esta mejora en la precision ocurre siempre y cuando la fusion se haga sobre medi-
ciones estadsticamente diferentes. Esto es, no hay mejora cuando las mediciones
estan correlacionadas totalmente, es decir con |ij | = | iijj | = 1.
Se observa que los esquemas de fusion parecen hacer uso de todas las mediciones,
incluso de aquellas cuyas varianzas son mayores, y es as que logran reducir la
varianza de la fusion por debajo de la de cualquiera de las mediciones originales.
Esto da la pauta de que nunca se deben descartar mediciones, por mas imprecisas
que sean.
z = Hx + , (3.22)
donde H <M N es una matriz conocida que modela al sistema de observacion y <M
es un conjunto de perturbaciones a la medicion, que sin perdida de generalidad se puede
asumir que tiene media nula. La matriz de observacion H puede representar un sistema
de medicion sencillo, como es el caso en que H = [1, 1]T <21 , que analizamos en la
seccion 3.1, o puede representar a un sistema de medicion mas complejo, en el que cada
sensor zi observa sumiltaneamente a varias de las magnitudes de interes a la vez.
Ahora, para que sea posible recuperar informacion de todas las componentes del vector
x, la matriz H debe consistir en una buena observacion, es decir que debe comprender
una cantidad de obsevaciones linealmente independientes que sea mayor o igual a N .
En otras palabras: Rg(H) = N . Resultan de interes aquellos casos en los que existe
redundancia, con M > N = Rg(H), ya que son los que permiten realizar analisis tales
como los presentados en la seccion 3.1, y representan casos practicos de fusion de m
ultiples
sensores.
Bajo las mismas hipotesis y lnea de razonamiento de la seccion 3.1, el problema
es ahora encontrar la forma optima afn de combinar las observaciones z, para obtener
una fusion insesgada de mnimo error cuadratico medio. Esto es, encontrar una matriz
B <N M y un vector u <N constantes, tales que:
+u = arg mn E kxF xk2
x
FBAU E = Bz (3.23)
xF =Bz+u
E kxF xk2 .
(3.24)
siendo M una matriz simetrica y definida positiva. Dado que esta matriz permite pon-
derar o asignar prioridades a las componentes del vector error, los resultados obtenidos
seran m
as generales que los que se obtendran al adoptar, por ejemplo, la norma Eucldea:
kvk2 = vT v.
3. Fusion BAUE 25
es decir que
BH = I y u = 0 . (3.26)
Estas son restricciones que se deben contemplar durante el problema de minimizacion.
Se procede expresando el error cuadratico medio como funcion de la matriz incognita
B, a la vez que se hace uso de las condiciones de la ecuacion (3.26):
= E (B)T M(B) .
(3.27)
se obtiene
E kxF xk2m = E T r MB T BT
, (3.29)
y dado que la operacion T r() es una sumatoria y la expectacion es un operador lineal,
puede intercambiarse el orden de los operadores para luego obtenerse:
1 1
2 T T
E kxF xkm = T r MB B = T r B MB2 ,2
(3.30)
donde se adopta la notacion = E T .
Para la confeccion de la funcion de costos, a
un queda por dar forma a la condicion
BH I = 0. Ya que esta ecuacion matricial representa N N ecuaciones escalares, para
cada una de las cuales existe un multiplicador de Lagrange, resulta conveniente agrupar a
todos los multiplicadores en una matriz <N N . Si se parte de las N N condiciones
escalares:
XM
bln hnm = lm , (3.31)
n=1
de los cuales el primero representa T r (BH) y el segundo T r (). Por lo tanto, la funcion
costo puede expresarse finalmente como:
1 1
T
J(B, ) = T r B MB2 + T r ((BH I)) .
2
(3.34)
Para encontrar la matriz B que minimiza la funcion costo se puede calcular su gradiente
([22]):
J
= 2MB + (H)T , (3.35)
B
para luego igualarlo a cero. Si la matriz de covarianza del ruido tiene inversa, se puede
despejar B:
+ (H)T = 0
2MB
= 1 (H)T
MB
2
1
= M (H)T 1 .
1
B (3.36)
2
Finalmente, multiplicando a derecha por la matriz H y aplicando la condicion BH =I
se encuentra la matriz que da solucion al problema. Para realizar el despeje se supone
momentaneamente que tambien el producto HT 1 H tiene inversa:
1
M1 T HT 1
H = I
2
T = 2M(HT 1
H)
1
= 2(HT 1 1
H) M . (3.37)
menciona en [23]. Sin embargo, el error cuadratico medio asociado a la regla de fusion
s depende de la matriz M, tal como lo muestra la expresion (3.30).
Analogamente a lo que se concluyo en la seccion 3.1, respecto de adoptar como figura
de merito a la varianza de la regla de fusion, bajo este modelo general es de interes conocer
la matriz de covarianza de la regla de fusion, ya que esta es un ndice de cuan dispersa
o perturbada se ve la fusion como consecuencia del ruido aditivo. Aplicando la definicion
de matriz de covarianza y teniendo en cuenta la expresion (3.26), resulta:
xFBAU E x)T
FBAU E = E (
xFBAU E x)(
T
=E B (Hx + ) x B (Hx + ) x
T
=E I x + B
BH I x + B
BH
h i
T T
= E B B = B B
T . (3.40)
FBAU E = ((HT 1 1 T 1 T 1 1 T 1 T
H) H ) ((H H) H )
= (HT 1 1 T 1 T 1
H) (H H)(H H)
1
,
1
FBAU E = HT 1
H . (3.41)
Se observa que la matriz de covarianza de la fusion tambien resulta independiente de la
matriz M.
Los resultados que presentan las expresiones (3.39) y (3.41) son equivalentes a lo
publicado en [11], como Minimum Variance Fusion Approach bajo las simplificaciones
M = I, N = 1 y HT = [1, 1, . . . , 1], y a lo publicado en [24] como Minimax MSE
Estimation in the Linear Gaussian Model.
Para caracterizar mas claramente el desempe no de la regla de fusion, mas alla de
conocer su matriz de covarianza, se analizan diversas condiciones del problema realizando
simulaciones donde se varan tanto la cantidad de observaciones M como la relacion senal
a ruido de las mismas.
M . Un segundo caso, en el que los ruidos estan descorrelacionados pero con varianzas
diferentes, = diag(21 , 22 , . . . , 2M ), se muestra en la Fig. 3.3 (uncorr. Gaussian).
Dado que la regla de fusion desarrollada en la seccion 3.2 solo depende de los momentos de
primer y segundo orden del ruido, se espera que para cualquier tipo de ruido con la misma
media y matriz de covarianza se logren iguales niveles de performance. Se simula, entonces,
un escenario equivalente pero con densidades uniformes, con las mismas estadsticas de
primer y segundo orden que en el caso Gaussiano, Fig. 3.3 (i.i.d. Uniform y uncorr.
Uniform).
Una caracterstica com un se observa en todos los trazados:
1
M SE para M > N = 4 , (3.42)
M
y se observa que los niveles de error cuadratico medio son iguales, para ruido uniforme
y para ruido Gaussiano. Identicas conclusiones se extraen adoptando distintos valores de
N y x. En todos los casos, la matriz de observacion H <M N se genero aleatoriamente,
cumpliendo que Rg(H) = N . Casos con matriz de covarianza arbitraria (no diagonal) no
fueron presentados, debido a la inestabilidad numerica en la inversion de la matriz
para valores elevados de M .
Relaci
on senal a ruido Tambien es de esperar que el error cuadratico medio vare
dependiendo de cual sea la relacion se
nal a ruido de las mediciones. Entonces, para un
3. Fusion BAUE 29
nas hipotesis adicionales. En esta seccion analizamos las implicancias de haber adoptado
cada una de dichas hipotesis.
Aqu se ve que en la minimizacion de J() intervienen las variables B, u y x. Esto nos hace
pensar que, por ejemplo, para un determinado valor de x habra un conjunto de valores
de B, u que minimizan a J(), y que tanto el valor que adopte J() como los que adopten
B y u dependeran del valor de x. Esta situacion, en que el conjunto de parametros se
adecua al valor de x, puede ser particularmente u til si se dispone, a priori, de alg un
conocimiento acerca del valor de x. Si, en cambio, no se conoce nada acerca del valor de
x, resulta natural buscar la minimizacion de la funcion costo J() bajo la condicion de que
3. Fusion BAUE 31
u
la optimizacion (Jmin , B, ) no dependa del valor de x, es decir que ni el error cuadratico
medio ni la regla de fusion dependan del valor de la variable a estimar. Para buscar dicha
condicion, escribimos el valor mnimo de la funcion costo como
T h 1
1i
Jmin = I x+u
BH M BH I x+u + T r 2 B T MB 2 , (3.47)
Aqu, el termino que depende del vector u aporta una cantidad constante al valor de
la funcion costo, y no interactua con ninguna de las demas variables del problema. Es
as que el mnimo valor que puede adoptar J() se da cuando u = 0. Resulta, entonces,
que bajo la hipotesis de regla de fusion afn, pedir que la minimizacion de la funcion costo
sea independiente de x lleva a que la regla de fusion resulte insesgada. Por otra parte, a
la luz de lo desarrollado a lo largo de la seccion 3.2, si imponemos la condicion de que el
estimador sea insesgado llegamos a una funcion costo independiente del valor de x. Estas
dos afirmaciones dan lugar a la siguiente doble implicancia:
E[xF ] = x {Jmin independiente de x} (3.50)
Conclusi on Bajo el criterio de mnimo error cuadratico medio y regla de fusion afn,
son equivalentes la hipotesis de regla de fusion insesgada y la hipotesis de error cuadratico
medio independiente del valor de la variable x a estimar.
Estimacion de un escalar
Bajo los mismos modelos y notaciones utilizadas en la seccion 3.2, se analiza el caso
en que N = 1, esto es, H = h <M , x = x <:
z=hx+ , (3.51)
bT <1M y u = u <:
y por lo tanto B =
xF = bT z + u . (3.52)
El error cuadratico medio logrado mediante una fusion BAUE, adoptando la norma Eu-
cldea (M = I), sera de acuerdo a la expresion (3.30)
h
T b
i
= 1
M SEu = T r b T
, (3.53)
h h
que por corresponder a una estimacion insesgada, cumple que M SEu = F2 BAU E . Para un
valor particular x = x, el error cuadratico medio para una regla de fusion sesgada, dado
por la expresion (3.46), resulta ser:
2
x) = bTb h 1 x + ub + bTb bb ,
M SEb ( (3.54)
donde se reservan los subndices b para referirse a los parametros de la regla de fusion
sesgada. Si para este valor de x = x se logra que
M SEb (
x) = M SEu . (3.57)
Es decir, si < 1 resulta preferible utilizar la regla de fusion sesgada frente a la insesgada.
Si bien esta igualdad es valida solamente para x = x, y requiere de conocer el valor
exacto de x, existe un intervalo xmin < x < xmax dentro del cual sigue siendo cierto que
M SEb < M SEu , y cuyos extremos se pueden calcular partiendo de la siguiente inecuacion:
T 2
bb h 1 x + ub + M SEu < M SEu . (3.58)
donde s
1+
= . (3.60)
1
3. Fusion BAUE 33
Aplicando la regla de estimacion sesgada dada por las expresiones (3.61) y (3.62) y sim-
ulando un total de 10000 realizaciones para el ruido , a efectos de calcular estadsticas,
se obtuvieron los siguientes resultados para los errores cuadraticos medios:
Estimacion de un vector
Se presenta ahora una generalizacion de la regla de fusion sesgada, para el caso en que
x <N , y por simplicidad se asume que M = I, es decir que se adopta la norma Eucldea.
Haciendo dicha simplificacion, la expresion (3.46) toma la forma:
h i
M SEb (B, u, x) = ((BA I) x + u)T ((BA I) x + u) + T r B BT .
(3.70)
Por lo tanto, el problema de encontrar una regla de fusion sesgada optima, que tenga
menor error cuadratico medio que la regla BAUE, puede plantearse como encontrar un
conjunto de parametros Bb , ub que cumplan:
0, x
M SEb (Bb , ub , x) < M SEb B, x X
M SEb (Bb , ub , x) M SEb (B, u, x) B, u, x X (3.72)
En otras palabras, que la regla sesgada tenga menor error cuadratico medio que la regla
BAUE en cierto intervalo X <N , y que sea la regla de menor error cuadratico medio
entre todas las posibles reglas sesgadas. Para realizar la optimizacion puede utilizarse un
criterio minimax:
n o
(Bb , ub ) = arg mn max M SEb B, u, x M SEb B, 0, x (3.73)
B,u xX
3. Fusion BAUE 36
X = {x : xH x + 2<{cH
1 x} + d1 0} , (3.74)
T r(J1 T r(J1
x ) x )
xb = 1 H
+
x H
c1 . (3.75)
T r(J1
x ) + c 1 c 1 d1 T r(J1
x ) + c 1 c 1 d1
T r(J1 T r(J1
x ) x )
xb = 1 +
x .
x (3.76)
T r(J1
x )+c
2 T r(J1
x )+c
2
Planteo y desarrollo
Dado que se supone a x un parametro determinstico, y siendo que la matriz H es
conocida, entonces las mediciones z estan distribuidas de acuerdo a N (Hx, ). En primer
lugar se define la funcion de verosimilitud Lx (z):
1 1 T 1 (zHx)
Lx (z) =
p(z|x) = e 2 (zHx)
. (3.79)
(2)M/2 | |1/2
Para encontrar el valor de x que maximiza esta expresion, es conveniente notar que la
funcion et es monotona creciente y por lo tanto se puede maximizar su argumento:
1
ln (Lx (z)) = k (z Hx)T 1
lx (z) = (z Hx) . (3.80)
2
Esta expresion tiene un u
nico maximo que puede encontrarse igualando su gradiente a
cero. Para calcular la derivada de lx (z) respecto de x se hace primero un cambio de
variable: v = z Hx, y se aplica la regla de la cadena para la derivacion respecto de un
vector:
lx (z) v lx (z)
= .
x x v
El primero de los terminos resulta ser:
v [z Hx]
= = HT ,
x x
y el segundo:
1 vT 1
lx (z) v
= = 1 1
v = (z Hx) .
v 2 v
lx (z)
Por lo tanto, de la condicion x
= 0, resulta la siguiente ecuacion:
HT 1
(z H
xF M L ) = 0
3. Fusion BAUE 38
HT 1 z HT 1
H
xFM L = 0
HT 1
HxFM L = HT 1
z
1
FM L = HT 1 HT 1
x H z . (3.81)
Por las mismas razones que se expusieron en la seccion 3.3, se supone que la matriz
T 1
H H tiene inversa.
Analisis de resultados
Se encuentra, en primer lugar, que la regla de fusion Maximum Likelihood para el caso
de ruido Gaussiano resulta ser la misma que la regla de fusion afn derivada mediante el
criterio de mnimo error cuadratico medio (BAUE). Esta coincidencia hace evidente el
hecho de que la regla de fusion Maximum Likelihood es afn e insesgada para el caso de
ruido Gaussiano, y ademas, por ser ambas reglas de fusion exactamente iguales, la matriz
de covarianza de la regla ML tambien es:
FM L = (HT 1
H)
1
(3.82)
Cota de Cram` er-Rao Cuando se conoce la distribucion del ruido, se puede estudiar
la eficiencia de la estimacion mediante la comparacion con la Cota de Cram`er-Rao. Esta
cota es un lmite inferior para la varianza (o matriz de covarianza) de cualquier estimacion
insesgada que se haga para un cierto parametro. La cota establece que, en el caso escalar:
" 2 #
1 l (X)
V AR[] donde I() = E ,
I()
y en el caso vectorial:
" T #
I()1 l (X) l (X)
COV [] donde I() = E , (3.83)
lx (z)
= HT 1 T 1
(z Hx) = H ,
x
y reemplazando este resultado en la ecuacion (3.83) se encuentra que:
1 1
x] E (HT 1 T 1 T
= HT 1 T 1
COV [ )(H ) E[ ] H
1
x] HT 1
COV [ H . (3.84)
u uo xc
= (4.1)
f zc
v vo yc
= , (4.2)
f zc
despejando u y v de estas expresiones se tiene
xc
u= f + uo (4.3)
zc
yc
v = f + vo , (4.4)
zc
y se observa que las coordenadas xc e yc aparecen en ambas ecuaciones normalizadas con
el valor de zc . Para poder describir la proyeccion como una operacion lineal se procede
multiplicando ambos miembros de las ecuaciones por el factor zc :
uzc = xc f + uo zc (4.5)
vzc = yc f + vo zc (4.6)
Es importante notar que as como el punto (xc , yc , zc ) se proyecta en el punto (u, v),
cualquier punto que se encuentre sobre la recta que une a dichos puntos tendra la misma
proyeccion (u, v) (ver Fig. 4.1). Observando las ecuaciones, queda claro que si se toma un
punto cualquiera de la recta (x0c , yc0 , zc0 ) = s (xc , yc , zc ), la proyeccion (u, v) es la misma:
s xc
u f 0 uo
s zc = s yc . (4.8)
v 0 f vo
s zc
4. Modelos de camara y lente 43
Este hecho se suele representar agregando una ecuacion mas al sistema de ecuaciones
(4.7), que indique que puede haber un factor de escala s arbitrario, proporcional al valor
de zc :
u f 0 uo xc xc
s v = 0 f vo
yc = A yc .
(4.9)
1 0 0 1 zc zc
De este modo, para cada punto del espacio (xc , yc , zc ) se realiza el producto matricial de
la ecuacion (4.9) y se obtiene como resultado un vector
U u
V = s v , (4.10)
s 1
Dicho factor es tpicamente cero, salvo en casos muy especiales, que no son de interes para
nuestro estudio (ver [26]).
A simple vista se concluye que esta transformacion no es lineal, ya que contiene al vector
constante t. Sin embargo, es posible expresar esta operacion como una transformacion
lineal si se representa al vector (xa , ya , za ) en un espacio de dimension 4, bajo la siguiente
equivalencia:
xa
xa ya
ya , (4.15)
za
za
1
y a la transformacion como el producto
xa xa
xc ya ya
yc = R t = r1 r2 r3 t , (4.16)
za za
zc
1 1
donde ri son los vectores columna de la matriz de rotacion. Finalmente, expresando la op-
eracion de proyeccion para este nuevo conjunto de coordenadas, se tiene la transformacion
completa:
xa
u ya
s v = A R t za .
(4.17)
1
1
4.2. Lentes
El modelo de camara pinhole permite explicar solo los efectos de proyeccion en el
sistema fotografico. Es por ello que cuando se trabaja con camaras convencionales que
s involucran una lente o un conjunto de lentes, es necesario incorporar modelos que
expliquen otros fenomenos que aparecen. En esta seccion trataremos algunos de los efectos
distorsivos de la lente, haciendo particular enfasis en aquellos que se especifican en las
hojas de datos de lentes para fotografa profesional.
Las lentes del sistema fotografico tienen por funcion lograr un tama
no de campo visual
distinto del que se tendra seg
un el esquema de camara pinhole. Se pueden utilizar lentes
para reducir el campo visual y magnificar un sector de la escena (como si se aumentara
la distancia focal f ), o tambien para ampliar el campo visual (como si se redujera f ).
En el ambito de la fotografa, a estas dos configuraciones se las suele denominar teleob-
jetivo (telephoto) y gran angular (wide-angle), respectivamente, y en general se las logra
mediante un sistema de varias lentes.
El modelo pinhole supone que los rayos ingresan a la camara a traves de un punto sin
dimensiones, sin embargo las camaras fotograficas tienen un diafragma cuyas dimensiones
pueden variar. Al cociente entre la distancia focal y el diametro del diafragma se lo
denomina apertura relativa, y se lo simboliza como f/ o f-stop. Por ejemplo, una
apertura relativa f/8 representa un diametro del diafragma ocho veces mas chico que la
distancia focal. El valor de la apertura relativa por un lado influye, al igual que el tiempo
4. Modelos de camara y lente 45
de exposicion, en la cantidad de luz que ingresa a la camara; y por otro lado tambien
afecta a la resolucion espacial de la imagen proyectada1 .
1
Esta u
ltima idea se desarrolla en la seccion 4.2.4
4. Modelos de camara y lente 46
donde
p
r= (u uo )2 + (v vo )2 : distancia del punto (u, v) al centro optico
p
r0 = (u0 uo )2 + (v 0 vo )2 : distancia del punto (u0 , v 0 ) al centro optico.
Fig. 4.4: Curvas de distorsion porcentual, para los modelos Apo-Digitar 5.6/24, de Schneider
Optics (izquierda), y Apo-Sironar digital 35 mm f/4.5, de Rodenstock Photo Optics
(derecha).
u = u u0 = k3 r3 + k4 r4 + . . . (4.21)
v = v v 0 = k3 r3 + k4 r4 + . . . , (4.22)
o en forma equivalente
u0 = u (k3 r3 + k4 r4 + . . .) (4.23)
v 0 = v (k3 r3 + k4 r4 + . . .) , (4.24)
donde se asumio k0 = k1 = k2 = 0.
En la bibliografa ([26], [27], [29]), al realizarse la calibracion de los parametros k3 , k4 , . . .,
en camaras digitales para vision artificial, se asume que solo el primer termino (o los
primeros dos terminos) es relevante para un buen ajuste, y que la inclusion de terminos
de orden superior no es de importancia, e incluso lleva a problemas de estabilidad numeri-
ca. Sin embargo, para explicar la distorsion en todo el campo visual de la lente, resulta de
importancia la consideracion de terminos de ordenes superiores (ver trazados en la Fig.
4.4).
No se entra en mayor detalle acerca de este efecto de distorsion, ya que en lentes profe-
sionales predomina la distorsion radial frente a la tangencial2 .
En caso de tenerse ambos tipos de distorsion, las variables observadas se relacionan
con las variables del modelo pinhole sumando ambos efectos de distorsion:
u u0 = ur + ut (4.27)
v v 0 = vr + vt , (4.28)
Sistema lineal
(
H
I10 (u, v)
I1 (u, v) H
H a1 I10 (u, v) + a2 I20 (u, v) ,
a1 I1 (u, v) + a2 I2 (u, v)
I20 (u, v)
I2 (u, v)
I1 , I2 , a1 , a2 (4.29)
p
El eje de las abscisas, que representa la frecuencia espacial = 12 + 22 , se mide
en unidades de pares de lineas por milmetro, [lp/mm]. La escala [lp/mm] mide
la cantidad de pares de lineas (linea clara - linea oscura) que se observan en un
milmetro de la imagen proyectada.
Tal como se menciono con anterioridad, es un hecho que las caractersticas de la lente
tienen variaciones importantes para valores crecientes de la distancia r. Tambien es natural
imaginar que, en general, la MTF depende de ambas frecuencias, 1 y 2 , y por lo tanto
la curva cambia dependiendo de la orientacion del patron de intensidades. Para ilustrar
estos efectos, se muestran en la Fig. 4.6 curvas MTF de las mismas lentes a las que se
hizo referencia durante el analisis de distorsion radial.
De estas curvas se extraen algunas caractersticas mas especficas:
El eje de las abscisas no representa frecuencias espaciales, como en la Fig. 4.5, sino
distancia al centro optico r, absoluta (en mm) o relativa al radio de la lente. De esta
manera se describe la dependencia de la MTF con la posicion.
Fig. 4.6: Curvas MTF para los modelos Apo-Digitar 5.6/24, de Schneider Optics (izquierda), y
Apo-Sironar digital 35 mm f/4.5, de Rodenstock Photo Optics (derecha).
Se trazan varios pares de curvas (solida y punteada) en cada grafico, y cada par de
curvas se asocia a un valor de frecuencia . Por ejemplo, en las curvas de la izquierda
las frecuencias son = 7,5 lp/mm, 15 lp/mm y 30 lp/mm; y en las curvas de la
derecha las frecuencias son = 3,75 lp/mm, 7,5 lp/mm, 15 lp/mm y 30 lp/mm.
Para frecuencias crecientes, las curvas de MTF tienen menor amplitud. Es decir que
la MTF se parametriza para ciertos valores de frecuencia, y se trazan las curvas
como funcion de la distancia al centro optico.
Los graficos que se muestran tambien estan dados para valores especficos del factor
de escala ( 0 = 0, en un caso, y 0,02x, en el otro) y de la apertura del diafragma3
(f/11, en un caso, y f/8, en el otro).
f
D 2,44 = 2,44 f-stop , (4.35)
d
siendo d el diametro de la apertura del orificio y la longitud de onda. Esta es una
limitacion en la maxima resolucion que se puede alcanzar en la imagen proyectada.
MTF de cada etapa, y que el sensor electronico afecta a la MTF del sistema fotografico.
En efecto, el hecho de que el pxel tenga un area determinada sobre la cual se proyecta la
senal de luz, implica que la senal electrica generada resulta en una integracion de toda la
luz que ilumina al sensor. Esto hace que, por ejemplo, una se nal de luz cuya intensidad
tenga variaciones a lo largo del area del sensor, sea interpretada como una se nal cuyo
valor de intensidad sea el valor promedio de la verdadera se nal proyectada.
Es natural, entonces, afirmar que la maxima frecuencia espacial que puede detectarse
con certeza en un sensor electronico es aquella que corresponde a un ciclo cada dos pxeles
(una lnea con luz en un pxel, y una lnea sin luz en el pxel vecino). Esto no es otra cosa
que el Criterio de Nyquist para el muestreo de una se nal. Si se conocen las densidades de
pxeles du y dv , entonces las dimensiones horizontal y vertical del pxel promedio son 1/du
y 1/dv , y las frecuencias maximas que pueden detectarse cumplen:
1 2
= (4.40)
1M AX du
1 2
= , (4.41)
2M AX dv
du
1M AX = (4.42)
2
dv
2M AX = . (4.43)
2
Las imagenes proyectadas que tengan frecuencias espaciales mayores que estos maximos
seran interpretadas erroneamente, ya que estaran afectadas por el efecto de aliasing.
Es importante mencionar que dado que en la imagen digital las distancias se observan
en pxeles, las frecuencias (1 , 2 ) se mediran en ciclos por pxel, o pares de linea por pxel.
De todas formas, conociendo las distancias entre pxeles se puede hacer la conversion de
unidades a pares de lineas por milmetro.
Al efecto de aliasing en imagenes se lo suele denominar Efecto Moire.
Par
ametro Especificaci
on
H 7,60mm
V 5,70mm
NH 3648
NV 2736
f 6,1mm
Fig. 4.10: Patron senoidal de frecuencias generado mediante Test Charts (los patrones de onda
rectangular superiores e inferiores son de referencia).
La camara se monta sobre un trpode a una altura y con una inclinacion tales que
el panel de calibracion quede perpendicular al eje optico, y por lo tanto no haya defor-
maciones debido a la perspectiva. Se toman fotografas del patron para distintas aper-
turas relativas. En la tabla A.1 del apendice A se especifican los parametros bajo los
cuales fueron tomadas las fotografas de calibracion, y se hace referencia a las imagenes
disponibles en el DVD que acompa na a este trabajo.
Una vez tomadas las fotografas de calibracion, se capturan los niveles de gris obser-
vados en los patrones de cada fotografa, en las zonas de mayor contraste7 , y se obtiene
as un conjunto de 11 curvas en cada una de las 10 imagenes de calibracion. A modo de
ejemplo, en la Fig. 4.12 se muestran los perfiles de intensidades asociados a dos casos
extremos: respuesta en el centro del sistema optico (patron n
umero 0), y respuesta en una
esquina del sistema optico (patron numero 5), en ambos casos con apertura relativa f/7.1.
A partir de los perfiles de intensidad se realizan detecciones de frecuencias y de sus
amplitudes asociadas, lo cual permite trazar los diagramas MTF como funcion de la
frecuencia espacial. Las curvas MTF correspondientes a los trazados de la Fig. 4.12 se
7
Se utiliz
o el paquete de software ImageJ, disponible en http://rsbweb.nih.gov/ij/ al 13/11/2010, que
permite trazar una recta sobre la imagen, y obtener el perfil de intensidades que se observa sobre dicha
recta.
4. Modelos de camara y lente 61
numerico que vincule las muestras de la MTF con las muestras de la respuesta
impulsiva. Se propone el uso de la FFT (Fast Fourier Transform) como algoritmo
eficiente para el calculo de la Transformada inversa de dos dimensiones.
Dado que las curvas MTF obtenidas estan afectadas por errores en los procesos de
observacion y de deteccion, y que se conocen para valores de frecuencia no uniforme-
mente espaciados, es conveniente realizar un ajuste de las curvas. De la observacion
de las curvas MTF y de sucesivas pruebas8 , se concluye que se logra un buen ajuste
mediante un modelo pasabajos de primer orden.
Para la determinacion del parametro caracterstico del modelo de primer orden (frecuencia
de corte, c ), se realiza un ajuste por Cuadrados Mnimos no lineal, mediante el algorit-
mo iterativo de Levenberg-Marquardt9 . Una vez realizado el ajuste, se dispone de una
parametrizacion de la MTF que tiene la siguiente forma
1
M T Fc () = r 2 (4.46)
1 + c
y para generar la respuesta en frecuencia como funcion de las dos frecuencias espaciales,
(1 , 2 ), se hace k
M T F (1 , 2 ) = M T Fc () 2 2 . (4.47)
= 1 +2
Para poder aplicar la FFT inversa de dos dimensiones10 sobre la respuesta en frecuencia,
se deben tener muestras uniformemente espaciadas, para lo cual se eval ua la funcion
M T F (1 , 2 ) una grilla de 16 x 16 con frecuencias en el intervalo {1 [1/2; 1/2] 2
[1/2; 1/2]}. De este modo se recupera una respuesta impulsiva, h(up , vp ), que tambien
esta evaluada sobre una grilla de 16 x 16 pxeles. En la Fig. 4.14 se muestran: el ajuste
de la MTF mediante un modelo de primer orden (arriba), la MTF como funcion de las
frecuencias (1 , 2 ) (abajo a la izquierda), y la respuesta impulsiva de dos dimensiones
que se obtiene de aplicar la FFT inversa de dos dimensiones (abajo a la derecha). La
curva MTF corresponde al patron n umero 6 de la imagen DPP 0003. Se observa que
la densidad de la grilla adoptada es suficiente para la caracterizacion de la respuesta
impulsiva, e incluso podra trabajarse con una grilla menos densa.
A partir de esta caracterizacion de la MTF del sistema optico puede encararse la
confeccion de la matriz H para la fusion de imagenes, al comienzo del captulo siguiente.
8
Se hicieron pruebas con modelos de primer y segundo orden.
9
Se utiliz
o la funci
on lsqcurvefit del paquete de software MATLAB & Simulink Student Version,
que implementa este algoritmo.
10
Mediante la funcion ifft2, del paquete de software MATLAB & Simulink Student Version.
4. Modelos de camara y lente 64
Fig. 4.14: Resultados de hacer un ajuste de primer orden (arriba), evaluar la MTF de dos di-
mensiones (abajo izquierda) y aplicar la FFT inversa (abajo derecha).
4. Modelos de camara y lente 65
Ruido fotonico (photon noise, o shot noise): Es resultado del comportamiento cuanti-
co de la luz, y representa una incerteza o una fluctuacion en el flujo de fotones que
incide en una celda del sensor. La cantidad de electrones que se acumulan en cada
celda debido a la incidencia de fotones tiene una distribucion Poisson.
Ruido de patron fijo (fixed pattern noise): Es un efecto asociado a diferencias con-
structivas de los pxeles, y consiste en que los pxeles de un mismo sensor tengan
sensibilidades levemente diferentes. Esto provoca un error sistematico en la toma de
imagenes, cuya caracterstica puede depender del nivel de intensidad y de la longi-
tud de onda. En principio no puede hacerse una caracterizacion estadstica de dicho
ruido, aunque s puede medirse la presencia de un patron.
Ruido termico (dark current noise, readout noise y reset noise): Son ruidos asoci-
ados a la agitacion termica de los electrones en los dispositivos sensores, y en los
dispositivos de lectura y amplificacion. Tal como ocurre en cualquier dispositivo
electronico, el nivel de ruido es altamente dependiente de la temperatura. Dicho
aporte de ruido suele modelarse como ruido blanco.
Dado que en cada imagen se observa una combinacion de todos estos efectos, y que no es
nuestra intencion hacer una discriminacion del tipo de ruido a la hora de hacer la fusion
de imagenes, se tratara al ruido como si mostrase una u nica caracterstica. Por otra parte,
tal como se dedujo en el captulo 3, la regla de fusion BAUE solo requiere de conocer los
momentos de primer y segundo orden del ruido aditivo. Es por esto que nos limitaremos
a estimar una eventual correlacion del ruido (momentos de segundo orden).
Partiendo del modelo de observacion linealizado de la ecuacion 3.22, y aplicando dicho
modelo al sistema fotografico, puede imaginarse que el vector de ruidos contiene los
ruidos presentes en distintos pxeles de una misma imagen, o bien que sus componentes
representan el ruido que se observa en un mismo pixel para imagenes sucesivas. La car-
acterstica a estimar en el primer caso es la correlacion espacial del ruido (entre pxeles
vecinos), y en el segundo caso es la correlacion temporal (para un pixel en particular, de
una imagen a la siguiente). Es posible realizar estimaciones de ambos tipos de correlacion,
sin embargo, por la forma en que se representa el sistema de observacion mediante la ma-
triz H, en el captulo siguiente (ver seccion 5.1), solo se necesita estimar la correlacion
temporal del ruido.
4. Modelos de camara y lente 66
Para la estimacion de la correlacion temporal del ruido se hacen las siguientes consid-
eraciones:
Ya que algunos de los fenomenos de ruido son dependientes de la cantidad de carga
acumulada, se hace una estimacion de las estadsticas del ruido para distintos niveles
de intensidad de luz.
Se supone que, para un determinado nivel de intensidad de luz, el ruido de cualquier
pixel del sensor responde a una misma distribucion. Esta suposicion representa la
hipotesis de que las celdas CCD no tienen diferencias constructivas significativas, y
evita tener que hacer una caracterizacion para cada pixel.
Para la medicion de la correlacion temporal del ruido, se toman fotografas de un
patron liso con luz uniforme11 . De este modo las imagenes pueden suponerse de igual
intensidad, y todas las diferencias que aparecen entre observaciones son debidas al ruido.
Para estudiar la correlacion temporal, puede formarse el vector a partir de muestras de
ruido en un pixel determinado en sucesivas imagenes. Si para la imagen nesima, en el
pxel i, jesimo se tiene un ruido ni,j , y se dispone de K imagenes, el vector para dicho
pixel es: i,j
1
i,j
2
i,j = . . (4.48)
..
i,j
K
Por otra parte, la funcion de autocorrelacion de un proceso aleatorio real de tiempo
discreto, X(n), se define como ([41]):
donde X (n) = E [X(n)]. Todas las expectaciones son calculadas utilizando la funcion de
densidad de probabilidad de la variable X(n) en el instante de tiempo n:
Z
E [f (X(n))] = f (x)pX(n) (x)dx . (4.52)
CXX (n1 , n2 )
XX (n1 , n2 ) = p
CXX (n1 , n1 )CXX (n2 , n2 )
CXX (n1 , n2 )
=p (4.54)
V AR [X(n1 )] V AR [X(n2 )]
que adopta valores entre 1 y +1, indicando el nivel y el tipo de correlacion del proceso.
Es as que, para el vector de ruidos i,j , puede confeccionarse una matriz CX , donde en
cada posicion de la matriz se ubiquen los coeficientes de la funcion de autocovarianza:
h T i
CX = E i,j i,j i,j i,j
, (4.55)
y de igual modo puede confeccionarse una matriz PX con los coeficientes de correlacion
normalizados.
Ahora, el problema de la estimacion es determinar la forma de computar las expecta-
ciones de forma tal de lograr una buena estimacion. Es aqu donde entra en juego la
segunda consideracion planteada: el ruido de cualquier pixel de la camara responde a una
misma distribucion de probabilidad. Bajo esta suposicion, el vector de ruidos para cada
pixel, i,j , es una realizacion de un mismo vector aleatorio . Por lo tanto, es posible aprox-
imar las expectaciones mediante promedios a lo largo de los pxeles vecinos (promedios
del ensamble):
1 X i,j
= (4.56)
NP i,j
= 1
X T
i,j
i,j
C C , (4.57)
NP i,j
siendo NP el n umero de pxeles vecinos que se utilice para realizar las estadsticas. Los
estimadores presentados aqu son estimadores Maximum Likelihood de la media y de la
matriz de covarianza.
En este trabajo se realizan estimaciones de la matriz de correlacion normalizada P ,
para distintos niveles de exposicion, con lecturas del fotometro digital desde 2 hasta +2,
y con pasos de 1/3 (en total 13 niveles de intensidad). La cantidad de imagenes tomadas
con cada nivel de intensidad12 es de 20 ( <20 ), y por lo tanto cada matriz P es de
dimensiones 20 20. Para el calculo de estadsticas se utilizan pxeles en un cuadrado de
100 100 pxeles ubicados en la esquina superior izquierda de las imagenes, lo cual da un
total de muestras de NP = 10000.
En la figura 4.15 se grafican las matrices P para los 13 niveles de exposicion. Los
niveles de correlacion (1 a +1) se muestran como niveles de gris (negro a blanco). Se
observa que sobre la diagonal de las matrices, el coeficiente de correlacion es +1, esto es
porque en dicha posicion se mide la correlacion de cada componente de consigo misma.
12
Para 3 de los 13 niveles de exposici
on se dispone de 10 imagenes, en lugar de 20.
4. Modelos de camara y lente 68
Fuera de la diagonal, la correlacion tiene niveles cercanos a cero, lo cual indica en primera
instancia que la correlacion es nula, o que hay muy poca correlacion. Tambien se observa
que el coeficiente de correlacion tiene un nivel uniforme, es decir que la correlacion del
ruido entre dos imagenes cualesquiera es practicamente la misma y no hay una correlacion
de ruido mayor entre imagenes consecutivas.
Se da una particularidad en las imagenes con mayor intensidad (Exposicion +1,66
y +2,00), en las que se observa que fuera de la diagonal hay coeficientes de correlacion
mayores que 0, y del orden de +0,25. Estas imagenes fueron tomadas con el maximo nivel
de exposicion de la camara, y a simple vista se observa que en dichas imagenes los niveles
de ruido son muy inferiores a los que se presentan para niveles de exposicion menores.
Esto tiene que ver con que a mayor exposicion se almacena mayor cantidad de carga, y los
efectos del ruido aditivo se hacen menos perceptibles. Tambien ocurre que a altos niveles
de exposicion, los sensores se saturan y la posibilidad de que se sume ruido se ve limitada.
Estos fenomenos tienen repercusion en los coeficientes de correlacion medidos, ya que la
se
nal se vuelve mas determinstica y por lo tanto el coeficiente de correlacion comienza a
ser poco significativo13 , e incluso toma importancia el termino de ruido de patron fijo.
A la luz de este analisis de correlacion, se concluye que las componentes de ruido
aleatorio estan practicamente descorrelacionadas temporalmente. Sin embargo, se observa
que las varianzas de ruido tienen variaciones importantes con la intensidad de luz: a simple
vista, en la imagenes oscuras se observa un nivel de ruido mayor que en las imagenes claras.
Es necesario caracterizar de alg un modo este efecto, ya que a la hora de realizar la fusion,
toda informacion que se tenga acerca de los niveles de ruido resulta fundamental para
lograr la maxima reduccion del ruido.
De manera equivalente a como se realizo la estimacion de la media y de la matriz de
covarianza, se realiza ahora una estimacion de las varianzas de ruido como funcion de
la intensidad. Nuevamente, suponiendo que los pxeles de cada imagen son realizaciones
de acuerdo a una misma distribucion de probabilidad, es posible calcular la varianza
muestral, de acuerdo a
1 X i,j
2 2 = ( )2 (4.58)
NP i,j
Se calcula la varianza muestral de los mismos 100 100 pxeles (NP = 10000) en un
total de 130 imagenes distintas, 10 por cada nivel de exposicion y para los 13 niveles
de exposicion. En la Fig. 4.16, cada punto representa la varianza que se estima en cada
imagen.
Los puntos de la Fig. 4.16 muestran claramente una dependencia de la varianza del
ruido con el nivel de exposicion de la imagen, y la poca dispersion de los puntos da un
indicio de cuales son los valores caractersticos para la varianza del ruido. Tomando como
referencia a los centros de masa de los puntos medidos se puede confeccionar la siguiente
tabla:
13
Ver que en la Ec. 4.54, realiza una normalizacion dividiendo por los desvos del ruido, que al
hacerse cada vez m
as chicos llevan a valores de correlacion elevados.
4. Modelos de camara y lente 69
Exposici
on Varianza de ruido
2,00 9,06
1,66 11,32
1,33 12,06
1,00 11,91
0,66 10,07
0,33 8,39
0,00 7,44
+0,33 8,66
+0,66 7,33
+1,00 4,99
+1,33 2,57
+1,66 1,54
+2,00 0,84
A modo de resumen de esta seccion, se concluye que el ruido que presenta la camara
digital puede considerarse aleatorio y descorrelacionado para un rango amplio de niveles
de exposicion (desde niveles de fotometro de 2,00 hasta +1,33). Se conocen tambien los
niveles de la varianza del ruido para los diferentes niveles de exposicion. Para los rangos de
exposicion mas elevados, (+1,66 a +2,00) empiezan a observarse fenomenos que no pueden
caracterizarse como ruido aditivo descorrelacionado, sin embargo, se tiene un calculo de
varianza muestral como medida de la dispersion debido a otros efectos.
BAUE DE IMAGENES
5. FUSION DIGITALES
mas bien concentrarse en la MTF y en el ruido, que son los fenomenos que se modelaron y
midieron en el captulo anterior. Es as que, por ejemplo, si se tienen imagenes afectadas
tanto por la respuesta en frecuencia de la lente (MTF) como por la distorsion radial, el
esquema de fusion buscara recuperar la informacion que en cada imagen se pierde por los
efectos de la MTF, y obtendra una imagen que seguira teniendo distorsion radial.
Una imagen digital puede representarse mediante una matriz X, donde la intensidad
de luz de cada pixel de la imagen se ubica en forma de n umero real en una componente
de la matriz, y las coordenadas del pixel (up , vp ) en la imagen se corresponden con el
numero de columna y fila de la matriz. Por otra parte, es posible modelar al proceso
de convolucion en dos dimensiones, entre la imagen original y la respuesta impulsiva del
sistema optico, como un producto matricial de la forma (5.1) si se ordenan las columnas
de la matriz X en un u nico vector columna (una a continuacion de la otra). Bajo este
esquema de modelado, el vector x contendra las columnas de la imagen X, y la matriz
H sera una matriz bloque (block matrix, [30], [42]) conteniendo versiones desplazadas de
la respuesta impulsiva h(up , vp ). Para una imagen X <NH NV (de NH NV pxeles), el
vector x sera de dimension NH NV , y para una respuesta impulsiva de soporte cuadrado
de tama no LL, la matriz H sera de dimension (L+NV 1)(NH +L1)NH NV . Estas
dimensiones apenas contemplan la operacion de filtrado que tiene lugar en una sola imagen
observada, y dado que la fusion trata con varias observaciones simultaneamente, la matriz
H en realidad puede tener dimensiones mayores. El hecho de que las dimensiones de los
vectores y matrices crezcan en semejante medida lleva a que la regla de fusion BAUE, que
consiste en la inversion de una matriz y en sucesivos productos, sea impracticable bajo
este esquema.
A la luz de dicho problema, se propone una alternativa en la que no se realice el
modelado de toda la imagen simultaneamente, sino que se trabaje a nivel pixel, teniendose
as matrices y vectores de dimensiones mucho menores, y por lo tanto resultando en
reglas de fusion numericamente implementables. La propuesta consiste en suponer que
n
la intensidad del pixel i, jesimo de la nesima imagen observada (zi,j ) resulta ser una
combinacion lineal de las intensidades de los pxeles de la imagen original, ubicados en la
posicion i, j y sus alrededores. Es decir que
X
n
zi,j = hnk,l Xik,jl . (5.2)
k,l
Los coeficientes hnk,l , que determinan los pesos con que aportan los pxeles vecinos del pixel
i, jesimo de la imagen original, son los coeficientes de la respuesta impulsiva asociada a
la nesima imagen observada, y la sumatoria tiene tantos terminos como coeficientes de
la respuesta impulsiva se deseen incorporar. De este modo, para una cantidad de imagenes
5. Fusi
on BAUE de imagenes digitales 73
que pueden expresarse como el producto de una matriz H con un vector x. Ahora, la
matriz H contiene en la fila nesima los coeficientes de la respuesta impulsiva asociada
a la imagen nesima, y el vector x contiene la intensidad del pixel i, jesimo y las
intensidades de sus pxeles vecinos.
La decision de cuantos coeficientes adoptar esta relacionada, por un lado, con la for-
ma de la respuesta impulsiva y la mnima cantidad de coeficientes que la describen con
precision (ver Fig. 4.14), y por otro lado, con la inestabilidad numerica resultante de
incorporar en la matriz H terminos nulos, o practicamente nulos. De un analisis de las
respuestas impulsivas obtenidas en el captulo 4, se puede observar que:
Para tener en cuenta pxeles vecinos que aporten como mnimo con un 5 % del aporte
que hace el pixel central, basta con tomar los 25 pxeles centrales de la respuesta
impulsiva (soporte de 5 5),
Para tener en cuenta pxeles vecinos que aporten como mnimo con un 10 % del
aporte que hace el pixel central, basta con tomar los 9 pxeles centrales de la re-
spuesta impulsiva (soporte de 3 3),
Para tener en cuenta pxeles vecinos que aporten como mnimo con un 20 % del
aporte que hace el pixel central, basta con tomar los 5 pxeles centrales de la re-
spuesta impulsiva (pixel central y los 4 pxeles adyacentes).
Ademas, dado que las respuestas impulsivas obtenidas mediante la FFT inversa son
simetricas respecto del pixel central, en realidad hay varios coeficientes de hnk,l que son
iguales. Esto lleva a que, por ejemplo, no se pueda hacer una estimacion individual de
cada uno de los 4 pxeles adyacentes al pixel i, jesimo, o de cada uno de los pxeles ubi-
cados en las esquinas del cuadrado de 3 3, ya que si todas las filas de H tienen algunos
elementos iguales, entonces no se cumple que Rg(H) = N . Es as que resulta necesario
hacer uso de esta propiedad de simetra de la respuesta impulsiva, y agrupar los pxeles
que son multiplicados por un mismo coeficiente, del siguiente modo:
n
zi,j = hn0,0 Xi,j + hn1,0 (Xi1,j + Xi+1,j + Xi,j1 + Xi,j+1 ) + (5.4)
de forma tal que se puede hacer una estimacion del valor del pixel Xi,j , una estimacion
de la suma de los 4 pxeles adyacentes, una estimacion de la suma de los 4 pxeles de las
5. Fusi
on BAUE de imagenes digitales 74
Fig. 5.1: Zonas de la imagen dentro de las cuales se tiene una misma matriz H, con la misma
numeraci
on que se adopt
o en el captulo 4.
fenomenos de saturacion ni las variaciones que pueda haber en la MTF cuando los tiempos
de exposicion son demasiado elevados.
En este trabajo, dicho factor se calcula tomando el valor medio de todas las inten-
sidades de la imagen, y luego dividiendolo por el nivel de intensidad correspondiente a
un tono de gris al 50 %. Esto es equivalente a suponer que la imagen original X es una
imagen con nivel de exposicion normal (la que se indicara con el fotometro de la camara
en su valor 0), y que el hecho de tomar una fotografa con mayor o menor luz hace que
cada pixel individual de la imagen observada aumente o disminuya su intensidad en la
misma proporcion en que lo hace la intensidad media de toda la imagen.
donde las componentes de la diagonal son las varianzas del ruido en cada imagen. As como
en la matriz H cada fila se multiplica por un factor que indica el nivel de exposicion de
la imagen, en las componentes de la matriz se ubican las varianzas que corresponden
al nivel de exposicion con que fue tomada cada imagen (ver tabla 4.2).
Esta forma de modelar los efectos del ruido, tal como ocurre con la matriz H, funciona
bien para niveles de exposicion en que el sensor tiene una respuesta lineal. Por ejemplo,
para una imagen con un nivel de exposicion muy elevado, al extremo de estar saturada en
varias zonas, su varianza de ruido de acuerdo a la tabla 4.2 sera muy peque na y, seg
un
se analizo en el captulo 3, por ser una de las observaciones con menor varianza de ruido
entonces es una de las que realiza el mayor aporte a la fusion. Es de esperar, entonces que
la imagen resultante del proceso de fusion este saturada si es que alguna de las imagenes
originales esta saturada. Este efecto podra corregirse adoptando alg un criterio para las
zonas en que una imagen este saturada, por ejemplo asignando una varianza de ruido
arbitrariamente elevada (para reducir su nivel de aporte), o simplemente excluyendola de
la fusion. En las secciones siguientes se ilustraran los resultados de la fusion distinguiendo
los casos en los que se incluye una imagen saturada de los casos en los que no se incluye
ninguna imagen saturada.
Aun en los casos en los que haya mas de N imagenes tomadas con aperturas relativas
diferentes (Rg(H) = N M ), las filas de la matriz H seran similares, por estar
2
Ver tabla A.2 en el apendice A.
3
Ver SIN REGULARIZAR N2 M11.TIF y SIN REGULARIZAR N3 M11.TIF, con N = 2 y con N = 3, respec-
tivamente, en directorio Sin Regularizar.
5. Fusi
on BAUE de imagenes digitales 77
representando respuestas impulsivas que sabemos que tienen una misma forma.
La solucion al problema de fusion BAUE puede interpretarse como la solucion al
siguiente sistema lineal de ecuaciones:
HT 1 T 1
H xF = H z , (5.7)
AxF = b , (5.8)
A = UDVT , (5.9)
donde D <N N es una matriz diagonal, y las matrices U <N N y V <N N son
unitarias, es decir que UT U = I y VT V = I. Los elementos de la matriz diagonal D se
denominan valores singulares de la matriz A, son positivos, y se los suele ordenar de mayor
a menor a lo largo de la diagonal: D = diag(d1 , d2 , . . . , dN ), con d1 d2 . . . dN . Los
vectores columna de las matrices U y V se denominan vectores singulares izquierdos y
derechos, respectivamente, y son ortonormales. El n umero de condicion de la matriz A
se define, a partir de esta descomposicion, como el cociente entre el valor singular mas
grande y el valor singular mas chico:
d1
(A) = . (5.10)
dN
El n
umero de condicion de la matriz permite estimar el efecto que tienen posibles pertur-
baciones del vector b en la solucion xF ([43]):
kxF k kbk
(A) . (5.11)
kxF k kbk
5. Fusi
on BAUE de imagenes digitales 78
Aqu, las perturbaciones b no necesariamente se refieren a los efectos del ruido aditivo
del modelo, sino que mas bien estan dominadas por los errores de redondeo del calculo.
Para matrices con n umero de condicion mucho mayor que 1, ocurre que el hecho de tener
peque nos errores en el vector b (i.e., una aritmetica con suficientes dgitos) no garantiza
una solucion confiable. Cuando una matriz tiene un n umero de condicion mucho mayor
que 1, se dice que es una matriz mal condicionada.
El concepto de n umero de condicion, tal como se lopresento hasta aqu vale para
cualquier matriz, sin embargo la matriz A = HT 1 H tiene la particularidad de ser
simetrica, y por lo tanto su desarrollo en valores singulares es en realidad:
A = UDUT , (5.12)
que no es mas que una descomposicion en autovalores, o descomposicion espectral, de la
matriz A. A partir de esta expresion, y teniendo en cuenta que la matriz D es diagonal,
puede escribirse la descomposicion de la siguiente manera:
N
X
A= di ui uTi , (5.13)
i=1
donde los vectores ui son las columnas de la matriz U. Dado que la matriz A tiene rango
N , es posible expresar su inversa a partir de la expresion (5.12) como
A1 = UD1 UT . (5.14)
Por lo tanto, la solucion al sistema de ecuaciones, xF , puede expresarse como
xF = A1 b = UD1 UT b , (5.15)
que tambien puede descomponerse seg
un
N N
X 1 T
X uTi b
xF = ui ui b = ui . (5.16)
d
i=1 i i=1
di
Esta u ltima expresion desarrolla la solucion al problema de fusion BAUE como combi-
nacion lineal de los N vectores ui , mediante los coeficientes (uTi b)/di . En el caso de una
matriz mal condicionada, el valor singular dN es mucho menor que el valor singular d1 ,
(uT b)
con lo cual la solucion xF esta dominada por el termino dNN uN . Sin embargo, seg un la
expresion (5.13) el sumando de mayor peso en el desarrollo de la matriz A, y por lo tanto
el termino fundamental, es aquel que tiene el valor singular mas grande, es decir d1 u1 uT1 .
Este analisis indica que al invertir una matriz mal condicionada, la solucion al sistema
lineal no resulta dominada por las caractersticas mas fundamentales de la matriz A sino
por aquellas de menor importancia.
Una solucion a este problema es considerar que se tiene una buena descripcion de la
matriz A mediante los primeros k terminos de su desarrollo:
k
X
A Ak = di ui uTi , (5.17)
i=1
5. Fusi
on BAUE de imagenes digitales 79
donde queda claro que la solucion xk ya no esta dominada por el valor singular mas
pequeno, dN . A esta tecnica de regularizacion se la denomina Descomposicion en Valores
Singulares Truncada (o, por sus siglas en ingles, TSVD, [42]). De acuerdo al valor que
se adopte para k se tienen soluciones regularizadas en mayor o menor medida. En este
trabajo, el truncamiento puede hacerse con k = 1, si es que N = 2, o con k = 1 y k = 2,
si N = 3.
Las imagenes que se obtienen como resultado de la fusion mediante la tecnica de TSVD
se ordenan seg un la tabla A.3, del apendice A. Las imagenes que se eligen como entrada
al esquema de fusion para M = N = 2 son dos imagenes con nivel de exposicion normal
(nivel de fotometro +0) tomadas con diferentes aperturas relativas (IMAGEN 01.TIF e
IMAGEN 02.TIF). Para N = 2 y valores de M crecientes se van incorporando imagenes
con niveles de exposicion cada vez mas extremos, incluyendo con M = 3 una imagen
mas con exposicion normal (IMAGEN 03.TIF), luego incluyendo con M = 5 una ima-
gen sub-expuesta y otra sobre-expuesta (IMAGEN 04.TIF e IMAGEN 06.TIF), luego para
M = 8 otra imagen sub-expuesta (IMAGEN 05.TIF) y dos sobre-expuestas (IMAGEN 07.TIF
e IMAGEN 08.TIF), para M = 10 dos imagenes muy sub-expuestas (IMAGEN 10.TIF e
IMAGEN 11.TIF), y finalmente para M = 11 una muy sobre-expuesta (IMAGEN 09.TIF),
que es la que presenta saturacion en grandes zonas de la imagen. Para N = 3 se realiza
el mismo procedimiento, pero comenzando con M = N = 3.
La tecnica de TSVD puede interpretarse bajo este esquema como un filtro que tiene i = 1
para i k y i = 0 para i > k, y representa el filtrado espectral mas sencillo que puede
5. Fusi
on BAUE de imagenes digitales 80
Ejemplo 1
Este primer ejemplo esta inspirado en el metodo de regularizacion de Tikhonov ([42],
[44]), ya que adopta los mismos coeficientes de filtro. Sin embargo, es importante men-
cionar que el metodo de Tikhonov no se propone resolver un sistema de ecuaciones en
el que la matriz A sea cuadrada, sino que trata con un problema sub-determinado o
sobre-determinado en el que la solucion sin regularizar se calcula a partir de la matriz
pseudo-inversa.
Se adoptan entonces los factores de filtro dados por
d2i
i = , (5.20)
d2i + 2
de forma tal que la solucion regularizada toma la siguiente forma:
N N
X d2i uTi b X di
uTi b ui .
xf il1 = 2 2
u i = 2 2
(5.21)
d +
i=1 i
di d +
i=1 i
Segun esta propuesta, para valores singulares que cumplan que di , el termino de
la suma sera el mismo que el de la solucion sin regularizar, y para valores que cumplan
2 (uTi b)ui
di , el termino de la suma sera di di
, que por ser di resulta muy atenuado
respecto del termino de la solucion sin regularizar.
Se realizan pruebas para distintos valores del parametro , y los resultados se ordenan
seg
un la tabla A.4 del apendice A. Las imagenes generadas se encuentran en el directorio
FF1 del DVD que acompa na a este trabajo.
Ejemplo 2
El segundo ejemplo que se muestra esta basado en la idea de sumar a la matriz
A = HT 1
H un m u ltiplo de la matriz identidad antes de realizar la operacion de
inversion de la matriz. Seg un esta idea, la solucion regularizada sera
Dado que la matriz identidad tambien se puede desarrollar segun una descomposicion
espectral, y siendo que la matriz U es unitaria, se cumple que
1
xf il2 = UDUT + UIUT b, (5.24)
5. Fusi
on BAUE de imagenes digitales 81
y agrupando queda
1
xf il2 = U (D + I) UT b. (5.25)
Esta expresion puede llevarse a la forma
N N T
X 1 X di u i b
uT b ui =
xf il2 = ui , (5.26)
i=1
di + i d + di
i=1 i
La tecnica con los factores de filtro segun el segundo ejemplo (FF2), da lugar a
mejores resultados que las dos tecnicas anteriores. Es posible encontrar mas facil-
mente los valores del parametro que hacen que la imagen sintetizada no se vea
afectada por la saturacion ni por los efectos de la zonificacion. Se observa, al igual
que segun la segunda tecnica, que para valores de M menores se obtienen buenos
resultados con valores menores de , y que cuando se incluye mayor cantidad de
imagenes, el valor de debe aumentar para regularizar el problema. Sin embargo,
se observa que para M = 11, se da el mismo compromiso que con la tecnica anterior,
y resulta complicado encontrar un valor de adecuado.
Se observa que mediante las tecnicas de factores de filtro, las soluciones que estan
regularizadas mas de lo necesario (con valores de o demasiado altos) son mas
oscuras. Esto tiene que ver con que en ambos ejemplos, valores elevados de y
hacen que los factores i sean todos menores que 1, y por lo tanto que el vector
estimado xf il se componga de terminos demasiado atenuados.
Sesgo en la estimacion
La solucion regularizada puede escribirse, a partir de la expresion (5.19), como
xf il = UD1 UT b , (5.28)
donde la matriz es una matriz diagonal en la que se ordenan los valores de los factores
de filtro i . El sesgo en la estimacion de x puede calcularse del siguiente modo:
E [xf il x] = E UD1 UT b x .
(5.29)
E [xf il x] = E UD1 UT HT 1
(Hx + ) x . (5.30)
E [xf il x] = U ( I) UT x . (5.32)
Esta u
ltima expresion indica que para cada conjunto de factores de filtro, existe un
sesgo que depende linealmente del vector x. Ademas, se tiene que
lo cual indica que si los factores de filtro son todos muy inferiores a 1 (solucion demasiado
regularizada), entonces la norma de la solucion regularizada xf il es, en promedio, inferior
que la norma del vector a estimar x. Esta idea es consistente con el hecho de que para
valores elevados de los parametros y , la imagen sintetizada se oscurece.
luego, reemplazando los vectores b y z, de la misma forma que se hizo para el calculo del
sesgo, calculando la expectacion sobre cada termino, y operando sobre la expresion, se
llega a que:
E kxf il xk22 = k ( I) UT xk22 + T r 2 D1 .
(5.35)
Para comparar la solucion regularizada con la de la fusion BAUE, se debe comparar
este error cuadratico medio con el de la estimacion BAUE, que se calculo en el captulo
3: h 1 i
xFBAU E xk22 = T r HT H
E k . (5.36)
5. Fusi
on BAUE de imagenes digitales 84
Por ser todos los coeficientes de filtro menores o iguales que 1, el termino correspondiente
a la solucion regularizada resulta ser siempre menor que el error cuadratico medio de la
solucion BAUE. Sin embargo, el error cuadratico medio de la solucion regularizada se ve
afectado por el termino
k ( I) UT xk22 , (5.40)
que toma valores crecientes a medida que se reducen los factores de filtro i , por ejemplo,
aumentando los valores de los parametros y .
Este termino, que depende del valor de x, es un error que tiene origen en el sesgo del
estimador. Tal como se estudio en el captulo 3, el hecho de que un estimador tenga sesgo
lleva a que el error cuadratico medio sea dependiente del vector a estimar, x, y por lo
tanto es posible que para ciertos factores de filtro se tenga una solucion con menor error
cuadratico medio que la regla de fusion BAUE. Sin embargo, en las pruebas hechas a lo
largo de este captulo, los parametros y fueron variados sin considerar la posibilidad
de optimizar este error cuadratico medio, sino mas bien contemplando los compromisos
expuestos en la seccion 5.2.3.
permite lograr una fusion con mnimo error cuadratico medio. Los resultados se hacen
notables cuando se realiza una fusion de dos imagenes (M = 2) con niveles de exposicion
muy distintos, a los que corresponden varianzas de ruido muy distintas (ver tabla 4.2).
Las imagenes a las que se hace referencia a continuacion se encuentran en el sub-directorio
Caract Ruido.
Se toma como ejemplo la fusion de las imagenes IMAGEN 06.TIF (sobre-expuesta) y
IMAGEN 11.TIF (sub-expuesta), y se realiza la fusion bajo los siguientes casos:
2. Fusion BAUE, sin modelar la MTF (N = 1), con H = [h1 , h2 ]T , siendo h1 y h2 los
factores que modelan el nivel de exposicion de la imagen, y utilizando la matriz de
covarianza de ruido correspondiente.
Imagen resultado: BAUE N1 M02.TIF.
3. Fusion BAUE, sin modelar la MTF (N = 1), con H = [h1 , h2 ]T , siendo h1 y h2 los
factores que modelan el nivel de exposicion de la imagen, y sin distinguir las varian-
zas del ruido, es decir adoptando = 2 I (ruidos independientes e identicamente
distribuidos).
Imagen resultado: BAUE iid N1 M02.TIF.
4. Fusion (no BAUE) realizando un promedio de las dos imagenes, previa correccion
de los niveles de exposicion h1 y h2 .
Imagen resultado: Promedio M02.TIF.
Para la medicion del nivel de ruido de cada imagen resultado se trabaja de igual
forma que como se midio la varianza del ruido en la seccion 4.4.2. Para el calculo de
la varianza muestral se tomo un sector de las imagenes que tiene textura practicamente
uniforme (cuadrado de 20 20, cuyos vertices opuestos son el pixel (2620, 1120) y el pixel
(2640, 1140)). Las varianzas observadas para los cuatro casos se presentan en la tabla 5.1.
Estos resultados muestran que hay una ganancia en los niveles de ruido de la imagen
sintetizada, cuando se utiliza la matriz de covarianza dada por la caracterizacion
hecha en el captulo 4. Se tiene una reduccion del orden del 20 % en la varianza del ruido,
5. Fusi
on BAUE de imagenes digitales 86
respecto del caso en que se asume ruido identicamente distribuido en todas las imagenes
(casos 1 y 2 respecto del caso 3). Ademas, si bien el hecho de incluir el modelado de
la MTF hace que el problema sea numericamente inestable, los niveles de ruido que se
obtienen luego de realizar la regularizacion son equivalentes a los que se obtienen si no se
incluye el modelado de la MTF. Esto indica que el nivel de ruido debido a la inestabilidad
numerica esta correctamente controlado. Por otra parte, de la comparacion del caso 4 con
los primeros tres casos, queda claro que realizando una fusion BAUE se logra una solucion
notablemente menos ruidosa que si se propone fusionar mediante un simple promedio. En
la Fig. 5.2 se muestra un fragmento de cada una de las cuatro imagenes que se obtuvieron
segun los cuatro casos de fusion propuestos mas arriba.
Fig. 5.2: Fragmentos de las im agenes sintetizadas de acuerdo a los cuatro casos propuestos de
fusi
on, para el an
alisis del nivel de ruido. Caso 1 (a), caso 2 (b), caso 3 (c) y caso 4
(d).
5. Fusi
on BAUE de imagenes digitales 87
Otro analisis interesante, respecto de los niveles de ruido, es ver como vara la varianza
del ruido como funcion de la cantidad de imagenes incluidas en la fusion. Para este analisis
se calculan las varianzas de ruido de las imagenes presentadas en la seccion 5.2.2, es decir
para los dos ejemplos de regularizacion mediante factores de filtro, con N = 2 y N = 3,
y para valores de M crecientes entre N y 10. No se incluye en la fusion a la imagen
IMAGEN 09.TIF, que tiene un grado de saturacion importante, ya que su caracterstica
no solo se aparta del modelado lineal sino que ademas, por tener asociada una varianza
extremadamente peque na, resulta ser la imagen a la que mas peso se asigna. La varianza se
estima a partir de la observacion del mismo sector de textura uniforme que se utilizo para
los calculos anteriores. En la figura 5.3 se presentan dichas varianzas, normalizadas al
valor de la varianza del caso de fusion con M = N , en cada caso.
Se observa que la varianza tiene una relacion aproximadamente inversa con la cantidad
de imagenes incorporadas. Esto es consistente con el hecho de que, tal como se estudio en
el captulo 3, el error cuadratico medio es inversamente proporcional al valor de M . Si
bien la varianza y el error cuadratico medio solo coinciden en el caso de una regla de
fusion insesgada, ambos indicadores dan cuenta del nivel de error y/o ruido de la imagen
sintetizada, y pueden suponerse equivalentes a efectos del analisis de este grafico.
Otras conclusiones
En el modelado que se hizo del sistema optico, en la seccion 4.4, se clasifico a las curvas
de respuesta en frecuencia seg un la apertura relativa del diafragma. Tal como se desprende
de hojas de datos de lentes profesionales, la relacion entre la respuesta en frecuencia y
la apertura relativa suele ser importante, a un en lentes de muy alta calidad. Bajo esta
premisa, en la seccion 5.1 se propuso confeccionar la matriz H de forma tal que en cada
fila se tengan los coeficientes de la respuesta impulsiva asociada a la apertura relativa de
la fotografa. Luego, dado que una de las hipotesis bajo las cuales se desarrollo la regla
de fusion, es que el rango de la matriz H sea N , es condicion necesaria para realizar la
fusion de imagenes de acuerdo al esquema propuesto, que se disponga de al menos N
imagenes tomadas con distinta apertura relativa. Si no se hubiera caracterizado la MTF
como funcion de la apertura relativa, la fusion no se hubiera podido realizar de acuerdo a la
5. Fusi
on BAUE de imagenes digitales 89
Fig. 5.4: Resultados del modelado de la MTF en la fusi on BAUE. Regularizaci on mediante se-
gundo caso de factores de filtro, con N = 3, y (b) = 0, 05, (c) = 0, 1, (d) = 0, 2.
Imagen de referencia (a): fusion BAUE sin modelar la MTF.
5. Fusi
on BAUE de imagenes digitales 90
En el directorio Imagenes se tienen las imagenes utilizadas para la fusion, que fueron
tomadas con los siguientes parametros.
N =2 N =3
k=1 k=1 k=2
M =2 TSVD N2 M02 k1.TIF - -
M =3 TSVD N2 M03 k1.TIF TSVD N3 M03 k1.TIF TSVD N3 M03 k2.TIF
M =5 TSVD N2 M05 k1.TIF TSVD N3 M05 k1.TIF TSVD N3 M05 k2.TIF
M =8 TSVD N2 M08 k1.TIF TSVD N3 M08 k1.TIF TSVD N3 M08 k2.TIF
M = 10 TSVD N2 M10 k1.TIF TSVD N3 M10 k1.TIF TSVD N3 M10 k2.TIF
M = 11 TSVD N2 M11 k1.TIF TSVD N3 M11 k1.TIF TSVD N3 M11 k2.TIF
N =2 N =3
M =2 = 0, 03 : FF1 N2 M02 003.TIF -
= 0, 04 : FF1 N2 M02 004.TIF -
= 0, 05 : FF1 N2 M02 005.TIF -
M =3 = 0, 05 : FF1 N2 M03 005.TIF = 0, 05 : FF1 N3 M03 005.TIF
= 0, 06 : FF1 N2 M03 006.TIF = 0, 06 : FF1 N3 M03 006.TIF
= 0, 07 : FF1 N2 M03 007.TIF = 0, 07 : FF1 N3 M03 007.TIF
M =5 = 0, 05 : FF1 N2 M05 005.TIF = 0, 05 : FF1 N3 M05 005.TIF
= 0, 1 : FF1 N2 M05 01.TIF = 0, 1 : FF1 N3 M05 01.TIF
= 0, 2 : FF1 N2 M05 02.TIF = 0, 2 : FF1 N3 M05 02.TIF
M =8 = 0, 05 : FF1 N2 M08 005.TIF = 0, 1 : FF1 N3 M08 01.TIF
= 0, 1 : FF1 N2 M08 01.TIF = 0, 2 : FF1 N3 M08 02.TIF
= 0, 2 : FF1 N2 M08 02.TIF
M = 10 = 0, 1 : FF1 N2 M10 01.TIF = 0, 1 : FF1 N3 M10 01.TIF
= 0, 2 : FF1 N2 M10 02.TIF = 0, 2 : FF1 N3 M10 02.TIF
M = 11 = 0, 3 : FF1 N2 M11 03.TIF = 0, 2 : FF1 N3 M11 02.TIF
= 0, 45 : FF1 N2 M11 045.TIF = 0, 45 : FF1 N3 M11 045.TIF
= 0, 5 : FF1 N2 M11 05.TIF = 0, 5 : FF1 N3 M11 05.TIF
N =2 N =3
M =2 = 0, 05 : FF2 N2 M02 005.TIF -
= 0, 06 : FF2 N2 M02 006.TIF -
= 0, 07 : FF2 N2 M02 007.TIF -
M =3 = 0, 05 : FF2 N2 M03 005.TIF = 0, 05 : FF2 N3 M03 005.TIF
= 0, 06 : FF2 N2 M03 006.TIF = 0, 1 : FF2 N3 M03 01.TIF
= 0, 07 : FF2 N2 M03 007.TIF
M =5 = 0, 05 : FF2 N2 M05 005.TIF = 0, 05 : FF2 N3 M05 005.TIF
= 0, 1 : FF2 N2 M05 01.TIF = 0, 1 : FF2 N3 M05 01.TIF
= 0, 2 : FF2 N2 M05 02.TIF = 0, 2 : FF2 N3 M05 02.TIF
M =8 = 0, 1 : FF2 N2 M08 01.TIF = 0, 1 : FF2 N3 M08 01.TIF
= 0, 2 : FF2 N2 M08 02.TIF = 0, 2 : FF2 N3 M05 02.TIF
M = 10 = 0, 1 : FF2 N2 M10 01.TIF = 0, 1 : FF2 N3 M10 01.TIF
= 0, 2 : FF2 N2 M10 02.TIF = 0, 2 : FF2 N3 M10 02.TIF
= 0, 3 : FF2 N2 M10 03.TIF
M = 11 = 0, 2 : FF2 N2 M11 02.TIF = 0, 2 : FF2 N3 M11 02.TIF
= 0, 3 : FF2 N2 M11 03.TIF = 0, 3 : FF2 N3 M12 03.TIF
= 0, 4 : FF2 N2 M11 04.TIF = 0, 4 : FF2 N3 M13 04.TIF
[1] X.R. Li; Y. Zhu; C. Han. Unified optimal linear estimation fusion part i: Uni-
fied models and fusion rules. Proceedings of the Third International Conference on
Information Fusion, 1:MOC2/10 MOC2/17, July 2000.
[4] R.R. Tenney; N.R. Sandell Jr. Detection with distributed sensors. IEEE Transactions
on aerospace and electronics systems, AES-17(4):501 510, July 1981.
[5] Z. Chair; P.K. Varshney. Optimal data fusion in multiple sensor detection systems.
IEEE Transactions on aerospace and electronics systems, AES-22(1):98 101, Jan.
1986.
[8] Y. Bar-Shalom; L. Campo. The effect of the common process noise on the two-sensor
fused-track covariance. IEEE Transactions on Aerospace and Electronic Systems,
AES-22:803805, Nov. 1986.
[9] H.F. Durrant-Whyte; B.Y.S. Rao; H. Hu. Toward a fully decentralized architecture
for multi-sensor data fusion. IEEE Proceedings of the International Conference on
Robotics and Automation, 2:1331 1336, 1990.
[10] Y. Xu; Y. Jin; Y. Zhou. Several methods of radar data fusion. 3rd International
Symposium on Electromagnetic Compatibility, pages 664 667, May 2002.
[11] Y. Zhou; H. Leung. Minimum entropy approach for multisensor data fusion. Pro-
ceedings of the IEEE Signal Processing Workshop on Higher-Order Statistics, pages
336 339, July 1997.
Bibliografa 97
[14] G.T. Zaniboni; N. D. Mascarenhas. Image data fusion using projection over the set
of solutions of an underdetermined least squares problem. Proceedings of the XII
Brazilian Symposium on Computer Graphics and Image Processing, pages 355 356,
Oct. 1999.
[15] M.L.S. Aguena; N.D.A. Mascarenhas. Multispectral image data fusion using projec-
tions onto convex sets techniques. XV Brazilian Symposium on Computer Graphics
and Image Processing, 2002. Proceedings, 2002.
[16] J. Yang; R.S. Blum. A region-based image fusion method using the expectation-
maximization algorithm. 40th Annual Conference on Information Sciences and Sys-
tems, pages 468 473, Mar. 2006.
[17] Y.J. Zhang; L.L. Ge; Y. Qian. New approach to pixel-based fusion for multifocus
images via blurring level measure. Proceedings of the 2007 International Conference
on Wavelet Analysis and Pattern Recognition, Beijing, China, pages 516 521, Nov.
2007.
[18] Y.J. Zhang; L.L. Ge. A simple and efficient hybird image fusion approach. 3rd
IEEE Conference on Industrial Electronics and Applications, ICIEA 2008., pages
1109 1113, Jun. 2008.
[19] M. Tico; K. Pulli. Image enhancement method via blur and noisy image fusion. 16th
IEEE International Conference on Image Processing (ICIP), pages 1521 1524, Nov.
2009.
[20] M.H. Arif; S.S. Shah. Block level multi-focus image fusion using wavelet transform.
International Conference on Signal Acquisition and Processing (ICSAP), pages 213
216, Apr. 2009.
[22] K. B. Petersen; M. S. Pedersen. The matrix cookbook, Oct. 2008. Version 20081110,
disponible en http://www2.imm.dtu.dk/pubdb/p.php?3274 al 10/11/2010.
[23] Brian D. Anderson; John B. Moore. Optimal filtering. Prentice-Hall Inc., 1979.
Bibliografa 98
[24] Y.C. Eldar. Mse bounds with affine bias dominating the cram`er-rao bound. IEEE
Transactions on Signal Processing, 56(8):3824 3836, Aug. 2008.
[25] Y.C. Eldar. Comparing between estimation approaches: admissible and dominating
linear estimators. IEEE Transactions on Signal Processing, 54(5):1689 1702, May
2008.
[26] Oliver Faugeras; Quang-Tuan Luong. The Geometry of Multiple Images: The Laws
That Govern the Formation of Multiple Images of a Scene and Some of Their Appli-
cations. The MIT Press, 2001.
[27] Z. Zhang. A flexible new technique for camera calibration. IEEE Transactions on
Pattern Analysis and Machine Intelligence, 22(11):1330 1334, Nov. 2000.
[29] Roger Y. Tsai. A versatile camera calibration technique for high-accuracy 3d machine
vision metrology using off-the-shelf tv cameras and lenses. IEEE Journal of Robotics
and Automation, RA-3(4), Aug. 1987.
[30] Anil K. Jain. Fundamentals of Digital Image Processing. Prentice-Hall Inc., 1989.
[32] D. Halliday; R. Resnick; K. Krane. Fsica, volume 2. CECSA, 1995. Version exten-
dida, 4ta. edicion.
[33] Zhengyou Zhang. Camera calibration with one-dimensional objects. IEEE Transac-
tions on Pattern Analysis and Machine Intelligence, 26(7):892 899, July 2004.
[34] Par Hammarstedt; Peter Sturm; Anders Heyden. Degenerate cases and closed form
solutions for camera calibration with one-dimensional objects. IEEE International
conference on computer vision, 1:317324, Oct. 2005.
[35] Xianghua Ying; Hongbin Zha. Linear approaches to camera calibration from sphere
images or active intrinsic calibration using vanishing points. IEEE Proceedings of the
10th International conference on Computed Vision, 1:596603, Oct. 2005.
[36] Hui Zhang; Kwan-Yee Wong; Guoqiang Zhang. Camera calibration from images of
spheres. IEEE Transactions on Pattern analysis and machine intelligence, 29(3):499
502, Mar. 2007.
[37] G.E. Healey; R. Kondepudy. Radiometric ccd camera calibration and noise estima-
tion. IEEE Transactions on Pattern analysis and machine intelligence, 16(3):267
276, Mar. 1994.
Bibliografa 99
[38] H. Faraji; W.J. MacLean. Ccd noise removal in digital images. IEEE Transactions
on Image Processing, 15(9):2676 2685, Sep. 2006.
[39] N. Teranishi; N. Mutoh. Partition noise in ccd signal detection. IEEE Transactions
on Electron Devices, 33(11):1696 1701, Nov. 1986.
[40] J. Hynecek. Spectral analysis of reset noise observed in ccd charge-detection circuits.
IEEE Transactions on Electron Devices, 37(3):640 647, Mar. 1990.
[41] K.S. Shanmugan; A.M. Breipohl. Random Signals: Detection, estimation and data
analysis. John Wiley & Sons, 1988.
[42] P.C. Hansen; J.G. Nagy; D.P. OLeary. Deblurring images. SIAM, 2006.
[43] R.L. Burden; J.D. Faires. Analisis numerico. Thomson Learning, 2002. 7ma. edicion.
[44] P.C. Hansen. Regularization tools: A matlab package for analysis and solution of
discrete ill-posed problems, Mar. 2008. http://www2.imm.dtu.dk/ pch/Regutools/.