Fusión de Datos

D.
Abeijn (2007) FUSION DE DATOS
3. Fusin de datos
3.1 Definicin
La fusin de datos (DF: Data fusin) de mltiples fuentes es un compendio de tcnicas
multidisciplinares, anlogas al proceso cognitivo que realizamos los humanos, para
integrar los datos de mltiples sensores (sentidos) con el fin de realizar inferencias sobre
el mundo exterior, convergiendo en un conjunto de resultados (reaccin).
As la fusin de datos pretende obtener un resultado de mejor calidad, a partir de
mltiples sensores, eventualmente heterogneos, realizando inferencias que pueden no
ser posibles a partir de uno solo. Teniendo mltiples aplicaciones tanto en el mundo
militar, reconstitucin de imgenes, diagnosis mdica y en la ltima dcada en el mundo
del transporte (Klein 2001; Hall y McMullen 2004).
3.2 Niveles de fusin

La Junta de Directores de Laboratorios (JDL: Joint Directors of Laboratories) concibe la
fusin como un proceso integral de tratamiento de datos (Hall y McMullen 2004),
subdividido en niveles que van desde la captura de los datos hasta el resultado final,
incluyendo la interaccin de dichos resultados con el receptor y/u operador.
3.2.1 Nivel 0: Pre-proceso de las fuentes

Los datos de las fuentes son habitualmente pre-procesados para una fusin posterior,
filtrando datos o alinendolos temporalmente u otras acciones previas.
Este proceso lo lleva a cabo, por lo general, el software asociado a cada uno de los
sensores comerciales de forma independiente del resto de sensores. Se puede considerar
as una pre-fusin.
Es a este nivel donde cada uno de los sensores aporta sus datos obtenidos de forma
independiente del resto.
3.2.2 Nivel 1: Evaluacin del objeto

Combinacin de los datos de los sensores para obtener posicin, velocidad, atributos y
caractersticas de la entidad.
Siendo la entidad, en transporte, por ejemplo un vehiculo, un incidente de trafico o la
congestin.
Los algoritmos de este nivel son:
1. Alineacin de datos: Ajustes espacio-tiempo y de unidades para posibilitar un
procesamiento posterior
2. Correlacin Dato/Objeto: Asociacin y correlacin de datos para cada individuo.
Para permitir la correcta agrupacin de los datos
3. Estimacin de posicin, cinemtica y otros atributos del objeto: Mediante la
combinacin de modelos fsicos y supuestos estadsticos para la obtencin del
Vector de Estado.
17
D. Abeijn (2007) FUSION DE DATOS
4. Estimacin de la identidad del objeto: Obtencin de la entidad mediante

mtodos paramtricos (Bayes, Dempster-Shafer), no paramtricos (redes
neuronales) o de lgica difusa.
3.2.3 Nivel 2: Evaluacin de la situacin

Interpretacin de los resultados del nivel anterior, en nuestro caso si se determina en el
paso anterior que las velocidades son bajas podemos interpretar que estamos en un
estado de congestin.
Las tcnicas ms adecuadas para este nivel son la Inteligencia artificial (IA) y el
razonamiento automtico.
1. Agregacin de objetos: Agregar los datos de cada una de las identidades para
una visin global de la situacin.
2. Interpretacin contextual: Tener en cuenta los factores externos al estudio que
pueden afectar de forma indirecta (En nuestro caso principalmente los factores
climatolgicos)
3. Evaluacin multiperspectiva: Observacin global del problema, desde el exterior
e interior.
3.2.4 Nivel 3: Evaluacin del futuro

Proyeccin de futuro de la entidad analizada a partir de la situacin actual. Los modelos
utilizados para este nivel son la inteligencia artificial, los modelos predictivos, el
razonamiento automtico y la estimacin estadstica.
1. Estimacin/Agregacin de capacidad de fuerza: Agregacin de la informacin
de diversos subsistemas para determinar sus interrelaciones y la robustez del
sistema.
2. Estimacin de implicaciones: Resultados de una hipottica accin sobre el
sistema
3. Evaluacin multiperspectiva: Anloga al del nivel 2, observacin del sistema
desde el exterior e interior.
3.2.5 Nivel 4: Proceso refinamiento

Metaproceso que monitoriza todo el proceso de DF para mejorar el rendimiento del
proceso en tiempo real, mediante la optimizacin de la utilizacin de recursos, la
modelizacin sensorial y la computacin de medidas de perfeccionamiento.
Este nivel se considera parcialmente dentro-fuera del proceso de fusin, ya que este
refinamiento es necesario para el correcto funcionamiento de la fusin y de las
operaciones a la que este destinada la DF.
1. Gestin de la misin: Direccin de los recursos existentes con el fin de obtener
los resultados deseados.
2. Prediccin de Entidad: Definir que entidades especificas debe reconocer el
proceso
18
3. Requerimientos de las fuentes: Definir la infraestructura necesaria de las fuentes

para que puedan identificar las entidades
4. Modelizacin del rendimiento del sistema: Definir la estructura del sistema de
fusin de datos, la relacin entre fuentes, los componentes de procesamiento,
etc.
5. Control del sistema: Tal como control de multiobjetivos y optimizacin.
3.2.6 Nivel 5: Refinamiento cognitivo

Mejora del sistema de fusin a partir de la relacin Sensor-Procesamiento-Persona.
Proyectando modelos en los que la representacin de los resultados (ya sean
intermedios o finales) permitan al operador identificar posibles errores en el
procesamiento, y que este previamente haya podido detectar errores en los datos
suministrados por los sensores.
Proceso de fusin de datos
N0 N1 N2 N3
Pre-proceso Evaluacin Evaluacin de Evaluacin
de las fuentes del objeto la situacin del futuro
N5
Fuentes Refin.
cognitivo
Sistema de gestin de la base

de datos
Soporte de la base de datos
Base de datos de fusin
N4
Proceso de
refinamiento
Interaccin
Persona
Ordenador
Figura 2: El proceso de fusin de datos. Fuente: Hall y McMullen 2004
Sin considerar que tienen la entidad de los niveles antes mencionados hay que tener en
cuenta tambin:
3.2.7 La gestin de la base de datos

Es un punto clave dada la gran cantidad de datos que se manejan durante el proceso.
Para desarrollar esta funcin ser necesario un considerable esfuerzo computacional,
19
destacando que el software comercial habitual es incapaz de gestionar el problema

completo de fusin
3.2.8 Interaccin de la persona con el ordenador

Este elemento, considerado externo a la fusin, es importante en el proceso de fusin.
Ya que una correcta interfaz del sistema, ser clave para el refinamiento cognitivo.
3.3 Tcnicas de fusin de datos

En este apartado se proceder a clasificar las diferentes tcnicas de fusin de datos y
posteriormente a describir con mayor precisin las ms utilizadas para as poder elegir
de forma ms sencilla el operador que mejores caractersticas presente para la solucin
del problema.
Para efectuar todo este proceso se deben definir algunos conceptos base para la correcta
comprensin por parte del lector de lo aqu expuesto.
1. xi : Representan el grado de de credibilidad de la informacin emitida por la
fuente i.
2. I : Intervalo de los valores de xi .
3. F ( xi ,..., x n ) : Operador de combinacin de la informacin
3.3.1 Clasificacin segn su comportamiento

Para no hacer esta clasificacin excesivamente complicada vamos a suponer que
estamos fusionando dos informaciones (La generalizacin al caso de ms datos es, en
general, sencilla), siendo as xi = ( x, y ) , y por lo general, excepto algn caso muy
especfico, I = [0,1] . Adems por la propiedad de semejanza entre el operador y el
entorno matemtico donde opera, F ( x, y ) = [0,1] .
Tal como plantea Bloch (1996) realizaremos la clasificacin en funcin de su
comportamiento, en primer grado segn su dependencia del contexto y en segundo
trmino segn su constancia a la hora de ser severas, prudentes o indulgentes.
Entendiendo bajo estos tres trminos lo siguiente:
1. Severo: Se aceptar que un operador tiene un comportamiento severo si se
comporta de forma conjuntiva, es decir:
F ( x, y ) min(x, y ) [1]
As estos operadores representan un consenso entre las partes de informacin, o
sus partes comunes o redundantes. Reduciendo la informacin ms incierta y
dando mayor fiabilidad al sensor ms restrictivo. Busca as satisfacer
simultneamente los criterios u objetivos de la fusin.
2. Prudente: El operador ser prudente si se comporta de forma comprometida,
es decir:
min( x, y ) F ( x, y ) max( x, y ) [2]
Los operadores que pertenecen a este grupo proveen una informacin global,
intermedia entre los diferentes valores de los sensores. La redundancia entre
20
diferentes elementos puede ser tomada en cuenta con algunos tipos de

operadores como las Integrales difusas.
3. Indulgente: Ser indulgente el operador si se comporta de forma disjunta, es
decir:
F ( x, y ) max( x, y ) [3]
Estos operadores incrementan la certeza que tenemos sobre una informacin,
dando mayor peso especfico al sensor que da la informacin menos incierta.
Expresa as, redundancia entre los criterios.
3.3.1.1 Operador Independiente del Contexto con Comportamiento Constante

(Operador ICCC)
La primera clase esta compuesta por los operadores que tienen igual comportamiento,
independientemente del valor de la informacin a fusionar, y que computa dichos datos
sin informacin respecto al exterior o el contexto. As respetan siempre una y solo una
de las siguientes cualidades:
( x, y ) I 2 , F ( x, y ) min ( x, y )
( x, y ) I 2 , min ( x, y ) F ( x, y ) max( x, y )
( x, y ) I 2 , F ( x, y ) max ( x, y )
Las tcnicas ms conocidas que se comportan de este modo son Bayes, Dempster-
Shafer y algunas clases de Lgica difusa.
3.3.1.2 Operador Independiente del Contexto con Comportamiento Variable

(Operador ICCV)
Esta segunda clase, comprende a los operadores que siendo independientes del contexto
no lo son del valor de x e y . As se pueden comportar de forma severa para ciertos
valores de credibilidad, mientras lo hace de forma indulgente para otros. Es decir, F
respetara ms de una de las cualidades presentadas en ICCC.
Las tcnicas ms conocidas que operan as son algunos tipos de Lgica difusa y de
Inteligencia artificial, como los Sistemas expertos (por ejemplo los tipo MYCIN).
3.3.1.3 Operador Dependiente del Contexto

(Operador DC)
La tercera clase incluye los operadores que son dependientes del contexto, es decir no
solo dependen de x e y sino tambin del conocimiento global o caractersticas de las
fuentes de datos (por ejemplo: conflicto entre fuentes, credibilidad de las fuentes).
Estos operadores son especialmente interesantes para problemas de clasificacin, ya que
permiten combinar informacin relacionada con una clase de una forma, e informacin
relacionada con otra clase de forma diferente.
Tcnicas conocidas, que se comporten segn lo detallado, son algunos tipos de
Conjuntos difusos y de Inteligencia artificial, como los Hbridas.
21
3.3.2 Clasificacin segn la lgica matemtica

D.L. Hall y S.A.H McMullen (2004) clasifican las tcnicas de fusin segn la lgica
matemtica utilizada para incorporar la incertidumbre. Este parmetro es la diferencia
clave entre las tcnicas de Bayes, Dempster-Shafer y Conjuntos difusos. Mientras en la
Inteligencia artificial el principal factor diferenciador es la forma de aprendizaje.
Dicha incertidumbre puede ser atribuida a las observaciones o bien a las conclusiones
llegadas. Las formas ms importantes de incorporarla son la:
3.3.2.1 Probabilstica
Es el modelo de lgica matemtica ms difundido y tambin el que cuenta con una base
terica ms potente, basada en la teora clsica de la probabilidad. Pero la determinacin
de las funciones de distribucin de probabilidades y de las probabilidades
condicionales, a travs de mtodos empricos o estocsticos, imponen hiptesis muy
restrictivas, poco crebles en problemas complejos.
Por otro lado esa potencia de la base terica permite tener poca complejidad
computacional.
Las Leyes clsicas de probabilidad y Bayes son las tcnicas de fusin con base
probabilstica.
3.3.2.2 Evidencial
La lgica evidencial define (a diferencia de la probabilidad) probabilidades no aditivas
como nocin general para la suposicin lgica y la probabilidad. La idea es aumentar la
lgica proposicional standard considerando un operador que representa el estado de
conocimiento que un agente racional tiene del mundo. Las probabilidades son as
definidas sobre el universo de operadores de todas las sentencias, y est argumentado
que esta es la mejor informacin disponible para el analista.
Dempster-Shafer y la Teora evidencial generalizada son las tcnicas de fusin con base
evidencial.
3.3.2.2 Difusa
La lgica difusa nace en un artculo de L.A. Zadeh publicado en 1965, titulado Fuzzy
Sets. Aparece como respuesta a la lgica clsica bivalente, permitiendo representar de
forma matemtica conceptos o conjunto imprecisos. Incluyndose as en la lgica
multivaluada, admitiendo varios valores como verdades posibles.
Los Conjuntos difusos y algunos operadores Hbridos de Inteligencia artificial son las
tcnicas de fusin con esta base lgica.
3.3.3 Descripcin de las tcnicas ms utilizadas

En este apartado describiremos algunas de las tcnicas ms utilizadas en la fusin de
datos, centrndonos especialmente en las de lgica probabilstica, evidencial y difusa.
Limitndonos a hacer una introduccin a la Inteligencia artificial, por su diversidad de
tcnicas y complejidad.
3.3.3.1 Bayes
Esta tcnica de inferencia, que utiliza la lgica probabilstica, est basada en la regla de
Bayes, y pertenece as a los algoritmos que usan conocimientos a priori (razonamiento
22
causa efecto) sobre el espacio de observacin para realizar inferencias sobre la identidad
de los objetos. La inferencia bayesiana provee un mtodo para calcular la veracidad de
la probabilidad condicional o a posteriori (razonamiento efecto causa) de una hiptesis
dada (Klein 2001).
Si E es el evento a evaluar, y x1 y x 2 los elementos de informacin dados por dos
sensores, a partir del Teorema de Bayes obtenemos (Bloch 96):
p( x 2 | E , x1 ) p(E | x1 )
p(E | x1 , x 2 ) = p( E )
p( x 2 | x1 )
p ( x 2 | E , x1 ) p( x1 | E ) p 2 (E )
=
p ( x 2 | x1 ) p ( x1 )
p ( x 2 | E , x1 ) p( x1 | E ) p 2 (E )
=
p ( x 2 | x1 ) p ( x1 )
p 2 (E )
= p ( x 2 | E , x1 ) p ( x1 | E ) [4]
p ( x1 , x 2 )
Esta ecuacin relativamente compleja, se puede simplificar suponiendo que nuestras
fuentes y sus datos son independientes entre ellos. Quedando as:
p ( x 2 | E ) p ( x1 | E ) p 2 (E )
p(E | x1 , x 2 ) = [5]
p ( x1 ) p ( x 2 )
Si deseamos generalizarlo para un nmero n de elementos de informacin, obtenemos:
p ( x n | E , x1 ,K , x n 1 )L p ( x1 | E ) p n (E )
p(E | x1 ,K , x n ) = [6]
p ( x1 ,K , x n )
Si esta expresin no depende del orden en que se reciben los elementos de informacin,
podemos simplificar la ecuacin [6], ya que dada la complejidad de entrenamiento de
las diferentes fuentes resulta conveniente:
n
p (x | E ) i
p(E | x1 ,K , xn ) = p (E )
2 i =1
n
[7]
p(x )
i =1
i
Si definimos = {E1 ,K, E r }como el conjunto de eventos a evaluar (El Faouzi 2005)
podemos tomar la decisin final segn los siguientes criterios:
1. Regla de mxima probabilidad a posteriori: El estado ms probable es aquel con
la mayor probabilidad a posteriori.
E k = arg max 1i r {p (Ei | x1 , K , x n )} [8]
23
2. Regla de mxima probabilidad: El estado ms probable es aquel con la mayor

funcin de probabilidad.
n
E k = arg max 1i r p (x j | E i ) [9]
j =1
Se trata as de una tcnica severa donde el operador es independiente del contexto y del
valor de las variables.
La principal ventaja de la tcnica de Bayes para la fusin de datos es que posee un
formalismo bien desarrollado, donde la evidencia es tratada como una funcin de
probabilidad. As usando esta tcnica, se pueden expresar conocimientos a priori de
forma estocstica para obtener el estado ms probable del sistema.
Desde el punto de vista de la aplicacin, se necesita una fuerte estimacin de las
funciones de probabilidad ( p (x j | Ei ) ), y de las de las de probabilidad a priori ( p(Ei ) )
que modelan el conocimiento aportado por cada una de las fuentes, incluso en caso de
total ignorancia. La prctica comn es definir p(Ei ) como uniforme ( p(E i ) = 1 r ),
hecho que no aporta mayor conocimiento, y estimar p (x j | Ei ) en funcin de la
credibilidad que tenga cada una de las medidas tomada por los diferentes sensores,
usando para ello mtodos estadsticos de aprendizaje
X1
Fuente 1 p ( x1 | Ei )
Formula
combinatoria de
Bayes
X2 Lgica
Fuente 2 p (x2 | Ei ) de Resultado
p ( Ei | x1 , K , x n )
decisin Fusin
para i = 1, K , r
Xn
Fuente n p (xn | Ei )
Figura 3: Proceso de fusin con la tcnica de Bayes. Fuente: Klein 2001.

.
3.3.3.2 Dempster-Shafer
La inferencia Dempster-Shafer, algoritmo de fusin de datos basado en la lgica
evidencial, se utiliza cuando a la suma de informaciones aportada por las fuentes de
datos no se les puede asociar el 100% de la probabilidad de certeza. El algoritmo
captura y combina la certeza o conocimiento existente usando la regla de Dempster,
que encuentra la interseccin o conjuncin de los eventos identificados por las fuentes
de informacin y sus probabilidades asociadas (Klein 2001).
La informacin del sensor i est representada por la funcin de masa (o credibilidad)
mi [0,1] que asigna valores a cada uno de los subconjuntos del conjunto de
24
discernimiento D (conjunto de eventos considerados), ignorando como se dividen estos

valores de masa dentro del subconjunto. Adems a partir de los valores de masa del
conjunto se pueden derivar otras funciones, como la plausibilidad, la credibilidad, la
comunalidad o la duda (Bloch 1996).
La combinacin se realiza mediante la suma ortogonal de Dempster, que para n fuentes
resulta:
0 si A =

1
m( A) = i =1 mi ( A) =
n
KmB 1=(AB1 )m2 (B2 )L mn (Bn ) si A [10]
1 k B1 B2 n
1 si A = D

donde A, B1 , K , Bn son subconjuntos de D y k , que se puede interpretar como la
medida de conflicto entre fuentes, resulta:
k = m1 (B1 )m2 (B2 )L mn (Bn ) [11]
Altos valores de k representan un grado de conflicto alto entre las fuentes, dando
tambin una indicacin de la exhaustividad del conjunto de discernimiento D . As debe
tenerse en cuenta a la hora de evaluar la calidad de la combinacin, ya que cuando el
valor sea muy alto, la combinacin normalizada (Siendo 1 k el factor de
normalizacin) tomar decisiones cuestionables que no podrn apoyar conclusiones
aceptables (El Faouzi 2005).
Podemos definir adems la credibilidad, la plausibilidad y la comunalidad como:
Comi ( A) = m (B ) i [12]
A B
donde
Com( A) = in=1 Comi ( A) = Com1 ( A)Com 2 ( A)L Com n ( A)

1
[13]
1 k
y
Cre( A) = m (B ) [14]
B A
Pl ( A) = m(B ) = 1 Cre(A)
B A =
[15]
Se puede considerar que Cre( A) y Pl ( A) son respectivamente, los lmites inferiores y

superiores del intervalo de credibilidad [Cre( A), Pl ( A)] , donde Cre( A) Pl ( A) es la
expresin natural de la ignorancia concerniente a A .
Se puede observar que las funciones de masa son muy similares a las de probabilidad,
ya que se asigna una evidencia a uno o ms subconjuntos del conjunto de proposiciones.
Pero con esta tcnica se puede asignar evidencia al conjunto de discernimiento D . Es
decir la funcin de masa puede representar explcitamente ambigedad o ignorancia
sobre la observacin mediante:
()
Cre( A) + Cre A + Cre(D ) = 1 [16]
25
mientras que en Bayes no existe esta opcin, resultando:

()
p ( A) + p A = 1 [17]
As podemos considerar que Bayes es un caso particular de la teora evidencial donde
Cre(D ) = 0 .
Si definimos D = {E1 ,K, E r } como el conjunto de estados a evaluar podemos tomar la
decisin final segn los siguientes criterios (El Faouzi 2005):
1. Regla de mxima credibilidad: El estado ms probable es aquel con mayor

credibilidad
{ ( )}
E k = arg max 1i r Cre E i [18]
2. Regla de mxima plausibilidad: El estado ms probable es aquel con mayor
plausibilidad
{ ( )} = arg min {Cre(E )}
E k = arg max 1i r Pl E i 1 i r i [19]
Se trata as de una tcnica severa donde el operador es independiente del contexto y del
valor de las variables
Fuente 1 Def. de
m
Combinacin de Lgica
Fuente 2 Def. de las funciones de de Resultado
m masa con la regla decisin Fusin
de Dempster
Fuente n Def. de
m
Figura 4: Proceso de fusin con la tcnica de Dempster-Shafer. Fuente: Klein 2001.

.
3.3.3.3 Conjuntos difusos
La lgica difusa es efectiva cuando los procesos son difciles de modelar con
paradigmas matemticos clsicos que requieren lmites bien definidos. Por tanto es
beneficiosa cuando los lmites entre conjuntos de valores no estn claramente definidos
o existe ocurrencia parcial de un evento. As en la teora de Conjuntos difusos formar
parte de un conjunto es funcin del grado Klein 2001.
Estableciendo normas y conjuntos difusos, la lgica difusa crea una base de control que
permite a los gestores construir un sistema de control incluso cuando no se ha entendido
completamente el comportamiento matemtico del proceso. Permitiendo as incorporar
la indefinicin (o vaguedad) en el proceso de decisin.
Es as una tcnica muy til si existen:
26
1. Deficiencias en los modelo matemticos o falta de capacidad para analizar todos

los datos
2. Sensores de poca calidad o poco representativos
3. Sistema experto, o un experto, para calibrar el sistema
Mediante su comportamiento podemos clasificar (Bloch 1996) los diferentes operadores

que utilizan est tcnica en:
1. Operadores ICC
Las tres familias de operadores que se comportan segn estos parmetros son:
las normas triangulares (T-norma), las conormas triangulares (T-conorma) y los
operadores medios.
Un ejemplo de T-norma es min( x, y ) . As si definimos i como T-norma, que
tiene un comportamiento severo:
( x, y ) I 2 , i ( x, y ) min (x, y ) [20]
Un ejemplo de T-conorma es max( x, y ) . As si definimos u como T-conorma,
que tiene un comportamiento indulgente:
( x, y ) I 2 , u ( x, y ) max ( x, y ) [21]
Un ejemplo de operador medio es la media aritmtica. As si definimos m como
operador medio, que tiene un comportamiento prudente:
( x, y ) I 2 , min ( x, y )m( x, y ) max( x, y ) [22]
2. Operadores ICV
El operador que se comporta siguiendo estos parmetros es la Suma ortogonal,

tal que:
g ( x, y )
( x, y ) = [23]
g ( x, y ) + g (1 x,1 y )
donde g es creciente, positiva, continua y g (0,0) = 0 , que supone que tenga
las mismas caractersticas.
Su comportamiento depender, como corresponde a este grupo, de los valores de
las variables.
3. Operadores DC
En esta seccin se incluyen los operadores que se comportan en funcin del

conflicto entre las fuentes y la fiabilidad de las mismas. Permiten as tener en
cuenta que las fuentes aporten informaciones contrapuestas, que haya fuentes
ms crebles que otras, y que esta fiabilidad dependa tambin del evento
evaluado por esa fuente, ya que dichas fuentes no podrn evaluar todos los
eventos con la misma precisin.
27
Los operadores dependientes del conflicto se comportaran segn la consonancia

de las fuentes. As si son consonantes tienen un comportamiento severo;
indulgente cuando son disonantes y prudente en caso de conflicto parcial.
Los operadores dependientes de la fiabilidad de las fuentes permitirn asignar
valores numricos a nuestros conocimientos sobre cada una de las fuentes.
Clasificacin segn
Lgica Operador matemtico Comportamiento del operador
el comportamiento Tcnica de fusin
matemtica especfico especfico
del operador
Bayes Probabilstica Producto de probabilidades Severo
Conjuntos difusos Difusa T-noma Severo
(Operador ICCC) T-conorma Indulgente
Medio Prudente
Dempster-Shafer Evidencial Suma ortogonal Severo
Conjuntos difusos Difusa Suma simtrica Los tres comportamientos son

posibles segn los valores a
combinar
Sistemas expertos Combinacin de factores de Severo (si x, y > 0)

(Operador ICCV) certeza
Prudente ( en resto de casos)
Indulgente (si x ,y < 0)
Conjuntos difusos Difusa Operador dependiente del Severo si las fuentes son
conflicto consonantes
Prudente si el conflicto es
parcial
(Operador DC)
Indulgente si las fuentes son

disonantes
Conjuntos difusos Difusa Operador dependiente de la

fiabilidad de la fuente
Tabla 5: Clasificacin de los operadores segn su comportamiento. Fuente: Bloch 1996.
3.3.3.4 Inteligencia artificial

Se denomina Inteligencia artificial (IA) a la ciencia que desarrolla tcnicas para que las
mquinas puedan imitar las formas de comprensin, razonamiento y aprendizaje
humano.
Para alcanzar este propsito existen dos vas. La denominada IA convencional, que se
caracterizan por el formalismo y su base estadstica, donde se incluyen:
28
1. Sistemas expertos: Sistemas diseados para actuar como un experto humano en

un dominio particular o rea de conocimiento. En este sentido, pueden
considerarse como intermediarios entre el experto humano, que transmite su
conocimiento al sistema, y el usuario que lo utiliza para resolver un problema
con la eficacia del experto. El Sistema Experto utilizar para ello el
conocimiento que tenga almacenado y algunos mtodos de inferencia.
Simultneamente, el usuario puede aprender observando el comportamiento del
sistema, es decir, los sistemas expertos se pueden considerar al mismo tiempo
como un medio de ejecucin y transmisin del conocimiento (monografas.com
2007)
2. Red bayesiana: Modelo basado en la ya analizada tcnica de Bayes
La otra va es la IA computacional, que implica el aprendizaje iterativo basndose en
datos empricos, donde se incluyen:
1. Redes neuronales: Son un paradigma de aprendizaje y procesamiento automtico
inspirado en la forma en que funciona el sistema nervioso de los animales. Se
trata de un sistema de interconexin de neuronas en una red que colabora para
producir un estmulo de salida
2. Sistemas difusos: Modelo basado en la ya analizada tcnica de Conjuntos
difusos.
Tambin existen los modelos Hbridos que fusionan varias tcnicas de IA,
aprovechando las caractersticas ms apropiadas de cada una de ellas para una mejor
solucin del problema.
3.4 Utilidad de la fusin de datos de mltiples fuentes

La fusin de datos de mltiples fuentes aparece como respuesta a la posibilidad de
aumentar el nmero de sensores, y as mejorar el resultado de problemas complejos,
como la restitucin de imgenes, la diagnosis medica, la deteccin de la congestin de
carreteras, de incidentes en carretera o del tiempo de viaje.
Uno de los principales objetivos de la fusin de datos es combinar la informacin
obtenida a travs de las diferentes fuentes para tomar una mejor decisin, realizando
para ello una reduccin de la imprecisin e incertidumbre e incrementando la robustez
(Bloch 1996).
Disponibilidad de datos
Fusin de Agregacin
datos de modelos
Integracin
de datos
Figura 5: La fusin de datos como va alternativa. Fuente: El Faouzi 2005
29
As como muestra El Faouzi (2005), la fusin es una va alternativa a la agregacin de

modelos, que sigue la senda abierta por la integracin de datos. La primera, como
muestran Hall y McMullen (2004), es ms robusta que la segunda, ya que en la
agregacin los modelos compiten entre ellos con fuentes propias, mientras que en la
fusin las fuentes se complementan y son redundantes. Por otra parte la integracin de
datos utiliza una nica fuente principal, usando otra como apoyo o validacin.
3.4.1 Ventajas y limitaciones

A la hora de implementar un sistema de fusin de datos, debemos tener en cuenta cuales
son los puntos fuertes del proceso as como sus limitaciones ya que, como se mostraba
en el Nivel 4, una correcta planificacin de la DF nos permitir optimizar su
rendimiento.
Por ejemplo, los resultados de Nahum y Pokoski (1980) muestran de forma cualitativa
como la fusin de datos de mltiples fuentes aumenta la posibilidad de clasificar
correctamente los datos, frente a un nmero menor de fuentes. Tambin nos permite
observar que:
1. La combinacin de datos de fuentes poco fiables (PN<0,5) no aporta ninguna
mejora. As la primera premisa para la fusin ser que los datos tengan una
fiabilidad aceptable.
2. La combinacin de datos de fuentes muy precisas (PN>0,95) no aporta ninguna
mejora significativa. As si nuestros sensores son muy precisos no tiene sentido
invertir tal esfuerzo.
3. El aumento del nmero de sensores mejora la precisin del sistema si bien, esta
mejora se vuelve casi imperceptible a partir del octavo a dcimo sensor. Hay
que tener en cuenta que esta perdida de inters en un mayor nmero de sensores
no ser real, si el nuevo sensor aporta datos no redundantes.
Figura 6: Relacin del nmero de fuentes con el rendimiento del sistema. Fuente: Nahum y Pokoski
30
As las ventajas de la fusin de datos de mltiples fuentes son:

1. Robustez operacional: Ya que un sensor puede aportar informacin cuando los
otros no estn operativos o solo parcialmente operativos.
2. Cobertura espacial extendida: La correcta fusin de los datos de los sensores
distribuidos por el espacio dan una mejor resolucin que uno solo de ellos.
3. Cobertura temporal extendida: Un sensor puede obtener informacin cuando
otros no o de forma ms continua.
4. Aumento fiabilidad: Un buen proceso de fusin puede confirmar la veracidad de
una informacin, dada la inherente redundancia de los datos de las fuentes.
5. Reduccin ambigedad: La fusin de la informacin de mltiples sensores
permite reducir el numero de hiptesis a realizar
6. Mejora de deteccin: Una correcta fusin facilita la deteccin de un suceso,
gracias a la redundancia de los datos.
Y sus limitaciones:
1. Calidad y nmero de sensores: Como hemos visto anteriormente, la calidad del
sensor y su nmero determinar de forma importante la calidad del resultado
final de la DF.
2. Imposibilidad de corregir errores de base: El proceso de DF no puede corregir

errores en el pre-procesamiento de los datos. Es decir no hay correccin aguas
arriba de la inferencia, si bien el Nivel 4 proceder a un refinamiento de los
resultados, pero ya a partir del nivel 1.
3. La calidad de la informacin sobre los sensores: Si la informacin que tenemos

sobre los sensores (su rendimiento, datos que pueden aportar) es pobre o
incorrecta, tambin lo sern los resultados de la DF.
4. Inexistencia del algoritmo de DF ideal: Cada algoritmo tiene sus fortalezas y

debilidades debiendo el gestor elegir el ms apropiado para el fin deseado.
5. Falta de datos de entrenamiento: Nunca habr suficientes datos para entrenar al

sistema, es decir los recursos son limitados.
6. Dificultad de cuantificacin del rendimiento: No existen parmetros claros y

globales para determinar si un sistema de DF es mejor que otro. Queda as en
manos del gestor una correcta valoracin
7. Dinamismo del proceso: Es imposible analizar el proceso como algo esttico,

siendo as difcil de valorar su rendimiento de forma generalizada, ya que
depender de su grado de aprendizaje y de los datos disponibles en ese
momento.
31
Ventajas Limitaciones
1. Robustez operacional 1. Calidad y numero de sensores
2. Cobertura espacial extendida 2. Imposibilidad de corregir errores de

base
3. Cobertura temporal extendida
3. La calidad de la informacin sobre
los sensores
4. Aumento fiabilidad
4. Inexistencia del algoritmo de DF

5. Reduccin ambigedad ideal
6. Mejora de deteccin 5. Falta de datos de entrenamiento
6. Dificultad de cuantificacin del

rendimiento
7. Dinamismo del proceso
Tabla 6: Resumen de Ventajas y limitaciones
Tambin hay que considerar el esfuerzo de clculo y memoria que supone la gestin de
un sistema de mltiples fuentes de datos y su consiguiente fusin. Si bien, segn Hall y
McMullen (2004), la mayor parte del esfuerzo se emplea en la gestin de los datos.
20
Porcentaje del Software total
15
10
Display especial
Control del Hardware
Procesamiento datos
Control de procesos
Gestin de datos
Comunicaciones
Interfaz usuario
Fusin de datos
Sistema Op.
Figura 7: Perfil del software requerido para un sistema de fusin de datos. Fuente: Hall y McMulen
32
3.5 Aplicacin de la fusin de datos a la ingeniera del transporte

La fusin de datos aparece a finales de los aos 80 del siglo anterior con fines
claramente militares, como se puede apreciar en la bibliografa. El Departamento
estadounidense de Defensa apoya as este nuevo compendio de tcnicas con el fin de
obtener beneficios en el campo militar y en el aerospacial, para mejorar la fiabilidad y
precisin de las operaciones de la agencia espacial NASA.
Posteriormente, en el campo civil, los estamentos (universidad, empresa, estados)
relacionados con la robtica, la climatologa y el procesamiento de imgenes han
mostrado mucho inters en la fusin de datos, provocando un rpido desarrollo de este
nueva ciencia.
Por otra parte con la aparicin de los Sistemas Inteligentes de Transporte (ITS) y los
Sistemas Avanzados de Informacin al Viajero (ATIS) ha nacido, a principio de los 90,
el inters de la ingeniera del transporte por dichas tcnicas. As los ITS han permitido
diversificar las fuentes para la obtencin de datos sobre el estado de la red viaria con
costes aceptables, haciendo posible la fusin de datos de mltiples fuentes. Y los ATIS
y la gran expansin de los sistemas de navegacin GPS entre los usuarios, han hecho
que tal esfuerzo tenga un gran efecto positivo en la informacin disponible, no solo por
parte de los gestores sino tambin de los usuarios.
La fusin de datos en el campo de la ingeniera del transporte ha sido implementada con
el fin de obtener:
1. Mayor fiabilidad de los resultados
2. Mayor robustez del sistema
3. Mayor cobertura espacial y/o temporal
4. Mayor precisin de los resultados
5. Menores costes de operacin
Siendo, en todos los casos conocidos, alcanzados dichos objetivos en mayor o menor
medida, siempre mejorando las tcnicas habituales utilizadas con anterioridad.
Los primeros autores que se interesan por la fusin de datos aplicada al clculo del
tiempo de viaje, lo hacen en los aos 90.
Desde EE.UU. Palacharla y Nelson (1999) estudian la aplicacin de la lgica difusa a la
estimacin del clculo de viaje, valorando que sistema hbrido resulta ms interesante, si
el de los conjuntos difusos sobre una red neural o el de los mismos conjuntos en un
sistema experto. Obtienen como resultado que el primer sistema hbrido es ms preciso
incrementando ambos la calidad del resultado obtenido con tcnicas habituales.
Por esta va de los sistemas hbridos tipo lgica difusa - red neural continan los
estudios del Ministerio austriaco de Trfico, Innovacin y Tecnologa (bm vit) que en
2006 presenta un proyecto, ya en proceso de pruebas, de obtencin de tiempos de viaje
y de la saturacin de la red viaria a partir de mltiples fuentes (espiras inductivas, lser,
coches flotantes (sensores ubicados en los taxis)). La tcnica utilizada en este caso es
conocida como ANFIS (Redes Neurales Adaptables con Inferencia Difusa) y los
resultados obtenidos presentan una mejora del 50% en el nmero de errores detectados.
Tambin con un sistema basado en ANFIS obtiene Sazi Murat (2006) tiempos de espera
en intersecciones sealizadas obteniendo resultados mejores que el HCM (Highway
Capacity Manual principalmente en situaciones de sobresaturacin.
33
Por otra parte Weizhong Zheng, Lee y Shi, investigadores de Singapur y China, han
realizado predicciones de flujos de trfico mediante inferencia bayesiana sobre
estructura neural a partir de una nica fuente, obteniendo resultados superiores que
redes neurales simples en el 85% de los casos.
Desde Francia se ha apostado por sistema de fusin de datos ms sencillos desde el
punto de vista conceptual. As El Faouzi y sus colaboradores (2000 y 2005) han optado
por la inferencia evidencial de Dempster-Shafer que consideran una generalizacin de la
teora de Bayes. Obteniendo con el primer mtodo resultados superiores al de Bayes y al
de tcnicas habituales en una va de Toulouse, a partir de lectura de matrculas y de
espiras inductivas.
Aparte, los operadores de autopistas franceses AREA, ASF. ESCOTA y SAPN estn ya
utilizando o estudiando sistemas de fusin de datos para el clculo de tiempos de viaje
en sus vas (AREA 2006; Guiol y Schwab 2006; Ferr).
Suecia y Escocia a travs de sus direcciones generales de trfico SRA (Sweden Road
Administration) y Transport Scottland estn estudiando detalladamente, desde 2001, la
implantacin de la fusin de datos para la obtencin de tiempos de viaje. Escocia utiliza
en sus pruebas (en la A1 en los alrededores de Edimburgo) hasta 4 fuentes (telefona
mvil, espiras inductivas, coche flotante y lectura de matrculas) donde destacan por su
fiabilidad la telefona mvil y la lectura de matrculas (Peterson 2006; Scott 2006).
En Alemania dgg, empresa perteneciente al grupo T-Systems, ha desarrollado un
software capaz de inferir difusamente sobre las variables del trfico para la obtencin
del estado de congestin, utilizando adems dominios de definicin dinmicos. Ahora
estn estudiando evolucionar dicho software para obtener las demoras debidas a la
congestin, utilizando para ello informacin proporcionada por las espiras inductivas y
coches flotantes.
Por su parte, en Holanda, van Lint, Hoogendoorn y van Zuylen (2005) utilizan redes
neurales para la prediccin de tiempos de viaje con datos faltantes, obteniendo
resultados satisfactorios a pesar de la falta de datos.
Park y Lee (2004), ambos coreanos, han obtenido tiempos de viaje en ambiente urbano
mediante la implementacin de redes neurales e inferencia bayesiana, ambos de forma
independiente, a partir de espiras inductivas y coche flotante. Considerando en ambos
casos prometedores los resultados.
34

Fusión de Datos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Fusión de Datos

Cargado por

Copyright:

Formatos disponibles

D.

Abeijn (2007) FUSION DE DATOS

3.2 Niveles de fusin

3.2.1 Nivel 0: Pre-proceso de las fuentes

3.2.2 Nivel 1: Evaluacin del objeto

4. Estimacin de la identidad del objeto: Obtencin de la entidad mediante

3.2.3 Nivel 2: Evaluacin de la situacin

3.2.4 Nivel 3: Evaluacin del futuro

3.2.5 Nivel 4: Proceso refinamiento

3. Requerimientos de las fuentes: Definir la infraestructura necesaria de las fuentes

3.2.6 Nivel 5: Refinamiento cognitivo

Proceso de fusin de datos

Sistema de gestin de la base

Figura 2: El proceso de fusin de datos. Fuente: Hall y McMullen 2004

3.2.7 La gestin de la base de datos

destacando que el software comercial habitual es incapaz de gestionar el problema

3.2.8 Interaccin de la persona con el ordenador

3.3 Tcnicas de fusin de datos

3. F ( xi ,..., x n ) : Operador de combinacin de la informacin

3.3.1 Clasificacin segn su comportamiento

diferentes elementos puede ser tomada en cuenta con algunos tipos de

3.3.1.1 Operador Independiente del Contexto con Comportamiento Constante

3.3.1.2 Operador Independiente del Contexto con Comportamiento Variable

3.3.1.3 Operador Dependiente del Contexto

3.3.2 Clasificacin segn la lgica matemtica

3.3.3 Descripcin de las tcnicas ms utilizadas

2. Regla de mxima probabilidad: El estado ms probable es aquel con la mayor

Figura 3: Proceso de fusin con la tcnica de Bayes. Fuente: Klein 2001.

discernimiento D (conjunto de eventos considerados), ignorando como se dividen estos

Com( A) = in=1 Comi ( A) = Com1 ( A)Com 2 ( A)L Com n ( A)

Se puede considerar que Cre( A) y Pl ( A) son respectivamente, los lmites inferiores y

mientras que en Bayes no existe esta opcin, resultando:

1. Regla de mxima credibilidad: El estado ms probable es aquel con mayor

Figura 4: Proceso de fusin con la tcnica de Dempster-Shafer. Fuente: Klein 2001.

1. Deficiencias en los modelo matemticos o falta de capacidad para analizar todos

Mediante su comportamiento podemos clasificar (Bloch 1996) los diferentes operadores

El operador que se comporta siguiendo estos parmetros es la Suma ortogonal,

En esta seccin se incluyen los operadores que se comportan en funcin del

Los operadores dependientes del conflicto se comportaran segn la consonancia

Bayes Probabilstica Producto de probabilidades Severo

Conjuntos difusos Difusa T-noma Severo

(Operador ICCC) T-conorma Indulgente

Dempster-Shafer Evidencial Suma ortogonal Severo

Conjuntos difusos Difusa Suma simtrica Los tres comportamientos son

Sistemas expertos Combinacin de factores de Severo (si x, y > 0)

Prudente ( en resto de casos)

Indulgente (si x ,y < 0)

Indulgente si las fuentes son

Conjuntos difusos Difusa Operador dependiente de la

Tabla 5: Clasificacin de los operadores segn su comportamiento. Fuente: Bloch 1996.

3.3.3.4 Inteligencia artificial

1. Sistemas expertos: Sistemas diseados para actuar como un experto humano en

3.4 Utilidad de la fusin de datos de mltiples fuentes

Figura 5: La fusin de datos como va alternativa. Fuente: El Faouzi 2005

As como muestra El Faouzi (2005), la fusin es una va alternativa a la agregacin de

3.4.1 Ventajas y limitaciones

As las ventajas de la fusin de datos de mltiples fuentes son:

2. Imposibilidad de corregir errores de base: El proceso de DF no puede corregir

3. La calidad de la informacin sobre los sensores: Si la informacin que tenemos

4. Inexistencia del algoritmo de DF ideal: Cada algoritmo tiene sus fortalezas y

5. Falta de datos de entrenamiento: Nunca habr suficientes datos para entrenar al

6. Dificultad de cuantificacin del rendimiento: No existen parmetros claros y

7. Dinamismo del proceso: Es imposible analizar el proceso como algo esttico,