Está en la página 1de 61

MSTER AUTOMTICA, ROBTICA Y TELEMTICA

Anlisis de mtodos para la fusin de datos en redes descentralizadas y propuesta de mejora cualitativa para la deteccin de informacin corrupta utilizando Sistemas Clasificadores

Trabajo de curso para la asignatura de Robots y Sistemas Autnomos

Jess Gonzlez Villagmez villagomez@us.es


Sevilla, Julio de 2012

ndice general
1. Introduccin 1.1. Introduccin . . . . . . . . . . . . . . 1.2. Arquitecturas para fusin de datos . 1.2.1. Arquitecturas jerrquicas . . . 1.2.2. Arquitecturas distribuidas . . 1.2.3. Arquitecturas descentralizadas 1.3. Estructura del documento . . . . . . 1 1 2 2 4 5 5 7 7 11 13 16 18 22 22 23 23 25 30 32 34 37 37 38 38 40 42 47

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

2. Fusin descentralizada de datos 2.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . 2.2. Filtro de informacin de Kalman. El Filtro de Canal 2.2.1. Descentralizacin del Filtro de Informacin . . 2.3. Estructura general . . . . . . . . . . . . . . . . . . . 2.4. Ventajas, inconvenientes y alternativas . . . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

3. Mtodos basados en el estudio de la covarianza 3.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Interseccin de la covarianza . . . . . . . . . . . . . . . . . . . 3.2.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2. Planteamiento del problema . . . . . . . . . . . . . . . 3.2.3. Usando el algoritmo CI para fusin descentralizada de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Unin de la covarianza . . . . . . . . . . . . . . . . . . . . . . 3.3.1. Ejemplo de tolerancia a fallos en una red descentralizada 4. Algoritmo CU reforzado con Sistemas Clasicadores 4.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Teora del Aprendizaje en Sistemas Clasicadores . . . 4.2.1. Teora del Aprendizaje . . . . . . . . . . . . . . 4.2.2. Algoritmos Genticos . . . . . . . . . . . . . . . 4.2.3. Sistemas Clasicadores . . . . . . . . . . . . . . 4.3. Representacin y funcionamiento del sistema . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

ii

NDICE GENERAL

iii

4.3.1. 4.3.2. 4.3.3. 4.3.4. 4.3.5.

Presentacin de la propuesta . . . . . . . . . . . . . . . Clasicador . . . . . . . . . . . . . . . . . . . . . . . . Algoritmo de actualizacin de los niveles de adaptacin Interpretacin de los resultados . . . . . . . . . . . . . Conclusin . . . . . . . . . . . . . . . . . . . . . . . . .

47 49 50 50 52

ndice de guras
1.1. Sistema de seguimiento basado en mltiples sensores con arquitectura jerrquica. . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Ejemplo de arquitectura track-to-track, en la que referencias locales son generadas de forma local en cada sensor para posteriormente ser enviadas al centro de fusin donde se generar una referencia global. . . . . . . . . . . . . . . . . . . . . . . . 1.3. Arquitectura tipo Pizarra para fusin de informacin . . . . 2.1. Ejemplo de redes descentralizadas de sensores. . . . . . . . . . 2.2. Ejemplo de arquitectura descentraliza con comunicacin nodonodo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Nodo y arquitectura de red para DKF: (a) Arquitectura de ltros de consenso para KF de un nodo, y (b) Patrones de comunicacin entre ltros de consenso low-pass/band-pass entre nodos vecinos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1. Silueta de la elipse de la covarianza actualizada. Las varianzas Paa y Pbb se corresponden con las elipses slidas exteriores. Las elipses discontinuas representan los valores de Pcc que surgen para diferentes valores de Pab . La actualizacin con estimaciones verdaderamente independientes se corresponden con la elipse slida interior. . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Distintos resultados para el algoritmo de CI:(a) Estimaciones iniciales de las covarianzas y la covarianza actualizada calculada por el ltro de Kalman; (b) Posible covarianzas actualizadas calculadas a partir de una combinacin convexa de dos covarianzas iniciales parametrizadas por . (c) Covarianza actualizada como la combinacin convexa de las dos covarianzas iniciales que maximiza la informacin (minimizan el rea encerrada por las elipses) (d) Caso donde una covarianza inicial domina el resto. . . . . . . . . . . . . . . . . . . . . . . . . . .

4 5 8 10

19

27

29

iv

NDICE DE FIGURAS

3.3. Forma cannica del nodo en un red descentralizada de fusin de datos que produce estimaciones locales del estado utilizando algoritmo CI para combinar informacin recibida de otros nodos y un ltro de Kalman para incorporar medidas sensoriales independientes. . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4. (a) Dos nodos contienen estimaciones mutuamente inconsistentes; (b) El algoritmo de CU resuelve la inconsistencia entre estimaciones; (c) El algoritmo de CI obtiene mejores estimaciones de otros nodos. . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1. Sistema Clasicador cannico. . . . . . . . . . . . . . . . . . . 4.2. Propuesta de integracin del sistema clasicador en nodo de red descentralizada, integrando subsistemas de CI y CU. . . .

30

36 44 47

Captulo 1 Introduccin
1.1. Introduccin

El objetivo del presente trabajo es realizar un anlisis no exhaustivo de las tcnicas actuales para estimacin y fusin de datos. El motivo por el cual se propone esta temtica se debe principalmente a la realizacin durante el curso de prcticas realizadas relacionadas con el ltro de Kalman. El objetivo era determinar cuales son los lmites actuales cuando se plantean sistemas tpicos en la realidad, como robots mviles que poseen multitud de sensores, desde un enfoque descentralizado de la arquitectura. Dado que un anlisis exhaustivo e implementacin de todo lo relacionado con la estimacin y fusin de datos en entornos distribuidos o descentralizados sera el objeto de tesis doctorales [Capitan], en este trabajo se proporciona una ampliacin de conocimientos cuya base es la propia asignatura de Robots y Sistemas Autnomos. Reiteradamente se nos habla de sistemas robticos, con diversa capacidad sensorial, que realizan tareas, navegan hasta puntos de paso, o waypoints, etc. Pero a la hora de implementar realmente un sistema robtico medianamente complejo, empiezan a surgir cuestiones relacionadas con lmites tericos, los cuales son completamente desconocidos por el autor. As pues, y para concluir esta presentacin de introduccin, a lo largo del presente documento el lector podr encontrar un pequeo contexto relativo a la fusin de datos cuando hay diversos elementos sensoriales, el conjunto de problemas relativos a la combinacin de las diversas medidas, y alternativas o soluciones para problemas concretos, que tras consultar diversa bibliografa, se puede decir que constituyen, en lenguaje vulgar, la cima de un iceberg. Por lo tanto, en el presente trabajo tan solo se roza la supercie en cuanto a tratamiento estadstico de la informacin (Teorema de Bayes, por ejemplo), fusin y estimacin, y adecuacin de los datos, proporcionando en el ltimo

1.2. Arquitecturas para fusin de datos

captulo una propuesta de alternativa a los algoritmos clsicos de resolucin de problemas en redes descentralizadas. Existen otras alternativas para la fusin descentralizada de informacin, como por ejemplo el teorema de Bayes descentralizado. El motivo por el cual no se ha presentado en este trabajo, es principalmente porque existe mucha bibliografa al respecto, al tiempo que se enmarca ms bien en la Teoria de la Estadstica y Probabilidad, ms si cabe que el objetivo del presente trabajo es determinar los lmites del ltro de Kalman en entornos descentralizados. A continuacin se muestra una breve introduccin del contexto, introduciendo en primer lugar el elemento sobre el cual versar la temtica del trabajo: las redes de sensores, y las distintas distribuciones lgicas y arquitecturas que pueden presentar.

1.2.

Arquitecturas para fusin de datos

Los sistemas de fusin de datos pueden tomar muchas topologias y formas. En el nivel ms simple, se puede considerar un conjunto de sensores que comunican informacin directamente con un proceso central donde se llevara a cabo un proceso de fusin de datos. En este caso, no sera necesario llevar a cabo ningn tipo de procesamiento a nivel local (en el sensor); esto presenta la ventaja de poder implementar una vasta red de fuentes de informacin, al tiempo que presenta la limitacin de la necesidad de un elemento central, que si fallara, toda la red dejara de ser funcional. La clasicacin de las arquitecturas bien se puede realizar por el aumento de la capacidad de procesamiento en los nodos (dotarlos de cierta inteligencia o autonoma) o bien por las condiciones de comunicacin entre los elementos. A continuacin se exponen una posible clasicacin de este tipo de arquitecturas, junto con los algoritmos de fusin de datos asociados.

1.2.1.

Arquitecturas jerrquicas

En una estructura de tipo jerrquico, el nivel ms bajo de procesamiento transmite informacin hacia los elementos superiores (comunicacin bottomup), pasando a travs de niveles o etapas (fsicos o lgicos), en los cuales la informacin va pasando a travs de sucesivos procesos de tratamiento y renamiento hasta el nivel ms alto donde se dispone de alguna observacin global de alguna caracterstica del sistema. Este tipo de arquitecturas es ampliamente utilizado, y respecto a la red ms bsica posible, tiene la ventaja de que descarga de necesidad de procesamiento al nodo central.

1.2. Arquitecturas para fusin de datos

Figura 1.1: Sistema de seguimiento basado en mltiples sensores con arquitectura jerrquica. Supongamos por ejemplo, que todos los sensores estn midiendo alguna caracterstica comn, x(k). Las observaciones se llevan a cabo de forma local, de acuerdo a una ecuacin de la forma: z i (k) = H i (k)x(k) + wi (k), i = 1, , S. (1.1)

En principio, en cada nodo sensorial se debe llevar a cabo algn proceso de estimacin o fusin de la informacin para obtener estimaciones locales basadas nicamente en observaciones de tipo local de la forma: i = 1, , S. (1.2) Cada una de estas estimaciones xi (k | k) posteriormente deben ser propagadas hacia los niveles superiores, pasando a travs de nodos intermediarios, que no poseen capacidad sensorial, hasta llegar al nodo central, el cual realiza el proceso de fusin para obtener una estimacin global, de la forma:
S

xi (k | k) = xi (k | k 1) + W i (k)[z i (k) H i (k)xi (k | k 1)],

x(k | k) =
i=1

i (k) i (k | k) x

(1.3)

donde i (k) son matrices de ponderacin en cada posicin i. El principal problema de esta alternativa es que en cada sensor se est observando un estado comn, por lo que los modelos de los procesos locales estaran relacionados a travs de algn modelo global de la forma x(k) = F i (k)x(k) + B i (k)u(k) + Gi (k)v(k), i = 1, , S (1.4)

Esto signica pues que las predicciones realizadas a nivel local estn correladas, con lo que la actualizacin a nivel local tambin, a pesar del hecho de que los procesos de observacin son independientes, y las medidas son diferentes. Como consecuencia, las estimaciones locales generadas en cada sensor

1.2. Arquitecturas para fusin de datos

no pueden ser combinadas de la forma expuesta en (1.3). En este punto, el tipo de mtodos a aplicar para tratar con este problema son los denominados algoritmos de fusin track-to-track [Durrant, Grime]. Este tipo de algoritmos requiere que las correlaciones entre todos los nodos sean explcitamente calculadas, y mantenidas, al tiempo del clculo de la covarianza asociada a cada estimacin. Como conclusin, se puede decir que este tipo de mtodos no son vlidos para arquitecturas dinmicas, y supone un problema cuando el nmero de nodos crece, dado que es necesario mantener medidas entre cada uno de los elementos, lo que en la prctica no es posible su implementacin cuando el nmero de nodos es elevado.

Figura 1.2: Ejemplo de arquitectura track-to-track, en la que referencias locales son generadas de forma local en cada sensor para posteriormente ser enviadas al centro de fusin donde se generar una referencia global.

1.2.2.

Arquitecturas distribuidas

Sin entrar en detalle, se puede decir que la motivacin de este tipo de arquitecturas es el deseo de poder modularizar y exibilizar el sistema, al tiempo que cualquier implementacin de arquitectura centralizada supondra ms inconvenientes que ventajas. Un ejemplo de este tipo de arquitecturas es la denominada Blackboard, originalmente desarrollada para sistemas de reconocimiento vocal, la cual consiste bsicamente en un conjunto de agentes autnomos, en el que cada uno representa una fuente de informacin o conocimiento, el cual es intercambiado a travs de un recurso comn, ya bien sea memoria compartida o algn recurso comn de comunicacin. A esta plataforma comn se la denomina pizarra. Cada agente en el sistema es capaz de leer del recurso comn, sin restricciones de ningn tipo, cualquier tipo de informacin que considere oportuna. Se pueden aadir tantos agentes como sea requerido. La exibilidad de este tipo de arquitectura ha provocado su uso extendido en multitud de aplicaciones para fusin de

1.3. Estructura del documento

datos en aplicaciones de interpretacin de informacin y tareas de localizacin.

Figura 1.3: Arquitectura tipo Pizarra para fusin de informacin Los principales problemas que presenta esta arquitectura estn relacionados con el recurso comn; la necesidad de un gestor que controle el acceso, en modo lectura o escritura, o vericar la consistencia de la informacin presente en cada momento.

1.2.3.

Arquitecturas descentralizadas

Aunque se describe con mayor profundidad en el captulo 2, una red descentralizada de fusin de datos consiste en un conjunto de nodos sensores, con cierta capacidad de procesamiento, que no requieren de ningn recurso comn o central, tan solo cierta comunicacin con nodos adyacentes. En cada subsistema, se produce una fusin de los datos a partir de la informacin local, la obtenida hasta ese momento y la recibida de otros vecinos. Es un tipo de red en el que cada nodo posee una estimacin local del modelo global. As, cualquier red centralizada se puede plantear como una red completamente descentralizada, modicando la lgica de cada elemento.

1.3.

Estructura del documento

En el captulo 2 se presenta una alternativa para la propagacin y fusin de estimaciones locales a travs de una red descentralizada, convergiendo en estimaciones similares a las planteadas en una red centralizada, denominado

1.3. Estructura del documento

ltro de informacin de Kalman: ltro de canal. Se presentan sus funcionalidades bsicas introduciendo los elementos que la componen. Se presentan otras alternativas a la tcnica presentada, argumentando sus inconvenientes principales, cuya aproximacin de solucin es mostrada en el captulo 3. Mtodos basados en el tratamiento de la covarianza de las estimaciones, para resolver dos de los principales problemas existentes en las redes descentralizadas. Las tcnicas mostradas en el captulo 3 presentan tambin un conjunto de inconvenientes si se producen una serie de condiciones anmalas en la red. Una propuesta de solucin a las mismas es presentada en el captulo 4. El argumento por el cual se introduce este ltimo captulo es para completar este documento de introduccin, basndose en una tcnica cada vez ms extendida como son los algoritmos genticos. Lo que se expone en el captulo 4 se trata de una propuesta de mejora cualitativa para tcnicas expuestas en el captulo 3, y no constituye en lugar alguno implementacin concreta, dado que si fuera el caso, quedara fuera del mbito propuesto de este trabajo.

Captulo 2 Fusin descentralizada de datos


2.1. Introduccin

La recoleccin de datos de forma distribuida para tareas de supervisin, modelizacin, monitorizacin activa, vigilancia o control distribuido ha experimentado en los ltimos aos fuertes avances, debido, entre otras causas, a la miniaturizacin de muchos de los componentes, la mejora en las comunicaciones (protocolos dedicados, como Zigbee), el bajo coste de la distribucin y un gran empuje a la componente terica por parte del mundo de la Academia. Adems, en el contexto de infraestructuras civiles y de defensa, hoy en da se intenta explotar de alguna forma la fusin de datos (elementos verticales) de distintas fuentes de informacin, distribuidas geogrcamente, para obtener medidas ms ables relativas a adquisicin, estimacin para posicin, seguimiento de caractersticas, etc. Es lo que se conoce como Integracin Horizontal [Gardner]2.1 , junto con otro tipo de subsistemas complementarios. El problema de la estimacin distribuida ha estado presente desde hace dcadas: la implementacin del ltro de Kalman en entornos distribuidos fue resuelto en primera instancia por Speyer [Speyer], en 1979. Posteriormente, una alternativa fue propuesta, entre otros, por Rao, Durrant-Whyte y Sheen [Rao]. Pero estas alternativas presentan diversos problemas, entre otros, que requieren de una red completamente conectada (grafo completo). Esto implica la no realizacin prctica de la solucin, debido principalmente a la complejidad que presenta en las comunicaciones (O(n2 ), donde n equivale al nmero de nodos). Por lo tanto, en este punto se pueden identicar dos problemas distintos: en primer lugar, ltro de Kalman descentralizado, y en segundo lugar, ltro de Kalman distribuido, en la que los nodos se conectan con sus vecinos en una red o grafo conexo con pocos elementos. En el presente tema se aborda
2.1

Por sus siglas en ingls, HI: Horizontal Integration.

2.1. Introduccin

el problema del ltro de Kalman descentralizado. De forma general, un sistema descentralizado de fusin de datos (en adelante DDFs - Decentralized Data Fusion System) consiste en una red de nodos interconectados, independientes, los cuales poseen uno o ms sensores con cierta lgica de procesamiento y sistemas de comunicacin. Mediante la lgica incorporada y la capacidad sensorial los nodos realizan tareas de estimacin local para posteriormente comunicar el resultado al resto de nodos de la red. Gracias a la comunicacin, el sistema no requiere la utilizacin de ningn recurso comn, dado que la comunicacin es estrictamente a nivel local, donde cada nodo tiene conocimiento nicamente de los vecinos ms cercanos. El conjunto de ventajas que presenta una arquitectura descentralizada sobre una centralizada es muy amplio: Escalabilidad: Al eliminar el elemento central de fusin y cualquier elemento comn de comunicaciones, no existen lmites y el sistema no presenta a nivel computacional cuellos de botella o limitaciones en cuanto a problemas en la comunicacin. Robustez: Dado que no es necesario albergar uno o varios nodos centrales con conocimiento de la topologa de la red a nivel lgico, el sistema es insensible tanto a la prdida o adicin en lnea de nodos sensoriales como a cambios en la propia infraestructura de comunicaciones. Modularidad: Dado que todos los procesos de estimacin/fusin de medidas provenientes de los sensores se realizan a nivel local, sin necesidad de un conocimiento global (a priori), el desarrollo y programacin de la red puede realizarse de forma modular.

Figura 2.1: Ejemplo de redes descentralizadas de sensores.

2.1. Introduccin

La denicin anterior es bastante exible en cuanto a la implementacin fsica de los nodos con capacidades sensoriales. Existen multitud de redes de sensores, descentralizadas o no, en nuestro entorno. Por ejemplo, toda la electrnica y sensores presentes en un vehculo, e interconectados mediante bus de tipo CAN, es un ejemplo de red. Al mismo tiempo, un grupo de UAV sobrevolando cierto objetivo en tierra (o aire), en coordinacin directa con equipos en tierra, tambin son ejemplos de redes, las cuales, y ms concretamente en entornos militares, en las ltimas dcadas se est poniendo especial nfasis en lograr la completa descentralizacin de los elementos. Motivo: menor prdida de vidas humanas, y mayor concrecin de los objetivos. Supongamos por ejemplo cierto objetivo a ser destruido por algn misil de largo alcance. Una estimacin inicial de la posicin, con relativa precisin, puede ser dada a partir de imgenes obtenidas por satlite; la precisin sigue sin ser lo sucientemente buena (del orden de metros), si pensamos por ejemplo en que el objetivo se encuentra en zona civil. El siguiente paso, sera o bien enviar equipos en tierra para que, haciendo uso de diversos sensores, se ajustara ms la posicin del objetivo, o bien enviar aviones no tripulados (UAV) teleoperados y jar an ms el objetivo. Si se piensa de una forma centralizada, y aplicando este ejemplo, si alguno de los aviones no tripulados fuera derribado, o alguno de los sensores de los equipos en tierra fuera destruido, la resolucin del objetivo disminuira en relacin a la sensibilidad de las medidas estimadas. En este caso, si el objetivo fuera mvil, podra darse el caso de perderse por completo la oportunidad de destruirlo. Sin embargo, en una alternativa descentralizada, la acumulacin de recursos (areos y terrestres, gura 2.2) servira para obtener una mejor precisin del objetivo, y en el hipottico caso de que se perdieran alguno o incluso todos los elementos cercanos al objetivo, la ltima estimacin de la posicin del objetivo seguira siendo vlida, y muy precisa, debido a la actualizacin del estado en algn nodo cercano de control. La idea de este captulo es proporcionar una visin rpida a los elementos que subyacen de un estudio inicial sobre la estimacin distribuida. Como se ha explicado anteriormente, si se tiene una red centralizada, la estimacin mediante ltro de Kalman es inmediata, mientras que apareceran cuellos de botella en las comunicaciones y complejidad exponencial en el nodo central. Pero tampoco se puede aplicar ltro de Kalman a cada uno de los nodos de la red sin un estudio previo, dado que consistira en replicar el mismo problema por el nmero de nodos de la red, al mismo tiempo que en otros nodos no se tiene conocimiento de las observaciones realizadas en otro subconjunto de nodos. El objetivo pues de esta seccin, es proporcionar nociones sobre la forma

2.1. Introduccin

10

Figura 2.2: Ejemplo de arquitectura descentraliza con comunicacin nodonodo. posible de descentralizar el algoritmo de estimacin/fusin centralizado por excelencia, el ltro de Kalman. El uso de este mtodo est muy extendido, principalmente debido a que provee una estimacin ptima, en trminos de denicin del error cuadrtico medio, bajo asumpciones de linealidad del proceso y modelo de observacin, incluyendo variables aleatorias que representan a errores de modelado o rudo en las medidas. Para terminar la introduccin con un ejemplo que argumente la necesidad del tratamiento de la estimacin o fusin de datos, supngase por ejemplo la posicin de un determinado objetivo observado en tierra por un UAV, la cual es calculada a bordo a partir de la estimacin de su propia posicin, determinada a partir de un GPS y sistemas inerciales, y de la estimacin de la relacin existente entre el vehculo y el objetivo, basados en el rango y/o dinmicas del conjunto de sensores a bordo.Todos estos componentes poseen modelos conocidos de incertidumbre que contribuyen a la incertidumbre derivada de la estimacin global de la posicin del objetivo. Dicha medida se caracteriza grcamente como una elipse asociada al error en la medida. As, medidas de informacin que incluyen al mismo tiempo medidas de incertidumbre son denominadas estimaciones del estado.

2.2. Filtro de informacin de Kalman. El Filtro de Canal

11

2.2.

Filtro de informacin de Kalman. El Filtro de Canal

En este punto se propone, partiendo del algoritmo clsico de estimacin de Kalman, una aproximacin [Durrant] a la estimacin del estado con mltiples fuentes, para el caso ms simple de red descentralizada: cada nodo se comunica con su vecino o vecinos ms prximo/s y no hay conocimiento de la topologa general de la red. Consideremos un sistema [Makarenko] descrito de forma lineal como x(k) = F (k)x(k 1) + w(k) (2.1)

donde x(k) es el estado de inters en el instante de tiempo t = k, F (k) es la matriz de transicin del estado del instante de tiempo t = k 1 a t = k, y w(k) es el rudo asociado al proceso modelado como una secuencia de rudo blanco no correlado con E w(i)wT (j) = ij Q(i). Visto desde un sensor, el sistema es observado de acuerdo a la siguiente expresin: z(k) = H(k)x(k) + v(k) (2.2)

donde z(k) es el vector de observaciones realizadas en t = k, H(k) es la matriz de observacin o modelo, y v(k) es el rudo asociado al modelo de observacin, modelado como una secuencia no correlada de rudo blanco con E v(i)v T (j) = ij R(i). Si partimos del algoritmo clsico de estimacin, el ltro de Kalman, se generar una estimacin para el estado x(k | k) para el instante de tiempo t = k dadas todas las observaciones hasta la marca temporal t = k, junto con la correspondiente matriz de covarianza para la estimacin P (k | k), de forma: x(k | k) = x(k | k 1) + W (k)[z(k) + H(k) (k | k 1)] x P (k | k) = P (k | k 1) W (k)S(k)W T (k) donde la matriz de ganancia W (k) viene dada por la expresin: W (k) = P (k | k 1)H T (k)S 1 (k), y la covarianza del trmino de innovacin: S(k) = H(k)P (k | k 1)H T (k) + R(k) (2.6) (2.5) (2.3) (2.4)

Inicialmente, se puede pensar que el problema es fcilmente interpretado para sistemas de mltiples sensores u observaciones. Si se representa el conjunto de medidas de mltiples fuentes como

2.2. Filtro de informacin de Kalman. El Filtro de Canal

12

z i (k) = H i (k)xi (k) + v i (k), i = 1, . . . , N

(2.7)

la estimacin del estado no puede ser obtenida a partir de una simple combinacin lineal de las contribuciones individuales de cada uno de los sensores, de forma
N

x(k | k) = x(k | k 1) +
i=1

W i (k)[z i (k) + H i (k) (k | k 1)], x

(2.8)

debido principalmente a que el trmino de innovacin I nn (k) = z i (k) H i (k) (k | k 1) x (2.9)

generado a partir de las medidas de cada sensor, est correlado, dado que comparten informacin comn del modelo del sistema a travs de la prediccin x(k | k 1). Esto supone que la estimacin del estado ser errnea. Hasta este punto, todas las estimaciones estaban asociadas a las medidas del estado; esto es, tenan cierta dimensin o sentido fsico. Sin embargo, al cambiar el paradigma, es posible aplicar una solucin para sistemas descentralizados. Supongamos que los nodos comunican informacin en trminos de medidas de informacin adimensionales (asociadas al estado actual). Esto signica que es posible una representacin de la medida completamente independiente de la dimensin del proceso medido. Es lo que se conoce como el trmino de informacin del ltro de Kalman (IKF Information Kalman Filter), o ltro de informacin. Reescribiendo los trminos de estimacin del estado y covarianza como dos nuevas variables: y (i | j) P 1 (i | j) (i | j), x Y (i | j) P 1 (i | j) (2.10)

y reescribiendo al mismo el trmino de informacin obtenida a partir de una observacin: i(k) H T (k)R1 (k)z(k), I(k) H T (k)R1 (k)H(k) (2.11)

es posible reescribir tambin la estimacin del ltro de Kalman, como: y (k | k) = y (k | k 1) + i(k) (k | k) = Y (k | k 1) + I(k) Y (2.12) (2.13)

El trmino de informacin del ltro de Kalman no suele ser muy utilizado, debido principalmente a que los trminos de actualizacin son de dimensin

2.2. Filtro de informacin de Kalman. El Filtro de Canal

13

el estado, mientras que en el algoritmo de Kalman distribuido, estos trminos de actualizacin son de dimensin de la observacin. Una vez introducido el trmino de informacin en esta denicin, ante el problema de mltiples sensores, ahora es posible aplicar una combinacin lineal a partir de los trminos de informacin de las observaciones para la obtencin de la estimacin
N

y (k | k) = y (k | k 1) +
i=1

ii (k)

(2.14)

dado que los trminos de informacin ii (k) de cada sensor son no correlados. A partir de este punto, cada nodo de la red genera el trmino de informacin relativo ii (k) y stos son sumados en el centro de fusin para obtener una estimacin global de la informacin. La etapa de prediccin del ltro de informacin: Y (k | k 1) = M (k) M (k)G(k)1 (k)GT (k)M (k) (2.15)

y (k | k 1) = [1 M (k)G(k)1 (k)GT (k)] F T (k) (k 1 | k 1) (2.16) y donde (k) = GT (k)M (k)G(k) + Q1 (k) y M (k) = F T (k)Y (k 1 | k 1)F 1 (k) (2.18) (2.17)

Una vez que se ha obtenido el ltro a aplicar en cada nodo, el siguiente paso consistira en descentralizarlo. En la siguiente subseccin se expone el mtodo para ello. Existen muchas alternativas que utilizan este algoritmo para la fusin de datos: arquitecturas jerrquicas con ltro de informacin, estimacin multi-sensorial multi-objetivo con ltro de informacin, etc. Para ms informacin, consltese [Durrant].

2.2.1.

Descentralizacin del Filtro de Informacin

En este paso se trata de descentralizar la estimacin realizada por el ltro de informacin. En este tipo de sistemas, cada nodo genera una prediccin, realiza una observacin y calcula una estimacin local la cual es comunicada al resto de sus vecinos. Cada nodo recibe un conjunto de estimaciones locales, e implementa un algoritmo de asimilacin local para producir una estimacin global en forma de informacin del estado, equivalente a la que podra haberse obtenido con un sistema centralizado. Bsicamente, esta es la idea que

2.2. Filtro de informacin de Kalman. El Filtro de Canal

14

subyace para la descentralizacin del ltro: replicar el mtodo que se llevara a cabo de forma centraliza a todos los nodos. Se parte de la asumpcin de que cada nodo mantiene un modelo en espacio de estados de la forma (F (k), G(k), Q(k)), esto es, en el conjunto de localizaciones de los sensores se debe observar un determinado estado consistente, de forma que los modelos locales estn relacionados mediante algn modelo global, comn, de la forma:

xi (k) = F i (k)x(k) + B i (k)u(k) + Gi (k)v(k),

i = 1, ..., S.

(2.19)

La expresin anterior es equivalente a un modelo que estuviera en un nodo central, vericndose la prediccin y i ( | ) y ( | ) para todos los nodos de la red (i = 1, ..., N ). Cada nodo comienza calculando su estimacin local y i (k | k 1) basada en una prediccin local y i (k | k 1) y la informacin proveniente de la observacin local ii (k) de acuerdo con: Etapa de prediccin:

y i (k | k 1) = 1 i (k)GT (k) F T (k)y i (k 1 | k 1) + Y i (k | k 1)B(k)u(k) (2.20)

Y i (k | k 1) = M i (k) i (k)i (k)T (k) i

(2.21)

con M i (k) y i (k) especicadas para el nodo i esimo (2.13) y (2.14), respectivamente, donde i (k) = M i (k)G(k)1 (k) i Etapa de estimacin: Extendiendo (2.8) y (2.9) para el caso multinodal: y i (k | k) = y i (k | k 1) + ii (k) Y i (k | k) = Y i (k | k 1) + I i (k) (2.23) (2.24) (2.22)

estas estimaciones de informacin parciales locales son comunicadas a los nodos vecinos donde se lleva a cabo un proceso de asimilacin, de la forma

2.2. Filtro de informacin de Kalman. El Filtro de Canal

15

Etapa de asimilacin:
N

y i (k | k) = y i (k | k 1) +

[ j (k | k) y j (k | k 1)] y
j=1

(2.25)

Y i (k | k) = Y i (k | k 1) +

[Y j (k | k) Y j (k | k 1)]]

(2.26)

j=1

Si cada nodo comienza con una estimacin inicial asociada a la informa cin del estado y j (0 | 0) = 0, Y j (0 | 0) = 0 y la red est completamente conectada, se demuestra que las estimaciones obtenidas en los nodos sern idnticas. Tal y como se coment en la seccin anterior, la cantidad de informacin transmitida por la red, que equivale a: ij (k) y j (k | k) y j (k | k 1) y I j (k) Y j (k | k) Y j (k | k 1) (2.28) (2.27)

consistente en la diferencia entre la informacin local en el instante de tiempo k y la prediccin basada nicamente en la informacin disponible hasta el instante de tiempo k 1 (informacin nueva). As, el conjunto de nodossensores en una red comunican informacin nueva e independiente entre cada uno de sus vecinos para posteriormente asimilar y fusionar informacin para obtener estimaciones ptimas globales. Por ltimo, respecto a las ecuaciones planteadas en esta subseccin: La capacidad de clculo adicional requerida en cada nodo para poder llevar a cabo el proceso de asimilacin de informacin es pequea, dado que solo se tienen que llevar a cabo suma de vectores y matrices. La cantidad de informacin requerida en cada nodo es menor que si la organizacin fuera jerrquica. Esto es debido a que cada nodo calcula individualmente una estimacin global, con lo que no es necesaria la comunicacin antes de un ciclo de estimacin de estimaciones o predicciones.

2.3. Estructura general

16

2.3.

Estructura general

Dada una estimacin del estado y (k | k 1), sta es transmitida a travs de la red al resto de nodos colindantes con el origen de la transmisin. Una vez recibida en el destino, se produce un proceso de substraccin de informacin entre la informacin actual y la recibida justo en el instante de tiempo anterior. Tras un proceso de simplicacin y ltracin, la informacin ya est lista para ser incorporada al proceso central de fusin de datos y obtener as, mediante las ecuaciones de actualizacin asociativas ( N ii (k)), la estimacin i local del nodo actual. El algoritmo que realiza dicho proceso de sustraccin es el denominado ltro de canal, y reside en la interfaz o capa de intercomunicacin del nodo con el exterior. En el caso de prdida de paquetes en las comunicaciones, tal y como est planteado el ltro de informacin, el mtodo sera completamente robusto, en el sentido de que la informacin que contiene cada transmisin contiene implcitamente toda la estimacin del estado hasta ese instante de tiempo. De nuevo, no se considera el orden de los mensajes ni la redundancia de estos; se asume, como caso ideal, que se enva uno y solo un mensaje entre nodos por estimacin y que est garantizado el sincronismo en la red. El resumen de las funciones ms importantes que un nodo de una red descentralizada realiza, son las siguientes: 1. Informacin de prediccin del estado, en este caso, generando y (k | k1) y Y (k | k 1), de forma sncrona, en un determinado instante de tiempo a partir del histrico. 2. Pre-procesamiento de la observacin para proveer el vector (i(k)) y la matriz (I(k)) de informacin de sta. 3. Transmisin de la informacin a travs del ltro de canal. Para consideraciones de robustez en las comunicaciones, la informacin completa de la estimacin del estado es transmitida entre los nodos. 4. Fusin de la informacin recibida a travs de los canales. Este tipo de tareas requiere normalmente de cierta sincronizacin y/o compensacin de latencias y retardos en las comunicaciones. Los canales calculan los nuevos incrementos de informacin sustrayendo a la informacin recibida en el instante de tiempo anterior la actual recin obtenida del canal. Una vez obtenidos los incrementos, la nueva informacin es entonces fusionada con la estimacin local del estado. La estimacin del estado tiene lugar de forma local en el ltro del nodo, el cual es simplemente un ltro estndar de informacin que suma la informacin

2.3. Estructura general

17

total de las observaciones, la recibida por los distintos canales y la prediccin. Toda comunicacin pasa a travs del gestor del canal (channel manager), el cual gestiona tanto la sincronizacin como la interfaz de comunicacin. El ltro de canal mantiene una estimacin de toda la informacin que ha sido recibida en cada uno de los canales de entrada que conectan fsicamente la interfaz con la red. De forma resumida, las principales operaciones de cada uno de los nodos son las descritas a continuacin: Procesamiento sensor Cuando un sensor realiza una observacin, la informacin en bruto pasa a travs de un conjunto de etapas de pre-procesamiento, para transformar los datos en bruto de la observacin en trminos de informacin (i(k),I(k)) antes de que sea fusionada en el ltro local para estimacin. Filtro local El ltro local genera informacin de la estimacin del estado partir de la medida observada, la prediccin, y la recibida a travs de las comunicaciones. Al mismo tiempo, se asocian a la estimacin un ndice relativo a la informacin y una probabilidad de correccin relativa al formato. Filtro del canal El ltro de canal es utilizado para la gestin de las comunicaciones entre nodos, realizando principalmente dos funciones: mantener cierto control de la informacin comunicada previamente en el canal, y para sincronizar informacin entrante y saliente con el ltro local del nodo. La funcin de sincronizacin es realmente til cuando algunos nodos se encuentran situados remotamente. Gestor del canal Este gestor sirve como interfaz entre el ltro local y el/los ltro/s del canal. Su tarea consiste bsicamente en recoger informacin (en un horizonte temporal) del ltro de canal, calcula el incremento de informacin por simple adicin, y le pasa el resultado al ltro local. Al mismo tiempo, tambin recibe estimaciones del estado actualizadas del ltro local, para ser distribuidas a cada uno de los ltros del canal. Temporizacin En principio, cada nodo posee un reloj sincronizado respecto a un sistema temporal comn, al que se le puede integrar marcas temporales provenientes de sensores GPS, en el caso de que los sensores fueran, por ejemplo, UAV. Cada nodo en la red trabajara de forma asncrona respecto al resto de nodos, de forma que cada uno est programado para

2.4. Ventajas, inconvenientes y alternativas

18

que envie informacin cada un determinado T , el cual no tiene por qu ser el mismo para todos los nodos. Cuando un nodo recibe nueva informacin a travs del canal, se le aplica el proceso de prediccin asociado a un determinado horizonte temporal, y posteriormente es almacenada, hasta que bien sea de nuevo actualizada o bien utilizada para algn propsito. Pasado el horizonte temporal (el cual no tiene por qu coincidir con T ), se espera hasta la prxima recepcin de informacin.

2.4.

Ventajas, inconvenientes y alternativas

Existen muchas aproximaciones al problema de Kalman descentralizado. En [Reza], la propuesta es muy similar a la resumida en este trabajo, haciendo uso de ltros de entrada y uno central [Durrant]. As, se propone subdividir el problema de DKF -Distributed Kalman Filter- en dos subproblemas de consenso dinmicos: uno en trminos de medidas ponderadas y otro en base a matrices de covarianza inversa (informacin). La solucin se plantea de forma distribuida aplicando dos tipos de ltros, los denominados ltros de consenso low-pass y band-pass. El primero de ellos se utiliza para la fusin de las medidas, mientras que el segundo se emplea para la fusin de la inversa de las matrices de covarianza. Plantean un ltro hipottico central de Kalman para redes de sensores, que puede ser descompuesto en n-micro ltros de Kalman cuyas entradas se corresponden con ambos ltros de consenso (gura 2.3). En [Kamgarpour] se lleva a cabo un estudio de las propiedades de convergencia de mtodos basados en ltros de consenso. Se demuestra que, para procesos invariantes en el tiempo y medidas del modelo, se garantiza que las estimaciones locales de la matriz de la covarianza del error converge a la matriz de la covarianza del error centralizada, al tiempo que las estimaciones locales del estado convergen en media a la estimacin de un hipottico ltro central de Kalman. Sin embargo, debido al uso de ltros de consenso, las estimaciones locales del estado no convergen a la estimacin por mnimos cuadrados que hubiera sido obtenida aplicando un ltro centralizado de Kalman. El factor negativo de [Durrant] (o al menos de la documentacin consultada) es el hecho de que no se hace referencia alguna a la topologa necesaria de red para garantizar la convergencia de la estimacin, ni tampoco se hace mencin a la redundancia o prdida de paquetes de informacin.

2.4. Ventajas, inconvenientes y alternativas

19

Figura 2.3: Nodo y arquitectura de red para DKF: (a) Arquitectura de ltros de consenso para KF de un nodo, y (b) Patrones de comunicacin entre ltros de consenso low-pass/band-pass entre nodos vecinos. Respecto a la alternativa mostrada en este captulo, se puede resumir en dos las principales caractersticas que posee el trasfondo terico de los denominados ltros de canal: 1. Los datos de entrada provenientes de nodos remotos son asimilados por el sensor local antes de ser comunicada al resto de nodos adyacentes. En este punto, no importa el orden de los mensajes, dado que nicamente hay un nico mensaje de salida para cada nodo. De esta forma, aunque la red crezca de forma dinmica, la cantidad de informacin enviada a travs de los enlaces de comunicacin permanecera constante, lo que resulta en una interesante funcionalidad: Un sistema descentralizado de fusin de datos puede, a priori, escalar de forma indenida su tamao sin incrementar el ancho de banda entre nodos adyacentes. 2. Como se ha comentado anteriormente, un nodo compara lo que ha sido previamente comunicado con la informacin total local presente. As, si por algn motivo la comunicacin se suspendiera por un instante, el ltro

2.4. Ventajas, inconvenientes y alternativas

20

de canal acumulara la informacin de forma que cuando el canal fuera reestablecido, la informacin total acumulada en el canal es enviada en un nico mensaje. Esta lgica permite la desconexin de un nodo y su reinsercin en otra parte de la red, junto con la posterior actualizacin en un nico paso. O lo que es lo mismo, se puede decir que un DDFs es relativamente robusto a cambios y prdidas respecto del sistema de comunicacin. Se puede decir que juntos, el ltro de canal y las operativas del nodo denen un sistema completamente modular en cuanto a algortmica se reere, es escalable en nmero de nodos y robusto ante la prdida de paquetes en las comunicaciones o incluso de nodos, intercambiando mensajes que albergan medidas de informacin sin unidades asociadas, adimensionales. Esto implica que es posible implementar cada sensor, cada canal, de forma completamente asptica, genrica, dado que no existe relacin alguna con el proceso a medir o con el mecanismo en s de medicin y su posterior integracin en la red. Formalmente, gracias a que la informacin se dene en trminos de medidas de Fisher y Shannon [Durrant], es posible a priori realizar procesos de inferencia relativa a combinacin entre los sensores. Sera posible determinar, por ejemplo, qu conguraciones entre sensores proporcionaran la mayor medida de informacin. Sin embargo, no todo son ventajas. Como se anticip en secciones anteriores, algoritmos del tipo ltro de informacin en el ltro de Kalman presentan problemas en cuanto a sincronizacin de la informacin, gestin y conanza en las comunicaciones, cuando la topologa de la red es arbitraria. Esto es, las caractersticas expuestas en este apartado se verican solo en el caso de redes completamente conectadas, o bien en redes con topologa de rbol. Bsicamente, y como resumen de este punto respecto a las comunicaciones, dadas las restricciones impuestas por la propia denicin de una red de sensores descentralizada, no es posible en general construir un conjunto de ltros los cuales puedan proporcionar estimaciones consistentes en toda la red. Otra alternativa presente en la literatura consiste en, a partir de una red arbitraria, construir algoritmos de enrutado para generar/simular una topologa lgica en forma de rbol. Otro problema aadido, adems del de las comunicaciones [Schlosser], es el hecho de que para la implementacin distribuida del ltro de Kalman, en cada nodo es necesario mantener un modelo completo del sistema, para las fases de estimacin y prediccin (2.19). Si la red crece exponencialmente en nmero de nodos, esta operacin sera impracticable. Sin embargo, en [Berg] partiendo de un modelo central del estado, y con los modelos locales de observacin,

2.4. Ventajas, inconvenientes y alternativas

21

se observ que para las fases en las que el modelo era requerido, tan solo se hacia uso de un submodelo localmente observable del original, manteniendo consistencia en las estimaciones a travs de la red. Hasta este punto, se han descrito problemas relativos a la fsica del problema: comunicaciones y modelo. Pero existen problemas que subyacen a la hora de implementar los algoritmos distribuidos para estimacin, que an no han sido comentados. El primero de ellos es la informacin redundante, y la toma de decisiones a partir de informacin cclica (o empobrecimiento de la informacin). Una solucin a dicho problema se presenta en el siguiente captulo, y se conoce como DDF-CI (CI-Covariance Intersection). El siguiente punto conictivo en DDFs es lo que se conoce como insercin de informacin corrupta en la red. En particular, qu sucede en una red cuando se introduce informacin no vlida o esprea. La solucin a este problema se denomina database deconiction. Del mismo modo, en el captulo 3 se presenta una aproximacin a las soluciones presentes en la literatura.

Captulo 3 Mtodos basados en el estudio de la covarianza


3.1. Introduccin

Al nalizar el captulo 2, se introducan los principales problemas relacionados con los sistemas de fusin de datos. El primero de ellos est relacionado con la informacin redundante, y su efecto en el sistema. El segundo consiste en determinar cules son los efectos al introducir en el sistema informacin esprea o incorrupta. A lo largo del presente captulo se exponen con ms detalle estos dos problemas, junto a posibles soluciones. Cabe destacar que los problemas que se presentan a continuacin se dan principalmente en sistemas de fusin de datos en los que las redes son: completamente descentralizadas, donde los paquetes de informacin pueden llegar de forma redundante, no existe una topologa concreta en la red, y el nmero de nodos es aleatorio, y no determinado. La alternativa presentada en el captulo 2, el ltro de informacin de Kalman y el ltro de canal, tan solo es vlido para situaciones en las que la red dispone de una topologa en rbol, o conectada, y se mantiene un orden estricto en las comunicaciones, sin redundancia de informacin. Dado que la solucin propuesta es para redes ideales, en este captulo se presentan problemas que suelen ser comunes a la hora de realizar los procesos de implementacin en redes reales.

22

3.2. Interseccin de la covarianza

23

3.2.
3.2.1.

Interseccin de la covarianza
Introduccin

Especcamente, las diversas piezas o paquetes de informacin de mltiples fuentes no pueden ser combinadas directamente, o al menos es necesario conocer su nivel de correlacin, tal y como se ha visto en el captulo 2. As, el efecto de la informacin redundante en, por ejemplo, la gestin de una batalla, puede ser vista a continuacin, en lo que se suele denominarse Susurro en el pasillo (Whispering in the hall) [Hall]: 1. Supongamos un nodo de reconocimiento fotogrco que transmite informacin sobre caractersticas potencialmente importantes. Esta informacin se propaga a travs de la red, cambiando de forma y combinndose con informacin de otros nodos. 2. El nodo de estimacin de posicin de la tropa de infantera recibe eventualmente la informacin anterior de alguna forma y estima que alguna de las caractersticas pudiera representar un batalln de tanques en movimiento, en una determinada posicin . Existen muchas otras posibles interpretaciones de la caracterstica, pero la posibilidad de que sea un batalln de tanques en movimiento es considerada por ser de importancia tctica que garantiza la transmisin de una hiptesis de baja credibilidad. De nuevo, la informacin puede ser sintetizada, aumentada o transformada en funcin de informacin de otros nodos. 3. El nodo de reconocimiento fotogrco recibe la hiptesis de baja credibilidad de que un batalln de tanques puede haber sido movilizado hasta la posicin .Un chequeo de dicha zona detecta una caracterstica que es consistente con la hiptesis. Dado que el nodo no puede conocer de alguna forma si la hiptesis estuvo basada en la misma evidencia fotogrca, este asume que la caracterstica que ha detectado es una conrmacin independiente de la hiptesis de partida. As, el nodo transmite de nuevo la informacin, con un nivel alto de credibilidad, de que en la posicin existen caractersticas para pensar de que realmente existe un batalln de tanques movilizndose. 4. El nodo de posicin de la tropa de infantera recibe informacin de la red, con un alto nivel de credibilidad, de que el nodo de fotoreconocimiento ha detectado un batalln de tanques en la posicin determinada. El nodo de posicin de la tropa se reere a esta informacin con una conrmacin de su hiptesis anterior, y solicita la puesta en marcha de acciones hostiles.

3.2. Interseccin de la covarianza

24

El principal problema es que ambos nodos estn compartiendo piezas de informacin redundante, sin embargo, la consideran como elementos independientes de informacin incrementando la credibilidad de la hiptesis de la existencia de un batalln de tanques. El resultado nal puede ser igualmente el uso de fuerza y recursos en una realidad que quizs no sea la que tiene mxima credibilidad. Otro ejemplo similar puede ser la estimacin de la posicin o velocidad en un vehculo mvil. El siguiente ejemplo es similar al desarrollado en la prctica del curso actual: 1. El sistema de navegacin y control de un vehculo mantiene un ltro de Kalman para estimar la posicin, y en algunos casos, un ltro de Kalman similar para la estimacin de la direccin del vehculo. 2. Cada ltro utiliza informacin de sensores a bordo del vehculo. 3. El estado completo del vehculo queda determinado (para objetivos de prediccin) combinando las estimaciones de posicin y orientacin. 4. La covarianza de la prediccin asociada a la posicin puede ser obtenida esencialmente como una suma de las covarianzas de la posicin y orientacin. Posteriormente las estimaciones son transformadas a algn marco de referencia comn. El problema en este ltimo ejemplo es que los errores en la posicin y en la orientacin no son independientes, lo que signica que la covarianza de la prediccin de la posicin subestimar el error actual de posicin. Debido a ello probablemente se llevarn a cabo maniobras peligrosas. Para evitar consecuencias desastrosas debido a informacin redundante en estimadores tipo ltro de Kalman, cierta informacin sobre la covarianza debe ser propagada y actualizada en el tiempo en toda la red. Sin embargo, mantener covarianzas cruzadas en redes arbitrarias descentralizadas no es posible, tan solo en algunos casos especiales como redes en topologa de rbol o totalmente conectadas. Sin embargo, en este tipo de redes se pierde la caracterstica de robustez, dado que si algn nodo cae, se puede decir que la red entera tambin. As, lo que aporta robustez y conabilidad al sistema, proporciona problemas en cuanto a redundancia en la informacin, y viceversa. Para soslayar el problema, una primera aproximacin pudiera ser considerar independencia entre los nodos. En este tipo de casos, la solucin consistira en incrementar articialmente la covarianza de la estimacin conjunta. Esta

3.2. Interseccin de la covarianza

25

heurstica, o ajuste del ltro, puede ayudar a prevenir estimaciones no consistentes, pero el lado negativo es que requiere de un gran anlisis emprico previo para estimar cunto se debe aumentar esta covarianza. Incluso con este anlisis, en muchos casos la integridad de la estimacin de ltros de Kalman se pone en evidencia, dando lugar a resultados no conables. Si escalamos el problema a redes mayores, el problema de encontrar un valor adecuado para la independencia de las estimaciones hace que el clculo de la propia covarianza sea un problema ms complejo que el original, incluso a veces sin solucin. En resumen, la nica va que garantizara robustez, exibilidad y consistencia de las estimaciones en una red descentralizada de topologa arbitraria, en general, consiste en explotar un mecanismo de fusin de datos que no requiera de asumpciones de independencia. Dicho mecanismo, denominado Covariance Intersection (CI), satisface el conjunto de premisas.

3.2.2.

Planteamiento del problema

Supongamos dos piezas de informacin, etiquetadas como A y B, que van a ser fusionadas para obtener una estimacin conjunta, C. Tanto A como B bien pueden ser medidas directas obtenidas de algn tipo de sensor, o bien algn tipo de informacin obtenida a travs de algn estimador lineal. Se puede decir que ambos trminos estn afectados por ruidos y errores de modelado, adems, sus valores son conocidos con cierta imprecisin y A y B son variables aleatorias a y b, respectivamente. Si desconocemos cualquier propiedad estadstica de ambas variables, la nica informacin disponible son las estimaciones de las medias y las covarianzas de a y b y la correlacin cruzada entre ellas. Estas son {a, P aa }, {b, P bb } y 0, respectivamente.
T T P aa = E[ aT ] P ab = E[ b ] P bb = E[bb ] a a

donde a a a, y b b b. En general, la matriz de correlacin cruzada entre las variables aleatorias, P ab , es desconocida, y distinta de 0. La nica restriccin que se impone es la consistencia en la estimacin. En otras palabras, se debe cumplir que P aa P aa 0 P bb P bb 0 El problema consiste pues en la fusin las estimaciones consistentes de A y B para generar una nueva estimacin, C, {c, P cc }, la cual se garantiza que ser consistente:

3.2. Interseccin de la covarianza

26

P cc P cc 0 donde c c c y P cc = E[cT ]. c De forma genrica, el algoritmo de interseccin de la covarianza (CI) parte de una combinacin convexa de la media y covarianza de las estimaciones que son representadas en el espacio de la informacin; de esta denicin surge una interpretacin geomtrica de las ecuaciones del ltro de Kalman. Supngase la forma general de las ecuaciones del ltro de Kalman como c = W aa + W bb (3.1)

P cc = W a P aa W T + W a P ab W T + W b P ba + W T + W b P bb W T a b a b

(3.2)

donde los pesos W a y W b son elegidos para minimizar la traza de la matriz P cc . Esta forma conducira al ltro convencional de Kalman si las estimaciones fueran independientes (P ab = 0) y generaliza las ecuaciones del ltro con ruido coloreado cuando se conocen las correlaciones. Si se interpretaran de forma grca estas ecuaciones, se observara que al pintar las elipses relacionadas con las covarianzas3.1 , esto es, P aa ,P bb y P cc para todos los valores de P ab , el valor P cc siempre estara en la interseccin entre P aa y P bb (gura 3.1). Una interpretacin inicial sugiere que si P cc reside en la interseccin entre P aa y P bb para cualquier valor de P ab , entonces cualquier estrategia de actualizacin que encuentre P cc que encierre la regin de interseccin debe ser consistente incluso si no se tuviera conocimiento sobre P ab . Cuanto ms ajustada es la regin de covarianza actualizada que encierra la regin de interseccin, de forma ms efectiva es utilizada la informacin para la etapa de actualizacin. La interseccin se caracteriza por la combinacin convexa de las covarianzas. El algoritmo de la interseccin de la covarianza se muestra a continuacin: P 1 = P 1 + (1 )P 1 cc aa bb P 1 c = P 1 a + (1 )P 1 b cc aa bb donde [0, 1].
Para una matriz de covarianza P se corresponde con el lugar geomtrico de los puntos {p : pT P 1 p = c}, donde c es una constante
3.1

(3.3) (3.4)

3.2. Interseccin de la covarianza

27

Figura 3.1: Silueta de la elipse de la covarianza actualizada. Las varianzas Paa y Pbb se corresponden con las elipses slidas exteriores. Las elipses discontinuas representan los valores de Pcc que surgen para diferentes valores de Pab . La actualizacin con estimaciones verdaderamente independientes se corresponden con la elipse slida interior.

La manipulacin libre de este ltimo parmetro inuye sobre las ponderaciones W asociadas a a y b. As, diferentes valores para [Hall] pueden usarse para optimizar la actualizacin respecto a algn criterio cuantitativo, como por ejemplo minimizar la traza o el determinante de la matriz P cc . Las funciones de coste, las cuales son convexas respecto al parmetro , disponen de un nico ptimo en el rango de operacin; virtualmente, cualquier tipo de optimizacin (desde Newton-Raphson a otro tipo de tcnicas) pueden ser utilizadas para minimizar cualquier tipo de norma. En el algoritmo 1 se incluye un cdigo de ejemplo para la optimizacin de en el proceso de fusin de dos estimaciones. Respecto a la convergencia del mismo, algunas consideraciones deben tomarse en cuenta para que la propia actualizacin de la estimacin no supere a la estimacin anterior en s. Supongamos por ejemplo que se toma un valor jo de = 0,5. En este caso, la estimacin actualizada sera simplemente la misma que la de Kalman, pero con una covarianza multiplicada por un factor de 2. As, una actualizacin cuya observacin tuviera un valor alto para la covarianza, sobreestimara a la propia estimacin anterior. En resumen, el uso de un valor jo para el tamao de la covarianza en el algoritmo de CI

3.2. Interseccin de la covarianza

28

Algoritmo 3.1 Funcin que implementa el algoritmo CI para: a) fusin de dos estimaciones {a, A},{b, B} para proporcionar {c, C}, y b) Calcular el valor de el cual minimiza el det(C). La matriz de observacin es H. function [c,C,omega]=CI(a,A,b,B,H) % % Estimaciones % (a,A) y (b,B) para proporcionar estimacion (c,C) y el valor % de omega que minimiza el det(C). La matriz de observacion es H Ai=inv(A); Bi=inv(B); % Calculo de omega mediante la funcion de minimizacion con % restricciones: fminbnd(). f=inline(1/det(Ai*omega+H*Bi*H*(1-omega)), ... omega, Ai, Bi, H); omega=fminbnd(f,0,1,optimset(Display,off),Ai,Bi,H); % La version sin restricciones de la optimizacion: % omega = fminsearch(f,0.5,optimset(Display,off),Ai,Bi,H); % omega = min(max(omega,0),1); % Nuevo valor para la covarianza: C=inv(Ai*omega+H*Bi*H*(1-omega)); % Nueva media: nu=b-H*a; W=(1-omega)*C*H*Bi; c=a+W*nu;

3.2. Interseccin de la covarianza

29

implicara la divergencia del propio mtodo. Como resumen, el algoritmo de interseccin de la covarianza ofrece un algoritmo general de actualizacin que es capaz de generar una estimacin actualizada incluso cuando no son conocidas la correlacin de la prediccin y de la observacin.

Figura 3.2: Distintos resultados para el algoritmo de CI:(a) Estimaciones iniciales de las covarianzas y la covarianza actualizada calculada por el ltro de Kalman; (b) Posible covarianzas actualizadas calculadas a partir de una combinacin convexa de dos covarianzas iniciales parametrizadas por . (c) Covarianza actualizada como la combinacin convexa de las dos covarianzas iniciales que maximiza la informacin (minimizan el rea encerrada por las elipses) (d) Caso donde una covarianza inicial domina el resto.

3.2. Interseccin de la covarianza

30

3.2.3.

Usando el algoritmo CI para fusin descentralizada de datos

Supongamos el peor caso de red: de topologa completamente arbitraria, de N nodos, que puede cambiar dinmicamente. Cada nodo dispone nicamente de informacin sobre quines son sus vecinos, y el formato de comunicacin entre los mismos. Asumiendo que los ruidos relacionados con el proceso y con las mediciones son independientes, la nica fuente de correlaciones no modeladas es el propio sistema de fusin de datos. En este caso, el algoritmo CI puede ser aplicado para desarrollar un algoritmo descentralizado y distribuido de fusin de datos que haga uso de esta red. En cada nodo se dispone de varios elementos (gura 3.3): Estimaciones de otros nodos, correladas un cierto valor desconocido, Medidas tomadas localmente, que pueden ser fusionadas utilizando el ltro de Kalman, dado que son independientes. Proceso de estimacin del estado.

Figura 3.3: Forma cannica del nodo en un red descentralizada de fusin de datos que produce estimaciones locales del estado utilizando algoritmo CI para combinar informacin recibida de otros nodos y un ltro de Kalman para incorporar medidas sensoriales independientes.

3.2. Interseccin de la covarianza

31

Para describir los pasos que se llevaran a cabo en cada uno de los nodos, supongamos que la estimacin en el nodo i esimo se representara por xi (k | k), con su covarianza asociada P i (k | k). Supongamos que en el instante de tiempo k + 1, el nodo realiza una observacin de forma local, representada por z i (k | k). El algoritmo de fusin distribuido para la propagacin de la estimacin del estado desde el instante de tiempo k hasta el siguiente k + 1 para el nodo i esimo tiene los siguientes pasos: 1. Se realiza el proceso de prediccin en el nodo i esimo en el instante de tiempo k + 1 usando las ecuaciones de prediccin del algoritmo clsico de Kalman. 2. Se usa la ecuacin de actualizacin del ltro de Kalman para actualizar la prediccin de z i (k | k). Esta actualizacin es la estimacin distribuida i con media x (k+1 | k+1) y covarianza P (k+1 | k+1). Esta estimacin i no es nal, dado que no incluye medidas de observacin ni estimaciones propagadas de otros nodos. 3. El nodo i esimo propaga su estimacin a todos sus vecinos. 4. El nodo i esimo fusiona su prediccin xi (k + 1 | k) y P i (k + 1 | k) con las estimaciones distribuidas que ha recibido de sus vecinos para generar i la actualizacin parcial x+ (k + 1 | k + 1) y P + (k + 1 | k + 1). Es en este i punto donde se utiliza el algoritmo CI, dado que estas estimaciones son propagadas sin conocimiento alguno de las correlaciones. Finalmente, el nodo i esimo usa las ecuaciones de actualizacin del ltro de Kalman para fusionar z i (k + 1) con la actualizacin anterior parcial para generar una nueva estimacin xi (k + 1 | k + 1) con covarianza P i (k + 1 | k + 1). El nodo incorpora su ltima medida al proceso usando las ecuaciones del ltro de Kalman, gracias a que sta es independiente de la prediccin o de la informacin proporcionada por el resto de sus vecinos. Este algoritmo tiene una serie de ventajas; entre otras, los nodos propagan su estimacin local ms actualizada, sin consideraciones de robustez en las comunicaciones. Puede haber ciclos, enlaces bidireccionales, o incluso prdida de paquetes o redundancia de los mismos. Otra ventaja pudiera ser el hecho de que las tasas de actualizacin y refresco de los diferentes ltros no tiene por qu ser la misma. Por ltimo, se establece el hecho de que cada nodo puede tener un modelo distinto para la observacin: algunos pueden disponer de un modelo muy preciso para algunas variables relativamente importantes, mientras que otros pueden disponer de precisin para otro subconjunto de las mismas; al nal, la estimacin consistir en la unin de la informacin ms precisa de todos los nodos.

3.3. Unin de la covarianza

32

3.3.

Unin de la covarianza

Tal y como se ha visto hasta ahora, el algoritmo de CI proporcionaba una solucin para el problema de la fusin de datos para estimaciones de media y covarianzas, en entornos arbitrarios. En la prctica, adems del anterior, tambin se presentan otro tipo de problemas incluso antes de que el proceso de fusin pueda llevarse a cabo. Ms concretamente, antes de fusionar dos o ms medidas, es necesario comprobar si estas son mutuamente inconsistentes. Por ejemplo, supngase dos medidas de posicin que dieren en ms de un kilmetro, pero que sus respectivas covarianzas sugieren que su precisin es del orden del metro; en este caso se observa claramente que hay algn error. Un mecanismo existente en la literatura para detectar desviaciones estadsticamente signicativas entre estimaciones es el mtodo de las distancias de Mahalanobis. Esta distancia, entre dos estimaciones {a, A} y {b, B} se dene como: (a b)T (A + B)1 (a b) la cual es bsicamente el cuadrado de la distancia entre la medida normalizada por la suma de sus respectivas covarianzas. Intuitivamente, si estas son muy elevadas, entonces existir una gran diferencia entre los vectores de medidas a y b, con lo que la distancia de Mahalanobis ser pequea, y viceversa. Una medida elevada para esta distancia indicar que las estimaciones no son consistentes entre s, dejando a eleccin del usuario la eleccin de los rangos de aceptacin en funcin del problema dado. Cuando se sobrepasa algunos de los lmites de aceptacin, es necesario tomar alguna medida al respecto. Resolver las inconsistencias que han producido dicho exceso, es lo que se conoce como deconiction 3.2 . En este tipo de problemas, lo nico que se conoce es que al menos alguna de las estimaciones ({a, A} o {b, B}) es consistente con el estado real del objeto de inters. Dado que generalmente no es posible conocer cual de las dos estimaciones es esprea, la nica forma rigurosa de combinar ambas estimaciones es formando una estimacin a partir de la unin de ambas [Uhlman], {u, U }, la cual garantiza que es consistente respecto a las dos estimaciones originales. Dicha unin puede calcularse a partir de las dos estimaciones como U A + (u a)(u a)T U B + (u b)(u b)T
3.2

(3.5) (3.6)

Dado que la traduccin literal al castellano es Evasin de conictos, a lo largo del presente texto se seguir utilizando la denicin anglosajona.

3.3. Unin de la covarianza

33

donde algn tipo de medida asociada a U (por ejemplo, el determinante) se utiliza para ser minimizada. Esta unin de las estimaciones puede ser posteriormente fusionada con alguna otra estimacin utilizando el algoritmo CI. De forma intuitiva se puede ver a partir de las ecuaciones anteriores que si una estimacin {a, A} es consistente, entonces la traslacin del vector a hacia u requerir que su covarianza sea expandida con la suma de una matriz que al menos sea tan grande como el producto exterior de (u a) para que sea consistente (del mismo modo si se realiza con b). As, el algoritmo de CU (Covariance Union, en adelante) determina el vector medio que tenga la menor covarianza U que sea lo sucientemente grande para garantizar la consistencia sin tener en cuenta cual de las estimaciones de entrada es consistente. Como un simple ejemplo de la implementacin de CU, considrense dos estimaciones {a, A} y {b, B} relacionadas con la posicin de algn objetivo en tierra respecto a dos UAV que sobrevuelan la zona. Supongamos que la observacin que proporciona el primero de los UAV (en adelante nodo) establece que a = [0, 0]T , y que el segundo nodo la establece en b = [4, 4]T , y cada uno posee una matriz de covarianza del error equivalente a la identidad. Si se determina que ambas medidas son inconsistentes entre s, implicando esto que al menos una no es consistente con la posicin real del objeto, entonces es necesario aplicar el proceso de deconiction. La estimacin ptima resultante de aplicar el algoritmo CU puede ser 3.3 u= U= 2 2 5 4 4 5

Es sencillo ver cmo la estimacin proporcionada es consistente con las dos estimaciones de partida. Si por ejemplo {a, A} es una estimacin consistente con la posicin del objetivo, entonces la covarianza U para la estimacin u debe ser mayor o igual que A + (u a)(u a)T . Como conclusin, si alguna de las dos estimaciones representara una estimacin consistente del estado del objeto, el resultado obtenido por el algoritmo CU tambin sera consistente.
El clculo no es inmediato, es necesario aplicar un conjunto de rutinas basadas en la optimizacin del determinante [Wu].
3.3

3.3. Unin de la covarianza

34

3.3.1.

Ejemplo de tolerancia a fallos en una red descentralizada

Considrese el caso de una red arbitraria, que puede cambiar dinmicamente, similar a la expuesta en otros casos. Supngase que todos los nodos de la red presentan un proceso de convergencia al mismo estado de un objeto de inters, {a, A}.Si la estimacin en un nodo en particular introduce informacin esprea inconsistente, del tipo {a , A }, cuales seran las consecuencias a largo plazo de la propagacin de este tipo de informacin corrupta? Supongamos que esta estimacin daina se ha producido en el nodo i esimo de la red, y que se desva bastante del verdadero estado lgico del objeto (haciendo uso de la denicin de Mahalanobis). A partir de este punto, se pueden considerar dos casos: intercambio de informacin sncrona, o asncrona. Sncrono: Ambos nodos intercambian sus respectivas estimaciones, y determinan de forma independiente que son inconsistentes con la propia. Dado que ningn nodo puede determinar (a priori) cual de las dos es esprea, se aplica el algoritmo CU para producir una estimacin consistente. En este punto, la estimacin inconsistente {a , A } ha sido sustituida por una consistente de la forma {u, U }, y consecuentemente eliminada. Se pone de maniesto que no ha sido necesario determinar qu estimacin era inconsistente; se elimina, y se sustituye por una que s lo es. El aspecto negativo se reere al nodo cuya estimacin era consistente de partida, dado que ha sido sustituida por una que posee una covarianza mayor. Sin embargo, futuras comunicaciones y fusiones haciendo uso del algoritmo de CI provocar que el estado vuelva a tener la estimacin original {a, A}. Asncrono: Existen dos formas, en el caso de intercambio de informacin asncrona, en el que la estimacin esprea puede ser combinada con estimaciones de otros nodos: 1. La estimacin consistente {a, A} es transmitida hasta el nodo i desde alguno adyacente: en este caso, al detectarse la inconsistencia, salta el algoritmo CU, y sustituye la actual por el resultado del algoritmo, {u, U }. En este punto, las estimaciones en la red son consistentes, pero no similares. Sucesivamente, y como se ha visto en el caso sncrono, mediante fusiones con el algoritmo CI nalmente se volver a la estimacin de partida, {a, A}.

3.3. Unin de la covarianza

35

2. La estimacin inconsistente {a , A } es transmitida desde el nodo i hasta alguno adyacente. En este caso, el nodo que recibe la estimacin esprea aplica el algoritmo CU, y obtiene una estimacin consistente. Sin embargo, el nodo i sigue conteniendo la estimacin esprea, mientras que su vecino contiene la misma, pero degradada hasta hacerla consistente. En adelante, se pueden dar dos situaciones distintas: a) Si el nodo i recibe informacin de otro nodo (distinto del vecino anterior), entonces su estimacin inconsistente es sustituida por una que ya no lo es, y el fragmento {a , A } ya ha sido eliminado de la red. b) Si el nodo adyacente a i recibe de nuevo informacin, el proceso de deconiction no ser llevado a cabo, dado que la estimacin no es inconsistente con la propia (como resultado del algoritmo CU). En este caso, el algoritmo de CI ser utilizado para fusionar las estimaciones, y el nodo adyacente almacenar ahora una estimacin esprea, de la forma {a , A }, por ejemplo. Obsrvese que esto tan solo puede ocurrir en el caso de que el nodo i transmita dos veces su estimacin (esprea) antes de que el nodo destinatario reciba informacin de otros nodos de la red. En este punto, ya no hay lmite de propagacin de la informacin esprea en la red. La situacin anterior puede observarse de forma grca en la gura 3.4. La combinacin de los algoritmos CU y CI proporcionan una solucin consistente y robusta a fallos para la gestin de problemas de informacin en una red descentralizada, la cual puede soportar desde tareas de control hasta de gestin. La casustica anterior pone de maniesto el hecho de que es posible identicar y arreglar los efectos de informacin esprea o incorrupta en una red. Este suele ser el caso tpico cuando algn tipo de sensor falla o bien debido a algn fallo humano. Pero tambin es posible que algn tipo de adversario, con ciertos conocimientos de la red, introduzca informacin incorrupta deliberadamente para producir estimaciones inconsistentes, sin que los algoritmos de deconiction adviertan de dichas inconsistencias. Este es el motivo por el cual se introduce el uso de algoritmos genticos en el captulo 4, para la deteccin temprana de informacin esprea y su posterior tratamiento.

3.3. Unin de la covarianza

36

Figura 3.4: (a) Dos nodos contienen estimaciones mutuamente inconsistentes; (b) El algoritmo de CU resuelve la inconsistencia entre estimaciones; (c) El algoritmo de CI obtiene mejores estimaciones de otros nodos.

Captulo 4 Algoritmo CU reforzado con Sistemas Clasicadores


4.1. Introduccin

El objetivo de la propuesta presentada en este captulo es muy simple: aadir cierta capacidad de inteligencia al nodo de la red descentralizada para que sea capaz de poseer mtodos ms robustos para la deteccin de informacin esprea o incorrupta. Tal y como se indic al nal del captulo anterior, el principal problema que presentaba el algoritmo de la unin de la covarianza para la deteccin y correccin de insercin en la red de informacin corrupta era el hecho de que se poda dar la situacin en la que, con una comunicacin arbitraria, toda la informacin de la red descentralizada convergiera a un estado de inconsistencia con el modelo observado. El uso cada da ms extensivo de los algoritmos genticos fue el germen para introducir la solucin propuesta en este captulo. Aplicaciones tales como el control de vuelo de un equipo tipo quadrotor [Passow], control de navegacin autnoma para robots mviles mediante GA4.1 [Manikas] o incluso en mtodos para la optimizacin de un ltro extendido de partculas de Kalman para la estimacin de estados de sistemas no lineales [Yang], sugirieron la posibilidad de una posible mejora cualitativa de la estimacin del estado presente en cada uno de los nodos. El objetivo pues del algoritmo gentico consistita en ir modelando la informacin que se tiene en cada momento de la evolucin del modelo, para poder detectar posibles anomalias en cuanto a la informacin tanto propagada a partir de otros nodos, como de la informacin capturada en los sensores propios del nodo.
4.1

GA: Genetic Algorithms.

37

4.2. Teora del Aprendizaje en Sistemas Clasicadores

38

Por ltimo, la insercin del algoritmo gentico no es suciente para poder resolver el problema; falta el elemento de decisin que tome la accin oportuna asociada a la estimacin en el instante de tiempo k. En la literatura existen muchos mtodos relacionados con sistemas de decisin: desde sistemas expertos, creados por una subdivisin de Siemens para la gestin y auto-comprobacin de sistemas de automatizacin en la dcada de los 70, hasta sistemas vericadores de teoremas de alto nivel (PVS - Proof Verication System). En un rango intermedio, existen muchos mtodos dependiendo del nivel de complejidad que se desee adoptar. En este caso, se plantea el uso de sistemas clasicadores, cuya principal caracterstica pudiera ser la velocidad de respuesta y la adecuacin dinmica al entorno sin necesidad de comprobacin humana alguna. En este captulo se presentan en primer lugar, los fundamentos bsicos de los algoritmos genticos y los sistemas clasicadores. Posteriormente se propone una posible solucin en la que se integraran el propio sistema clasicador junto con el algoritmo gentico, donde el principal objetivo sera que el algoritmo gentico se fuera adaptando a la evolucin del subsistema local observado desde el nodo, de forma que cuando algn tipo de informacin no correlada esprea entrara en el sistema, no pasara por la lgica del algoritmo de CU y posteriormente al de CI, sino que de forma adaptativa el sistema clasicador fuera rechazando dicha estimacin, hasta el punto de que si sta fuera continuamente introducida en el sistema, bien pudiera ser por un cambio real en el modelo observado, con lo que el sistema empezara a otorgarle mayor credibilidad hasta el punto de ser considerada para el proceso de estimacin.

4.2.
4.2.1.

Teora del Aprendizaje en Sistemas Clasicadores


Teora del Aprendizaje

Sin prdida de generalidad, se puede decir que el aprendizaje es un proceso cognitivo mediante el cual un agente adquiere conocimiento, o aumenta la calidad y/o cantidad que posea anteriormente, y mejora sus habilidades para llevar a cabo una tarea. En algunos casos dicho conocimiento pueden poseerlo otros agentes que podran actuar como maestros, o incluso como orculos4.2 . Por aprendizaje bsico se entiende el que se da en el reino animal: cuando los organismos se ajustan o adaptan al conjunto de estmulos que provienen del entorno, es decir, reciben informacin y la almacenan con el n de reutilizarla
Se establece en el mundo de la IA que un orculo es un ente que posee el conocimiento universal, suponiendo siempre la hiptesis de mundo cerrado.
4.2

4.2. Teora del Aprendizaje en Sistemas Clasicadores

39

en situaciones o patrones de estmulos semejantes, se puede decir que aprenden. Si se trata el aprendizaje desde un nivel de abstraccin superior, adquirir un concepto o una conducta motora o intelectual est considerado como un caso estndar de los procesos de aprendizaje: ni dichos conceptos ni las conductas aprendidas han de ser justicadas por el agente para contar como aprendidas. Es decir, el agente no tiene que dar una explicacin del proceso. Llegando aun ms lejos, algunos autores arman que tampoco debe preocuparse por la veracidad o utilidad de lo aprendido, simplemente de aprenderlo. En general, este proceso puede tener dimensiones gigantescas, pero en contraposicin, existen variantes muy simples que sern las tratadas en la siguiente propuesta. Entre estas variantes se pueden mencionar aquellas que ven al aprendizaje como un tipo especial de mecanismo de resolucin de problemas en el que las tareas de bsqueda en un espacio y de representacin del conocimiento son muy relevantes. Si se situa el contexto ms concretamente en el caso de los Sistemas Clasicadores, se pueden identican los siguientes componentes (descritos en secciones posteriores): Mdulo de reglas clasicadoras: conjunto de reglas para el modelo local observado. Mdulo de seleccin: dispara la accin relativa a la estimacin actual. Mdulo de algoritmo gentico: para un instante de tiempo k, representa todo el conocimiento hasta el instante de tiempo k 1. Mdulo de recompensa: proporciona recompensa en funcin de la satisfactibilidad de la accin tomada respecto a la estimacin. El agente o nodo debe disponer de al menos un algoritmo de aprendizaje; dicho algoritmo o estrategia es un algoritmo gentico o evolutivo. A medida que se van recibiendo estimaciones de otros nodos o medidas de los sensores, el sistema aumenta su conocimiento, y sus capacidades se vern ampliadas. La representacin del conocimiento puede hacerse de varias formas, pero en este caso en concreto ser con clasicadores. De la calidad del conocimiento que se tenga en la base de reglas, depende la calidad de lo aprendido. Los mtodos de aprendizaje se pueden intentar clasicar segn la cantidad de conocimiento que poseen. Entre los llamados weak-methods estn los algoritmos genticos o las redes neuronales. Estos mtodos son muy mecnicos. En el otro lado estn los rich-knowledge methods, basados en heursticas de bsqueda y grandes cantidades de conocimiento de respaldo.

4.2. Teora del Aprendizaje en Sistemas Clasicadores

40

4.2.2.

Algoritmos Genticos

Los principios bsicos fueron establecidos por J.H. Holland [Andreas], el cual pretenda establecer un nuevo paradigma de computacin basado en los principios de la teora de la evolucin de Darwin. Los algoritmos genticos son algoritmos de bsqueda adaptativos basados en principios derivados de la evolucin en un conjunto de individuos. As, un algoritmo gentico se caracteriza por: Una poblacin de estructuras (individuos) que representan soluciones candidatas del problema a resolver. Mecanismo de seleccin competitiva basada en la bondad ( relativa a la poblacin) de cada individuo. Operadores genticos idealizados que modican las estructuras seleccionadas para obtener nuevos individuos. Esquema general de un algoritmo gentico: algoritmo gentico t := 0 inicializa(t) evala (t) mientras !finalizacin hacer selecciona l(t) de l(t) modifica l(t) para obtener l(t+1) evala l(t+1) t := t +1 fmientras fin Todo ello permite al algoritmo gentico explotar todo el conocimiento acumulado durante la bsqueda de tal manera que se consiga un equilibro entre la necesidad de explorar nuevas partes del espacio de bsqueda y la necesidad de centrarse en zonas de alta adaptacin del mismo. Aplicado a este contexto, lo ideal sera excitar inicialmente al modelo con un conjunto amplio de estimaciones iniciales. Esto provocar que se cubra un amplio abanico de posibilidades, haciendo el mtodo ms robusto.

4.2. Teora del Aprendizaje en Sistemas Clasicadores

41

4.2.2.1.

Algoritmo gentico cannico

El algoritmo gentico acta sobre una poblacin de longitud ja sobre un alfabeto que representan soluciones candidatas del problema a resolver cromosomas-. De cada uno de estos individuos se dispone de una medida de su nivel de adaptacin denotado por , donde es la funcin de adaptacin o de adecuacin. Pasos en cada etapa Seleccin: La idea en esta seccin es que sean los mejores individuos de la poblacin los que se reproduzcan, los que tengan mejor funcin de adaptacin. En este caso, en la poblacin (o conocimiento del modelo) se quedarn el conjunto de estimaciones consistentes y ms probables con el modelo actual. Modicacin: El objetivo es generar nuevos puntos en el espacio de bsqueda. Como estos han sido obtenidos a partir de los individuos de la poblacin actual, es muy probable que pertenezcan a zonas con altos niveles de adaptacin. Operadores Combinacin: Combina la informacin procedente de dos individuos para generar otros dos. Explota el espacio posible de estimaciones. Mutacin: Dado un individuo, modica aleatoriamente una de las posiciones de su cadena. As se garantiza que es posible cubrir todo el espacio de bsqueda. Ambos operadores se aplican probabilsticamente sobre el conjunto de individuos seleccionados. Existen ms propuestas de operadores genticos: combinacin bipuntual, combinacin uniforme,etc. Poltica de sustitucin Existen dos grandes tendencias para decidir si en un paso determinado se modica toda la poblacin o tan solo a una parte. Modo poblacional: Se seleccionan individuos a los que se les aplicar con cierta probabilidad un operador u otro. En el caso de cruzamiento, los individuos generados sustituyen a sus progenitores. Modelo de estado jo: De entre toda la poblacin, se eligen a dos para combinar. Posteriormente se elige a otro para ser eliminado, normalmente el peor adaptado, y se sustituye por el mejor de los elementos generados.

4.2. Teora del Aprendizaje en Sistemas Clasicadores

42

Denicin de Esquema y Longitud de denicin Esquema: Toma la forma de una cadena de igual longitud que los elementos de la poblacin, pero aumenta su alfabeto con el smbolo (no importa). Este smbolo indica que el valor que haya en la posicin que ocupa en la cadena no es relevante para estudiar el valor de la funcin de adaptacin. As, las posiciones de un esquema que no contienen al smbolo se denominan denidas. Orden de un esquema O(H): Nmero de posiciones denidas que posee un esquema. Longitud de denicin (H): Distancia entre las posiciones denidas ms externas. 4.2.2.2. Crticas del teorema enunciado por Holland

Desigualdad: El uso a largo plazo (entre varias generaciones) es inviable. No aparecen nuevas instancias de un esquema dado. Considerar las interacciones entre los diversos esquemas (el teorema los ignora). Hiptesis de uniformidad: Diversas muestras de individuos de un esquema pueden dar estimaciones de la bondad de dicho esquema muy diferentes. Al concentrarse la bsqueda en una zona del espacio del problema (o en ciertos hiperplanos), las interpretaciones sobre las restantes posibles soluciones dejan de ser signicativas. Convergencia prematura: Es causa del anterior punto, y se basa en que las estimaciones de la bondad de los hiperplanos solamente sern relevantes en las primeras generaciones. Si en las poblaciones iniciales antes de haber explorado muchas zonas del espacio de bsqueda, existen hiperplanos muy buenos, la bsqueda se centrar rpidamente en estos, de manera que es posible que nunca se encuentre el ptimo.

4.2.3.

Sistemas Clasicadores

Los Sistemas Clasicadores, tambin llamados CS o CFS (Classier Systems), fueron presentados por Holland en 1975. Estos sistemas son similares a un sistema experto, pero el conocimiento se van adquiriendo dinmicamente, lo que es condicin indispensable para el contexto actual. Se emplean cuando se desea controlar o emular un entorno caracterizado por:

4.2. Teora del Aprendizaje en Sistemas Clasicadores

43

Cambios constantes, eventos importantes mezclados con ruido: el problema de rudo en los sensores queda implcito en el modelo. Necesidad de actuar sobre l en tiempo real: en funcin del tipo de red, puede ser necesario. Objetivos implcitos sin denir o mal denidos. No necesita un experto humano. Sirve para una multitud de entornos distintos. A partir del modelo original propuesto por Holland, han surgido muchas modicaciones. Algunas de ellas han asumido conceptos de Aprendizaje evolutivamente reforzado (ERL) y de Q-learning (aunque este ltimo no es realmente evolutivo), y por ello tambin lo llaman Q-CS, QLCS, etc. Recientemente Holland lo nombra sistema de agentes adaptativos. La idea inicial era construir ANIMATs (Animal+roboT) que pudieran evolucionar en un entorno. Pero no solo sirve para robots sino en cualquier tarea software que requiera autoaprendizaje. El LCS (Learning Classier System) se basa en un conjunto de Reglas de Aprendizaje como la siguiente, tambin llamadas clasicadores: IF <condicion> THEN <mensaje> A ello se le llama Sistema de Produccin, que es computacionalmente completo (dentro del entorno que queremos simular/controlar). Las condiciones utilizan el cdigo binario {0,1,*}, siendo * no importa; y los mensajes utilizan el cdigo binario {0,1}. En el proceso se identican los siguientes componentes: La base de reglas, que contiene una serie de clasicadores (reglas) con el conocimiento necesario para aplicar acciones sobre la estimacin dada. El estmulo, o recepcin de estimacin (bien local o de otros nodos), aquello que se captura en los detectores y acta sobre el dominio a partir del contenido de la base de reglas y del aprendizaje. Los mensajes, que son pares (estmulo-accin), y que asocian la accin correspondiente a un estmulo segn el conocimiento que tenemos en la base de reglas. El mecanismo de evaluacin, que permite conocer el nivel de actuacin del nodo sensorial.

4.2. Teora del Aprendizaje en Sistemas Clasicadores

44

Figura 4.1: Sistema Clasicador cannico. Asignacin de credibilidad, que va incrementando la credibilidad, salud, aptitud, etc. de una regla en funcin de su salida frente al estmulo que la ha lanzado. Aplicado al contexto actual, bien pudiera ser la inversa de la covarianza de la medida (en el caso de valores numricos) o bien la inversa del determinante de la matriz de covarianza del error, ponderando ms positiviamente en cuanto menor sea el error cuadrtico medio. El contexto (o entorno), de donde se obtienen las secuencias de estmulos de trabajo. El algoritmo gentico, que permite la adaptacin (evolucin) de la base de reglas frente a las estimaciones que le llegan de sus vecinos. Cada clasicador o regla tiene asociada una aptitud en funcin de su adecuacin frente a las estimaciones que le llegan del exterior. Las entradas procedentes del entorno se codican en una o ms cadenas binarias, que se introducen en un conjunto de estmulos. Los clasicadores chequean el conjunto de estmulos. Si hay alguno que encaje en su respectiva condicin IF , entonces se activa el respectivo clasicador. Los clasicadores activos compiten por ser seleccionados (ruleta, torneo...), en funcin de su aptitud. El que sea seleccionado, genera su respectiva accin de salida. Otra posible implementacin y perfectamente aceptada, es que de todos los clasicadores activos, los que sean seleccionados insertan su respectiva sa-

4.2. Teora del Aprendizaje en Sistemas Clasicadores

45

lida al conjunto de mensajes pudiendo ser decodicado o no para producir una salida hacia el entorno. De esta forma realimentaramos el sistema y el llevar a cabo una accin dependera de varios clasicadores (y no de uno slo), pudiendo fusionar en un paso posterior, haciendo uso del algoritmo de CI, las estimaciones proporcionadas. El entorno debe ofrecer una recompensa a las reglas que generaron salidas buenas (se suma a la aptitud). Esa recompensa en el supuesto anterior se distribuye entre todas las reglas que contribuyeron a producir esa salida. Hay varios algoritmos de distribucin, pero uno muy usado (y tambin muy criticado) es el bucket brigade (brigada de baldes). En el algoritmo de reparto de recompensa bucket brigade, la regla que envi al entorno la salida, recibe una recompensa. Una parte proporcional de esa recompensa la cedera a la regla que produjo el mensaje anterior que la activ. Y as hacia atrs, siguiendo la trayectoria inversa que gener el mensaje de salida. El principal problema del LCS es que cuando los mensajes de salida son producidos por cadenas muy largas de reglas clasicadoras (cuando el modelo es bastante complejo de modelar), el reparto de la recompensa hace que a cada una le toque muy poco, y el sistema aprende muy despacio o no aprende. En cuanto a la evolucin del sistema, el objetivo es generar nuevas reglas que amplen progresivamente la base de conocimiento inicial, por medio de un algoritmo gentico. Las soluciones propuestas para resolver este tipo de problemas pueden caracterizarse bsicamente segn dos criterios: Qu representa un individuo en la poblacin? En general, ha habido dos respuestas a esta pregunta, donde cada una representa una escuela diferente en el uso de algoritmos genticos en aprendizaje. Dichas escuelas son: Michigan En este enfoque los individuos de la poblacin representan reglas individuales, por lo que la solucin del problema consiste en toda la poblacin. Pittsburgh La poblacin consiste en conjuntos de reglas de cardinalidad variable; por tanto, cada individuo representa una posible solucin del problema a resolver. Los sistemas que siguen la escuela Michigan tienen un problema adicional: como la solucin del problema es toda la poblacin, cmo se evala la bondad de sus individuos de forma independiente?; pues la bondad de la solucin hace referencia a todos ellos. Los sistemas que

4.2. Teora del Aprendizaje en Sistemas Clasicadores

46

siguen el segundo enfoque siguen casi al pie de la letra el esquema general (o clsico) de algoritmo gentico, ya que la poblacin consiste en diferentes soluciones posibles que compiten entre s. Cmo se representan los objetos? Existen dos tipos de representaciones, que inuyen en la denicin de los operadores genticos a utilizar. Clsicas Se mantiene la representacin de cadenas binarias, y aunque en su mayora la longitud de dichas cadenas suelen ser jas en todo el desarrollo, algunas veces su longitud puede ser variable. Ad hoc En este caso la representacin es mucho ms cercana al problema a resolver, en tareas de clasicacin suele utilizarse la representacin atributo-valor. En el primer caso, no deben hacerse apenas cambios sobre un algoritmo gentico estndar. El principal inconveniente es encontrar una representacin binaria adecuada a nuestro problema. La gran ventaja es que la mayor parte de la teora de los algoritmos genticos se ha realizado para este tipo de representaciones. Para el tipo ad hoc, se deben disear tambin los operadores genticos concretos que puede ser una tarea complicada, pero al estar ms cercanos al problema a resolver, suelen ser ms ecientes.

4.3. Representacin y funcionamiento del sistema

47

4.3.

Representacin y funcionamiento del sistema

A continuacin se detalla de forma concisa la propuesta de representacin para los distintos componentes del presente trabajo.

4.3.1.

Presentacin de la propuesta

Un esquema grco que resume la propuesta de sistema clasicador basado en algoritmo gentico para la deteccin temprana de informacin esprea, siendo alternativa incluso al algoritmo de CU, se muestra en la gura 4.2.

Figura 4.2: Propuesta de integracin del sistema clasicador en nodo de red descentralizada, integrando subsistemas de CI y CU. La lgica de funcionamiento propuesta es la siguiente: 1. Los mdulos de recepcin de informacin reciben medidas en forma de observaciones locales, z(k), o bien expresada en trminos de informacin i(k) o de estimacin y (k | k) de otros nodos.

4.3. Representacin y funcionamiento del sistema

48

2. El siguiente paso consistira en trasladar la informacin a un sistema de traduccin, bien basado en reglas o funciones heursticas, o por tablas, para ser codicada en trminos de premisas condicionales que disparen o no las reglas del sistema clasicador. 3. En el caso de que al traducir las estimaciones u observaciones: a) Se verica alguna premisa asociada a alguna regla, se disparara la accin asociada. La inferencia puede ser tan compleja como sea necesaria. En principio se estima que puede depender directamente de la complejidad del modelo (2.19), y puede requerir varios niveles de profundidad en la activacin de reglas: reglas que sean premisas para que otras puedan converger a la salida, por ejemplo. 1) Se actualiza el conocimiento representado en la poblacin de cromosomas, mejorando la estimacin que es consistente con la premisa actual. b) No se verica ninguna regla: No se dispara ninguna accin: no fusin local, ni CI, ni CU. Se actualiza el conocimiento hasta el instante de tiempo k representado en el algoritmo gentico mediante los operadores vistos en la seccin 4.2.2.1, expandiendo el espacio de soluciones para aceptar la estimacin de entrada. En ambos casos, se actualizan las premisas que disparan las reglas clasicadoras, dado que hay que realimentar (positiva o negativamente) y representar en conocimiento la estimacin de entrada actual. 4. Si la salida ha producido algn tipo de estimacin por fusin mediante CI, se calcula algn parmetro numrico relativo a la misma, para, mediante algn tipo de lgica, como el Bucket brigade, repartir la recompensa entre las reglas que han producido la accin de salida. 5. La salida, estimacin o medida de informacin se propaga mediante los canales de comunicacin adecuados al resto de nodos. La evolucin del modelo quedar representada en la evolucin del propio algoritmo gentico, de forma que cuanto ms complejo sea el modelo, mayor nmero de posibles estados habr considerado el propio algoritmo. Para determinar la propia consistencia de la estimacin, o de la medida obtenida, se hace evolucionar al mismo tiempo el sistema clasicador, el cual se encargara, entre otras cosas, de detectar cuando un elemento de entrada es corrupto o inconsistente con la informacin/estimacin local. As, cuantos ms paquetes de datos pasen por el nodo, ms se reforzar su conocimiento, y capacidad de

4.3. Representacin y funcionamiento del sistema

49

actuacin. En la seccin 4.3.3 se propone un algoritmo para la actualizacin de los niveles de adaptacin de las reglas. En la literatura [Baos] se pueden encontrar otros algoritmos, tanto para esta actualizacin, como para la propia evolucin del algoritmo gentico.

4.3.2.

Clasicador

El clasicador tpico no es ms que una lista con tres elementos: Nivel de adaptacin o salud: Nmero natural mayor o igual que cero. Representa la inversa de la covarianza (o la inversa del determinante, en su caso). Cabeza de la regla: Es una lista de la forma (1 0 * ... * 1) donde cada elemento de la lista pertenece al dominio de denicin del problema, y el carcter * se corresponde a no importa. Accin asociada: En esta propuesta se ha considerado como un nmero entero natural, pero es independiente de la evolucin del sistema, con lo que otra representacin vlida podra haber sido un carcter o incluso una cadena de smbolos. Con nmeros naturales es ms intuitivo ver la salida del sistema, pudiendo asignar acciones en funcin del valor de dicha salida. Un ejemplo de representacin interna de un clasicador en el presente trabajo es el siguiente: (3 ( 4 1 * * 0 0)) donde: 3 : Nivel de adaptacin de la regla. 4 : Salida de la regla (accin). (1 * * 0 0): Cabeza de la regla. En esta propuesta se ha seguido el modelo Pittsburgh, en el cual la accin de cada clasicador representa una posible solucin del sistema.

4.3. Representacin y funcionamiento del sistema

50

4.3.3.

Algoritmo de actualizacin de los niveles de adaptacin

El algoritmo que se ha seguido para la actualizacin de los niveles de adaptacin de los clasicadores del sistema es el siguiente: 1. Todos los clasicadores parten con un valor del nivel de adaptacin igual a cero ( (0 | 0) = 0). y 2. Hasta que el nmero de iteraciones sea mayor que un ndice, o no hayamos excedido algn horizonte temporal: a) Elegimos un ejemplo aleatorio del histrico. b) Elegimos un clasicador cuya cabeza de regla coincida con el estmulo. c) Si la salida de la regla coincide con la accin del clasicador aumentamos el nivel de adaptacin en cierta cantidad. Si no es el caso, decrementamos dicho nivel de adaptacin en la misma cantidad. 3. Devolvemos el conjunto de clasicadores.

4.3.4.

Interpretacin de los resultados

Dado que la alternativa que se ha propuesto es completamente genrica, lo nico que faltara sera dar un signicado a lo que representara un estmulo para el sistema, y lo que se correspondera con una accin en el entorno. Un ejemplo de esto es el dado en [Baos], el cual es mostrado a continuacin. Conjunto de situaciones posibles: IF inconsistencia baja con est. valor0 y valorLocal valor00 THEN @ IF inconsistencia alta con est. valor1 y valorLocal valor11 THEN % IF inconsistencia leve con est. valor2 y valorLocal valor01 THEN $ IF inconsistencia grave * * THEN * Conjunto de estados posibles. Combinacin con sensores entrada en el entorno actual:

4.3. Representacin y funcionamiento del sistema

51

IF @ THEN aceptarla IF % THEN fusionarla_CU IF $ THEN fusionarla_CI IF * THEN rechazarla

Donde una posible codicacin del conocimiento podra ser la siguiente:

Nivel de inconsistencia de la estimacin con la local: 0000=baja 1111=grave Estado relativo al modelo observado: 00=valor0 01=valor1 10=valor2 11=valor3 Mi accin: 00=rechazarla 01=fusionarla_CI 10=fusionarla_CU 11=aceptarla Estimacin local a partir de las medidas observadas: 00=valor00 01=valor01 10=valor10 11=valor11 Smbolos internos: 0000=@ 0001= % 0010=$ 1111=! 1000=*

4.3. Representacin y funcionamiento del sistema

52

4.3.5.

Conclusin

La propuesta presentada en este captulo puede suponer, si fuera considerada como argumento central de posteriores investigaciones, una posible alternativa a la deteccin de informacin esprea o incorrupta, o incluso, si fuera sucientemente expresivo, podra llegar a considerarse como un elemento central de fusin y estimacin de las medidas, para la obtencin del estado local. Se ha demostrado a lo largo de muchas dcadas que la utilizacin de mtodos relacionados con la inteligencia articial han supuesto verdaderas soluciones a problemas que inicialmente se planteaban irresolubles, o que han arrojado mejores soluciones que los mtodos clsicos. Existe multitud de bibliografa relacionada con estimacin y fusin de datos (centralizada o descentralizada), ya sea para seguimiento de caractersticas, para localizacin y mapeado del entorno (SLAM), navegacin de vehculos mviles, etc. Al mismo tiempo, existen una vasta coleccin de libros y publicaciones en general sobre inteligencia articial, aplicados a problemas tpicos del mundo de la robtica. Sin embargo, existe poca bibliografa relativa a la fusin de estas dos tcnicas anteriores [Manikas], en la cual no se hace mencin alguna a posibles alternativas a los problemas tpicos existentes al implementar una red descentralizada para fusin de datos. As, el objetivo del presente trabajo ha sido el de exponer brevemente conceptos relacionados con el DDF, diferentes alternativas de implementacin, sus inconvenientes, y posibles soluciones basadas en otras disciplinas.

4.3. Representacin y funcionamiento del sistema

53

Bibliografa
[Andreas] Holland Classier Systems, Department of Applied Computer Science, Institute of Information Processing and Information Economics, Vienna Universty of Economics and Business Administration, 1995. Computacin evolutiva (CE) Sistemas Clasicadores. Angel Garca Baos. Escuela de Ingeniera de Sistemas y Computacin. Universidad del Valle, 2008. T. Berg. Model Distribution in Decentralized Multi-Sensor Data Fusion. PhD thesis, The University of Oxford, 1993. Cooperacin Descentralizada para Percepcin Activa con Mltiples Robots. Tsis Doctoral. Jess Capitn Fernndez, 2011. Introduction to Decentralised Data Fusion. Hugh DurrantWhyte. September 27, 2002. Horizontal Integration based upon Decentralized Data Fusion (DDF), NetCentric Architecture (NCA), and Analysis Collaboration Tools (ACT). C4ISR/C2 Architecture. Sheldon B. Gardner Naval Research Laboratory Washington. S. Grime and H. Durrant-Whyte. Data fusion in decentralized sensor networks. J. Control Engineering Practice, 2, 1994. Handbook of Multisensor Data Fusion, 2001, edited by David Hall and James Llinas.

[Baos]

[Berg] [Capitan] [Durrant] [Gardner]

[Grime] [Hall]

[Kamgarpour] Convergence Propertiesof a Decentralized Kalman Filter.Maryam Kamgarpour and Claire Tomlin. Proceedings of the 47th IEEE Conference on Decision and Control Cancun, Mexico, Dec. 9-11, 2008. [Makarenko] Decentralized Data Fusion and Control in Active Sensor Networks. Alexei Makarenko, Hugh Durrant-Whyte.

54

BIBLIOGRAFA

55

[Manikas]

Genetic Algorithms for Autonomous Robot Navigation. Survey. Theodore W. Manikas, Kaveh Ashenayi, y Roger L. Wainwright. Diciembre 2007. B.N.Passow, M.A.Gongora, S.Coupland, A.A.Hopgood, Realtime Evolution of an Embedded Controller for an Autonomous Helicopter, Proc. of the IEEE Congress on Evolutionary Computation, WCCI08, Hong Kong, 2008. B. S. Y. Rao, H. F. Durrant-Whyte, and J. A. Sheen. A fully decentralized multi-sensor system for tracking and surveillance. Int. Journal of Robotics Research, 12(1):2044, Feb 1993. Distributed Kalman Filtering and Sensor Fusion in Sensor Networks. Reza Olfati-Saber. J. L. Speyer. Computation and transmission requirements for a decentralized linear-quadratic-gaussian control problem. IEEE Trans. on Automatic Control, 24(2):266269, Feb 1979. Communication Issues in Decentralized Kalman Filters. Markus S. Schlosser and Kristian Kroschel. "Covariance Consistency Methods for Fault-Tolerant DistributedData Fusion", J. Uhlmann, Information Fusion 4 p. 201-215, 2003. S.-P. Wu, L Vanderberghe, S.Boyd, Maxdet: Software for determinant maximization problems, alpha version. Stanford University Technical Report, April 1996. A method of Genetic Algorithm optimized Extended Kalman Particle Filter for nonlinear system state estimation. Shuying Yang, Wenjuan Huang et al. 2009 Fifth International Conference on Natural Computation.

[Passow]

[Rao]

[Reza] [Speyer]

[Schlosser] [Uhlmann]

[Wu]

[Yang]

También podría gustarte