Está en la página 1de 19

928

Signal Processing: Image Communication 20 (2005) 927–946


www.elsevier.com/locate/image

intGuide: Una plataforma para servicios contextuales con


realidad aumentada, basada en los resultados de los
Proyectos de Investigación Europeos
Athanasios M. Demiris×, Vassilios Vlahakis, Alexandra
Makri, Manos Papaioannou, Nicolaos Ioannidis
INTRACOM S.A., Hellenic Telecommunications and Electronics Industry, Greece
Received 11 October 2004; accepted 15 May 2005

Abstracto

A medida que las personas se familiarizan cada vez más con la tecnología de la información, exigen una continua
disponibilidad de servicios relacionados con su trabajo u ocio. La era de la computación omnipresente anunciada
hace mucho tiempo se está convirtiendo en una realidad cotidiana a un ritmo cada vez mayor. Junto a la evolución de
la computación omnipresente y nómada, la necesidad de las personas de acceder a grandes cantidades de
información de manera exhaustiva y eficiente da lugar a las áreas de visualización de la información y de realidad
aumentada. Tales tecnologías permiten la presentación integral de la información visual dirigida igualmente a las
necesidades de las diferentes categorías de personas.
En los últimos 5 años hemos estado activos en un conjunto de proyectos de investigación europeos que abordan las
direcciones de investigación antes mencionadas, con el objetivo a largo plazo de desarrollar una plataforma de
software que permitirá a los servicios conscientes del contexto implementar tecnología avanzada de visualización en
una serie de los ámbitos de aplicación, como la difusión del patrimonio cultural, la televisión interactiva y la
industria minorista. La multitud de los ámbitos de aplicación abordados, así como la experiencia multidisciplinaria
necesaria para crear una plataforma genérica se abordaron con éxito en actividades de investigación
complementarias. En este artículo presentamos la idea de una plataforma para los servicios sensibles al contexto
mediante la explotación de la tecnología de visualización avanzada y posteriormente analizamos brevemente los
proyectos de investigación que entregaron piezas valiosas en el rompecabezas global. Se pone énfasis en las
cuestiones prácticas de la implementación y despliegue en diferentes escenarios de aplicación.

Abreviaturas: API, interfaz de programadores de aplicaciones; AR, realidad aumentada; CDWA, categorías para la
descripción de obras de arte; CIDOC, Comité Internacional de Documentación del Consejo Internacional de
Museos; DVB, difusión de vídeo digital; FFT, transformada rápida de Fourier; SIG, sistema de información
geográfica; GPS / D-GPS, sistema de posicionamiento global / sistema de posicionamiento global diferencial;
GPRS, servicio general de radio por paquetes; IEEE, Instituto de Ingenieros Eléctricos y Electrónicos; IST,
Tecnologías de la Sociedad de la Información; LAN, red de área local; MPEG, grupo de expertos en imágenes en
movimiento; PDA, asistente digital portátil; R / F, radiofrecuencia; SMIL, lenguaje de integración multimedia
sincronizada; UMTS, sistema universal de telecomunicaciones móviles; VRML, lenguaje de marcado de realidad
virtual; WLAN, red de área local inalámbrica; XML, lenguaje de marcado ampliado; XMT, MPEG-4 extensible
formato textual

Keywords: Context-aware services; Ubiquitous computing; Augmented-reality; Nomadic devices; Computer vision applications
1. Introducción 929
selección de estos dominios se basó principalmente
en los intereses de los equipos involucrados en el
Cada plataforma de software más grande y de proceso de desarrollo, y también exhibió la
alguna manera compleja requiere generalmente un importante característica comercial de la difusión a
sistema de aplicaciones concretas que cubren través de segmentos de mercado vivos.
partes del dominio apuntado antes de que pueda
materializarse. La razón de ello es el know-how Para implementar tal plataforma, son necesarias
necesario, que se refleja en detalles que harán que diferentes áreas de experiencia. A diferencia de otros
la plataforma sea utilizable en muchas áreas. intentos similares, en nuestro caso nos centramos en
Cuantas más aplicaciones se construyan antes de los aspectos relacionados con la presentación
construir una plataforma genérica, más genérica visualmente mejorada de la información, lo que
será la plataforma. Sin embargo, siempre hay un introduce la necesidad de incluir la tecnología de
equilibrio entre el grado de generalidad y el tiempo visión por computadora en el marco general. En este
de lanzamiento al mercado, que dictan un ritmo trabajo, presentaremos todas las características
más rápido en la introducción de una plataforma en abordadas por la plataforma, así como su
el mercado. arquitectura. Nos centraremos en los aspectos más
importantes (principalmente relacionados con las
En nuestro caso, estábamos tratando de desarrollar aplicaciones mejoradas de visualización) en cada
una plataforma genérica de entrega, lo que uno de los proyectos de investigación que
llamamos hace aproximadamente 5 años '' servicios proporcionaron conocimientos técnicos en diferentes
de alta calidad visualmente mejorados ''. Los partes de la plataforma general. Al final
servicios de gama alta estarían relacionados con la concluiremos con el futuro trabajo planeado para
entrega de información en función de la ubicación ampliar aún más la plataforma intGuide.
actual y del per fi l personal del usuario final. Esta
meta evolucionó en los últimos años hacia una 2. Estado de la técnica en los sistemas sensibles al
plataforma más concreta para servicios sensibles al contexto
contexto con tecnología avanzada de visualización.
El objetivo sigue siendo el mismo, es decir, la La informática contextual es un campo emergente.
entrega de información a los usuarios finales en un Sin embargo, ya existen algunos sistemas
formato visual fácil de comprender, dependiendo comerciales que aparecen en el mercado. Un
del contexto de los usuarios. ejemplo, que resulta ser el resultado de una actividad
de investigación europea, se presenta en [1]. El
Nuestra estrategia para recabar la experiencia objetivo principal y la principal diferencia con
necesaria en relación con los servicios sensibles al nuestro enfoque son la creación de un marco
contexto y reunir la experiencia de aplicar dichos genérico para los servicios sensibles al contexto en la
servicios en diferentes ámbitos de aplicación, plataforma del cliente con el enfoque en el manejo
verificando así la validez de nuestras orientaciones de varias entradas de sensores, así como la
de investigación y desarrollo, centradas en vinculación de estos sensores a eventos. En nuestro
colaboraciones con institutos y otras empresas caso, nos centramos en la infraestructura de back-
dentro de Europa con intereses de investigación office para apoyar y publicar los servicios sensibles
similares, en el marco de los proyectos europeos de al contexto, mientras que en el lado del cliente
investigación, principalmente en el programa IST asumimos un conjunto reducido de sensores (sistema
(Tecnologías de la Sociedad de la Información) de de posicionamiento global / sistema de
la Comisión Europea. Los proyectos fueron posicionamiento global diferencial (GPS / D-GPS ),
cuidadosamente definidos para complementarse y posiblemente un sistema de posicionamiento de red
ofrecer siempre un nuevo aspecto necesario para de área local inalámbrica (WLAN), así como
completar el rompecabezas. Con el fin de evitar sensores adicionales para una mayor precisión en la
una diversificación extrema, los ámbitos de detección de localización, como radiofrecuencia (R /
aplicación se limitaron a los tres siguientes: F) y etiquetas Bluetooth y / o sensores de
aplicaciones en el patrimonio cultural, el deporte y infrarrojos).
la televisión interactiva, así como la industria
minorista. Está claro que el único denominador Un enfoque que se parece más a la plataforma
común de todas estas áreas de aplicación es el intGuide en la dirección de una solución de back-
perfil genérico de los usuarios finales, es decir, en office sólida y completa es el presentado en [2].
todos estos dominios de aplicación, los usuarios Aparte del carácter más genérico en el manejo de
finales se originan a partir de una muestra sensores para la estimación de contexto (como en el
ampliamente difundida a través de la población. La caso anterior), el objetivo principal aquí es la
creación de componente-ware, ofreciendo una 930
enfoque en el lado del cliente, es decir, la guía móvil,
posibilidad de integración de menor nivel. intGuide está en la presentación multimedia y visual de la
es mucho más una plataforma para ser información. El artículo se centra en un ambiente de
personalizado usando principalmente las museo de interior y presenta muchos conceptos de
herramientas proporcionadas, y restringiendo el interacción interesantes que se asemejan a los
acceso sobre la interfaz de un programador de presentados en nuestro trabajo.
aplicaciones (API). La diferencia es una vez más el
carácter más práctico de intGuide, que hace En [9] se sigue un enfoque alternativo en el entorno
algunas suposiciones simplificadoras, reduciendo del museo, donde la información no es móvil, sino
así los grados de libertad, y permite principalmente presentada a los visitantes en función de su posición
la personalización. Sin embargo, a la comprensión y gestos (en la evaluación del sistema de visitantes
de los autores la arquitectura presentada en [2] sólo jóvenes).
puede cubrir parcialmente la funcionalidad de
intGuide y no aborda algunas de las cuestiones El enfoque en la usabilidad y varios medios de
prácticas cubiertas dentro de intGuide. interactuar con las guías electrónicas en los museos y
las instituciones de memoria se presentan en varios
En [3,4], una muy buena visión general de las casos en [10, 11]. Rocchi et al. [12] también se
aplicaciones de contexto se puede encontrar. enfocan en el concepto de publicación multi-
Especialmente en el caso de [4], el área de plataforma implementando múltiples tipos de
aplicación inicial para el servicio consciente del clientes.
contexto, el hogar inteligente, se presenta con todo
detalle. Un dominio importante de la aplicación Se pueden encontrar lecturas más genéricas
enredado por la investigación en sistemas sensibles relacionadas con los servicios sensibles al contexto
al contexto es el patrimonio cultural. Dado que en [13,14], donde también se encuentran muy buenas
algunos de los antecedentes presentados aquí definiciones del término contexto. Problemas de
también son originarios de este dominio, usabilidad adicionales en el reino de guías turísticos
comparamos nuestros esfuerzos con una selección se pueden encontrar en [15, 16].
indicativa de trabajos de investigación
comparables. En [5], se introduce el proyecto 3. La hoja de ruta para la plataforma intGuide
GUIDE. GUIDE está creando un sistema de apoyo
y guía electrónico metropolitano para turistas, que Una plataforma que permite la configuración y
publica contenido multimedia y ofrece servicios entrega de servicios sensibles al contexto con técnicas
interactivos a los visitantes de la ciudad de avanzadas de visualización requiere un conjunto de
Lancaster. El trabajo de [5] contiene valiosos módulos confiables que se pueden adaptar fácilmente
conocimientos sobre una evaluación experta del a las necesidades de varios proveedores de servicios
uso del sistema. El sistema GUIDE es un caso de aplicaciones y abordar un amplio espectro de
especializado de una guía metropolitana electrónica funcionalidad. En la Fig. 1, presentamos un intento de
centrada en los aspectos de usabilidad y orientación mostrar todos estos diferentes tipos de funcionalidad
por medio de la información contextual. Nuestro
que comprenden la plataforma intGuide. Están
enfoque difiere en que nos centramos también en la
separadas en infraestructura de back-office y
visualización avanzada de la información y
funcionalidad de cliente.
finalmente nos esforzamos por una plataforma más
genérica. Similar al sistema GUIDE es el proyecto
onTheMove, que también proporciona una guía de Como se ve en la siguiente figura, una plataforma para
la ciudad y cuenta con soporte GPS y WLAN, tal los servicios visualmente mejorados que tengan en
como se presenta en [6]. Un intento similar por el cuenta el contexto necesita tener un "punto de
Instituto de Tecnología de Georgia se puede entrada" para que el contenido entre en la plataforma.
encontrar en [7]. En este último, el enfoque se Por esta razón, existe la necesidad de servicios de
centra en la conciencia del contexto, con digitalización. Aunque hemos enredado este aspecto
similitudes con nuestro trabajo, principalmente la en algunos proyectos, decidimos evitar ofrecer una
posición y la orientación del usuario. solución completa para la digitalización, ya que hay
muchas soluciones disponibles en el mercado. En
No se evalúa la conmemoración de las acciones e colaboración con clientes potenciales, la solución más
intereses de los usuarios. adecuada puede ser seleccionada y fácilmente
incorporada en el marco general.
Un enfoque más cercano a algunas de las versiones
que presentamos aquí se encuentra en [8]. El Un sistema de gestión de activos es necesario para
administrar el contenido que se rellenará en los 931
convertirse fácilmente en otras representaciones,
dispositivos cliente después de la finalización del como el formato de texto MPEG-4 extensible (XMT)
proceso de creación. Nuestra solución se centra en -O de MPEG-4 que están relacionados. Otros
un sistema de gestión central que contiene y gestiona formatos que apoyan directa o indirectamente de
datos multimedia utilizando una estructura de alguna manera la noción de líneas de tiempo (como
descripción compatible con el grupo de expertos en XMT-A, lenguaje de marcado de realidad virtual
imágenes en movimiento (MPEG) -7. Encima de (VRML), etc.) también pueden ser abordados por
este núcleo hay un módulo especializado que mecanismos de conversión. Para esta conversión es
describe los datos en una manera orientada a la necesario tener en cuenta algunas simplificaciones y
aplicación. Por lo tanto, en el caso del patrimonio tener en cuenta que en la mayoría de los casos el
cultural, hay un módulo que apoya la descripción de poder expresivo completo de la representación
las representaciones multimedia de artefactos en objetivo puede no ser explotado de manera eficiente.
Dublin Core, el Comité Internacional de Incluso después de la introducción de elementos
Documentación del Consejo Internacional de personalizados que contienen información adicional
Museos (CIDOC) o las categorías para la para permitir una traducción más eficiente a otros
descripción de obras de arte (CDWA). El sistema formatos, todavía no es posible abordar todas las
central se desarrolló en el marco del proyecto de características ofrecidas por una representación
investigación de la experiencia de televisión diferente.
deportiva inmersiva personalizada (PISTE) (por
INTRACOM y la Universidad de Poznan de Sin embargo, nos hemos dado cuenta de que para la
Economía) [17] y extensiones especializadas para el mayoría de las aplicaciones es suficiente introducir
patrimonio cultural dentro del patrimonio cultural de una funcionalidad de tipo SMIL para las
realidad aumentada in situ guía (ARCHEOGUIDE) presentaciones. La extensión más importante para la
(por INTRACOM) [18]. ARCHEOGUIDE del autoría contextual es la descripción espacial. Por lo
proyecto europeo IST y PISTE, también un tanto, en un nivel de abstracción más alto, es
European IST Research Project. necesario introducir información que ayude a situar el
archivo multimedia en un área geográfica, y en casos
En todos los casos de aplicación investigados, hubo de aplicación de realidad aumentada (AR) también en
una clara necesidad de autorizar el contenido antes el punto de vista correcto. La interpretación de la
de su publicación en dispositivos cliente. descripción de SMIL depende del software del cliente.
Especialmente en los casos en los que el contenido Por ejemplo, una serie de imágenes que sirven como
debe presentarse de una manera de realidad mixta, imágenes de referencia para el cálculo del punto de
es decir, objetos artificiales superpuestos a imágenes vista correcto del usuario cuando se comparan con la
de entorno real, este procesamiento se hace vista actual necesitan ser etiquetadas separadamente
inevitable. Este procesamiento fue en la mayoría de en un archivo SMIL, ya que no hay ninguna
los casos llevado a cabo por personas diferentes, ya construcción que soporte tal noción.
sea simultáneamente, o en diferentes instantes. El
control de este autor fue significativamente
mejorado con la introducción de un módulo de Esto puede ser una violación del propósito inicial del
control de flujo de trabajo. Permitió el control de lenguaje SMIL, pero parece ser la única manera de
varias tareas necesarias para crear el resultado crear un entorno de creación que también se ocupará
deseado y siempre entregó una visión precisa del de las necesidades de un curador del museo de crear
desglose de la tarea y el estado del proceso. presentaciones multimedia sencillas para los visitantes
que utilizan asistentes digitales portátiles (PDA) para
La creación es un proceso que depende en gran visitar el sitio y el proveedor de servicios de
medida del dominio de la aplicación. No obstante, aplicación que ofrece vistas ampliadas de habitaciones
en el caso de los archivos multimedia, suele ser el vacías con muebles pre-seleccionados.
multiplexado de varios archivos en una presentación La conciencia contextual implica que el contenido
para un contexto dado, permitiendo anotaciones presentado tendrá en cuenta el perfil del usuario. Para
específicas que permiten la personalización del ello, hemos introducido la posibilidad de crear perfiles
contenido. Hemos aislado un núcleo común de todos de usuarios y luego tener una personalización
nuestros esfuerzos, que es un editor de lenguaje de dinámica del contenido basado en estos perfiles. En la
integración multimedia sincronizado (SMIL), que versión actual de la plataforma, sólo soportamos la
permite la creación de presentaciones multimedia a filtración simple de perfiles para hacer las
través de una línea de tiempo. SMIL puede adaptaciones necesarias de contenido y requiéramos
que el usuario cree una descripción de perfil antes habilitados para MPEG-4 (MELISA del European932 IST
del funcionamiento del componente de Research Project). El proyecto LoVEUS apoyó la
personalización. Esta funcionalidad necesita ser próxima generación de teléfonos móviles. El concepto
mejorada para la creación de servicios menos de smart-book fue concebido dentro del marco del
intrusivos e interrogativos. Los principales trabajos proyecto ARCHE-OGUIDE.
de personalización se llevaron a cabo en el marco de
ARCHOE-GUIDE, PISTE, LIFEPLUS [19] y multi- Los servicios orientados al contexto son mejorados
platforma de e-publishing para el ocio y la por la introducción de componentes colaborativos.
publicidad interactiva deportiva (MELISA) [20] el Dicha funcionalidad permite la experiencia
trabajo relacionado con la personalización fue compartida en el sitio o la comunicación con usuarios
realizado por INTRACOM). remotos. Esto puede suceder por una serie de razones,
Por lo general, los servicios conscientes del contexto como la transmisión de mensajes desde un punto
implican que los usuarios exhiban un centralizado a los dispositivos cliente, el intercambio
comportamiento nómada. Este hecho de nuevo de mensajes entre varios dispositivos cliente y en el
puede significar que hay un conjunto de dispositivos caso de aplicaciones AR, una experiencia de grupo
diferentes para apoyar. En los últimos años y en el para muchos usuarios, nuevamente en el sitio. El
contexto de los proyectos de investigación que proyecto que más abordaba el aspecto colaborativo
seguimos, apoyamos las siguientes plataformas: era ARIS. En el marco de PISTE, experimentamos
con el prototipo de grupo en el caso de la televisión
-Varias versiones de PDAs. interactiva, un medio designado para múltiples
-Web-almohadillas (hemos desarrollado usuarios simultáneos. Sin embargo, este tipo de
adicionalmente web-pads con adiciones de hardware colaboración / personalización de grupos aún no ha
para crear una plataforma de cliente, que llamamos encontrado su camino a la plataforma intGuide.
el '' smart book '', como se describe a continuación).
-Custom-sub-portátiles con el equipo necesario para Durante nuestra primera aplicación comercial de la
crear clientes AR (los llamados clientes de grasa). plataforma intGuide en el contexto de los museos y
-Los dispositivos de reproducción con restricciones sitios arqueológicos, nos enfrentamos a un conjunto
de recursos, tales como decodificadores de de problemas prácticos cotidianos que nunca fueron
televisión interactivos. obvios en el marco de los prototipos de prueba de
- Navegadores web convencionales. concepto, Proyectos de investigación europeos. Tales
problemas tenían que ver con la monitorización de los
Todas las plataformas anteriores presentan usuarios del contenido, la suficiencia de las baterías
características completamente diferentes y en los casos de dispositivos distribuidos a los usuarios
capacidades de reproducción. Con el fin de poder finales in situ, p. PDAs en un museo, robustez de las
convertir una presentación creada para una de estas plataformas de cliente, mantenimiento de los
plataformas a cualquiera de las otras, se requiere un dispositivos, registro y cancelación de registro de
proceso complejo. Hemos decidido apoyar la usuarios que toman prestado dispositivos cliente y
función de publicación multi-plataforma sólo para muchos más. Con el fin de poder abordar estas
contenido que tiene un carácter no en tiempo real. cuestiones, se introdujo un conjunto de herramientas
Durante la creación, existe la posibilidad de para el seguimiento del inventario, es decir, los
seleccionar un perfil de dispositivo para ser dispositivos que se prestan por los visitantes de un
soportado. Cada perfil de dispositivo contiene las sitio.
características de los principales tipos de multimedia
y permite la adaptación del contenido, según lo En las secciones siguientes, presentaremos
permita cada plataforma. Hemos estado brevemente cada una de las actividades de
experimentando con plataformas AR personalizadas investigación mencionadas aquí, agrupadas según el
en el marco de los proyectos ARCHEOGUIDE, dominio de la aplicación y resaltaremos los aspectos
ARIS [21] y LIFEPLUS, mientras que los PDAs han que juzgamos especialmente importantes para ser
sido uno de los dispositivos de destino de incluidos en la plataforma intGuide. Concluiremos
ARCHEOGUIDE, MELISA, LIFEPLUS y de con la presentación de la arquitectura intGuide
localización los servicios ubicuos mejorados emergente
visualmente (LoVEUS) [22] (ARIS del proyecto
europeo y LoVEUS del proyecto europeo IST). En
el marco de los proyectos PISTE y MELISA
trabajamos con decodificadores interactivos
933

Fig. 1. La paleta de las diferentes áreas de experiencia necesarias para desarrollar una plataforma de software que proporciona servicios
sensibles al contexto. En el lado izquierdo de la figura, las casillas blancas representan el conocimiento necesario para establecer la
infraestructura de back-office con el proveedor de servicios de aplicación, mientras que las casillas oscuras en el lado derecho representan los
conocimientos necesarios para establecer servicios contextuales con visualización avanzada en las plataformas cliente. Las cajas mixtas
representan el conocimiento necesario tanto para el back-office como para los clientes.

implementar el servicio utilizando sus propios


4. Uso y usuarios de la plataforma intGuide recursos para hacerlo y solicitando servicios de
consultoría ocasionales. Existen ya varios sitios que
Al desarrollar una plataforma siempre se tiene en han expresado el interés definido por instalar y
mente un grupo objetivo. intGuide se desarrolló desplegar servicios sensibles al contexto mediante la
teniendo en mente tres grandes grupos de usuarios plataforma intGuide.
objetivo: en primer lugar, los operadores de redes
móviles que buscan nuevos servicios atractivos En red móvil paralela, los operadores ya están
para ofrecer a su clientela; en segundo lugar, los buscando soluciones avanzadas para crear nuevos
proveedores de servicios de aplicación dedicados y flujos de ingresos. A largo plazo, esperamos que las
los operadores del servicio (estos dos grupos organizaciones más pequeñas surjan en el papel de
pueden complementarse en muchos casos); y proveedores de servicios de aplicaciones, invirtiendo
finalmente, los propietarios de contenidos, que en la plataforma intGuide y ofreciendo la solución
desean agregar valor a la difusión de su contenido. contextual como un servicio a los clientes
En este último grupo, se podrían imaginar grandes interesados.
museos u otras grandes organizaciones de Dichos clientes provendrán de los grupos antes
memoria, dispuestos a invertir en una plataforma mencionados, pero pertenecerán a las partes
para la mejor y más atractiva difusión de sus interesadas financieramente más débiles.
activos.
Por último, es importante mencionar que el éxito de la
En términos de factibilidad, es más probable que plataforma intGuide depende en gran medida de las
los grupos primero y último empiecen a utilizar la implementaciones de ejemplo del servicio. Para ello
plataforma primero. Esperamos que principalmente una parte del equipo de desarrollo se dedica a
los principales sitios culturales comiencen a desarrollar soluciones para los usuarios finales de los
clientes potenciales de intGuide. Su trabajo está solución verdaderamente móvil capaz 934 de
dirigido al desarrollo de soluciones para plataformas superponer correctamente el campo visual del
de clientes que serán utilizadas por los usuarios visitante requiere en el momento grandes esfuerzos
finales. Este trabajo se inició en el marco de los tanto en la integración del sistema como en el
Proyectos de Investigación Europeos y será el procesamiento algorítmico en la parte de visión
enfoque principal de la presente publicación. por ordenador. Este último resultado del requisito
no intrusivo, ya que no había posibilidad de
5. Conciencia de contexto y realidad aumentada introducir marcadores en el área; por lo tanto, un
en el patrimonio cultural: ARCHEOGUIDE, seguimiento robusto y en tiempo real sin
LIFEPLUS y LoVEUS marcadores fue objetivo. Adicionalmente, la
alimentación de la cámara que se necesitaba
analizar se originó a partir de una cámara montada
Los sitios del patrimonio cultural parecen ser uno en la cabeza.
de los campos de aplicación más obvios para la
introducción de dispositivos nómadas con Por lo tanto, el módulo de seguimiento necesitaba
capacidades avanzadas de visualización. A partir ser robusto al movimiento en todos los planos y
de su aparición en exposiciones, museos y sitios direcciones.
arqueológicos, se amplió el desarrollo de sus
predecesores, es decir, guías acústicas y ARCHEOGUIDE se basa en un concepto de
dispositivos multimedia, proporcionando a los procesamiento de tres pasos para la visualización
visitantes un conjunto de información correcta de las reconstrucciones de monumentos
audiovisual de fácil acceso. Ofrecen grandes en la vista del tronco del visitante, como se
ventajas sobre las guías acústicas existentes y muestra en la figura 2:
folletos relacionados con los sitios, como el
atractivo de la presentación, la riqueza de los
medios de expresión para los curadores del Paso 1: Cálculo aproximado de la posición del
museo y la emoción a través de la interactividad usuario mediante GPS diferencial; en el caso de
que ofrecen una ventaja competitiva significativa Olympia, donde 12 satélites eran visibles
a las instituciones culturales. continuamente por el sistema, instalamos un
servidor D-GPS y alcanzamos una precisión de
aproximadamente 2 m.
Antes de la introducción de tales soluciones en el
ámbito de la difusión del patrimonio cultural, el
proyecto ARCHEOGUIDE inició la Paso 2: Cálculo aproximado de la orientación de
experimentación con AR in situ para sitios los ojos de los usuarios mediante una brújula
arqueológicos. La "legibilidad" de los sitios digital integrada; el hardware utilizado entregó la
arqueológicos es extremadamente pobre, ya que rotación principalmente en el plano horizontal,
la mayoría de estos sitios están en ruinas. La mientras que el plano vertical podría estimarse
preservación de su carácter requiere una sólo dentro de 601
intrusión mínima en el sitio; por lo tanto, las alrededor del punto cero de calibración (el origen
ayudas visuales son limitadas, si existen en de los ejes).
absoluto.
Paso 3: Cálculo exacto del campo de visión del
Este caso reclama el apoyo de soluciones usuario por medio de visión por computadora y
tecnológicamente avanzadas. ARCHEOGUIDE seguimiento visual.
propuso una solución de este tipo, a saber, un
sistema móvil, que permite al visitante ver a
través de la cabeza-montado la reconstrucción El módulo de seguimiento fue desarrollado por el
del sitio, mientras que él / ella está caminando a Instituto Fraunhofer de Gráficos por Ordenador
través de él y escuchar la narración añadiendo a (IGD) y se presentó en detalle en [23]. Se basa en
esta información visual mejorada. El sistema fue imágenes de referencia del sitio para recuperar la
desarrollado y probado con éxito en condiciones posición y la orientación de la cabeza del visitante
reales en el sitio arqueológico de la antigua y, posteriormente, realizar una transformación de
Olympia. El proyecto se enfrentó a un conjunto deformación de imagen para mostrar
de desafíos tecnológicos. El desarrollo de una correctamente las imágenes preprocesadas de los
935

Fig. 2. La arquitectura general del sistema ARCHEOGUIDE, aquí presentada con el foco principal en la plataforma cliente.

imágenes de referencia y el fotograma actual de la


objetos superpuestos. Las imágenes de cámara del visitante.
superposición son representaciones
tridimensionales (3D) de los monumentos. Posteriormente, se realiza una transformación log-
polar del espectro; la correlación de fase se utiliza
El componente de seguimiento es alimentado por para recuperar la rotación y el factor de escala y
el módulo de control (desarrollado por finalmente la traducción (después de la
INTRACOM) con un conjunto de posibles rectificación).
imágenes de referencia. Esto ocurre evaluando La robustez de esta solución es notablemente alta y
las lecturas de un módulo D-GPS y una brújula suficiente para el caso de aplicación. Como se
digital, conectada a la unidad móvil, y muestra en [23] de nuevo, al aplicar ruido
posteriormente recuperando las imágenes de Gaussiano (con varianza s 02500) y usar imágenes
referencia del candidato de la base de datos del de prueba con poco solapamiento (menos del
sistema, que es georreferenciada (sistema de 50%), el error absoluto disminuye dos píxeles. El
información geográfica (GIS) como la carácter en tiempo real de los cálculos (cuando se
funcionalidad). Tanto el georreferenciamiento utiliza una transformación de Fourier rápida (FFT)
como la configuración y operación del servidor la implementación de lo anterior) en un PC
D-GPS fueron realizados por el partner A & Pentium 3 a 800 MHz se da, con una velocidad de
C2000. El componente de seguimiento fotogramas de 10 Hz. Para la deformación de las
inicialmente realiza el registro de imágenes imágenes superpuestas y la visualización de la
utilizando la transformada de Fourier-Mellin, que vista aumentada, se introdujo la solución de
es la traducción, la rotación y la escala invariante renderización Avalon introducida por el Zentrum
[23]. Tal como se presenta en la misma fuer Graphische Datenverarbeitung (ZGDV).
publicación, la secuencia de operaciones
comienza con la transformación de Fourier de las
Las imágenes de referencia, así como las 936
reconstrucción realista de la flora y la fauna en las
superposiciones correspondientes, residen en el presentaciones aumentadas dentro de un sitio
repositorio del servidor y se descargan en el arqueológico. La arquitectura del sistema incluía
dispositivo cliente después de la estimación dos módulos independientes que funcionaban en el
inicial de la posición y la orientación con la dispositivo móvil del visitante, a saber, el
ayuda del D-GPS y la brújula (modelo de cliente simulador de vida y el AR-Guide. Nuestra
ligero) o en el almacenamiento local del participación fue en la parte de la AR-Guía. Para
dispositivo cliente (modelo de cliente de grasa). una presentación detallada de los aspectos de la
Los dispositivos móviles están equipados con un vida de simulación se refieren a [24].
adaptador inalámbrico IEEE802.11b (instituto de
ingenieros eléctricos y electrónicos) y se
comunican de forma inalámbrica con el servidor Aunque los componentes básicos de AR-Guide
del sitio. La información adicional que se siguen siendo los mismos que en
descarga para un punto de vista dado en el sitio ARCHEOGUIDE, los socios involucrados en esta
son otros archivos multimedia, como narración, tarea eligieron la migración de un cliente dedicado
imágenes de artefactos relacionados y modelos a una arquitectura Active-X permitiendo el uso de
3D de artefactos. AR en un contenedor dedicado o convencional
como un navegador web. Además, se produjeron
cambios importantes en los componentes de
En 2001, cuando se montó la primera unidad metadatos y de presentación de resultados. En el
móvil ARCHEOGUIDE AR, su peso total esquema utilizado en el contexto de LIFEPLUS, la
superaba los 8 kg, lo que era incluso en la diferenciación entre las descripciones
mochila introducida, bastante pesada para multimediales y las descripciones específicas del
transportarla en el sitio arqueológico. La pantalla dominio condujo a un modelo personalizable de
montada en la cabeza con los auriculares, la modo, que fue adoptado dentro de la plataforma
cámara y la brújula digital fueron todos intGuide. Por lo tanto, para la descripción de los
conectados a un casco (al menos en la versión elementos multimedia, se utilizó un subconjunto
inicial del sistema). Esto obligó al consorcio MPEG-7 como base para la descripción, mientras
ARCHEOGUDE a buscar medios alternativos que la parte específica del dominio fue cubierta
para la presentación. Esto dio origen al "libro por una combinación de las descripciones de
inteligente" y la "guía de bolsillo", dos Dublin Core y el DCWA en el caso del patrimonio
soluciones que no exhiben el carácter inmersivo cultural.
de la unidad móvil AR, pero sin embargo
entregar una experiencia sensible al contexto
para el visitante del sitio. La primera de las dos La mayor mejora en comparación con
es una tableta con una pantalla táctil al aire libre, ARCHEOGUIDE fue la continuidad de la guía
mientras que la segunda es una PDA, ambas turística. En LIFEPLUS, hemos optado por un
equipadas con módulos GPS; el libro inteligente soporte continuo del visitante con información
también está equipado con una brújula digital. En multimedia, mientras que en ARCHEOGUIDE
hemos utilizado sólo áreas seleccionadas en el sitio
ambos casos, el usuario realmente no necesita
interactuar con los dispositivos, ya que la arqueológico para mostrar información aumentada
orientación, la narración y la visualización de la y reproducir archivos multimedia. Por un lado,
información se basan únicamente en la tuvimos que abordar numerosos problemas
información procedente de los sensores prácticos, como el paseo por un sitio arqueológico
mencionados anteriormente. Por lo tanto, lleno de ruinas con una pantalla montada en la
mientras los visitantes recorren el antiguo sitio cabeza todo el tiempo. Por otro lado, los
de Olimpia, sus dispositivos les presentan el problemas técnicos de reproducción continua y la
contenido apropiado. Con esto se concluyó el estimación robusta de la posición y la orientación
objetivo inicial de una avanzada AR-Guía para el debían resolverse.
patrimonio cultural.
El primer problema fue abordado con éxito (y
En un proyecto posterior, LIFEPLUS, se fácilmente) por medio del diseño del dispositivo y
investigaron y exploraron características del contenido. En lugar de las pantallas montadas
adicionales por primera vez. El proyecto se en la cabeza, utilizamos un conjunto de
enfrentó al gran desafío de introducir una binoculares que el visitante puede llevar en una
mano y colocarlas en su campo de visión bajo multimedia en la nueva área. 937
demanda. Por lo tanto, usamos la guía de sonido
en la mayoría de las áreas y los sonidos de noti fi
Dentro de LIFEPLUS realizamos los primeros
cación, cuando la información visible estaba
disponible. intentos de crear una versión más inmersiva de la
guía de bolsillo multimedia, adjuntando una
Para el segundo conjunto de problemas, se pantalla monocular a la PDA. La evolución de
utilizó un algoritmo simple para la determinación nuestros sistemas portátiles se ilustra en la Fig. 3.
de segmentos a lo largo de la trayectoria del
visitante. El algoritmo está tratando de identificar
cualquier desviación abrupta en las lecturas del Todos los ensayos realizados en el marco de los
dispositivo de posicionamiento y cambios muy proyectos anteriormente mencionados en los sitios
bruscos en el movimiento de la cabeza del arqueológicos de Olimpia y Pompeya requirieron
visitante y suavizarlos usando una simple un esfuerzo adicional, para ser generalizados a un
combinación de buffering y promediación. público más amplio. En el marco del proyecto
Además, es consciente del contexto, en el sentido LoVEUS, decidimos dejar las fronteras de los
de que no intenta determinar la posición actual sitios arqueológicos y museos y entregar contenido
del usuario basándose únicamente en las lecturas rico a los turistas metropolitanos que no utilizan
del D-GPS, sino que utiliza información sobre dispositivos de alquiler de clientes, pero mucho
las posiciones pasadas. Con el fin de aumentar la más su propia generación de teléfonos móviles. El
experiencia mejorada de la visita, el sistema no foco principal en el contexto de LoVEUS fue la
interrumpe la reproducción de archivos entrega de contenido enriquecido a los teléfonos
multimedia, incluso si se identifica la móviles sobre el actual servicio general de radio
penetración de una nueva área. La solución se da por paquetes (GPRS) y la emergente
una vez más en la fase de diseño de contenido. El infraestructura del sistema universal de
'' Etiquetado '' de segmentos multimedia se telecomunicaciones móviles (UMTS) a
utiliza para reproducir la parte caracterizada dispositivos, que tienen capacidades limitadas.
como 'fi nal' en cada segmento de área antes de
iniciar la reproducción de un nuevo conjunto

Fig. 3. A la izquierda se muestra la evolución de los asistentes digitales portátiles tanto en términos de hardware
como de software. La versión inicial, tal como se despliega dentro del proyecto ARCHEOGUIDE en un simple PDA y
muestras de pantallas de la guía multimedia LIFEPLUS con un robusto PDA con pantalla monocular miniaturizada
para acompañar al visitante sin distraerlo durante la visita. La evolución de la plataforma móvil de la realidad
aumentada para la orientación turística dentro de un sitio arqueológico, en el rectángulo redondeado, como prototipo
en ARCHEOGUIDE 2001, ya la derecha de la flecha como se presenta en el marco de LIFEPLUS 2004 en Pompeya.
El peso total se reduce de más de 8 kg a aproximadamente 1,5 kg. El coste total de la unidad móvil también se
reduce drásticamente, debido principalmente a la disponibilidad de pantallas montadas en la cabeza de precio
reducido.
significativa relacionada con la población de
Dentro de este proyecto se obtuvo una experiencia contenido a través de redes móviles comerciales,
haciendo uso de la infraestructura existente de cantidad de tiempo dentro de la cual una 938
operadores móviles. El reto principal fue la entrega "repetición" de un intento deportivo tendría
de contenidos multimedia interactivos sobre dichas sentido en una transmisión en vivo .
redes, preservando una calidad de servicio dada
(QoS). Hemos adquirido una valiosa experiencia en
el desarrollo de la aplicación cliente utilizando la Los estudios de caso para PISTE eran
tecnología de periféricos de dispositivos móviles de principalmente tipos de deportes de pista y de
información (MIDP 2.0) y los servicios de campo. Algunas mejoras representativas fueron la
localización en colaboración con los servicios de red reconstrucción tridimensional del movimiento de
Fraunhofer IGD (tecnología Mutimedia GIS) y los atletas y la proyección de los modelos 3D
Vodafone. El contenido mostrado no incluía AR en predefinidos en el área reconstruida del evento
tiempo real, sino que se enviaban vistas de realidad deportivo. Tal reconstrucción sería difundida en
mixta en el teléfono móvil. Sin embargo, esta forma de un clip MPEG-4 después del intento real.
información encontró su camino hacia la plataforma Ayudó a los espectadores a comprender mejor y
intGuide para el soporte de teléfonos móviles, y de explorar el evento y dejarlos almacenar el clip para
ahí la extensión del carácter de publicación multi- verlo siempre que estuviera disponible. Además,
plataforma. esta tecnología está permitiendo escenarios como
las carreras virtuales: después de las semifinales de
6. Tecnología de realidad aumentada en los un concurso en curso, las cuatro mejores de cada
deportes: PISTE y MELISA una de las semifinales están entrando en las fi
nales. Con la tecnología PISTE es posible crear
una fusión virtual que combine los intentos de
Un dominio de aplicación completamente todos los atletas que entran en las fi nales antes del
diferente es el de la radiodifusión deportiva. Los evento real. Otro escenario posible, posibilitado
deportes son una de las fuerzas motrices en el por la tecnología desarrollada dentro del proyecto,
mercado para numerosas aplicaciones, y por lo es la inserción de atletas virtuales para correr o
tanto siempre un dominio muy interesante para competir junto a los atletas actuales, imitando el
explorar y crear soluciones para. En el marco de movimiento exacto del campeón del mundo, el
dos proyectos europeos, PISTE y MELISA, campeón nacional del espectador, etc. la
tuvimos la oportunidad de explorar la entrega de plataforma PISTE estaba relacionada con la
contenidos mejorados visualmente a diversos mezcla 2D de metraje, tal como superponer el
dispositivos, principalmente los decodificadores intento de un atleta de salto alto en el intento
para la televisión interactiva y también los actual de otro atleta de salto alto, o el rastro de la
teléfonos móviles de próxima generación. pelota o un atleta de manera estroboscópica para
un mejor comprensión de una acción
Ambos proyectos abordaron la cadena completa particularmente rápida.
de producción y consumo durante la transmisión
de un evento deportivo en vivo. En el caso de El concepto detrás de estas características, que
PISTE, el enfoque principal fue el desarrollo de permite una creación casi en tiempo real de tales
mejoras 3D relacionadas con una mejor efectos, es el concepto de plantilla y la creación
visualización de la información relacionada con previa al evento. PISTE se basa en las actividades
la transmisión actual, y adicionalmente la preparatorias del equipo de radiodifusión in situ.
introducción de un personaje parecido al juego. Por lo tanto, los broadcasters crean tomas del
Se desarrolló un conjunto de mejoras visuales entorno antes del evento e implementan un
con el fin de agregar valor a la transmisión del conjunto de herramientas dedicadas para crear
contenido y proporcionar a los organismos de reconstrucciones en 3D del sitio (mapas de entorno
radiodifusión una ventaja competitiva al ofrecer calibrados). La paleta de herramientas para las
un contenido más atractivo. El desafío principal actividades preparatorias se complementa con una
en PISTE fue la determinación del movimiento herramienta de autoría para la creación de
humano en '' casi tiempo real '', así como la plantillas que indican las posiciones de los
transmisión y reproducción de gráficos 3D elementos gráficos e interactivos en la pantalla
animados e interactivos sobre las infraestructuras para determinados tipos de deportes, así como un
existentes (MPEG-2 DVB). El término "casi en sistema de anotación para la inserción de todos los
tiempo real" se refiere a un lapso de tiempo de tipos de los metadatos relacionados con el lugar
aproximadamente 10 minutos, ya que es la del evento, de los atletas participantes, de la
posición de las cámaras en el estadio, etc. Estos de deportes (modelo de distribución de puntos, 939
tal
metadatos se capturan en formato MPEG-7 y se como se presenta en [26]). El movimiento
multiplexan con el resto del contenido a la calculado se utilizó para retroproyectar a un atleta
demanda para radiodifusión en los dispositivos arti- ficial en el ambiente reconstruido, donde
cliente. En los dispositivos cliente un mecanismo ocurrió el evento. La reconstrucción del medio
de filtrado está analizando los metadatos que ambiente fue un proceso ineludible que tuvo que
llegan para seleccionar el contenido más tener lugar antes de la emisión con las
apropiado para los espectadores en casa, herramientas desarrolladas por la IGD Fraunhofer.
implementando así una forma simple de PISTE aportó información valiosa para la
personalización. plataforma intGuide en otro dominio, que
INTRACOM abordó en el proyecto, a saber,
La tecnología de visión estéreo entregó las perfiles de grupo y filtrado de contenidos para
herramientas para el análisis del movimiento múltiples usuarios. Puesto que la televisión es un
humano y su proyección sobre personajes medio que es utilizado simultáneamente por más
virtuales en un entorno real. El desafío dentro de de un usuario, es necesario dirigirse a sus intereses
PISTE fue menos el desarrollo de nuevos por igual. Dentro de PISTE, se desarrolló un
algoritmos, pero mucho más la identificación de algoritmo de filtrado simple, que combinaba los
los más apropiados y su interconexión en un perfiles individuales de cada espectador de
oleoducto de procesamiento, para lograr el acuerdo a las prioridades, dado su papel en la
resultado deseado en términos de precisión y emisión considerada ('' main viewer '', el que opera
tiempo de procesamiento. el control remoto, '', los que están interesados en la
emisión actual y los espectadores '' pasivos,
Un intento en pista y campo suele durar menos
entonces los que están siguiendo la emisión por el
de 10 s, es decir, se necesitan menos de 250 bien de la unidad.
fotogramas por cámara (o 500 campos en el caso
de cámaras de radiodifusión analógicas). La MELISA complementa los esfuerzos de PISTE y
configuración en el campo consistía en múltiples también exhibe algunas características comunes.
cámaras, en la mayoría de los casos tres. El Se centra en el contenido deportivo interactivo
metraje de cada cámara se procesó inicialmente relacionado con las mejoras 2D y principalmente
por separado por medio de segmentación de el apoyo a las actividades de juego.
imagen. El enfoque seleccionado, implementado Adicionalmente, en el marco de MELISA se
por la Universidad de Creta, requirió de la introduce el concepto de publicidad incrustada, es
selección del manual de usuario de 18 decir, la pre- sentación de anuncios incorporados
articulaciones distintas en el primer fotograma de en el flujo normal del programa, colocados en las
cada cámara (el procesamiento de cada cámara áreas apropiadas de las imágenes de video (como
podría tener lugar en paralelo, ya que la resaltar un logotipo en la ropa de una fórmula- 1
herramienta de creación desarrollada para este el piloto y mostrar algún texto adicional cerca).
propósito de INTRACOM podría conectarse La edición de plantillas juega un papel importante
remotamente al repositorio central y la en el proceso de preparación de contenidos de
regulación de múltiples instancias de la misma MELISA, al igual que en PISTE. Se pueden
estaba sujeta a un motor de flujo de trabajo, diferenciar las plantillas en tres categorías, la de
también desarrollado dentro del proyecto). Sobre las mejoras visuales, que consiste en plantillas 2D
la base de que la silueta del atleta se segmentó para mostrar gráficos de superposición, plantillas
[25] y pasó al componente de estimación de de apuestas para apoyar las apuestas en tiempo real
pose. Este último procesó el conjunto completo y las plantillas publicitarias para publicidad
de tramas segmentadas para cada cámara y interactiva. Estas plantillas predefinidas son
utilizando sus parámetros pan / tilt / zoom utilizadas por las aplicaciones Work Flow Control
(suministrados por sensores o el componente de en tiempo real para controlar la información
detección de movimiento de la cámara transmitida.
desarrollado por EPFL) estimó la postura 3D
(componente desarrollado por ZGDV y el
Un conjunto de reglas basado en secuencias de
Universidad de Hannover). La postura estaba
sujeta a un modelo anatómicamente correcto del tareas guía la instanciación en tiempo real de una
plantilla predefinida. La instancia de una plantilla
cuerpo humano [26], y también un modelo
estadístico del movimiento para el tipo específico de seguimiento de automóviles requeriría
recuperar los datos de seguimiento de la unidad contenido publicitario relacionado con 940
el
de mejoras visuales o de la unidad de conductor o el equipo.
procesamiento de imágenes. La información de 7. Conciencia de contexto y visualización
seguimiento de datos se puede utilizar para avanzada en aplicaciones de comercio: el
mostrar un logotipo de patrocinador siguiendo un escenario ARIS
coche alrededor de la pista. Las imágenes para el
logotipo o cualquier anuncio interactivo deben
ser recuperadas del Repositorio de Información. El objetivo del proyecto ISIS ARIS fue la
Para la coordinación de todas las tareas y la de fi integración perfecta de objetos virtuales, a través
nición de las dependencias se introduce la de técnicas de reconstrucción de iluminación, en
Aplicación de Control de Flujo de Trabajo en la entornos aumentados, en el contexto del diseño de
arquitectura. Al finalizar cada tarea, cada unidad interiores. Los escenarios de aplicación que se
notifica el Control de Flujo de Trabajo que, a su desarrollaron fueron: (1) un sistema interactivo de
vez, redirige los datos en consecuencia. escritorio, donde el usuario final puede integrar
Una Herramienta de anotación de eventos fácilmente modelos de mobiliario 3D en un
controlada por el operador gestiona la anotación conjunto de imágenes de su entorno real, teniendo
en tiempo real de datos activos y el en cuenta la iluminación consistente de objetos
desencadenamiento de eventos cuando se reales y virtuales; (2) una unidad AR móvil, donde
requiere, p. cuando se registra una puntuación de los modelos de productos en 3D pueden ser
objetivo, se activan automáticamente las visualizados directamente en un sitio real y
actualizaciones de escena necesarias. La discutidos con participantes remotos.
herramienta Annotation desempeña un papel
importante tanto en el alivio del director de la El proyecto ARIS alcanzó los objetivos antes
emisión de parte de la carga de trabajo como en mencionados al proporcionar: (1) métodos fáciles
la instanciación de la plantilla. Durante la de usar para la reconstrucción 3D y el registro de
radiodifusión, un operador registra cada cámaras; (2) seguimiento preciso de la cámara,
acontecimiento significativo como sucede. Cada utilizando métodos de visión con y sin
vez que el operador registra un evento, se genera marcadores; (3) herramientas para reconstruir la
información estadística y se almacena en el iluminación y los datos materiales de las imágenes
repositorio de información para su uso futuro. (incluida la luz diurna); (4) integración perfecta de
Esta información estadística puede ser utilizada escenas virtuales y reales mediante una
por una plantilla predefinida y mostrada al iluminación consistente entre objetos reales y
espectador en casa para mejorar la experiencia virtuales en velocidades de actualización
visual o como una ayuda a las decisiones de interactivas; (5) evaluación psicofísica y
apuestas. La anotación de eventos en vivo herramientas para ajustar la visualización
también se utiliza para activar las mejoras aumentada a las condiciones de brillo del ambiente
visuales automáticamente. Una falta en un real para pantallas montadas en la cabeza; (6)
partido de fútbol puede activar automáticamente componentes de colaboración, incluyendo métodos
una plantilla para mejoras visuales relacionadas de interacción y comunicación con usuarios
con un tiro de foul, como la distancia a la meta. externos y usuarios in situ en entornos
El algoritmo de visión por ordenador, aumentados.
responsable de la gran mayoría de las mejoras,
fue desarrollado por la Universidad de Essex y
presentado en [27]. Utiliza un mecanismo de Las dos imágenes de la derecha de la figura 4 son
análisis y recuperación basado en regiones para los resultados de la unidad ARIS móvil AR. El
rastrear objetos basados en el color, los usuario visualiza los resultados a través de una
momentos y la posición. unidad de visualización montada en la cabeza e
interactúa con la escena aumentada mediante
joystick y comandos de voz. La ventana de
La unidad de anotación también se utiliza para información del producto y todos los controles
activar el contenido publicitario en un evento necesarios aparecen en paneles ocultables que
deportivo cuando la acción lo permite. Un ofrecen una vista sin obstáculos a la escena
ejemplo sería la grabación de un pit-stop en un aumentada.
grand-prix de fórmula 1 que podría activar
automáticamente una plantilla de publicidad con
941

Fig. 4. Los resultados y el funcionamiento del sistema de escritorio interactivo ARIS, utilizando un complemento dentro de un
navegador web convencional, se muestran en las dos capturas de pantalla de la izquierda. Las capturas de pantalla de la unidad AR con
el conjunto completo de herramientas se muestran en las dos imágenes de la derecha. Estas últimas imágenes se muestran a través de
la pantalla montada en la cabeza en el caso de la versión inmersiva de la plataforma cliente.

El proyecto ARIS también se centró en el modelo de comunicación del servidor de comercio


despliegue de técnicas que permiten a los electrónico 3D.
participantes en el lugar y remotos colaborar
entre ellos e interactuar con la escena aumentada. 8. Lo que todo se reduce a ..., la arquitectura intGuide
En el caso de múltiples participantes en el sitio,
hay dos escenarios de aplicación: (1) la Todas las actividades de investigación mencionadas
existencia de un usuario maestro que tiene el anteriormente contribuyeron sustancialmente a la
privilegio de interactuar con la escena, mientras primera versión de la plataforma intGuide. La
que los otros usuarios simplemente ver los contribución de cada proyecto a intGuide se muestra
resultados de la interacción del maestro; (2) en la siguiente tabla, que resume el know-how que
todos los usuarios pueden interactuar con la cada proyecto entregó a la plataforma, utilizando los
escena, pero el sistema sólo permite uno a la vez. aspectos presentados en la Figura 1. Además, se
El participante remoto en el sistema de escritorio presentó un resumen de los desafíos generales de la
interactivo ARIS (diseñador de interiores) recibe ciencia y la implementación que fueron abordados
el espacio 3D reconstruido (por el cliente) y dentro de esos proyectos (por parte de todos los
puede interactuar con él (añadir y quitar muebles, consorcios respectivos).
hacer sugerencias, etc.) y devolverlo utilizando el
Projecto Aspectos cubiertos Desafíos científicos y Problemas de
tecnológicos integración
ARCHEOGUIDE Visualización de la Seguimiento sin Unidad AR móvil
información marcadores en tiempo
Interacción humano- real Presentación de objetos
ordenador multimedia en el campo
Fusión conceptual de visual del usuario de
Visión por ordenador y SIG multimedia con clasi forma natural
tecnología de fi caciones específicas
seguimiento del dominio Mecanismos de
interacción para usuarios
de AR nómadas

Identificación de
localización y orientación
basada en múltiples
sensores
LIFEPLUS
LoVEUS
PISTE
MELISA Control de flujo de (Cerca de) seguimiento Nuevos modelos de flujo
trabajo en tiempo real de objetos de trabajo para la
en movimiento rápido colaboración de
Visualización de múltiples entidades 942
información Seguimiento de
jugadores y objetos en Publicación
Visión por ordenador y deportes grupales multiplataforma de
tecnología de contenido interactivo
seguimiento Generación de
probabilidades en tiempo Modelado MPEG-21 de
real para apuestas en publicidad interactiva y
Ontología del dominio de juego procesos de apuestas
la aplicación
Transmisión de
contenidos a través de
múltiples redes (MPEG-
Tecnología de 2 / DVB, GPRS y
procesamiento UMTS)

Contenido MPEG-4
combinado y
reproducción de
metadatos MPEG-7 en
dispositivos de recursos
limitados (PDA,
teléfonos inteligentes)

ARIS Tecnología de Reconstrucción Aplicaciones


procesamiento geométrica con colaborativas de AR para
intervención mínima '' usuarios de tipo
Visión por ordenador y consumidor ''
tecnología de Reconstrucción de la
seguimiento iluminación con Tele-consulta y
intervención mínima experiencia compartida
Componentes de de vistas ampliadas
colaboración Seguimiento 3D en
tiempo real Repositorios comerciales
Ontología del dominio de de modelos 3D que
la aplicación Iluminación fotorrealista alimentan tanto
de escenas aumentadas aplicaciones AR como
Gestión de inventario y navegadores web
usuarios Evaluación perceptiva de convencionales
escenas aumentadas
Gestión de perfiles de
usuario para aplicaciones
AR colaborativas

Computer vision and Location and


tracking technology orientation
identification based on
multiple sensors
943

Location and Spatio-temporal


orientation detection characterization of
multimedia content
Rendering technology
LIFEPLUS Human–computer Realistic life Continuous multimedia
interaction playback in the context
of nomadic AR-units
Application domain Reconstruction Fine-grained
ontology ‘‘intelligent’’ location
and orientation
detection
Computer vision and 3D markerless tracking Equipment ergonomics
tracking technology and raggedization
Rendering technology
LoVEUS Digitization QoS for location-based Publishing of
multimedia playback interactive content over
over mobile wireless mobile telephony
networks
Human–computer Support of multiple
interaction types of devices
Location and
orientation detection
Personalization
techniques
PISTE Digitization Near-real-time human Dynamic
motion capturing in parameterization of 2D
sports and 3D template
concept
Computer vision and Reduction of manual Extension of a player to
tracking technology intervention in 3D support a multitude of
reconstruction of MPEG-4 profiles (at the
stadium areas time of development no
other implementation
supported)
Workflow control Content filtering based MPEG-4 and MPEG-7
on group profiles over DVB/MPEG-2
broadcasting
Application domain Workflow support for
ontology on-the-field
broadcasting and
interactive content
creation
Information
visualization
Personalization
techniques
Rendering technology
944

La arquitectura del lado del servidor de la plataforma permite el uso de diferentes sistemas de
plataforma intGuide se presenta en la figura 5. Esta localización, como posicionamiento basado en WLAN
figura denota la estructura completa del lado del en interiores, posicionamiento basado en etiquetas
servidor necesaria para aplicar prácticamente los (despliegue de cualquier tecnología ampliamente
servicios AR y los servicios sensibles al contexto. difundida para marcaje, como infrarrojos, R / F,
Esta infraestructura consiste en: (a) herramientas de Bluetooth, etc.) y posicionamiento GPS al aire libre.
procesamiento de la flina, que son necesarias para
preparar el contenido y extraerlo de los dispositivos La plataforma ofrece también un conjunto de
del cliente; (b) instalaciones de monitoreo en línea herramientas para la creación de perfiles para la
que garanticen un buen funcionamiento y control selección del contenido apropiado. Actualmente, el
total de toda la instalación; y finalmente (c) sistema admite mecanismos de filtración sencillos y,
facilidades para la evaluación del funcionamiento por lo tanto, permite la creación de perfiles de usuario
del sistema, que permitan estadísticas que pueden que se comparan con la categorización de contenido
conducir a adaptaciones y mejoras del servicio (y durante el proceso de anotación de contenido.
que son consideradas vitales por la mayoría de los
operadores de servicios). Para la plataforma hemos reutilizado la experiencia y
los resultados de todos los proyectos descritos
En el corazón del sistema, un sistema de gestión de anteriormente para el desarrollo de la parte de gestión
activos está ayudando a administrar los activos de contenidos y creación. También hemos
digitales que son necesarios para crear los servicios aprovechado la colaboración con los usuarios finales
sensibles al contexto y las mejoras visuales. El para identificar los problemas que surgen en la
término repositorio es indicativo de un conjunto de aplicación rutinaria cotidiana de sistemas nómadas
bases de datos diferentes, como la base de datos sensibles al contexto, problemas que no son obvios
operativa transaccional, el data mart necesario para durante el desarrollo de aplicaciones prototípicas. Dos
las evaluaciones estadísticas, etc. En la parte aspectos característicos son: (a) el monitoreo del uso
superior del repositorio, las bibliotecas del sistema para poder asistir a los visitantes cuando
especializadas permiten el acceso fácil y genérico, sea necesario (por ejemplo, quedarse sin pilas, pasar
teniendo en cuenta también las representaciones de demasiado tiempo repitiendo la misma interacción con
metadatos específicos del dominio. La fusión del el sistema, etc. ) y (b) la colaboración de grupos de
genérico con los metadatos específicos tiene lugar usuarios, que no quieren experimentar el sistema
en esta capa. Se supone que cualquier representación consciente del contexto por sí mismos.
específica requerida para extender el modelo
genérico tiene una representación en el lenguaje de Un componente de colaboración simple en las
marcado extendido (XML) -schema. La definición plataformas cliente, para el que intGuide proporciona
de esquema puede entonces ser fácilmente integrada las aplicaciones de control, permite la comunicación
y asociada a las estructuras de la base de datos. de voz y el intercambio de mensajes entre varios
Además, las herramientas de creación adaptan sus participantes, así como con la unidad central. Un
hojas de propiedades a las nuevas descripciones modelo más avanzado de colaboración, basado en los
extendidas en los paneles de anotación de contenido resultados completos de ARIS, todavía está en
de forma automática. construcción. Sin embargo, este modelo sólo afectará
a las plataformas de clientes inmersivos.

Las herramientas de posicionamiento y mapas La adaptación del terminal aprovecha los perfiles de
permiten la asociación de elementos multimedia y dispositivos dados para adaptar el contenido a
presentaciones a determinadas ubicaciones. Esta diferentes representaciones adecuadas para diversos
información se almacena en la base de datos tipos de dispositivos. Aunque está previsto extender la
centralizada y también en un archivo de descripción paleta de dispositivos compatibles en un futuro
XML que se llena a los dispositivos de cliente a próximo, actualmente el sistema puede producir
petición, utilizando los mecanismos de carga de contenido adaptado para Pocket PC, varios tipos de
contenido parametrizables. A continuación, puede pastillas para lápiz, la plataforma móvil AR-Guide
ser utilizado por el dispositivo cliente para (con los componentes de rastreo y representación de
identificar el material exacto y presentaciones ARCHEO - GUIDE y LIFEPLUS desarrollados por
relacionadas con una posición detectada. La Fraunhofer IGD) y navegadores web convencionales.
945

post-
offline online
operation

Content
Authoring Tool Registration & Statistics & Usage
Uploading /
Workflow Downloading Inventory Tools Evaluation Tool
Control

Map and Annotation Template Online


Positioning Tools Management Monitoring &
Tools Communication

Metadata Inventory Location


Descriptions & Management Detection
Translations (Server side)

Repository

Fig. 5. La arquitectura abstracta de la plataforma intGuide (del lado del servidor). Los rectángulos redondeados designan componentes que
no son directamente visibles para los operadores del sistema, mientras que los rectángulos normales representan herramientas con una
interfaz gráfica de usuario.
medios alternativos de interacción, incluso para
Una versión de cliente para la plataforma Symbian personas mayores y menos informáticas. La
60 teléfonos inteligentes está actualmente en conciencia del contexto es ya un paso importante
desarrollo. hacia la simplificación de la interacción, ya que los
movimientos de los usuarios están eliminando la
La plataforma intGuide también aborda la necesidad necesidad de recuperación de información a petición,
de las organizaciones que deseen desplegar servicios pero la eficiencia adicional puede depender del uso de
orientados al contexto para optimizar sus ofertas, formas más naturales de comunicación. Actualmente
mediante la introducción de una herramienta de estamos diseñando las partes de la herramienta de
evaluación estadística. creación, lo que permitirá la creación de enlaces entre
las partes interactivas del contenido y los medios de
9. Trabajos futuros entrada alternativos, si están disponibles. Dado que la
plataforma intGuide sirve para un amplio espectro de
Actualmente, intGuide está entrando al mercado en dispositivos cliente, esta tarea está mostrando una
su versión inicial. Una solución completa adaptada mayor complejidad con cada nuevo tipo de dispositivo
al patrimonio cultural evolucionó con base en esta añadido.
plataforma, bajo el nombre de producto intCulture.
Utiliza la plataforma intGuide en su núcleo y añade
todas las partes específicas del dominio de la
aplicación, necesarias para que intGuide funcione 10. Conclusión
fácilmente para una organización de memoria
(cultural). El desarrollo de una plataforma compleja de software
para la prestación de servicios, como los servicios
Nuestro trabajo en la plataforma principal, intGuide, sensibles al contexto, requiere conocimientos técnicos
continuará hacia una versión más reciente con el y experiencia práctica en un amplio espectro de áreas
foco en tecnologías avanzadas de personalización e de especialización. Para poder crear una plataforma
interactividad multimodal en el lado del cliente. El algo genérica y útil, es necesario desarrollar
objetivo es, por un lado, disminuir la información soluciones más pequeñas dentro del contexto de
necesaria del usuario para crear una experiencia aplicaciones prácticas. Nuestra estrategia para obtener
personalizada. Por otro lado, el trabajo relacionado esta experiencia se basó en una serie de
con la interactividad multimodal es necesario para colaboraciones exitosas en el marco de Proyectos
incrementar la aceptación de los dispositivos clientes Europeos. Hemos demostrado cómo combinar el
en una amplia gama de usuarios finales y explorar trabajo de investigación complementario de un total
de 5 años y un conjunto de proyectos para crear el 946 y
algunos de los proyectos mencionado anteriormente,
valor añadido necesario para el desarrollo de una también la evolución intGuide. Además, queremos
plataforma para servicios sensibles al contexto con agradecer explícitamente a la Universidad de
tecnología avanzada de visualización. Hemos Economía de Poznan, al Zentrum fuer Graphische
presentado proyectos de investigación relacionados Datenver- barbeitung Darmstadt, a la Universidad de
con la realidad aumentada y mixta y su arquitectura Manche- rast, al INRIA (Instituto Nacional de
y cómo han contribuido al desarrollo de la Investigación en Informática y Automática), a la
plataforma comercial global. Universidad de Bristol Centro de Computación
Gráfica en Portugal, Universidad de Essex,
Universidad de Uppsala, ENST (Universidad
Expresiones de gratitud Nacional de Suplente), ONDIM, Ladbrokes UK,
INTRALOT, Universidad de Hannover, Francia
Todo el trabajo presentado en este artículo está Telecom R & D, Thomson Multimedia R & D, Uni -
respaldado por el marco IST de la Comisión versidad de Creta, la Hellenic Broadcasting
Europea. Dentro de estos proyectos, muchos socios Organization, Cosmote, Vodafone Grecia para la
participaron activamente y contribuyeron de manera cooperación óptima en los proyectos mencionados.
significativa al éxito del resultado. La mayoría de las Por último, queremos agradecer a Michalis
cifras presentadas aquí son propiedad de los Karagiozidis, coordinador del proyecto LoVEUS por
respectivos consorcios de proyectos. Sin hacer una la información relacionada con el proyecto Loveus, y
diferenciación entre el valor de las contribuciones, Nikos Pronios, director del Departamento de Nuevas
los autores desean agradecer a Fraunhofer IGD y Tecnologías y Mercados de INTRA- COM, para la
especialmente al equipo del Dr. Didier Stricker, así supervisión administrativa de todos los proyectos
como a A & C 2000 por su continuo apoyo y previamente mencionado.
cooperación en todos los esfuerzos relacionados con

También podría gustarte