Interfaz Ensayo

Introducción
Una persona llega a una parada de autobús y ve un anuncio interesante, con una dirección URL en
la parte inferior de la misma. Es s / él tratando de encontrar un pedazo de papel y escribir hacia
abajo o comience a escribir la dirección con su her / dispositivo móvil pequeño? No es probable.
Por ejemplo, si escribe una dirección URL simples como http://www.google.com/ requiere más de
70 teclas con algunos modelos de teléfono. Supongamos que s / él puede visitar la URL
simplemente señalando con su her / dispositivo móvil sin ningún tipo de clave de prensado.
Creemos que esta es la manera como la gente se va a utilizar los servicios electrónicos en el medio
ambiente en todas partes.
Relacionadas con el Trabajo

Hay una variedad de dispositivos y las etiquetas que se pueden utilizar una interfaz de usuario que
apunta en un entorno móvil. Nuestro trabajo se centra en los teléfonos móviles, pero un enfoque
similar se puede utilizar con otros dispositivos móviles. Välkkynen et al. (2003) usar una PDA con
etiquetas RFID. Una gran desventaja de la tecnología RFID es que no es comúnmente disponible. El
lector RFID no es un accesorio estándar en los teléfonos móviles y un lector de RFID adicional es
necesaria. También produce etiquetas RFID sigue siendo inaceptablemente costoso para la
producción en masa mientras que las etiquetas visuales se pueden imprimir y copiar con bajo
costo.
También IrDA puede usarse para activar las operaciones sobre un teléfono móvil en la forma
propuesta por Pohjanheimo, Ailisto y Plomp (2004). Otras posibilidades incluyen Bluetooth y NFC.
Todos ellos comparten un problema común: el usuario no puede ver la etiqueta o la viga, lo que
hace difícil señalar. IrDA y NFC han rayos muy estrechos con el que apuntar, y Bluetooth cubre
gran superficie por lo tanto el derecho de seleccionar el dispositivo BT es difícil. Señalando con una
cámara es natural y fácil en comparación con estos.
Hay varios sistemas mediante etiquetas visuales. El reconocedor de código Visual presentada por
Rohs y Gfeller (2004) es capaz de reconocer varias etiquetas al mismo tiempo de una imagen, con
1,5 segundos de tiempo de procesamiento cuando menos del 5 etiquetas están presentes y 2,5
segundos, cuando más de 10 marcas están presentes.
mantener fija la cámara durante varios segundos y se tarda unos diez segundos para
completar el procesamiento de imágenes. Nuestro sistema es capaz de reconocer los
marcadores dentro de 0,1 segundos.
ARTag, presentado por Fiala (2004), es un sistema de etiquetado para AR-aplicaciones

basadas en ARToolkit. Utiliza cantidad limitada de etiquetas que se usan para codificar los
números de identificación. Además, no es para el uso del móvil, pero un PC en su lugar.
CyberCode de Sony, presentado por Rekimoto y Ayatsuka (2000), utiliza marcadores

visuales con una cantidad muy limitada de datos en comparación con nuestra solución. Una
gran capacidad de almacenamiento de nuestros marcadores es una ventaja en aplicaciones
en las que se encuentra todos los datos en un marcador sin la necesidad de ir a buscar datos
adicionales de por ejemplo, red externa lento.
Algunos de los sistemas de codificación (etiquetas) son estándar, como matriz de los datos
(2000) y QR Code (2000). Sin embargo aún no existe una forma estándar para presentar el
tipo de datos, ni forma estándar sobre cómo un dispositivo móvil debe reaccionar a los
datos.
Una cámara se puede utilizar para la interfaz de usuario mediante la definición de etiquetas
visuales como botones de control como en SpotCode el Intel Research Laboratory (2004).
Intel utiliza etiquetas visuales, por ejemplo, para el control de rotación y control deslizante.
El uso de su control de la rotación no es adecuada para usuarios principiantes como señaló
Toye et al. (2004).
Estamos presentando una implementación rápida con una mayor capacidad de codificación
en comparación con otros sistemas de etiquetado visual. Además, la interfaz de usuario es
conveniente también para usuarios novatos.
Visual Descripción del tag

La capacidad de separación de color y balance de blancos de las cámaras conectadas a los
teléfonos con cámara siguen siendo pobres. El color del objeto en la imagen es variable
dependiendo de las condiciones de iluminación y el fondo, etc Por lo tanto utilizando un código de
color no es aconsejable como también señaló el Rohs y Gfeller (2004). El contraste de luminancia
es mejor observables. La diferencia de luminancia se maximiza cuando el uso de marcadores en
blanco y negro, y en los marcadores Además se reconocen también con cámaras de escala de
grises y que se pueden imprimir con b / w-impresoras. Nuestra marca se compone de cuadros en
blanco y negro, tres bordes negro y un borde blanco y negro diferentes.
El número de celdas de datos del marcador no es fijo. Hemos utilizado tamaños de 6x6 a 30x30, es
decir 36 a 900 celdas de datos. El tamaño más pequeño es más que suficiente para una
identificación simple marcador (256 diferentes). Estos pueden ser usados para aplicaciones en las
que no hay necesidad de leer más información de la marca y el pequeño tamaño físico de la marca
es esencial. En la actualidad, nuestros marcadores pueden tener hasta 600 bits de información que
significa aproximadamente 70 caracteres sin compresión o, por ejemplo una capacidad de 150
dígitos. Un ejemplo de los marcadores de los tamaños de 6x6 y 18x18 se encuentra en la figura 2.
Orientación de la marca es libre, ya que se detecta
desde el borde discontinuo. Los datos se compone de tres partes: un tipo de información o parte
de identificación de la aplicación, una parte de la información y una corrección de errores y la
parte de detección. La información puede ser de cualquier tipo: texto, caracteres especiales,
números, datos binarios, etc La información o el tipo de aplicación es un número de identificación
(ID) y le dice a la aplicación de detección de cómo reaccionar a los datos. Hemos definido
actualmente, por ejemplo, los tipos de identificación siguientes: texto, dirección, número de
teléfono, SMS, el control, por marcadores de identidad y juego. Cuando nuestra aplicación detecta
un marcador de tipo URL se abre la www-browser en el teléfono con la dirección codificada en la
parte de la información. Respectivamente, una llamada telefónica se establece automáticamente
en el caso de un número de teléfono. El texto se muestra al usuario, etc
La plataforma móvil
El problema general con los dispositivos móviles es que no es una plataforma de nivel general, por
lo que son puestas en práctica a menudo dependen del dispositivo. Aplicaciones para teléfonos
móviles que operan bajo condiciones muy restringidas, tales como una limitada capacidad de
procesamiento y una capacidad de memoria muy limitada.
Entre varias opciones, seleccionamos Symbian Serie 60 para la plataforma de desarrollo. La

selección se basó en la prevalencia y la disponibilidad del SDK de desarrollo.
Una de las diferencias significativas entre los PCs y los teléfonos móviles es aritmética. En
concreto, teléfonos con Symbian OS se construyen en torno a un procesador que carece de una
unidad aritmética de punto flotante y una instrucción de división. operaciones de punto flotante
son considerablemente más lenta que la aritmética de enteros que corresponde y debe ser
evitado.
En este trabajo se estudian y desarrollan métodos de procesamiento de imágenes sólo para un

pequeño conjunto de teléfonos móviles, a saber, Nokia 7650, 3650, 3660, 6600 y 7610. A pesar de
que todos son del mismo fabricante de los resultados y los métodos de este trabajo no son
específicos del fabricante. Todos los modelos antes mencionados son capaces de capturar
imágenes fijas VGA (640x480 píxeles). La resolución de captura máxima es de 1152x864 píxeles
para el Nokia 7610. Al utilizar un sistema operativo Symbian v6.1 SDK de la interfaz de captura de
imágenes, que es compatible con los modelos, sobre todo, nos enteramos de que la captura de
imagen VGA por lo general toma alrededor de 600 a 700 ms y ms a veces incluso más de 1300. Sin
embargo, la captura de imágenes de resolución baja continua de tamaño QQVGA (160x120
píxeles) es rápido.
Es posible utilizar un complemento de la lente con el Nokia 3660. Con el objetivo de la cámara es
capaz de concentrarse cerca del marcador (5-10 cm). La calidad de la lente no es muy alta. Véase
la figura 3.
Aplicación
Teclados actuales son muy pequeñas e incluso una operación tan simple como tomar una
instantánea al presionar la tecla de desplazamiento en el medio es torpe. Muy a menudo la prensa
se interpreta como una prensa a la derecha / izquierda / arriba / abajo en vez de el centro. Hemos
resuelto esto en nuestra solicitud de una imagen de captura automática en la que cada imagen se
busca una etiqueta visual. La aplicación no está tratando de capturar imágenes lo más rápido
posible, pero sólo a un ritmo de 8 fotogramas por segundo, es decir, una imagen QQVGA de cada
125 milisegundos. La tasa es lo suficientemente rápido para hacer la operación sin problemas y al
mismo tiempo que el procesador no se carga en exceso. Si la velocidad de fotogramas es mucho
menor que este sistema no es en tiempo real más y la que apunta se convierte en difícil. Una cruz
se dibuja para el usuario de señalar y orientar la ayuda. La cruz se retira y la vista se congela
después de la detección.
Nuestra aplicación tiene dos modos de operación. El primero utiliza sólo imágenes de baja
resolución. Es capaz de funcionar muy rápido pero requiere un mayor tamaño físico de una
etiqueta. El otro utiliza imágenes de baja resolución para el buen fin y para predecir la
probabilidad de existencia de etiquetas. Una imagen de resolución VGA se captura sólo cuando un
nivel de probabilidad determinado umbral es excedido. La información real se descifra de la
resolución de imagen VGA. El umbral es una opción dinámica y puede ser cambiado en la
aplicación por el usuario.
Resultados y rendimiento
La Figura 5 muestra ejemplos de las detecciones éxito. Las imágenes fueron tomadas de forma
automática tras el reconocimiento, mientras que el teléfono se trasladó a un espacio de detección.
El espacio de detección es un volumen donde la detección es correcta si la cámara apunta hacia
una etiqueta. Véase la figura 4.
La versión de alta resolución con el complemento de la lente es capaz de reconocer las

etiquetas con el tamaño de la celda de sólo 0,06 mm2. La figura 5.a tiene 100 células en el
área de 4 mm x 4 mm y en 5.b hay una etiqueta de tamaño de 6 mm x 6 mm con 324 celdas
de datos.The reading distance is 6-8 cm for both of them. El complemento de la lente se
utilizó sólo en estos dos casos.
Los próximos seis casos (c ah) todos tienen la misma etiqueta de tamaño 24 mm x 24 mm.
La distancia entre la cámara y la etiqueta en 5.c es de 25 cm, mientras que el ángulo de
visión es de 65 °. La distancia en los próximos (D a H) es de 25 cm, 42 cm, 11 cm, 24 cm y
7 cm, respectivamente.
Los dos últimos casos (I y J) tiene una etiqueta de tamaño 40 mm x 40 mm con 324 celdas
de datos y el reconocimiento se muestra a una distancia de 12 cm y 19 cm.
El modo VGA se utilizó en los primeros seis imágenes (A a F) y el modo QQVGA en el resto de ellas
(G a J).
La velocidad de reconocimiento depende de muchos otros objetos están situados cerca de una
etiqueta. El modo de baja resolución puede tardar hasta 200 ms para terminar la detección si la
imagen es lleno de objetos pequeños. La detección se completó en 30 a 80 ms en las figuras
5, letra g de 5.j aunque hay una fuerte interferencia de la luz que se ve como un conjunto de
objetos pequeños. El resto de las imágenes en la figura 5 se detectaron en el modo VGA de
800 a 950 ms (incluyendo 600 a 700 ms de tiempo de captura). Estos tiempos fueron
medidos usando el Nokia 7650 y 3660 que tienen una CPU corriendo a 104 MHz.
En nuestros experimentos no hay malas interpretaciones de los datos codificados se han
encontrado. Por ejemplo, cuando una llamada telefónica se puso en marcha, que fue
siempre el número correcto.
Trabajo Futuro
El desarrollo de los teléfonos móviles es rápido, cámaras en los teléfonos móviles,

especialmente, a mejorar todo el tiempo. Esto significa que con los dispositivos de futuro
que son capaces de utilizar menor tamaño físico y / o aumentar la cantidad de información
en las etiquetas visuales. También hay nuevos teléfonos con dos cámaras apuntando a
diferentes direcciones. Esto permite expansiones, por ejemplo en los juegos fueron otra
cámara se puede utilizar como un canal de entrada y el otro para el control.
Hay pruebas en curso de usuario con nuestro sistema para ayudar a las personas de edad
avanzada. Además simple llamada telefónica al señalar en una etiqueta pegada a las imágenes de
la gente también mensajes de texto fácilmente se comprueba que las personas mayores no están
acostumbrados a estar escribiendo mensajes de texto, etc El uso de mensajes fijos que se pueden
enviar simplemente apuntando a una etiqueta se prueba en comunicación entre el personal del
centro de atención y las personas de prueba.
El sistema de etiquetado visual se describe aquí se seguirá desarrollando (fiabilidad, la

flexibilidad, la solución de detección, etc.) Naturalmente, los resultados de la prueba de
usuario se tendrá en cuenta en el desarrollo del sistema.
Conclusión
La aplicación que aquí se presenta tiene en cuenta las restricciones del entorno de Symbian y la
aplicación de algoritmos de detección utiliza métodos de bajo nivel de optimización. Esto hace que
la velocidad del sistema.
Un flexible sistema de etiquetado visual en diferentes tamaños físicos y de almacenamiento

puede ser utilizada libremente permite el uso de las etiquetas adecuadas en todas las
situaciones diferentes. La parte de ID de la aplicación de las etiquetas permite una
plataforma de aplicaciones flexible. Todas las clases de activación se puede hacer en el
mismo todo en una sola aplicación. Esto hace que el uso del paradigma que apunta
agradable para el usuario, que sólo tiene que aceptar las acciones deseadas.
Uso de la predicción de la probabilidad antes de capturar una imagen de alta resolución

hace que la correcta aplicación, con el objetivo de la etiqueta es fácil porque las imágenes
de vista previa son capturados de forma continua en tiempo real y el tiempo que requiere el
procesamiento se inicia sólo después de la etiqueta se encuentra. Esto hace que el uso mejor
y más fácil.

Interfaz Ensayo

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Interfaz Ensayo

Cargado por

Copyright:

Formatos disponibles

Introducción

Relacionadas con el Trabajo

ARTag, presentado por Fiala (2004), es un sistema de etiquetado para AR-aplicaciones

CyberCode de Sony, presentado por Rekimoto y Ayatsuka (2000), utiliza marcadores

Visual Descripción del tag

Entre varias opciones, seleccionamos Symbian Serie 60 para la plataforma de desarrollo. La

En este trabajo se estudian y desarrollan métodos de procesamiento de imágenes sólo para un

La versión de alta resolución con el complemento de la lente es capaz de reconocer las

El desarrollo de los teléfonos móviles es rápido, cámaras en los teléfonos móviles,

El sistema de etiquetado visual se describe aquí se seguirá desarrollando (fiabilidad, la

Un flexible sistema de etiquetado visual en diferentes tamaños físicos y de almacenamiento

Uso de la predicción de la probabilidad antes de capturar una imagen de alta resolución

También podría gustarte