Está en la página 1de 4

desar

ay Sistema de comando remoto


ro
ademi

por voz para un mvil


llo
Ac

RESUMEN herramientas elctricas, computadores y robots, do-


Hugo Velasco tados con la capacidad de atender a comandos de voz,
Miguel Escandn En este documento se presenta un estudio pro- dados por el operario del dispositivo. Es por ello que
gresivo de algunas de las principales tecnologas dis- en la actualidad, muchas empresas desarrolladoras de
Csar Rodrguez
ponibles para el reconocimiento de voz y comunica- tecnologa se encuentran trabajando en prototipos de
ciones inalmbricas. Finalizando con la implemen- bajo costo, para brindar al usuario final la facilidad de
tacin de un sistema mvil, que responde a la voz de interfaces hombre-mquina mucho mas amigables,
un usuario, haciendo uso de mtodos eficientes para abrindose de este modo un mercado potencial de
el control de movimiento. productos electrnicos. Estas nuevas tecnologas tam-
El sistema de reconocimiento de comandos de voz bin contribuirn a mejorar la calidad de vida de per-
conseguido tras la evaluacin de varias opciones, se lo- sonas con discapacidades fsicas [1].
gr a travs de la utilizacin del circuito integrado Por lo tanto es necesario, hacer uso de la tecnologa
HM2007, en el cual se encuentra implementada una disponible para llegar a aplicaciones tiles, y de esta
red neuronal para la identificacin de comandos voca- manera poder valorar los alcances reales de la misma;
les. Los comandos son codificados y transmitidos pos- evaluando parmetros de confiabilidad, relacin cos-
teriormente va infrarrojo. La informacin llega al m- to beneficio y escala de integracin entre otros.
vil y es procesada por los sistemas de control digital,
que gobiernan de manera directa su comportamiento. Este artculo se organiza de la siguiente manera:
El sistema de reconocimiento de voz es porttil e en la seccin 2 se da a conocer el problema. En la
independiente del mvil, al que comanda de forma seccin 3, se realiza un estudio sobre algunas de las
remota, de modo que se puede adaptar a otras ta- principales tecnologas disponibles tanto para el re-
reas, que impliquen el control por voz. conocimiento de voz, como para la transmisin de
datos. En la seccin 4, se detalla la forma en que fue
Palabras clave: Reconocimiento de comandos de implementado un modelo de aplicacin, para la com-
voz, redes neuronales, comunicacin IR, manejo efi- probacin del sistema de voz. En la seccin 5, se
ciente de la energa. plantea el uso de otra tecnologas para la mejora de
los resultados obtenidos.
ABSTRACT
This document presents a study of some of the II. PLANTEAMIENTO DEL PROBLEMA
main technologies available for speech recognition Se busca disear un sistema de comando remoto y
and wireless communications. Also the porttil capaz de responder a ordenes dadas por voz
implementation of a mobile system is presented, this humana, y a partir de dichas rdenes, realizar el con-
mobile is able to respond to the users voice, by using trol de un mvil accionado por motores. El sistema
of efficient methods for the movement control. de reconocimiento de voz debe ser adaptable a mvi-
Se busca disear The speech recognition system of voice les de cualquier tamao, para ampliar el rango de apli-
caciones (sillas de ruedas, montacargas, juguetes, etc.).
un sistema de commands obtained after evaluation of several
comando remoto options, was achieved through the use of integrated Para llevar a cabo la realizacin de este sistema se
y porttil capaz circuit HM2007, which is implemented in a neuronal recurri al uso y contraste de diferentes tecnologas
de responder a network, for vocal commands identification. The como procesamiento digital de seales (DSP) y sis-
commands are codified and transmitted later by temas expertos para el reconocimiento del habla,
ordenes dadas infrared way. The information arrives at the mobile
por voz humana, evaluando caractersticas relativas a software como
and is processed by the control digital systems, which tiempo de respuesta y efectividad de interpretacin,
y segn estas, govern of direct way his behavior. The speech as como las relativas a hardware considerando con-
realizar el control recognition system is portable and independent of sumo de energa y portabilidad.
de un mvil mobile, which it commands of remote form to, so
accionado por that it could be adapted to other tasks, that imply De igual manera para el desarrollo del sistema de
motores. the speech control . comunicacin remota se estudiaron tecnologas de
comunicaciones inalmbricas de RF (Radio Frecuency)
e IR (Infra Red), realizando una comparacin de cos-
I. INTRODUCCIN to / beneficio, eficiencia, y facilidad de manejo, de tal
En el futuro cercano, ser cada vez mas comn forma que se obtuviera un sistema confiable, y adap-
Artculo recibido en Abril de 2002
Aceptado en Junio de 2002 encontrar sistemas electrnicos como: juguetes, table segn las necesidades de la aplicacin.

72 Vol. 7 No.1
No.1
Ingeniera
III. DESCRIPCIN Y ANLISIS Este mtodo presenta varios inconvenientes debi-
do a que se toman muestras de 0.5 segundos para su
DE TECNOLOGAS anlisis. Si este tiempo no coincide con el momento
en que se habla, la evaluacin de la palabra es inco-
Una vista final del mvil se observa
rrecta; adems presenta un gran retardo en lograr la
en la figura 1, donde se aprecian los
identificacin del comando dado.
mdulos de comunicaciones, potencia,
sensrica y control. La segunda op-
cin que se estu-
La figura 2, presenta el diagrama de dio fue el integra-
bloques del sistema final. Las tres di- do HM2007 de
visiones que se observan all, corres- H U A L O N
ponden a los siguientes tpicos: Microelectronic
Sistemas de reconocimiento de voz Corp., el cual
Fig. 1. Vista real del prototipo. Comunicaciones. consiste en una
Sistemas de locomocin y control red neuronal apli-
del mvil. Fig. 4. Presentacin final del kit de
cada al reconoci-
desarrollo del HM 2007.
Se destaca el teclado de miento de co-
3.1 Sistema de reconocimiento
RECONOCIMIENTO POTENCIA programacin, el micrfono para la mandos de voz.
DE HABLA
(HM2007) de comandos de voz captura de voz y la salida en BCD. En la figura 4 se
SCVR MVIL
CONTROL
(AT8951 El sistema de reconocimiento de co- muestra el mdulo de reconocimiento de voz, a tra-
mandos de voz SRCV, es la parte ms
MC68HC908JL3)
vs del cual se toma la seal de voz, se procesa y
COMUNICACIONES
IR
COMUNICACIONES importante de este proyecto, de su efi- finalmente, se genera un cdigo digital el cual est
TX (MC145026) RX (MC145027)
ciencia para reconocer los comandos asociado al comando que ha reconocido.
Fig. 2 Diagrama del bloques del sistema de de voz, depende en gran parte los re-
comando remoto. Se muestran las relaciones sultados finales del sistema. Algunas de las caractersticas del HM 2007 son:
entre el SCVR, las comunicaciones y el mvil
Para tal efecto, se presentaron dos Reconocimiento mximo de 40 palabras de 0.96
opciones como las ms viables para dar solucin al segundos de duracin.
problema. Una primera opcin consiste en lograr la Reconocimiento mnimo de 20 palabras de 1.92
identificacin de las palabras haciendo uso de anli- segundos de duracin.
sis estadstico. As se desarrollo un programa en Soporte de RAM externa, donde se almacenan los
LabVIEW [2], sobre una plataforma PC con descriptores de cada palabra.
procesador AMD K6-II de 400MHz y 64MB de Soporte de micrfono externo.
memoria RAM. El mtodo implementa el estudio Utiliza tecnologa CMOS LSI, con lo que se tiene
de patrones estadsticos de la voz, tales como: un bajo consumo de energa.
varianza, desviacin estndar, tercer momento, etc.,
y factores deducibles a partir de sus componentes Se escogi este CI debido a su relacin costo/pres-
en frecuencia como potencia media, picos de poten- taciones, dentro de una moderada gama de integra-
cia, armnicos etc. Con este primer mtodo se logr dos que se pueden conseguir en el mercado. Este
una efectividad de aproximadamente un 80% en di- integrado reconoce un 100% ms de palabras, que
ferenciar palabras, cuando el programa es configu- otros que realizan la misma funcin.
rado para un usuario en particular. Un detalle del Este integrado facilita enormemente la labor de en-
software en LabVIEW, se muestra en la fig. 3. trenamiento y reconocimiento de voz, ya que cuenta
con interfaces para teclado matricial 4x3, junto con una
salida de datos en BCD, lo cual facilita el manejo y la
decodificacin de las instrucciones.
Con la red neuronal, se obtuvo una efectividad del
89% para reconocer los comandos entrenados, para
la persona que realiz el entrenamiento. Para otras
personas vara entre un 60% a un 85% de efectividad.
Despus de haber evaluado estas tecnologas para
el reconocimiento de voz, se escogi usar el CI
HM2007, por cumplir mejor con los requerimientos
de portabilidad y relacin costo-eficiencia.

3.2. COMUNICACIONES
Cuando se reconoce una palabra previamente en-
trenada se le enva un cdigo al mvil para que adopte
una opcin de movimiento, las palabras que se eli-
Fig. 3. Detalle del cdigo fuente del software para la
identificacin de comandos de voz en LabVIEW.
gieron se observan en la tabla I junto con el respec-
tivo cdigo que se le enva al mvil:

Vol. 7 No.1
No.1 73
Ingeniera
TABLA I. Voces entrenadas por el usuario y cdigos Es importante que la comuni- emite informacin en el mismo canal de comunica-
asociados para interpretacin por parte del control cacin entre el mvil y el sistema cin, seleccionado por el receptor, es decir, el mvil.
del sistema, para cada accin. de voz sea confiable, de manera
que se eliminen posibles fallas del Cuando la seal es activa en ambos receptores, el
VOZ DE
ACCIN
MANDO
CODIGO sistema. Tambin es necesario sistema de control toma la decisin de dar marcha
tener en cuenta, la posibilidad de hacia adelante a ambos motores, para dirigir el mvil
00100000
Adelante GO
00110000 01000000 una futura ampliacin de los sis- hacia la fuente. Si alguna seal se pierde en este pro-
00010001 temas u opciones en el compor- ceso, el control
Atrs BACK
00100001 00110001 tamiento del mvil. produce un giro
Izquierda IZQ
00010010 correctivo del
00100010 00110010 El desarrollo del sistema de mvil hacia la
00010011
Derecha DER
00100011 00110011 comunicaciones comenz con direccin en la
00000100 00010100 el estudio de factibilidad de un cual an se en-
Alto STOP
00100100 00110100 sistema inalmbrico RF basado cuentra presen-
Acelere FAST
00001000 00011000 en el CI TRF6900 de Texas te la seal de re-
00101000 00111000 Instruments [3]. Este sistema cepcin. Esto
00001001 00011001
Desacelere SLOW
00101001 00111001 presentaba bastantes compleji- Figura 5. Comportamiento grfico del se muestra en la
00010000 00000001 dades tcnicas para su desarro- algoritmo de seleccin. Las flechas figura 5.
Ven COME
00000010 00000011 llo debido a costos, el tiempo indican el sentido de giro de las llantas.
de implementacin y tolerancia
de los componentes externos, aunque es una op- IV. MVIL
cin para tener en cuenta en un trabajo futuro de-
bido a sus caractersticas de alcance y disponibili- El proceso de diseo tuvo en cuenta las etapas a
dad del enlace SRCV - Mvil. continuacin, en las cuales se fija como parmetro prin-
cipal la eficiencia del sistema.
Una segunda alternativa para lograr la comunica-
cin entre el SRCV y el mvil utiliza un par de trans-
misin-recepcin de datos fabricado por Motorola, 4.1 Sistema de traccin del mvil
especial para comunicaciones seriales por infrarrojo, Dado que el mvil debe salir de dificultades cuan-
MC145026 (emisor) y MC145027 (receptor). Estos do se encuentre en condiciones adversas como un
permiten transmitir las palabras ya codificadas hacia terreno escabroso u obstculos, es importante que
el mdulo de control aprovechando los datos de un el sistema de traccin sea lo mas potente posible.
nibble de longitud que se pueden enviar por medio
de estos integrados [4], [5]. Para tal fin, se adopt
como plataforma mecni-
Dada la confiabilidad en la transmisin lograda, ca del mvil, dos carros de
gracias a los sistemas de prevencin de errores inter- bateras comnmente co-
nos que poseen los integrados MC1450CXX y a su nocidos como Buggy
flexibilidad para establecer diferentes canales de co- acoplados lateralmente; un
municacin, se adopt la opcin IR, como sistema a dibujo esquemtico del
implementar en el prototipo final. Fig. 6. Esquemtico del acople se ve en la figura 6.
sistema de traccin del mvil.
En el prototipo realizado, el operario del mvil cuenta
con un transmisor que tiene una direccin que selec- Cada uno de estos carros cuenta con un motor
ciona un canal especfico; en el mvil se instala un re- DC con una tensin nominal de 3 voltios, y caja de
ceptor con el mismo canal habilitado. El circuito de transmisin con una relacin de 58,57:1. Esto mues-
control sabe cual es el respectivo nmero que identifica tra que la velocidad sobre las llantas no es muy alta,
Debido a que es a cada una de las instrucciones (ver tabla I) y depen- pero el torque que se desarrolla en ellas s lo es. Por
necesario diendo de cual sea este, ejecutar la accin correspon- lo cual, una carga hasta de una libra puede ser trans-
controlar el diente al comando de voz. portada con facilidad (en este caso, la carga est cons-
sentido de giro tituida por los sistemas electrnicos y una batera).
Adems, se utilizaron estos CI para implementar
del mvil se la funcin de bsqueda de la base remota (el lugar Debido a que es necesario controlar el sentido de
hacen girar los en que se encuentra ubicado el SRCV) por parte del giro del mvil se hacen girar los motores en direccio-
motores en mvil. Esta funcin se basa en el uso de dos recep- nes opuestas, lo que da como resultado un movimien-
direcciones tores MC145027, aislados de tal forma, que recono- to circular alrededor del centro del eje.
opuestas, lo que cen la fuente de transmisin de manera unidireccional
da como y por medio de un algoritmo de seleccin), permi- 4.2 Sistema de potencia
ten al mvil dirigirse hacia la base de transmisin.
resultado un Dado que en un sistema mvil, la energa que se
movimiento El algoritmo de seleccin consiste en la evaluacin puede transportar es limitada, la alimentacin puede
circular de las seales provenientes de cada uno de los sensores llegar a ser un problema. La primera solucin que se
alrededor del IR. Estos generan una seal en estado alto TTL, en el plante fue la utilizacin de dos bateras, ya que en la
centro del eje. momento de detectar la fuente de transmisin, que prctica se presentaron problemas de ruido, que afec-
taban el comportamiento del circuito de control. Lo

74 Vol. 7 No.1
No.1
Ingeniera
anterior en el momento en que se efectuaba algn cam- cabo la ejecucin de un mvil a mayor escala, que
bio de estado sobre los motores, por lo tanto fue ne- permita transportar una persona.
cesario desacoplar totalmente el sistema de alimenta-
cin, de los sistemas de traccin y control. Tambin se proyecta el uso de tecnologas, como
la transformada Wavelet, que permitan obtener un
La alimentacin del mvil es una batera de 6V @ mayor desempeo del sistema, en cuanto a la efecti-
4Ah (Amperios hora). Fue escogida porque brinda una vidad del reconocimiento de los comandos. Es de-
autonoma bastante amplia para el funcionamiento de cir, hacer posible que cualquier usuario pueda ope-
los sistemas. La batera tiene unas dimensiones rar el sistema, con un 100% de confiabilidad.
(108mm x 70mm x 47mm) y peso (0.9kg), apropiados
para la capacidad de carga del sistema de traccin.
Para obtener la alimentacin regulada del circuito de CONCLUSIONES
control, se utiliz un conversor reductor LM2678T-5 Dado que los requerimientos tanto de hardware
de National Semiconductors [6], de 5V @ 3A. como de software, necesarios para realizar el procesa-
El manejo de los motores se realiza por medio de miento de las seales y en este caso seales de voz son
relevos electromecnicos, configurados como puente tan grandes, los tiempos de respuesta que se deben
H, para conseguir la inversin de la polaridad. Se hace esperar de ningn modo cumplen con exigencias de
necesario adems, minimizar las prdidas que puedan tiempo real. Por lo tanto las aplicaciones en las cuales
tener los interruptores que se conmutan en el puente se utilice este sistema, no podrn demandar tiempos
H. Los relevos utilizados para la implementacin son despreciables de respuesta (tiempos menores a 2 seg).
los ATX221 M01 de doble bobina fabricados por NaiS. Cuando se realizan implementaciones, para m-
Estos relevos cuentan con memoria, ya que con slo dulos que requieren determinadas condiciones de au-
un pulso de corriente se logra el cambio de estado y tonoma y consumo de energa, la relacin peso vs.
sostenimiento de ste, sin necesidad de mantener capacidad Ah es un doble compromiso por parte del
energizada la bobina, esto por cada interruptor. Con diseador. Es decir, se requiere llegar a un rango p-
la aplicacin de un pulso sobre la otra bobina se logra timo, donde se presente el mnimo peso con la ma-
cambiar el estado del interruptor. yor autonoma.

En comparacin con los relevos clsicos, que deben De acuerdo con las pruebas realizadas al prototipo
mantener la alimentacin del electroimn para conser- final, durante el da, en un espacio cerrado e iluminado
varse en cierto estado, se logra un ahorro significativo con lmparas fluorescentes, se determin que se pueden
de energa. Esto en vista a que los cambios de accin alcanzar distancias mximas de transmisin de 15 m.
ocurren en un tiempo pequeo, con respecto al tiempo La interferencia de la luz es un problema crtico
que dura realizando una accin en particular. en el proceso de comunicaciones IR, entre los ele-
Para administrar la energa a los motores se utiliza mentos del sistema, ya que afecta los umbrales de
una modulacin por ancho de pulso (PWM) [7], [8], de deteccin de luz infrarroja.
la fuente de alimentacin, con lo que se obtuvo una El sistema cuenta con una efectividad para responder
mejora sustancial en la autonoma del mvil, al com- a los comandos de 60% a 85%, para cualquier usuario.
pensarse la cada de tensin que se presenta con el tiem-
po. Esto se logra con un incremento del porcentaje de
ciclo til mximo de la seal, con que se excita a los REFERENCIAS
motores. Este sistema se implemento por medio del [1] SEAL COLOMBIA. (Documental en Video). Bogot. Diciembre 2001.
mdulo de temporizacin del C MC68HC908JL3 de [2] NATIONAL INSTRUMENT. Labview basics course manual. April 1998
Motorola [9], que funciona como PWM. Edition.
[3] Spevak P., y Loy M. Texas Intruments. Application Report. SWRA034B -
May 2001.
[4] MOTOROLA. Encoder and Decoder Pairs. MC145026/D. Revisin 3. 1998.
4.3 Sistema de control del mvil [5] JAN AXELSON. Comunicaciones inalmbricas con PC. Electrnica y com-
El sistema de control del mvil se implementa por putadores. Cekit. 1997
[6] NATIONAL SEMICONDUCTOR. Power Ics Databook. USA. 1995.
medio de un microcontrolador 8951 de ATMEL [10] [7] SAVANT, RODEN y CARPENTIER, Diseo Electrnico. Addison-Wesley
junto al C MC68HC908JL3. La seleccin de estos Iberoamericana. USA. 1992.
dos C se debe al aprovechamiento de las caracters- [8] BOYLESTAD, Robert L.; NASHELSKY, Louis. ELECTRONICA: Teora de
Circuitos. 6 Ed. Prentice Hall Hispanoamericana S.A., Mxico DF. 1996.
ticas individuales, como nmero de puertos I/O dis- [9] MOTOROLA. MC68HC908GP32/H Technical Data. Revisin 5. Julio 2001.
ponibles en el 8951, y los perifricos de temporizacin [10] BERNAND ODANT. Microcontroladores 8051 y 8052. 1 Ed. Editorial Pa-
y conversin anlogo-digital que posee el JL3. La fun- raninfo. Madrid. 1995.

cin que desempea este conjunto hace posible reci- Hugo Fernando Velasco Pea
bir las seales de los sistemas de comunicacin y con Estudiante de Ingeniera Electrnica, Universidad Distrital. Integran-
base en los cdigos recibidos tomar las decisiones co- te del grupo de Instrumentacin Virtual. hvelasco@ieee.org
rrespondientes, como se describi anteriormente.
Miguel A. Escandn Moscoso
Estudiante de Ingeniera Electrnica, Universidad Distrital. Integrante
V. TRABAJO A FUTURO del grupo de Instrumentacin Virtual. miguelescandon@mixmail.com

Despus de la realizacin de un pequeo modelo Csar H. Rodrguez Garavito


Estudiante de Ingeniera Electrnica, Universidad Distrital. Integran-
del sistema de comando remoto, se podra llevar a te del grupo de Instrumentacin Virtual. cesar_rodriguez80@yahoo.es

Vol. 7 No.1
No.1 75
Ingeniera

También podría gustarte