Está en la página 1de 10

Aplicaciones de

reconocimiento
automtico de voz y
conversin de texto a voz
usando Google y Elastix

Reconocimiento Automtico de Voz

ASR (por sus siglas en ingls Automatic Speech


Recognition)
Es una parte de la Inteligencia Artificial que tiene
como objetivo permitir la comunicacin hablada
entre seres humanos y computadores.
Funciona gracias a la cooperacin de un conjunto
de informaciones que provienen de diversas
fuentes de conocimiento como la acstica,
fontica, fonolgica, lxica, sintctica, semntica y
pragmtica

Reconocimiento Automtico de Voz


Llamada
Entrante

Asterisk
Grabacin
de la voz

El script AGI devuelve una


variable de canal a Asterisk

Script AGI
Se recibe el texto
con el contenido
de la grabacin

Envo de la
grabacin a google

Google

Reconocimiento Automtico de Voz


Componentes necesarios

Conexin a internet.

Interprete PERL (preinstalado en Elastix).

Librera perl-libwww (preinstalado en Elastix).

FLAC (preinstalado en Elastix).

Script AGI para comunicarse con google


(http://zaf.github.com/asterisk-speech-recog/)

Reconocimiento Automtico de Voz


Aplicacin practica

IVRs interactuando con la voz.

Marcacin con voz.

Manejo de aplicaciones internas de Asterisk.

Interactuar con servicios de publicacin y


redes sociales ( P. Ej: Twitter).

...

...

Posibilidades ilimitadas

Reconocimiento Automtico de Voz

TTS (por sus siglas en ingls Text To Speech)


Es una voz artificial lo suficientemente similar
al producido por una persona al leer un texto
cualquiera en voz alta.
Debe ser inteligible, natural y no debe requerir
ningn ajuste durante el proceso.

Conversin de Texto a Voz


Respuesta
al usuario

Asterisk
Se convierte el archivo de audio
a un formato que Asterisk sea
capaz de reproducir

Origen de texto desde


diversas fuentes.

Script AGI
Google responde
con el archivo de
audio.

Envo de texto a google

Google

Conversin de Texto a Voz


Componentes necesarios

Conexin a internet.

Interprete PERL (preinstalado en Elastix).

Librera perl-libwww (preinstalado en Elastix).

sox y mpg123 (preinstalados en Elastix).

format_sln (preinstalado en Elastix).

Script AGI para comunicarse con google


(http://zaf.github.com/asterisk-googletts/)

Conversin de Texto a Voz


Aplicacin practica

IVRs con respuestas dinmicas ( P. Ej:


Consultas a bases de datos ).
Lectura de servicios externos ( P. Ej: Fuentes
RSS )

Servicios para personas no videntes.

...

...

Posibilidades ilimitadas

Uso de las dos tecnologas juntas


Asterisk

Consulta del
usuario usando
ASR.

Lgica de la
aplicacin
Resultado en
texto para
TTS

Script AGI (API de interaccin)


Consulta del usuario
convertida a texto

Google

Resultado en audio
para el usuario

También podría gustarte