Quisiéramos que leyera este texto en voz alta para que
NaturallySpeaking pueda acostumbrarse a su voz. Cuando haya
terminado de leer, haremos algunos ajustes tras los cuales podrá comenzar a dictar. El texto que va a leer explica algunas de las razones por las que hablarle a su PC no es igual que hablarle a una persona.
La capacidad de hablar es un talento que damos por sentado. El
hecho de que podamos hablar e interpretar el habla no nos impresiona mucho. A los tres años, la mayoría de nosotros ya somos capaces de entender perfectamente lo que se nos dice.
La tecnología del reconocimiento del habla es relativamente
reciente y, no obstante, pretendemos que las máquinas sean expertas en el arte de una buena conversación. Es cierto que juegan al ajedrez mejor que la mayoría de nosotros y efectúan cálculos complejísimos con una rapidez impresionante. Sin embargo, aún no están a la par de nuestras expectativas.
Esto no significa que su PC no pueda entender bien el lenguaje
hablado, sino que aún no se puede comparar con lo que somos capaces de hacer los humanos. Piense en lo que hacemos cada vez que hablamos con alguien...
El primer desafío es identificar lo que es voz y lo que es
ruido. Nuestra capacidad de filtrar los ruidos ambientales permite que conversemos casi en cualquier parte: en estaciones de tren, en pistas de baile, mientras despega un avión... Sería muy aburrido si tuviéramos que aislarnos cada vez que quisiéramos hablar con alguien.
Para una máquina, sin embargo, no es fácil saber en qué
sonidos concentrarse. Para que su voz se entienda, tiene que dictar en un ambiente silencioso y hablar claramente a un micrófono especial que haya sido colocado en la posición correcta.
El segundo desafío es reconocer la voz de varias personas. No
tenemos ningún problema en charlar un momento con la tía María, que tiene una voz aguda y fina, y después con el primo Pablo, que tiene una voz de barítono. Cuando conocemos a alguien, nos adaptamos fácilmente a su timbre, tono, volumen y acento, sin tener que pedirle que primero nos hable durante algunos minutos.
Su PC necesita tiempo para adaptarse a las características
únicas de cada voz. El proceso de enseñarle al software a reconocer su manera de hablar se denomina "entrenamiento" y es lo que está haciendo ahora.
Afortunadamente, los programas de reconocimiento del habla
están mejorando y los procesadores son cada vez más rápidos, por lo que el tiempo de entrenamiento se ha reducido a tan sólo unos minutos. Para un porcentaje pequeño de personas, sin embargo, algunos minutos pueden no ser suficientes.
Si después de efectuar el entrenamiento nota que
1 NaturallySpeaking comete muchos errores, es posible que sea necesario dedicarle más tiempo al entrenamiento.
Otro desafío del reconocimiento del habla es saber cómo
distinguir entre dos o más frases que suenen casi iguales. Para hacer frente a este problema, las personas se valen del contexto para distinguir entre "qué elocuente" y "que él lo cuente". Utilizamos el contexto continuamente para descartar las interpretaciones que no tengan sentido.
Los programas de reconocimiento del habla no conocen el
significado de las palabras y no pueden aplicar sentido común. Lo que sí hacen es llevar un registro de la frecuencia con que aparecen palabras individuales y combinaciones de palabras. Esta información le ayuda al programa a escoger las palabras o frases que tienen mayor probabilidad de ser las correctas.
Este programa, además, incluye una función que analiza
documentos y añade las palabras que no están en el vocabulario. Puede así enriquecer el vocabulario y aumentar la capacidad del programa de reconocer las palabras que normalmente emplea cuando dicta.
Además, como si el reconocimiento no fuera ya de por sí
complicado, a menudo balbuceamos, pronunciamos mal u omitimos palabras. Asumimos, por lo general correctamente, que los oyentes podrán completar los espacios en blanco. Desgraciadamente, las máquinas todavía no son capaces de entender un discurso incompleto y no pueden adivinar lo que no se ha pronunciado.
Una de las maneras más eficaces de obtener un buen
reconocimiento es hablar uniforme y claramente cuando se dicta, como un narrador de noticias o un locutor de radio. Intente componer sus pensamientos antes de comenzar a hablar. Esto ayudará a pronunciar frases más largas y naturales.
Hable a un ritmo normal. Es más fácil que otra persona
comprenda lo que dijimos si lo repetimos más despacio. Sin embargo con las computadoras esto no funciona, porque el programa busca patrones de sonidos predecibles cuando intenta reconocer palabras. Si pronuncia cada sílaba por separado, Dragon NaturallySpeaking intentará transformar cada sílaba en una palabra.
Mientras usted lee este texto, Dragon NaturallySpeaking se
está adaptando al volumen y tono de su voz. Es por eso que cuando dicte debería hablar como lo está haciendo ahora. Si grita o murmura, la calidad del reconocimiento disminuirá.
Por último, evite decir palabras innecesarias que no quiere
ver en su documento, como "este... "ah" o "eh". El programa no puede saber cuáles son las palabras importantes y simplemente transcribe todo lo que oye.
Ya verá: con algo de práctica, desarrollará el hábito de
dictar con voz clara, constante y el reconocimiento mejorará. 2 Está a punto de terminar el entrenamiento. Esperamos que a partir de ahora vea la capacidad de hablar bajo una nueva óptica. También esperamos que estos consejos le sean útiles... ¡y que disfrute mientras habla con su PC!