Está en la página 1de 3

Quisiéramos que leyera este texto en voz alta para que

NaturallySpeaking pueda acostumbrarse a su voz. Cuando haya


terminado de leer, haremos algunos ajustes tras los cuales
podrá comenzar a dictar. El texto que va a leer explica
algunas de las razones por las que hablarle a su PC no es
igual que hablarle a una persona.

La capacidad de hablar es un talento que damos por sentado. El


hecho de que podamos hablar e interpretar el habla no nos
impresiona mucho. A los tres años, la mayoría de nosotros ya
somos capaces de entender perfectamente lo que se nos dice.

La tecnología del reconocimiento del habla es relativamente


reciente y, no obstante, pretendemos que las máquinas sean
expertas en el arte de una buena conversación. Es cierto que
juegan al ajedrez mejor que la mayoría de nosotros y efectúan
cálculos complejísimos con una rapidez impresionante. Sin
embargo, aún no están a la par de nuestras expectativas.

Esto no significa que su PC no pueda entender bien el lenguaje


hablado, sino que aún no se puede comparar con lo que somos
capaces de hacer los humanos. Piense en lo que hacemos cada
vez que hablamos con alguien...

El primer desafío es identificar lo que es voz y lo que es


ruido. Nuestra capacidad de filtrar los ruidos ambientales
permite que conversemos casi en cualquier parte: en estaciones
de tren, en pistas de baile, mientras despega un avión...
Sería muy aburrido si tuviéramos que aislarnos cada vez que
quisiéramos hablar con alguien.

Para una máquina, sin embargo, no es fácil saber en qué


sonidos concentrarse. Para que su voz se entienda, tiene que
dictar en un ambiente silencioso y hablar claramente a un
micrófono especial que haya sido colocado en la posición
correcta.

El segundo desafío es reconocer la voz de varias personas. No


tenemos ningún problema en charlar un momento con la tía
María, que tiene una voz aguda y fina, y después con el primo
Pablo, que tiene una voz de barítono. Cuando conocemos a
alguien, nos adaptamos fácilmente a su timbre, tono, volumen y
acento, sin tener que pedirle que primero nos hable durante
algunos minutos.

Su PC necesita tiempo para adaptarse a las características


únicas de cada voz. El proceso de enseñarle al software a
reconocer su manera de hablar se denomina "entrenamiento" y es
lo que está haciendo ahora.

Afortunadamente, los programas de reconocimiento del habla


están mejorando y los procesadores son cada vez más rápidos,
por lo que el tiempo de entrenamiento se ha reducido a tan
sólo unos minutos. Para un porcentaje pequeño de personas, sin
embargo, algunos minutos pueden no ser suficientes.

Si después de efectuar el entrenamiento nota que


1
NaturallySpeaking comete muchos errores, es posible que sea
necesario dedicarle más tiempo al entrenamiento.

Otro desafío del reconocimiento del habla es saber cómo


distinguir entre dos o más frases que suenen casi iguales.
Para hacer frente a este problema, las personas se valen del
contexto para distinguir entre "qué elocuente" y "que él lo
cuente". Utilizamos el contexto continuamente para descartar
las interpretaciones que no tengan sentido.

Los programas de reconocimiento del habla no conocen el


significado de las palabras y no pueden aplicar sentido común.
Lo que sí hacen es llevar un registro de la frecuencia con que
aparecen palabras individuales y combinaciones de palabras.
Esta información le ayuda al programa a escoger las palabras o
frases que tienen mayor probabilidad de ser las correctas.

Este programa, además, incluye una función que analiza


documentos y añade las palabras que no están en el
vocabulario. Puede así enriquecer el vocabulario y aumentar la
capacidad del programa de reconocer las palabras que
normalmente emplea cuando dicta.

Además, como si el reconocimiento no fuera ya de por sí


complicado, a menudo balbuceamos, pronunciamos mal u omitimos
palabras. Asumimos, por lo general correctamente, que los
oyentes podrán completar los espacios en blanco.
Desgraciadamente, las máquinas todavía no son capaces de
entender un discurso incompleto y no pueden adivinar lo que no
se ha pronunciado.

Una de las maneras más eficaces de obtener un buen


reconocimiento es hablar uniforme y claramente cuando se
dicta, como un narrador de noticias o un locutor de radio.
Intente componer sus pensamientos antes de comenzar a hablar.
Esto ayudará a pronunciar frases más largas y naturales.

Hable a un ritmo normal. Es más fácil que otra persona


comprenda lo que dijimos si lo repetimos más despacio. Sin
embargo con las computadoras esto no funciona, porque el
programa busca patrones de sonidos predecibles cuando intenta
reconocer palabras. Si pronuncia cada sílaba por separado,
Dragon NaturallySpeaking intentará transformar cada sílaba en
una palabra.

Mientras usted lee este texto, Dragon NaturallySpeaking se


está adaptando al volumen y tono de su voz. Es por eso que
cuando dicte debería hablar como lo está haciendo ahora. Si
grita o murmura, la calidad del reconocimiento disminuirá.

Por último, evite decir palabras innecesarias que no quiere


ver en su documento, como "este... "ah" o "eh". El programa no
puede saber cuáles son las palabras importantes y simplemente
transcribe todo lo que oye.

Ya verá: con algo de práctica, desarrollará el hábito de


dictar con voz clara, constante y el reconocimiento mejorará.
2
Está a punto de terminar el entrenamiento. Esperamos que a
partir de ahora vea la capacidad de hablar bajo una nueva
óptica. También esperamos que estos consejos le sean útiles...
¡y que disfrute mientras habla con su PC!

También podría gustarte