Está en la página 1de 5

Amazon Polly Guía para desarrolladores Cómo escuchar las voces

IdiomaNombres/

Nombres/

ID

ID

femeninos

masculinos

Enrique

Conchita

Español

(europeo)

(es- Lucía

ES)

Español

Mia

(México)

(es-

MX)

Penélope/

Miguel

(EE.UU.)

Español

Penelope

(es-

US)

Astrid

Sueco

(sv-

SE)

Turco

Filiz

(tr-

TR)

Gwyneth

Galés

(cy-

GB)

Con el fin de garantizar un soporte continuo para nuestros clientes, no tenemos previsto eliminar ninguna voz. Esto se aplica tanto a las voces disponibles actualmente como a las que lo estarán en un futuro.

Cómo escuchar las voces

Puede utilizar la consola de Amazon Polly para oír una muestra de cualquiera de las voces disponibles en Amazon Polly

Para escuchar una voz en Amazon Polly

1. Inicie sesión en la consola de administración de AWS y abra la consola de Amazon Polly.

2. Elija la pestaña Text-to-Speech.

3. Seleccione un idioma y una región; a continuación, elija una voz

4. Introduzca el texto que desea que lea la voz o utilice la frase predeterminada y, a continuación, elija Listen to speech (Escuchar fragmento hablado).

Puede elegir cualquiera de los idiomas que ofrece Amazon Polly y la consola mostrará las voces disponibles para ese idioma. En la mayoría de los casos, habrá al menos una voz masculina y una voz femenina, a menudo más de una de cada. Una voz es bilingüe (hindi e inglés de India) y algunos solo tienen una sola voz.

Note

El inventario de voces y el número de idiomas incluidos se actualiza de manera continua para añadir opciones adicionales. Si desea proponer un nuevo idioma o una nueva voz, no dude en

Amazon Polly Guía para desarrolladores Velocidad de la voz

dejar sus comentarios en esta página. Lamentablemente, no podemos hacer ningún comentario sobre los planes para lanzar nuevos idiomas específicos.

Cada voz se crea con hablantes nativos del idioma, por lo que existen variaciones entre las voces, incluso dentro del mismo idioma. A la hora de seleccionar una voz para un proyecto, pruebe cada una de las voces posibles con un fragmento de texto para comprobar cuál se adapta mejor a sus necesidades.

Velocidad de la voz

Debido a la variación natural existente entre las voces, cada voz disponible leerá el texto a velocidades ligeramente diferentes. Por ejemplo, con las voces del idioma inglés de Estados Unidos, Ivy y Joanna son ligeramente más rápidas que Matthew al decir "Mary had a little lamb" y notablemente más rápidas que Joey.

Dado que existe tanta variación entre las voces y que el grado de esa variación puede depender el texto que se lee, no hay una velocidad estándar (palabras por minuto) disponible para las voces de Amazon Polly. Sin embargo, puede saber el tiempo que tarda su voz en decir el texto seleccionado mediante las marcas de voz. Para obtener más información sobre el uso de marcas de voz en Amazon Polly, consulte Uso de marcas de voz (p. 26)

Para saber aproximadamente lo que se tarda en decir un fragmento de texto

1. Abra la CLI de AWS.

2. Ejecute el siguiente código, rellenándolo con sus datos según sea necesario

aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt

3. Abra LengthOfText.txt

Si el texto era "Mary had a little lamb", las últimas líneas devueltas por Amazon Polly serían:

{"time":882,"type":"viseme","value":"t"}

{"time":964,"type":"viseme","value":"a"}

{"time":1082,"type":"viseme","value":"p"}

El último visema, básicamente el sonido de las letras finales de "lamb" comienza 1082 milisegundos después del comienzo del fragmento de voz. Si bien no es exactamente la duración del audio, es un valor próximo y puede servir de base para la comparación entre voces.

En determinadas aplicaciones, es posible que prefiera que la voz que le gusta sea más lenta o más rápida. Si la velocidad de la voz es un problema, Amazon Polly ofrece la posibilidad de modificarla mediante etiquetas SSML.

Por ejemplo, si sus destinatarios hablan inglés, pero no de forma fluida, podría plantearse reducir la velocidad del fragmento hablado con el fin de darles un poco más tiempo para comprender.

Amazon Polly le ayuda a ralentizar la velocidad de la voz mediante la etiqueta SSML <prosody>, como en este ejemplo:

<prosody rate="slow">Mary had a little lamb.</prosody>

Amazon Polly Guía para desarrolladores Preguntas frecuentes

Dispone de cinco opciones de velocidad diferentes: x-slow, slow, medium, fast y x-fast. La velocidad de cada opción es aproximada, en función de su voz preferida, por lo que le recomendamos que pruebe la voz para ver si satisface sus necesidades. La opción medium es la velocidad normal de la voz.

Preguntas frecuentes

En este tema se ofrecen respuestas a las preguntas frecuentes sobre Amazon Polly.

Temas

Preguntas generales (p. 8)

Representación de contenido (p. 8)

Seguridad y confidencialidad de los datos (p. 9)

Preguntas generales

P: Tengo textos que utilizan diferentes estándares de codificación. ¿Qué estándar puedo usar con Amazon Polly?

Actualmente, Amazon Polly solo admite el estándar de codificación UTF-8.

P: ¿Puedo guardar el fragmento de voz sintetizada?

Cuando utilice la operación SynthesizeSpeech, puede guardar la salida de la síntesis para utilizarla en su propio sistema. También puede llamar a Amazon Polly, cifrar el archivo con una clave de cifrado y almacenarlo en Amazon Simple Storage Service (Amazon S3) o en cualquier otro almacenamiento seguro. La llamada a Amazon Polly de SynthesizeSpeech no tiene estado y no está asociada a ninguna identidad de cliente. No podrá recuperarla de Amazon Polly posteriormente.

Cuando se utiliza la operación StartSpeechSynthesisTask (síntesis asíncrona), la salida de la síntesis se almacena automáticamente en un bucket de Amazon S3. Puede recuperarlo como necesite. Para obtener más información al respecto, consulte Creación de archivos de audio largos (p. 138).

Representación de contenido

P: Me gustaría utilizar la misma voz en dos idiomas distintos. ¿Hay voces bilingües?

Actualmente solo hay una voz bilingüe: Aditi (hindi e inglés de India). El uso de una voz bilingüe le permite sintetizar el habla que incluye cualquiera de los dos idiomas por sí solo o ambos en un solo texto. Con Aditi, Amazon Polly también puede sintetizar el habla cuando contiene tanto Devangari (escritura hindi) como Romanagari (escritura latina).

Trabajamos sin descanso para mejorar las opciones de idioma de Amazon Polly, entre ellas aumentar el número de voces bilingües disponibles. Para obtener más información, consulte Voces bilingües (p. 20)

P: ¿Qué detalles de pcm se usan cuando se detecta pcm como formato de salida?

Cuando se usa pcm, el contenido devuelto es audio/pcm en un formato firmado de 16 bits, 1 canal (mono), little-endian.

P: Parte del texto se oye con el acento en la sílaba equivocada cuando Amazon Polly lo pronuncia. He intentado incluso con un acento agudo (U+0301) para marcar el énfasis, pero el acento sigue estando en la sílaba equivocada. ¿Cómo puedo solucionarlo?

Amazon Polly no reconoce actualmente los acentos agudos (U+0301) para marcar el énfasis en una sílaba. Sin embargo, hay dos formas de cambiar el énfasis en una palabra. Puede utilizar símbolos

Amazon Polly Guía para desarrolladores Seguridad y confidencialidad de los datos

fonéticos IPA y etiquetas SSML para alterar la pronunciación de la palabra. Para obtener más información, consulte Etiquetas SSML admitidas por Amazon Polly (p. 36). En algunos idiomas, también es posible utilizar un apóstrofo inmediatamente después de la sílaba para indicar un cambio en el énfasis. Por ejemplo, en ruso, las palabras страны́y стра́ны tienen distinto énfasis (marcado aquí con un acento agudo). No obstante, debido a que tienen una ortografía idéntica, Amazon Polly las pronunciará con el acento en la última sílaba, de acuerdo con el uso estándar del idioma. Puede utilizar un apóstrofo para marcar la sílaba acentuada de forma alternativa, como en стран'ы, y Amazon Polly pondrá el énfasis en la sílaba correcta.

P: Cuando utilizo viñetas en el texto, Amazon Polly no las reproduce correctamente. Dice "menos" cada vez que encuentra una. ¿Qué tengo que hacer?

Si utiliza "-" (un guion) como sustituto de una viñeta, en algunos idiomas, Amazon Polly lo reproduce como un signo menos. Si desea utilizar guiones para reemplazar una viñeta, puede hacerlo con una entrada de lexicón. Para obtener más información, consulte Administrar lexicones (p. 127).

P: Utilizo el símbolo "/" (barra inclinada) con frecuencia en el texto, especialmente al decir "y/o" y "sí/no". ¿Cómo representa esto Amazon Polly?

En inglés, Amazon Polly representa "and/or" en la síntesis de voz como "and or". En la actualidad, esta regla no está disponible en otros idiomas. En los idiomas distintos del inglés, Amazon Polly representa "sí/ no" como "sí barra inclinada no". Si desea cambiar este comportamiento, puede utilizar una entrada de lexicón. Para obtener más información, consulte Administrar lexicones (p. 127).

P: Cuando utilizo texto de un origen existente para sintetizar el habla mediante la AWS CLI en un equipo Linux, algunos caracteres UTF-8 parecen no funcionar con Amazon Polly, aunque esos mismos caracteres funcionan correctamente si se utiliza la consola. ¿Qué está ocurriendo?

Esto se debe a la forma en que el shell de Unix gestiona Unicode, y no es un problema específico de Amazon Polly. Existen dos opciones disponibles: puede localizar los caracteres problemáticos y sustituirlos en el texto de entrada, o bien puede utilizar una forma alternativa de acceso a Amazon Polly que no presente este problema, como la interfaz PHP. Se trata de un problema conocido y estamos trabajando para resolverlo, aunque solo lo generan unos pocos caracteres Unicode poco frecuentes.

P: Cuando intento sintetizar texto a partir de un origen que contiene símbolos del Alfabeto Fonético Internacional (IPA), Amazon Polly no los reconoce e incluso intenta pronunciar algunos. ¿Cómo soluciono esto?

Amazon Polly no reconoce los símbolos IPA a menos que se utilice SSML (Speech Synthesis Markup Language) para definirlos. Sin embargo, ya que pequeñas secciones de símbolos IPA constituyen normalmente una guía de pronunciación para el lector, en muchos casos estas secciones se pueden quitar de forma segura del texto de entrada mediante una simple eliminación. También puede utilizar un lexicón para cambiar la forma en que Amazon Polly los representa. Para obtener más información, consulte Generación de fragmentos hablados desde documentos SSML (p. 31) y Administrar lexicones (p. 127).

Seguridad y confidencialidad de los datos

P: ¿Puedo inhabilitar el registro de solicitudes con las API de solicitudes?

Sí, puede hacerlo poniéndose en contacto con AWS Support.

P: ¿Puedo enmascarar ciertos campos de datos para que no se almacenen? (Por ejemplo, si convierto texto que contiene información confidencial, pero no quiero que se almacene en los sistemas de AWS, ¿puedo enmascararlo?)

No, Amazon Polly no admite actualmente esta funcionalidad.

P: El texto que deseo utilizar con Amazon Polly es confidencial. ¿Cómo se protegen mis datos?

Amazon Polly Guía para desarrolladores Seguridad y confidencialidad de los datos

Todos los envíos de texto están protegidos mediante Capa de conexión segura (SSL) mientras están en tránsito, y se almacenan utilizando el cifrado RSA. Almacenamos los logs de servicios y el texto por separado, de forma que el contenido no se pueda vincular con el ID de cliente. En consecuencia, Amazon Polly no asocia los envíos de texto a la identidad del cliente.

P: ¿Durante cuánto tiempo se conservan los datos?

Amazon Polly conserva los datos durante 14 días. Transcurrido ese tiempo, se eliminan automáticamente de nuestro sistema.

P: ¿Puedo solicitar que los datos se borren antes?

Sí, puede hacerlo poniéndose en contacto con AWS Support.