Está en la página 1de 13

Parámetros de nivel de voz en reverberación muy baja y excesiva medida con un dispositivo basado en un

sensor de contacto y un micrófono de cabeza

Arianna Astolfi , Antonella Castellana , Giuseppina Emma Puglisi , Umberto Fugiglando y Alessio Carullo

Citación: El diario de la sociedad acústica de América 145, 2540 (2019); doi: 10.1121 / 1.5098942 Ver en línea: https://doi.org/10.1121/1.5098942

Ver tabla de contenido: https://asa.scitation.org/toc/jas/145/4

Publicado por el Sociedad Acústica de América

ARTÍCULOS EN LOS QUE PUEDE INTERESARSE

Modelo de prosodia jerárquica para el lenguaje espontáneo en mandarín


El diario de la sociedad acústica de América 145, 2576 (2019); https://doi.org/10.1121/1.5099263 Impacto aerodinámico de los pliegues

ventriculares en modelos computacionales de laringe


El diario de la sociedad acústica de América 145, 2376 (2019); https://doi.org/10.1121/1.5098775 Asociación intermodal entre

vocales y colores: una perspectiva lingüística cruzada


El diario de la sociedad acústica de América 145, 2265 (2019); https://doi.org/10.1121/1.5096632 Estimación inversa de la forma del

tracto vocal basada en una interfaz de mapeo del tracto vocal


El diario de la sociedad acústica de América 145, 1961 (2019); https://doi.org/10.1121/1.5095409 Detección de modulación de amplitud y

enmascaramiento de modulación en niños y adultos en edad escolar


El diario de la sociedad acústica de América 145, 2565 (2019); https://doi.org/10.1121/1.5098950 Eficiencia en vislumbrar secuencias de vocales

en fabricantes fluctuantes: efectos de la estructura fina temporal y la regularidad temporal

El diario de la sociedad acústica de América 145, 2518 (2019); https://doi.org/10.1121/1.5098949


Parámetros de nivel de voz en reverberación muy baja y excesiva medida con un dispositivo
basado en un sensor de contacto y un micrófono de cabeza

Arianna Astolfi 1, una) Antonella Castellana 2 Giuseppina Emma Puglisi 1


Umberto Fugiglando 3 y Alessio Carullo 2
1 Politecnico di Torino, Departamento de Energía, Corso Duca degli Abruzzi, 24, 10129, Torino, Italia
2 Politecnico di Torino, Departamento de Electrónica y Telecomunicaciones, Corso Duca degli Abruzzi, 24,

10129, Torino, Italia


3 Instituto de Tecnología de Massachusetts, Senseable City Lab, 77 Massachusetts Avenue, Cambridge, Massachusetts 02139, EE.

UU.

(Recibido el 18 de junio de 2018; revisado el 9 de marzo de 2019; aceptado el 3 de abril de 2019; publicado en línea el 30 de abril
2019)

Este trabajo aborda el efecto de la reverberación muy baja y excesiva en los niveles de presión sonora del habla. Las mediciones se
llevaron a cabo en una sala semianecoica y reverberante utilizando un dispositivo basado en un sensor de contacto fijado en la base del
cuello y un micrófono de cabeza colocada a 2,5 cm de la boca del hablante. Los oradores produjeron monólogos cortos y también
describieron un mapa con la intención de explicar correctamente las instrucciones a un oyente a 6 metros de distancia. En promedio, se
observó un aumento significativo de aproximadamente 2 dB en los niveles de voz medios, equivalentes y de modo en la sala semianecoica
en comparación con la sala reverberante para la descripción del mapa de las grabaciones con el dispositivo de contacto, por lo tanto,
destacando una mayor intensidad vocal en salas muertas cuando La tarea del discurso tenía una intención comunicativa. Tales resultados
confiables no se encontraron con el micrófono de cabeza porque los niveles de voz se vieron afectados por el ruido grabado en las pausas.
Particularmente, el intervalo de registro de 30 ms trajo errores más severos en el modo y los niveles medios del habla en comparación con 1
s. Cuando se eliminaron las pausas y se adoptó un intervalo de registro de 30 ms, los resultados fueron más consistentes con los obtenidos
con el sensor de contacto, pero las diferencias de nivel entre las dos habitaciones aún no fueron significativas. V C 2019 Acoustical Society of
America. https://doi.org/10.1121/1.5098942

[BVT] Páginas: 2540–2551

I. INTRODUCCIÓN más inteligible que el discurso conversacional ordinario y normalmente articulado,


que puede ser involuntario o producido deliberadamente en adaptación a una
Numerosos estudios han abordado hasta ahora los cambios en la producción del
situación perturbada de comunicación o a un oyente con capacidades de
habla para los hablantes debido a los diferentes entornos acústicos, centrándose
comprensión reducidas. El habla clara tiene como objetivo mejorar la inteligibilidad
principalmente en el efecto del ruido. 1 - 4 4 o distancia de los oyentes 5 5 - 9 9 en lugar de sobre el
del habla o preservarla en condiciones de escucha adversas. 17
efecto de la reverberación. 5 5 , 10

Se demostró que la reverberación influye en la producción de voces que apoyan a los


La forma en que un hablante se dirige a un oyente puede cambiar de acuerdo con el
conversadores 2 , 5 5 así como aumentar el nivel del discurso hacia una audiencia. 11 A pesar de
estado de la voz, 21 - 23 sensibilidad auditiva 24 , 25 años 7 7 y género, 4 4 , 7 7 estado de ánimo y
los efectos positivos, la reverberación excesiva también puede estar relacionada con la
incomodidad vocal. 12 y aumento de la fatiga vocal, especialmente en el caso de habla condiciones físicas, 26 , 27 y experiencia de hablar o entrenamiento. 28 , 29 Independientemente del

prolongada. 13 , 14 entorno de audición, la producción del habla está orientada al oyente ya que existen

diferentes discursos relacionados con el interlocutor (infantes, extranjeros, personas con


Hablar es un asunto muy complejo que involucra muchos problemas
discapacidad auditiva, mascotas, máquinas). 17 Tipo de oyentes, presencia de intención
además de la mera presencia de barreras acústicas como el ruido o la
comunicativa, 8 , 12 , 18 años contacto visual, 12 y familiaridad 19 se encuentran entre los principales
reverberación. Las modificaciones del habla se han estudiado a nivel global, es
factores de in fl uencia.
decir, en todo el conjunto de enunciados de un hablante dado, como la inserción
de pausas, cambios en los espectros a largo plazo o cambios en la frecuencia
Al observar los efectos del entorno de escucha, cuando el ruido de fondo está
fundamental media y a nivel segmentario, por ejemplo. , a nivel fonológico y
presente en el entorno, se produce un aumento global de la intensidad del habla, que
fonético. 15 , dieciséis Dichas modificaciones pueden determinarse por las
conduce al habla lombarda. 2 - 4 4 Tal aumento del habla es muy variable de hablante a
características del interlocutor, el tipo de interlocutor y el entorno de escucha. 17 Otros
hablante, lo que lleva a una variabilidad significativa entre hablantes, 4 4 y aumentar aún
factores de in fl uencia son el tipo de discurso, 18 años , 19 p. ej., discurso orientado a
más en el caso de tareas de habla con intención comunicativa. 30 Sin embargo, incluso
la lectura, espontáneo, simulado y orientado a tareas, y el estilo de hablar, 15 , dieciséis
en ausencia de ruido de enmascaramiento, se pueden observar aumentos del nivel de
, 18 años , 20 por ejemplo, discurso claro o discurso conversacional. En particular,
voz al cambiar las distancias entre el hablante y el oyente, 5 5 - 9 9 quizás como una forma
"hablar claro" es un estilo de habla intrínsecamente
de compensación por las dificultades percibidas del oyente.

A pesar de la extensa literatura sobre los efectos del ruido en el habla, según el
una) Correo electrónico: arianna.astol fi @ polito.it
conocimiento de los autores, se han encontrado pocos datos.

2540 J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 0001-4966 / 2019/145 (4) /2540/12/$30.00 V C Sociedad Acústica de América 2019
publicó que el informe detalla los cambios en la producción vocal en presencia de sala en comparación con una sala reverberante para los estilos de habla normal y fuerte.
reverberación y, en particular, los cambios en la intensidad de la voz.
En los estudios presentados hasta ahora, los niveles de voz se midieron con
Brunskog et al. 31 y Pelegr en Garcìa 10 investigó los efectos de los parámetros micrófonos de aire colocados específicamente en una habitación a una distancia dada
acústicos de la sala en el aumento del nivel de potencia de sonido de la voz (PWL) de la boca del hablante. En estudios recientes, se han utilizado dispositivos basados ​en
producido por seis altavoces masculinos que realizaron una conferencia de sensores de contacto para estimar los parámetros vocales a partir de la vibración de la
aproximadamente 5 minutos en seis salas con un volumen de 100 m 3 hasta 1900 m 3 y piel en el cuello del hablante. 34 - 39 Estos dispositivos se han producido con la intención
tiempo de reverberación en el rango de 0.06 s (a 1000 m 3 cámara anecoica) a 1.53 s. de realizar un monitoreo de voz a largo plazo ya que tienen una sensibilidad
Las mediciones de PWL de voz se basaron en la señal de voz adquirida con un insignificante al ruido de fondo. 40 Se han aplicado principalmente para investigar en el
auricular de conversación telefónica de computadora, colocado en los sujetos que campo el comportamiento vocal de los maestros. 41 - 43 En todos los estudios
hablan a unos 3 cm de la boca. Propusieron un nuevo parámetro objetivo, a saber, el ganancia
mencionados, cuanto mayor es el tiempo de reverberación en las aulas, mayor es la
de habitación, 10 que representa la ganancia producida en los oídos del hablante por intensidad vocal de los maestros debido al aumento del nivel de ruido de fondo con la
los reflejos en la sala. Del modelo propuesto por Brunskog et al. 31 parece que un reverberación. Tal comportamiento opuesto del nivel de voz de los docentes en
hablante tiende a hablar más alto en habitaciones con una ganancia de habitación comparación con los estudios de laboratorio mencionados anteriormente se debe
baja (la cámara anecoica) y más suave en habitaciones con una ganancia de principalmente al aumento del ruido de fondo y no al aumento de la reverberación del
habitación alta, que exhibe un mayor apoyo a la producción de voz debido a los sonido.
reflejos de la habitación.

En resumen, se han realizado muchos estudios que informan


cambios en la intensidad de la voz en presencia de ruido y a diferentes
Pelegr ın-García et al. 5 5 Analizó el efecto del entorno acústico en un distancias de comunicación, pero pocos compararon solo el efecto del
discurso espontáneo evocado para describir un mapa. 19 Participaron 13 tiempo de reverberación muy bajo y muy alto en ausencia de ruido. El
conversadores masculinos de entre 23 y 40 años, dirigiéndose a un oyente a presente trabajo investiga las variaciones de los parámetros del nivel del
distancias de comunicación duplicadas (las distancias dobles aumentaron de habla en grupos de sujetos mientras se habla en salas semianecoicas y
1.5 ma 12 m), en ausencia de ruido de fondo. Consideraron entornos reverberantes con estilos de habla espontánea que son comunes en la
acústicos muy diferentes, entre los cuales una sala anecoica y una sala de vida cotidiana. Dos tipos de discurso espontáneo, a saber, un monólogo
reverberación con un tiempo de reverberación promedio entre 500Hz y 1 kHz gratuito y la descripción de un mapa, se abordan con la intención
( T 30,0.5–1 kHz) de 0.04 sy 5.38 s, respectivamente. La señal acústica del habla de comunicativa de algunos oradores a un oyente a una distancia fija de 6
cada sujeto se recogió con un micrófono de aire colocado en la mejilla del m. Las mediciones se llevan a cabo con un micrófono de uso frecuente y
hablador a una distancia de 6 cm del borde de los labios. La duración de las
con un dispositivo basado en un sensor de contacto, indicado a
grabaciones varió entre 1 minuto y 2 minutos, dependiendo del tipo de mapa,
continuación como dispositivo de contacto, que estima la intensidad vocal
que era diferente en cada condición y administrado en orden aleatorio para
sin la influencia del sonido en el aire.
cada sujeto. A 6 m de la boca del hablante (una distancia que es
representativa de un escenario de lectura) encontraron un aumento del PWL
de sonido medio de 2.4 dB en la cámara anecoica en comparación con la
cámara de reverberación.
Más allá de los campos del comportamiento vocal a largo plazo y el monitoreo de
la salud vocal, este estudio puede ser atractivo para el campo de la comunicación del
habla, donde los lingüistas, los científicos del habla y los investigadores de comunicación
general pueden comprender más sobre el efecto del medio ambiente en la producción
Cipriano et al. 32 investigó las relaciones entre la acústica de la sala, el
del habla. y elija un dispositivo apropiado para hacer experimentos.
nivel de ruido de fondo y el esfuerzo vocal de un hablante, este último
expresado como nivel de presión sonora equivalente (SPL) a 1 m de la boca
del hablante, en aulas simuladas de varios volúmenes. Se encontró que los
II MÉTODO
altavoces, equipados con un micrófono de cabeza, ajustaban su esfuerzo
vocal linealmente con el soporte de voz, es decir, la diferencia entre el nivel de Los experimentos se llevaron a cabo en la sala semianecoica (volumen
sonido reflejado y el nivel de sonido directo en el aire de la voz del hablante, de aproximadamente 384 m 3) y sala reverberante (volumen de unos 294 m 3) del
en sus propios oídos. La pendiente de esta relación, que se definió como efecto Instituto Nacional de Investigación Metrológica (INRiM) en Turín, Italia. El
de sala, tiempo de reverberación, promediado en los rangos de frecuencia de un tercio
de banda de octava de (0.1-0.315) kHz, (0.4-2.5) kHz y (3.15-10) kHz, se midió
fue estadísticamente significativo e igual a 0.24 dB / dB en el caso de los niveles de en condiciones de vacío y fue igual a 0.10 s (estándar desviación 0.01 s), 0.11
ruido más altos de 62 dB, por lo tanto, apoya el aumento de SPL de voz cuando soporte s (desviación estándar 0.01 s) y 0.10 s (desviación estándar 0.01 s), y a 12.2 s
de voz disminuye, es decir, en una sala muerta. (desviación estándar

Este hallazgo fue confirmado por Bottalico et al. 33 quien monitoreó 20 3.3 s), 7.4 s (desviación estándar 1.6 s) y 2.5 s (desviación estándar 1.1 s) para los
sujetos mientras leía un texto en presencia de ruido de balbuceo ( UNA- SPL tres rangos de frecuencia y las salas semianecoicas y reverberantes,
equivalente ponderado, L UNA, eq ¼ 62dB) en salas anecoicas y reverberantes con T respectivamente. El equivalente general UNA-
30,0.5–1 kHz de 0.04 sy nivel de ruido de fondo ponderado, L UNA eq, bn, que se midió en la sala
2,37 s, respectivamente. Se encontró un aumento de aproximadamente 1dB en el SPL del semianecoica y de reverberación durante un período de 5 minutos, fue igual a
habla detectado por un micrófono de cabeza en un anecoico 24,5 dB y 30,3 dB, respectivamente.

J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 Astolfi et al. 2541
A. Sujetos e instrucciones experimentales. oyente, se sentó en el eje frente a ellos para permitir el contacto visual. Las
instrucciones se explicaron oralmente y no se les dijo a los oradores que las
A los sujetos involucrados en el estudio se les pidió que produjeran un
hicieran oír mientras hablaban. El oyente, de 24 años y con una audición
monólogo gratuito y la descripción de un mapa, mientras estaban equipados con
normal autoinformada, tuvo que tomar nota de lo que decían los oradores. No
un sensor de contacto incorporado en el dispositivo de Cuidado de Voz
dio retroalimentación al hablante sobre el nivel de voz percibido en su
(PR.O.Voice srl, Turín, Italia) y un micrófono de cabeza . Mesa yo muestra el
posición, ya sea verbal o no verbal. Tanto los oradores como el oyente se
número de sujetos que realizaron los experimentos en las dos salas.
colocaron a más de 1 m de distancia de las superficies fronterizas de las
habitaciones vacías.
El diseño del experimento se concibió originalmente para que todos los
sujetos realizaran ambas tareas del habla mientras usaban simultáneamente
La elección de hacer que los sujetos hablen libremente sobre un tema que
ambos dispositivos, pero el fracaso de algunas grabaciones creó una subdivisión
conocían bien se relacionó con el hecho de que esta se consideraba la mejor
desigual de los participantes entre los dispositivos y las tareas del habla. En
manera de hacerlos expresarse de manera normal. La lectura o la actuación
particular, el número de sujetos que realizaron las tareas del habla con ambos
habrían implicado una inflexión o un ritmo antinatural, por lo que los parámetros
dispositivos fue de 29 (19 hombres y 10 mujeres), mientras que 38 hablantes (25
vocales probablemente habrían sido influenciados por factores subjetivos y de
hombres, 13 mujeres) y 57 hablantes (27 hombres, 30 mujeres) realizaron las
estilo en lugar de solo por la acústica de la sala. 19
tareas del habla usando el dispositivo de contacto y el micrófono de cabeza,
respectivamente.
Para evocar otra forma de discurso natural con una intención de comunicación

El orden de los experimentos en las salas semianecoicas y muy específica, 8 A algunos de los sujetos también se les pidió que describieran un

reverberantes fue aleatorizado para cada sujeto. En cambio, cuando los mapa. El mapa contenía 12 puntos de referencia (por ejemplo, "autobús escolar",

sujetos realizaban ambas tareas del habla, su orden no estaba "tienda", "club náutico"), un punto de inicio y un punto final, y una línea discontinua que

contrarrestado, es decir, la descripción del mapa siempre seguía al discurso representa el camino que conecta estos dos puntos. Siguiendo el mismo procedimiento

libre, de modo que el discurso libre podría considerarse una tarea preliminar reportado en Anderson et al. 19 Se instruyó a los oradores para que describieran la ruta

destinada a familiarizar al hablante con el entorno de grabación. desde el inicio hasta los puntos finales, indicando los puntos de referencia a lo largo del
camino (por ejemplo, "diríjase hacia el oeste hasta encontrar el club náutico") mientras

Todas las asignaturas eran de maestría o doctorado. estudiantes del intenta habilitar el contacto visual con el hablador. El orador tenía la tarea de hacer que

Politecnico di Torino. Solo se reclutó a hablantes nativos de italiano de entre 20 y el oyente dibujara la ruta correctamente en un mapa en blanco que contiene todos los
30 años. Ninguno de los sujetos tenía discapacidad visual severa o trastornos elementos, excepto la ruta y la marca final. Se proporcionaron puntos cardinales y una
vocales, basados ​en autoinformes, y ninguno de ellos informó haber recibido cuadrícula cuadrada de fondo de 2,5 cm en el mapa para facilitar la comunicación entre
terapias del habla o entrenamientos vocales. Antes de comenzar los el hablante y el oyente. Se proporcionaron dos mapas, uno para cada habitación, cada
experimentos, se pidió a cada orador que realizara una prueba de detección uno con un tamaño de 29,7 cm. 42,0 cm. Los mapas se imprimieron en tela y se
audiométrica de acuerdo con el procedimiento sugerido por la aplicación basada colocaron sobre un panel de absorción de sonido colgado en un atril frente a los ojos
en iPad (Apple Inc., Cupertino, CA) titulada uHear, 44 , 45
del orador a una distancia de

que proporciona una evaluación de la sensibilidad auditiva por banda de frecuencia


(de 0,5 kHz a 6 kHz) con una clasificación basada en el nivel. Solo los sujetos con
una audición "normal" basada en la clasificación de la aplicación participaron en el 1,5 m ligeramente a la izquierda para que la vista del oyente no se vea perturbada.
experimento. Además, se pidió a los sujetos equipados con el dispositivo de Cada descripción del mapa duró de 2 a 3 minutos, dependiendo del hablante.
contacto que realizaran un procedimiento de calibración en la sala semianecoica,
como se describe en Carullo et al. 46 y resumido en la Sec. II B1 . Una vez que se Después de haber explicado las tareas del habla al sujeto oralmente, el
completaron las operaciones preliminares, se les pidió a los oradores que produjeran oyente regresó a su posición e indicó al hablante de manera no verbal cuándo
un discurso libre continuo de 5 minutos de duración, con el objetivo de transmitir comenzar a hablar. Los oradores sabían que el oyente tenía instrucciones de
información sobre algo que conocían bien (por ejemplo, el tema de investigación que dibujar el mapa que el orador estaba describiendo. Una vez más, no se les dijo
trataron, una receta, las reglas de un juego , el camino desde su casa al lugar de a los oradores que los hicieran oír mientras hablaban, y el oyente no le dio
trabajo), mientras está parado a 6 metros de una joven retroalimentación al hablante sobre el nivel de voz percibido en su posición, ya
sea verbal o no verbal.

Cuando el dispositivo de contacto y el micrófono de cabeza se usaron al


TABLA I. Número de sujetos que realizaron los experimentos con el dispositivo de contacto y el
mismo tiempo, se les pidió a los sujetos que pronunciaran simultáneamente la
micrófono para las tareas de habla libre y para describir un mapa. También se muestra la distinción
vocal / a / y tocaran el micrófono de condensador electret (ECM AE38, Alan
entre hembra (F) y macho (M). Se informa entre paréntesis el número de sujetos que usaron el
dispositivo de contacto junto con el micrófono de cabeza. Electronics GmbH, Dreieich, Alemania) con las manos en para producir picos
agudos en las señales adquiridas por los dos micrófonos. En el paso de
preprocesamiento, el tiempo de inicio y el tiempo de finalización de cada tarea
Dispositivo de contacto Micrófono de cabeza
de voz se seleccionaron manualmente por sujeto y dispositivo. El instante
FM en general F METRO En general inmediatamente posterior al pico agudo se utilizó como hora de inicio, con el
objetivo de seleccionar los historiales de tiempo correspondientes de las
Libertad de expresión 8 15 23 16 (5) 13 (10) 29 (15)
señales de los dos dispositivos. UNA MATLAB script (MathWorks, Natick, MA) fue
Describiendo un mapa 55 10 15 14 (5) 14 (9) 28 (14)
En general 13 25 38 30 (10) 27 (19) 57 (29)

2542 J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 Astolfi et al.
luego se usaba para cortar y guardar automáticamente archivos wav separados para ser El SPL equivalente se estimó como el promedio de la energía sonora en todos
analizados en el paso de procesamiento posterior. los cuadros, incluidos los no sonoros, cuya energía se estableció en cero, de
Durante los experimentos en la sala semianecoica, podría haberse producido acuerdo con ^ Svec et al. 47
una reflexión desde el piso en comparación con una sala anecoica completa. Para
suprimir esta reflexión, se colocaron gruesos paneles absorbentes de sonido en el 2. Micrófono de cabeza
piso de la habitación.
La señal acústica del habla fue captada con el micrófono omnidireccional
con cabeza de micrófono Mipro MU-55HN (Chiayi, Taiwán), colocada a una
B. Parámetros de nivel de voz
distancia de aproximadamente 2.5 cm del borde de los labios de los habladores,
Promedio, modo y SPL de voz equivalentes generales (SPL metro, SPL modo, ligeramente al lado de la boca, a aproximadamente 20 –40 horizontalmente,
y SPL eq, respectivamente) se han calculado para cada tarea de habla y dependiendo del tamaño de la cabeza del sujeto. El micrófono exhibe una
dispositivo. El sonido PWL también se ha estimado para el micrófono de frecuencia plana de 6 6 3 dB en el rango de 40Hz a 20 kHz. Se conectó al
cabeza. transmisor bodypack ACT-30T, que transmite a un sistema de micrófono
inalámbricoMipro ACT 311. Las señales wav se grabaron con la práctica
1. Dispositivo de contacto grabadora ZOOM H1 (Zoom Corp., Tokio, Japón) en formato de 16 bits / 44,1 kHz
y posterior procesado con
Antes de comenzar las tareas de habla, los altavoces estaban equipados con
Voice Care, 34 - 36 un dispositivo basado en un sensor de contacto que consiste en un
MATLAB MathWorks, Natick, MA). Se implementó una calibración comparativa con un
ECM AE38 (Alan Electronics GmbH, Dreieich, Alemania), fijado en la muesca yugular
medidor de nivel de sonido de clase 1 (modelo XL2 equipado con un micrófono
por medio de una banda quirúrgica, y conectado a un dispositivo de adquisición que
M2210, todo de NTi Audio, Schaan-Liechtenstein), utilizado como referencia,
actúa como registrador de datos. El sensor de contacto detecta los cambios en la
como se describe en el apéndice de Castellana et al. 39
presión acústica en la superficie del cuello debido a la actividad de las cuerdas vocales
durante la fonación, y el dispositivo de adquisición procesa la señal utilizando una
longitud de cuadro de 30 ms, que corresponde a las pausas intersilábicas, como se
En la literatura existente sobre micrófonos auriculares (o más
generalmente micrófonos en el aire) en el contexto acústico arquitectónico,
describe en Carullo et al. 46 El dispositivo se mantuvo en una bolsa pequeña, que fue
las pausas del habla no se eliminan en el cálculo de los parámetros SPL del
usada por el hablante durante todo el experimento para que no se le impusiera estar
habla, y el intervalo de registro adoptado a menudo se elige u omite al azar. 5
de pie con una postura antinatural.
5 , 10 , 31 - 33

Para la estimación de las ocurrencias de SPL, se eligió un intervalo de registro de

Al definir un umbral de voltaje de raíz cuadrada media (rms) adecuado que 1 s de acuerdo con los análisis realizados por Castellana et al. 39 relacionado con

discrimina los cuadros sonoros de los no sonoros, el dispositivo proporciona una la sensibilidad del ruido dentro de pausas en grabaciones de lectura repetidas

estimación de los SPL sonoros a una distancia fija de la boca del hablante, después realizadas en cámara semianecoica.

de una calibración frente a un micrófono de referencia. 34 - 36 Los resultados


generalmente se muestran como histogramas de ocurrencias. Con el objetivo de detectar diferencias en la intensidad del sonido debido a la
reverberación, se han calculado diferentes parámetros de voz con el micrófono de
cabeza, es decir, SPL equivalente, medio y de modo, así como PWL de sonido,
La calibración del dispositivo de contacto consistió en estimar la
teniendo en cuenta que este último es el parámetro más adecuado ya que está
mejor función de regresión entre los valores rms de la señal obtenida
directamente relacionado con la intensidad vocal. 10 , 31
de la vibración de la piel y los SPL medidos por el micrófono de
referencia. Dicha calibración se realizó para cada altavoz solo en la
sala semianecoica, ya que el objetivo era encontrar diferencias en la La relación entre PWL y SPL eq, r en la sala reverberante (r)
vibración de las cuerdas vocales en las dos salas. Durante la depende de dos factores de corrección que explican los efectos de las
reflexiones ( sol re fl), y de la distancia fuente-receptor y la directividad
calibración, el orador bajo supervisión usó el dispositivo de contacto y
fuente ( sol dist) Se puede expresar como PWL ¼ SPL eq, r - G reflejo - G dist. 5 5
se sentó en un escritorio ubicado en la habitación. El hablante tenía
que sostener la vocal "/ a /" durante un período continuo de 60 s
frente a un micrófono de referencia a una distancia fija de la boca, El factor de corrección sol reflejo está relacionado con el aumento de la SPL eq
comenzando suavemente (como un susurro) y aumentando la en el micrófono de cabeza debido a las reflexiones en la sala de reverberación
intensidad de la voz al más alto que pudiera ser alcanzado (como un en comparación con la sala semianecoica (sa) con la configuración de piso
grito) absorbente. Para esta medición, los 4128 BATINOS BLACKK (Br € uel & Kjaer,
Nærum, Dinamarca) emitiendo ruido ICRA 48 ( es decir, se utilizó un estímulo
acústico del International Collegium for Rehabilitative Audiology (ICRA),
equipado con el micrófono de cabeza y sol reflejo se determinó como la diferencia
entre el SPL eq valores medidos en las salas semianecoicas y reverberantes, es
decir, sol reflejo

Para cada monitoreo que usa el dispositivo de contacto, las ocurrencias de ¼ SPL eq, r, SOMBREROS - SPL eq, sa, SOMBREROS. Un valor promedio de sol reflejo

SPL se estimaron en el procesamiento posterior sobre la base de un modelo de basado en ocho medidas resultó igual a 0.34 dB (desviación estándar 0.05). Se
regresión logarítmica obtenido del valor eficaz del voltaje en la salida de la cadena espera un valor tan bajo desde entonces, como lo subraya Brunskog et al. 31 el
basada en ECM. A partir de tales distribuciones de SPL, se calcularon micrófono estaba lo suficientemente cerca de la fuente del habla que el campo
equivalentes, medias y modos como descriptores de la intensidad de la voz. los directo era predominante con respecto al campo reverberante.

J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 Astolfi et al. 2543
El factor de corrección sol dist depende de la distancia del receptor en su versión unilateral. La prueba se ha aplicado individualmente para cada
fuente y el patrón de directividad fuente. Se determinó realizando sujeto, considerando sus distribuciones SPL independientes en las dos salas,
mediciones de sonido PWL en la sala reverberante con un simulador siempre que el discurso evocado por el sujeto fuera diferente. La prueba verifica la
HATS, PWL SOMBREROS, de manera similar a la descrita por Brunskog et al. 31 En aceptación de la hipótesis alternativa. H 1: METRO sa> METRO r, dónde METRO sa y METRO
particular, el 4128 B&K HATS se colocó en la cámara reverberante r

equipada con el micrófono de cabeza. Se alimentó una señal de ruido son las medianas de las distribuciones de cada parámetro de voz en las salas
ICRA al altavoz y se midió simultáneamente mediante el micrófono de semianecoicas y reverberantes, respectivamente ( pags-
cabeza y un micrófono calibrado de 1/2 pulg., Tipo B&K 4943, ubicado en valores <0.05).
el campo reverberante de la sala, de acuerdo con las mediciones estándar
de sonido PWL ISO 3741. 49 El factor de corrección se ha obtenido como sol III. RESULTADOS

dist ¼ SPL eq, r, SOMBREROS - sol reflejo - PWL SOMBREROS y resultó igual a 23.3 dB
Los resultados se refieren a la comparación de los niveles de habla entre
(desviación estándar 0.05) basado en ocho mediciones.
salas semianecoicas y reverberantes, con dos dispositivos y para dos tareas de
habla diferentes. Debido a las diferentes características en términos de frecuencia
de la muestra, posicionamiento del sensor y tratamiento de marcos sordos, no se
realizó una comparación directa entre las cantidades estimadas por los dos
Al suponer que todos los hablantes tenían la misma directividad, igual a
dispositivos.
la de los HATS, la PWL de cada sujeto en la sala reverberante se estimó
finalmente como se describió anteriormente, restando a cada SPL eq los dos
factores de corrección A. Dispositivo de contacto
sol dist y sol re fl. El PWL de cada sujeto en la sala semianecoica (sa) se
Mesa II muestra el pags- valores de la prueba de rango con signo de Wilcoxon
obtuvo restando a cada SPL eq el factor de corrección sol dist solamente.
de una cola, que indican un aumento significativo de SPL eq, SPL metro, SPL modo para el
grupo de hablantes en la sala semianecoica en comparación con la sala

C. Análisis estadístico reverberante, solo en el caso de describir un mapa. El mismo comportamiento no es


significativo en el caso de la libertad de expresión.
Se han realizado diferentes análisis estadísticos con un MATLAB script
(MathWorks, Natick, MA) y los resultados comparados con el paquete de Mesa II también muestra el valor promedio general y la desviación
estadísticas de IBM SPSS (versión 21.0, Armonk, NY) para validar el estándar del promedio de SPL eq, SPL metro, SPL modo estimado con el dispositivo de
análisis. Lo mismo pags- contacto a 16 cm de la boca del hablante en las salas semianecoicas y
Los valores se obtuvieron con ambos tipos de software. reverberantes y las diferencias de nivel entre las dos salas ( re SPL sa-r). Se
Con el fin de comparar los parámetros SPL del grupo de sujetos en las encuentran valores medios globales más altos de 2.0 dB, 1.9dB y 2.4dB en la
dos salas, la prueba de rango con signo de Wilcoxon de una cola no sala semianecoica en comparación con la sala reverberante para SPL eq,
paramétrica 50 Inicialmente se ha aplicado. Suponiendo la dependencia de los
monitoreos del mismo sujeto en las dos salas, se ha considerado una lista SPL metro, y SPL modo, respectivamente, en el caso de la descripción del mapa. Estas
de muestras emparejadas para cada parámetro SPL. Los parámetros de voz diferencias son significativas ya que sus valores son más altos que las incertidumbres
SPL eq, SPL metro, SPL modo, y PWL, que se obtuvieron en las dos salas diferentes expandidas respectivas (factor de cobertura 2), que son de 1.4dB para re SPL eq y re SPL metro,
para cada sujeto, constituyeron las dos muestras de listas emparejadas. La y 1.7 dB para
prueba evaluó la aceptación de la hipótesis alternativa. H: M sa> METRO r, dónde re SPL modo en el caso de 15 sujetos, según Astol fi
et al. 51 Dado que la señal de dispositivo de contacto no se ve afectada por la cola de
reverberación, la diferencia re SPL eq de 2.0 dB en las dos habitaciones también es
METRO sa y METRO r son las medianas de cada lista de parámetros de voz en las salas representativo de re PWL. En el caso de la libertad de expresión, la diferencia de los
semianecoicas y reverberantes, respectivamente ( pags- valores inferiores a un nivel de parámetros SPL en las dos salas siempre fue menor que la incertidumbre respectiva.
significancia de 0.05).
Los parámetros SPL eq, SPL metro, y SPL modo en las dos salas también se han El resultado de la prueba U de Mann-Whitney relacionado con el mismo
comparado a través de la estimación de sus valores medios generales entre hablante en las dos salas respalda el hallazgo de una mayor intensidad de voz en
los sujetos para cada tarea y dispositivo, y el valor medio general de PWL se la sala semianecoica en comparación con la sala reverberante solo en el caso de
ha comparado también para el micrófono de cabeza. Las diferencias de los la descripción del mapa. Mesa III muestra que en el caso de describir un mapa, 13
valores medios entre las dos habitaciones se han calculado para cada de los 15 sujetos aumentaron su nivel de voz en la cámara semianecoica en
parámetro ( re SPL sa-r y re PWL sa-r) y tales diferencias se han considerado comparación con la sala reverberante, mientras que solo 10 de los 23 tienen el
significativas si sus valores exceden la incertidumbre expandida respectiva de mismo comportamiento en el caso de la libertad de expresión. No parece que
las diferencias entre los niveles del habla, como se explica en Astol fi et al. 51 en haya una diferencia de género al explicar los resultados, ya que 4 mujeres de 5
términos de variabilidad entre hablantes, es decir, referido a un grupo de (80%) y 9 hombres de 10 (90%) aumentaron significativamente su nivel de habla
en la sala semianecoica que en la sala de reverberación y, Por otro lado, 3
mujeres de 8 (40%) y 7 hombres de 15 (50%) hicieron lo mismo en el caso de la
norte Altavoces. libertad de expresión.
Solo para los datos SPL derivados del dispositivo de contacto, que está
directamente relacionado con la energía del habla emitida por los hablantes en las
dos salas, se ha llevado a cabo un análisis adicional aplicando la prueba U no El comportamiento vocal de los sujetos detectados por el dispositivo de contacto en
paramétrica de Mann-Whitney 50
las dos salas también se representa en las Figs. 1 y 2 ,

2544 J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 Astolfi et al.
CUADRO II. Valor promedio (celdas superiores) y desviación estándar del promedio (celdas inferiores) del equivalente, SPL eq, significa SPL metro, y modo, SPL modo, SPL (dB) estimado con el dispositivo de contacto a 16 cm de la
boca del hablante, en las salas semianecoicas (sa) y reverberantes (r), y las diferencias de nivel entre las dos salas ( re sa-r). Los resultados se muestran en el caso de la libertad de expresión y para la tarea de hablar de describir
un mapa. los pags- los valores de la prueba de rangos firmados de Wilcoxon de una cola de las listas emparejadas de parámetros relacionados con las dos habitaciones están en la parte inferior. Valores inferiores a un nivel de
significación de 0.05, reportados en negrita y cursiva, indican la aceptación de la hipótesis alternativa. H: M sa> METRO r, dónde METRO sa y METRO r son las medianas de cada lista de parámetros SPL en las salas semianecoicas
y reverberantes, respectivamente.

SPL eq SPL metro SPL modo

Tarea Numero de sujetos sa r sa r sa r re SPL eq re SPL metro re SPL modo

Libertad de expresión 23 79,8 78,5 77,4 76,2 79,3 77,9 1.3 1,2 1.4
1,5 1.9 1.4 1.9 1,5 2.1
pags- valor 0.354 0.329 0.389
Mapa 15 79,0 77,0 78,7 76,8 82,0 79,6 2,0 1.9 2,4
2.1 1.8 2,0 1.6 2.5 1.8
pags- valor 0.004 0.007 0.004

donde se muestran histogramas de las ocurrencias SPL relacionadas con la libertad de habla. La misma tabla también muestra el promedio general de SPL eq, SPL metro,
expresión y la descripción del mapa para cada sujeto. Los histogramas muestran SPL modo, y PWL, estimado con el micrófono de cabeza a unos 2,5 cm de la
efectivamente que algunas personas eran muy sensibles al cambio en el medio boca del hablante en las dos salas y las diferencias de nivel entre las
ambiente y otras no. salas. Todas las diferencias son más bajas que las incertidumbres
expandidas respectivas (factor de cobertura 2), que son 1.9 dB para re SPL eq,
B. Micrófono de cabeza 1.8 dB para re SPL metro, e igual a 2.0 dB para

Mesa IV muestra el pags- Los valores de la prueba de rango con signo de


re SPL modo en el caso de 28 sujetos, es decir, la muestra más pequeña en la tabla IV ,
Wilcoxon de una cola, que indican un aumento significativo de PWL para el grupo
según Astol fi et al. 51 Cautelosamente, en el caso de re PWL la incertidumbre podría
de oradores en la sala semianecoica en comparación con la sala reverberante, solo
considerarse lo mismo que re SPL eq, a partir del cual re Se obtiene PWL, y donde las
en el caso de la libre
contribuciones de incertidumbre de sol reflejo y sol dist No son considerados.

CUADRO III. Prueba U de Mann-Whitney de una cola pags- valores en cada par de distribuciones de SPL

estimadas para cada sujeto masculino (M) o femenino (F) con el dispositivo de contacto en las habitaciones

semianecoicas (sa) y reverberantes (r). Los resultados se informan tanto para la libertad de expresión como para IV. DISCUSIÓN
las tareas de descripción del mapa. Los valores inferiores a 0,05 se informan en negrita y cursiva e indican la
A. Dispositivo de contacto
aceptación de la hipótesis alternativa. H 1: METRO sa> METRO r, dónde METRO sa y METRO r son las medianas de las

distribuciones de SPL en las salas semianecoicas y reverberantes, respectivamente.


Los resultados para el dispositivo de contacto muestran un aumento significativo
en los parámetros de SPL en la sala semianecoica en comparación con la sala

pags- valores
reverberante para la descripción del mapa con valores de re SPL eq, re SPL metro, y re SPL modo
Tema de aproximadamente 2 dB, es decir, 2.0 dB, 1.9 dB y 2.4 dB, respectivamente.
Libertad de expresión Mapa
Asumiendo que re SPL eq También representa la diferencia en re PWL entre las dos

F01 1.000 - habitaciones, estos resultados confirman el hallazgo de Pelegr en la Galería et al. 5 5 quien
F02 0,000 - encontró un aumento en la PWL media de
F03 1.000 0,000
F04 1.000 0,000 2.4 dB en la cámara anecoica en comparación con la cámara de
F05 0,000 0,000
reverberación con la misma tarea pero usando un micrófono de cabeza.
F06 1.000 -
F07 1.000 1.000
Tal aumento del nivel del habla cuando la tarea del habla era describir
F08 0,000 0,000
claramente un mapa podría deberse a una mayor motivación de los hablantes
M01 0,000 -
para hacerse entender, ya que la intención era explicar correctamente las
M02 1.000 -
M03 0,000 -
instrucciones a un oyente que dibujó el camino en un cuadro en blanco. Este

M04 1.000 - comportamiento apoya la tendencia a aumentar la intensidad de la voz en el caso


M05 0,000 0,000 del habla espontánea producida con intención comunicativa en condiciones de
M06 0,000 - escucha adversas, como también se encuentra en el caso del efecto Lombard de
M07 0.006 0,000 Garnier et al. 30 En particular, descubrieron que el aumento de la intensidad vocal y
M08 1.000 0,000 los parámetros relacionados fue mayor en el caso de la comunicación interactiva
M09 1.000 0,000
que sin interacción.
M10 1.000 0,000
M11 0,000 0,000
M12 0,000 0,000
Además de una mayor intencionalidad de la tarea de descripción del mapa,
M13 1.000 0,000
también es importante considerar el orden de las tareas de voz en el protocolo
M14 1.000 0,000
M15 1.000 1.000
adoptado. Cuando los participantes realizaban ambas tareas del habla, la
descripción del mapa siempre seguía

J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 Astolfi et al. 2545
HIGO. 1. Histogramas de ocurrencias SPL relacionadas con 5 minutos de libertad de expresión continua realizados por estudiantes universitarios monitoreados utilizando el dispositivo de contacto en las salas semianecoicas y
reverberantes del INRiM. Los datos se obtuvieron aplicando la función de calibración de la sala semianecoica a ambas monitorizaciones en las dos salas.
pags- valores inferiores a 0,05 indican que los hablantes aumentan su nivel de voz en la sala semianecoica en comparación con la sala reverberante (10 de 23 sujetos).

la libertad de expresión; Por esta razón, la libertad de expresión puede estar sesgada y el Por otro lado, debe subrayarse que la tarea de hablar de describir un
cambio en la intensidad de la conversación solo puede referirse a la descripción del mapa es una forma de discurso espontáneo, cuya riqueza de patrones
mapa. prosódicos hace que las suposiciones de ser espontáneo sean poco creíbles. 52
Astol fi et al. 14 utilizó un dispositivo de contacto para llevar a cabo el mismo Describir un mapa es una forma de discurso espontáneo que generalmente se
experimento descrito en este estudio, pero con el objetivo de detectar el cambio en los denomina
cuadros de voz y las pausas debido a la reverberación. Encontraron una tendencia a monólogo de instrucciones, donde se le pide al orador que instruya a un oyente
aumentar los períodos de voz en la sala reverberante en comparación con la sala silencioso real o imaginario para que realice una tarea. 53 En este sentido, el habla
semianecoica, solo para los hablantes que describieron un mapa en comparación con se prueba bajo control experimental, es decir, se dan instrucciones y el hablante
los altavoces que produjeron un discurso libre. Hablar en reverberación excesiva logra cierto control sobre las palabras de contenido y la estructura sintáctica, por

puede considerarse otro ejemplo de una situación de habla perturbada de la misma lo que puede etiquetarse más apropiadamente como discurso de "laboratorio", en

manera que hablar en una sala muerta. Para que se entienda claramente, los lugar de "espontáneo". " habla. De esta manera, las variaciones observadas en las

altavoces aumentaron la duración de los fotogramas de voz en el primer caso, características del habla relacionadas con diferentes condiciones son más
confiables porque los enunciados del habla están más controlados. 52
mientras que aumentaron la intensidad de la voz en el segundo caso.

2546 J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 Astolfi et al.
HIGO. 2. Histogramas de ocurrencias SPL relacionadas con muestras de voz en las que estudiantes universitarios describieron un mapa monitoreado usando el dispositivo de contacto en las salas semianecoicas y
reverberantes del INRiM. Los datos se obtuvieron aplicando la función de calibración de la sala semianecoica a ambas monitorizaciones en las dos salas. pags- valores inferiores a 0.05 indican que los hablantes
aumentan su nivel de voz en la sala semianecoica en comparación con la sala reverberante (13 de 15 sujetos).

Se pueden hacer más consideraciones sobre la fatiga vocal en el caso de Se han encontrado 3,3 dB en la sala semianecoica y 1,7 dB y 2,8 dB en la sala
fonación prolongada con condiciones de reverberación muy altas o muy bajas. La reverberante, en el caso de la libertad de expresión y la descripción del mapa,
fatiga vocal se entiende aquí como una adaptación vocal negativa que ocurre como respectivamente. Este hallazgo apoya un aumento de la fatiga en el caso de
consecuencia del uso prolongado de la voz con un mayor esfuerzo vocal. 54 Tanto fonaciones prolongadas con tareas de habla como monólogos de instrucciones, como
para salas como para tareas de habla, el SPL modo es mayor que el SPL metro, observando, en el caso de describir un mapa, y cuando se habla en una sala muerta.
por lo tanto, una distribución sesgada hacia la izquierda de las ocurrencias de SPL.
Las diferencias entre el modo y la media son mayores en el caso de describir un
mapa que en el caso de la libertad de expresión y en la sala semianecoica que en
B. Micrófono de cabeza
la sala de reverberación. En particular, diferencias iguales a 1.9 dB y
En lo que respecta al micrófono con auriculares, la ausencia de
diferencias significativas entre las listas emparejadas de

CUADRO IV. Valor promedio (celdas superiores) y desviación estándar del promedio (celdas inferiores) de SPL equivalente, medio y de modo y PWL de sonido (dB), estimado con el micrófono de cabeza a una distancia de
aproximadamente 2.5 cm de la boca del hablante. Los datos están relacionados con la tarea de la libertad de expresión y la descripción de un mapa en las salas semianecoicas (sa) y reverberantes (r). Las pausas no se han
eliminado de las muestras de voz y se ha utilizado un intervalo de registro de 1 s para los análisis. SPL y sonido PWL diferencias entre las salas semianecoicas y reverberantes ( RE) También se informan. los pags- los valores
de la prueba de rangos firmados de Wilcoxon de una cola de las listas emparejadas de parámetros relacionados con las dos habitaciones están en la parte inferior. Valores inferiores a un nivel de significación de 0.05,
reportados en negrita y cursiva, indican la aceptación de la hipótesis alternativa. H: M sa> METRO r, dónde METRO sa y METRO r son las medianas de cada lista de parámetros de voz en las salas semianecoicas y reverberantes,
respectivamente.

SPL eq SPL metro SPL modo PWL

Tarea Numero de sujetos sa r sa r sa r sa r re SPL eq re SPL metro re SPL modo re PWL

Libertad de expresión 29 94,3 93,5 92,0 91,7 94,1 93,9 71,0 69,8 0.8 0,3 0.2 0.2 1,2
0.8 0.9 0.8 0.9 0.9 0.8 0.8 0.9
pags- valor 0,051 0.276 0,233 0.009
Mapa 28 94,7 94,3 89,8 90,9 94,8 95,2 71,3 70,7 0.4 0.4 1.1 0.4 0.4 0.6
0.9 0.9 0.9 0.8 1 0.9 0.9 0.9
pags valor 0.414 0.970 0,768 0,193

J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 Astolfi et al. 2547
SPL eq, SPL metro, y SPL modo En relación con las dos condiciones de salas puede ocurrir en la estimación de modo en el caso de las habitaciones
semianecoicas y reverberantes en el caso de la libertad de expresión y la semianecoicas y reverberantes, donde el nivel máximo de SPL más bajo colocado
descripción del mapa, se pueden atribuir a diferentes causas dependiendo del en correspondencia con el ruido puede superar el nivel máximo de SPL más alto
intervalo de registro o del entorno. Estas causas se pueden reconocer en la Fig. 3 que identifica los niveles del habla. Una comparación entre SPL eq y SPL metro derivado
(gráfico superior), que muestra los histogramas de las ocurrencias de SPL de las distribuciones que se muestran en la Fig. 3 , procesado con los dos intervalos
relacionadas con muestras de voz en las que un estudiante universitario de registro diferentes de 30 ms y 1 s, llevado a valores más bajos con 30 ms que
describió un mapa monitoreado usando el micrófono en las salas semianecoicas con 1 s, y el parámetro más afectado es SPL metro.
y reverberantes. Primero, el gran intervalo de registro de 1 s utilizado para los
análisis, que tiene una resolución pobre en comparación con las longitudes de En particular, las diferencias entre los intervalos de registro de 30 ms y 1 s son
trama de voz de 30-60 ms, podría ser la causa de una discriminación deficiente 1,5 dB y 1.7 dB para SPL eq en semi-
del SPL modo Entre las dos habitaciones. En segundo lugar, el ruido registrado en salas anecoicas y reverberantes, respectivamente, y 16,5 dB y 7.4 dB para SPL metro en
las pausas del habla, que es el ruido interno de la cadena de medición en la sala salas semianecoicas y reverberantes, respectivamente. Tenga en cuenta que las
semianecoica y el ruido debido a la reverberación del habla en la sala de diferencias en SPL eq son los mismos para PWL, ya que son iguales hasta una
reverberación, contribuye a la reducción de SPL eq y SPL metro en grabaciones de constante aditiva. A la luz de las consideraciones expresadas anteriormente, no se
discurso. Tenga en cuenta que en la sala semianecoica, los niveles de ruido recomienda la adopción de un intervalo de registro de 30 ms.
registrados en las pausas del habla se deben al ruido interno de la cadena de
medición y no al ruido de fondo de la sala. 37 El análisis resumido en la Fig. 3 para un sujeto se ha extendido a todos los
sujetos involucrados en los experimentos. Mesa Virginia) muestra los resultados
obtenidos al procesar la señal obtenida con el micrófono de cabeza usando un
intervalo de registro de 30 ms sin eliminar pausas. Los valores medios de todos los

El ruido grabado en las pausas del habla en la sala de reverberación, debido a la parámetros de SPL del habla informados en la tabla son consistentes con los

larga cola del sonido del habla que llena los espacios en el marco del habla, es resultados obtenidos para el sujeto individual: sus valores son más bajos cuando

bastante mayor (alrededor de 75 dB) que el ruido interno de la cadena de medición se analizan con un intervalo de registro de 30 ms en comparación con 1 s, sobre

en la sala semianecoica (alrededor 60 dB). Este comportamiento determina una todo para SPL metro y SPL modo.

disminución de SPL metro valores en la sala semianecoica en gran medida, por lo que
Además, las señales de todos los sujetos adquiridos con el micrófono
no se destaca una mayor intensidad vocal esperada en esta sala en comparación
headworn se han procesado con el mismo intervalo de registro de 30 ms,
con la sala reverberante, mientras que el bajo número de ocurrencias de niveles de
pero eliminando las pausas con dos técnicas diferentes. El primero se basa
ruido afecta levemente el SPL eq
en el algoritmo PRAAT "cutpauses" (versión 6.0.46), cuyo umbral de silencio

Estimación en las dos habitaciones.


se ha establecido en 35 dB para la sala semianecoica y 25 dB para la sala

Cuando se considera una longitud de fotograma más corta de 30 ms, comparable a


reverberante. Este último se basa en un MATLAB guión (MathWorks, Natick, MA),

la pausa inter-silábica 55 , 56 como en el dispositivo de contacto, se enfatizan todos los


desarrollado por los autores, que se basa en un umbral establecido en el 50%

hallazgos anteriores, como se muestra en la Fig. 3 (cuadro inferior). En cuanto a SPL modo está
del valor eficaz de la grabación general. Los resultados obtenidos con las dos
técnicas se presentan en las tablas. V (b) y V (c) , respectivamente. Una
preocupado, un sesgo
comparación entre los resultados reportados en la Tabla V

destaca que los parámetros de SPL de voz obtenidos después de que se han
eliminado las pausas son más altos que los mismos parámetros obtenidos sin eliminar
las pausas, principalmente para SPL metro y SPL modo. Este resultado esperado está
relacionado con la eliminación de los cuadros a menor intensidad que están por
debajo del umbral establecido. Cabe señalar que la técnica utilizada para cortar las
pausas afecta los parámetros estimados, como se muestra mediante una
comparación entre tablas V (b) y V (c) . En particular, la técnica implementada por los
autores parece proporcionar resultados más confiables ya que los niveles del habla
aumentan en la sala semianecoica con respecto a la sala reverberante, como se
muestra en la Tabla

V (c) . Esto está de acuerdo con los resultados obtenidos por el dispositivo de
contacto (ver Tabla II ), aunque las diferencias de nivel de voz en la tabla V (c) no
son significativos si se comparan con la incertidumbre estimada. También debe
señalarse que los resultados que se muestran en la Tabla V (c) no están lejos de
los obtenidos sin eliminar pausas y adoptar un intervalo de registro de 1 s, como
se resume en la Tabla IV , incluso teniendo en cuenta que para ambos análisis las
diferencias de nivel de voz no son significativas con respecto a la incertidumbre.
HIGO. 3. Histogramas de ocurrencias SPL relacionadas con muestras de voz en las que un
estudiante universitario describió un mapa monitoreado usando el micrófono en las salas
semianecoicas (gris oscuro) y reverberantes (gris claro) de INRiM. Los datos se refieren a intervalos
de registro de 1 sy 30 ms en el gráfico superior y el gráfico inferior, respectivamente. Como en el presente trabajo, Castellana et al. 39 analizó el efecto de
diferentes intervalos de registro en el intra y

2548 J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 Astolfi et al.
TABLA V. Valor promedio (celdas superiores) y desviación estándar del promedio (celdas inferiores) de SPL equivalente, medio y de modo y PWL de sonido (dB), estimado con el micrófono de cabeza a una
distancia de aproximadamente 2.5 cm de la boca del hablante . Los datos están relacionados con la tarea de la libertad de expresión y la descripción de un mapa en las salas semianecoicas (sa) y reverberantes
(r). Las pausas no se han eliminado de las muestras de voz (a), las pausas se han eliminado de las muestras de voz con el algoritmo PRAAT "cutpauses", cuyo umbral de silencio se ha establecido en 35 dB para
la sala semianecoica y 25 dB para la sala reverberante (b), se han eliminado las pausas de las muestras de voz que establecen el umbral de silencio al 50% del valor eficaz de la grabación general (c). Se ha
utilizado un intervalo de registro de 30 ms para los análisis. SPL y sonido PWL diferencias entre las salas semianecoicas y reverberantes ( RE) También se informan.

SPL eq SPL metro SPL modo PWL


Numero de
Tarea sujetos sa r sa r sa r sa r re SPL eq re SPL metro re SPL modo re PWL

(una) Pausas no eliminadas

Libertad de expresión 29 92,8 91,9 80,7 84,7 89,7 92,0 69,5 68,2 0.9 4.0 4.0 2.3 1.3
0.9 0.9 0.8 0.8 2.6 1,2 0.9 0.9
Mapa 28 93,2 92,8 75,4 82,9 57,3 87,7 69,8 69,2 0.4 0.4 7.5 30,4 0.7
1.0 0.9 0.9 0.8 4.2 4.2 2,0 1.0 0.9
(si) Pausas eliminadas con el algoritmo PRAAT "cutpauses"
Libertad de expresión 29 93,7 92,9 86,6 88,5 93,2 92,8 70,3 69,2 0.8 1.9 0.4 0.4 1.1
0.9 0.9 0.8 0.8 0.9 1.0 0.9 0.9
Mapa 28 94,8 94,8 86,8 89,9 94,8 94,8 71,5 71,1 0.0 3.1 0.0 0.4 0.4

1.0 1.0 0.9 0.9 1.1 1.0 1.0 1.0


(C) Pausas eliminadas estableciendo el umbral de silencio al 50% del valor eficaz de la grabación general

Libertad de expresión 29 94,9 93,8 91,8 91,2 93,0 92,8 71,6 70,2 1.1 0.6 0.2 0.2 1.4
0.8 0.9 0.8 0.8 0.9 0.9 0.8 0.9
Mapa 28 96,1 95,4 92,7 92,2 95,3 94,7 72,8 71,8 0.7 0,5 0.6 1.0
0.9 0.9 0.8 0.8 1.0 1.0 0.9 0.9

La variabilidad entre altavoces de los parámetros de nivel de voz, que se a quienes se les pidió que produjeran muestras de voz libre en una sala
han medido con el micrófono en una cámara semianecoica en lecturas semianecoica y reverberante, frente a un oyente sentado a 6 metros de distancia.
repetidas con muchos sujetos. También encontraron que el parámetro de Las tareas del habla fueron un breve monólogo, donde los sujetos explicaron algo
voz menos afectado era SPL eq, seguido de SPL metro, y el parámetro más que sabían bien y una descripción del mapa con la intención de explicar
afectado fue SPL modo. correctamente las instrucciones al oyente.

En conclusión, un intervalo de registro de 1 s puede considerarse mejor que Los cambios en la intensidad de la voz se detectaron mediante el uso de un
30 ms para los parámetros SPL del habla estimados con micrófonos de cabeza micrófono omnidireccional con cabeza para auriculares MU-55HN de Mipro (Chiayi, Taiwán)
sin eliminar pausas, pero el problema de las grabaciones de ruido de fondo en las y un analizador vocal portátil equipado con un dispositivo de contacto, Voice Care,
pausas del habla aún persiste, lo que hace que los micrófonos en el aire sean desarrollado en el Politecnico di Torino. La estimación de la incertidumbre de los
menos apropiados que el contacto dispositivos basados ​en sensores. Sin parámetros de SPL del habla también se tuvo en cuenta para la evaluación del resultado.
embargo, si se implementa un procedimiento de posprocesamiento para eliminar
las pausas y se utiliza un intervalo de registro de 30 ms, los resultados son Con respecto a las grabaciones con el dispositivo de contacto, que utiliza una
consistentes con los obtenidos con el dispositivo de contacto, aunque no son longitud de cuadro de 30 ms para seleccionar cuadros sonoros, se encontró un
significativos con respecto a la incertidumbre. Otro inconveniente de este análisis aumento significativo de aproximadamente 2 dB para la descripción del mapa en el
posterior al procesamiento es la dependencia de los resultados de la técnica promedio general entre sujetos de SPL equivalentes, medios y de modo en el semi-
utilizada para cortar las pausas que pueden generar resultados diferentes, sobre sala anecoica comparada con la sala reverberante. Esto destaca un mayor esfuerzo
todo cuando la señal adquirida en la sala de reverberación tiene que procesarse. 3 vocal en una sala muerta con una tarea de habla que requiere una intención
, donde una buena separación entre el nivel de ruido y el habla es difícil de comunicativa.
identificar, lo que hace que el procedimiento no sea bien reproducible.

En el caso del micrófono de cabeza que utiliza un intervalo de registro


de 1 s, no se encontraron diferencias significativas entre las habitaciones ni
en SPL de voz ni en PWL de sonido para ambas tareas de voz. La razón
La falta de resultados unívocos en el caso del micrófono de cabeza puede atribuirse a la técnica de adquisición, que en el caso de los micrófonos
también podría referirse a su distancia de los labios del sujeto, que no es en el aire, no permite que los marcos de voz se separen fácilmente de las
necesariamente estable ya que su arco delgado puede causar ligeros cambios
pausas. El ancho del intervalo de registro afecta aún más los resultados: un
en la posición del micrófono durante el experimento. Por el contrario, el sensor
intervalo de registro de 1 s no permite la discriminación entre el SPL modo en
de contacto está conectado a la muesca yugular del sujeto, manteniendo así
las dos salas, y el ruido registrado en las pausas del habla (debido a la
una posición fija durante el experimento.
cadena de medición en la sala semianecoica y la reverberación en la sala
reverberante) determina un SPL más bajo metro valores que los relacionados
solo con los marcos de voz. Con un intervalo de registro más corto de 30 ms,
V. CONCLUSIONES
cuya longitud es comparable a la
En este estudio, se investigó el efecto de la reverberación muy baja
y excesiva en las SPL del habla con sujetos

J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 Astolfi et al. 2549
14 A. Astolfi, A. Carullo, L. Pavese y GE Puglisi, "Duración de los períodos de voz y silencio del
pausa inter-silábica, el ruido grabado en las pausas del habla puede generar SPL
habla continua en diferentes entornos acústicos" J. Acoust. Soc. A.m. 137 ( 2), 565–579 (2015).
erróneo modo detección y SPL significativamente menor metro valores, incluso más de 10
dB, que con un intervalo de registro de 1 s. Si se implementa un procedimiento de 15 MA Picheny, NI Durlach y LD Braida, "Hablando claramente para personas con problemas de

postprocesamiento para eliminar las pausas y se utiliza un intervalo de registro de audición II: características acústicas del habla clara y conversacional" J. Discurso Escucha. Res. 29,

434-446 (1986).
30 ms para los análisis, los resultados son más consistentes con los obtenidos con dieciséisJC Krause y LD Braida, "Propiedades acústicas del habla clara producida naturalmente a
el dispositivo de contacto, aunque no sean significativos con respecto a la ritmos de habla normales" J. Acoust. Soc. A.m. 115 ( 1), 362–378 (2004).
incertidumbre. Sin embargo, aún persiste un inconveniente en el análisis posterior
17 M. Cooke, S. King, M. Garnier y V. Aubanel, "El oyente: una revisión de las modificaciones del
al procesamiento, que es la dependencia de los resultados de la técnica utilizada
habla inducidas por el contexto humano y algorítmico". Comput Discurso Lang. 28, 543–571
para cortar las pausas. Esto puede traer resultados diferentes, sobre todo cuando la
(2014).
señal adquirida en una habitación con alta reverberación tiene que ser procesada. 18 años V. Hazan y R. Baker, "Características acústicas-fonéticas del habla producida con la intención

comunicativa de contrarrestar las condiciones adversas de escucha"


J. Acoust. Soc. A.m. 130 ( 4), 2139-2152 (2011).
19 A. Anderson, M. Bader, E. Bard, E. Boyle, GM Doherty, S. Garrod, S. Isard, J. Kowtko, J.

McAllister, J. Miller, C. Sotillo, HS Thompson y


En resumen, la estimación de los parámetros de SPL se ve menos afectada R. Weinert, "El corpus de tareas de mapas HCRC" Lang. Habla 34, 351-366 (1991).
por el ruido registrado en las pausas del habla con 1 s que con intervalos de registro
20 RM Uchanski, SS Choi, LD Braida, CM Reed y NI Durlach, "Hablando claramente para personas con
de 30 ms, lo que sugiere lo primero para adquisiciones con micrófonos en el aire.
dificultades auditivas IV: Estudios adicionales sobre el papel de la velocidad de expresión" J. Discurso
Cuando se eliminan las pausas y se aplica un intervalo de registro de 30 ms para los Escucha. Res. 39, 494-509 (1996).
21 P. Bottalico, S. Graetzer, A. Astolfi y EJ Hunter, "Silencio y acumulación de voces en maestros de
análisis, los resultados son más consistentes con los obtenidos con un sensor de
primaria italianos con y sin trastornos de la voz". J. voz 31 ( 2), 260.e11–260.e20 (2017).
contacto, pero la reproducibilidad es deficiente. Sin embargo, incluso con las pausas
eliminadas, los resultados no están muy lejos de los obtenidos sin eliminar las 22 M. Kob, G. Behler y A. Kamprolf, "Investigaciones experimentales de la influencia de la acústica

pausas y adoptar un intervalo de registro de 1 s, incluso teniendo en cuenta que de la sala en la voz del profesor". Acust. Sci. Tech.
para ambos análisis las diferencias de nivel de voz entre las habitaciones no son 29 ( 1), 86–94 (2008).
23 V. Lyberg A˚ hlander, R. Rydell y A. L € ofqvist, "La comodidad del hablante en entornos de
significativas con respecto a la incertidumbre. .
enseñanza: problemas de voz en el personal docente sueco"
J. voz 25 ( 4), 430-440 (2011).
24 H. Lane, J. Wozniak, M. Matthies, M. Svirsky, J. Perkell, M. O'Connell y J. Manzella, "Cambios en la
presión del sonido y los contornos de frecuencia fundamental después de los cambios en el estado
Como conclusión, este estudio ha demostrado que los dispositivos basados ​en
auditivo" J. Acoust. Soc. A.m. 101 ( 4), 2244-2252 (1997).
sensores de contacto son más adecuados que los micrófonos en el aire para el monitoreo

del habla porque son capaces de detectar la actividad de las cuerdas vocales sin artefactos 25 SB Leder y JB Spitzer, "Frecuencia, intensidad y tasa fundamental de hablar de mujeres adultas

de ruido. con discapacidad auditiva profundamente adventicias"


J. Acoust. Soc. A.m. 93 ( 4), 2146-2151 (1993).
26 DH Klatt, "Usos lingüísticos de la duración segmentaria en inglés: evidencia acústica y

1 M. Cooke, C. Mayo y J. Villegas, "La contribución de los cambios duracionales y espectrales al perceptiva" J. Acoust. Soc. A.m. 59 ( 5), 1208-1221 (1976).
27 CE Williams y KN Stevens, "Emociones y habla: algunos correlatos acústicos" J. Acoust. Soc.
beneficio de la inteligibilidad del habla lombarda". J. Acoust. Soc. A.m. 135 ( 2), 874–883 (2014).
A.m. 52 ( 4), 1238-1250 (1972).
28 JC Krause y LD Braida, "Investigando formas alternativas de lenguaje claro: Los efectos de la
2 P. Bottalico, I. Ipsaro Passione, S. Graetzer y EJ Hunter, "Evaluación del punto de partida del
velocidad y el modo de hablar en la inteligibilidad"
efecto Lombard" Acta Acust. Acust 103 ( 1), 169-172 (2017).
J. Acoust. Soc. A.m. 112, 2165-2172 (2002).
29 WV Summers, DP Pisoni, RH Bernacki, RI Pedlow y MA Stokes, "Efectos del ruido en la
3 HL Lane, B. Tranel y C. Sisson, "Regulación de la comunicación de voz por dinámica sensorial" J.
producción del habla: análisis acústicos y perceptuales" J. Acoust. Soc. A.m. 84 ( 3), 917–928
Acoust. Soc. A.m. 47, 618-624 (1970).
44 JC Junqua, "El reflejo lombardo y su papel en el oyente humano y los reconocedores automáticos (1988).
30 M. Garnier, N. Henrich y D. Dubois, "Influencia de la inmersión del sonido y la interacción
del habla" J. Acoust. Soc. A.m. 93, 510-524 (1993). comunicativa sobre el efecto Lombard". J. Speech Lang. Oír. Res. 53, 588-608 (2010).
55 D. Pelegr ın-Garc ía, B. Smits, J. Brunskog y C. Jeong, "Esfuerzo vocal con el cambio de

distancia entre el hablante y el oyente en diferentes entornos acústicos" J. Acoust. Soc. A.m. 129 31 J. Brunskog, G. Gade, G. Pay a-Ballester y L. Reig-Calbo, "Aumento en el nivel de voz y la comodidad
( 4), 1981–1990 (2011). del orador en las salas de conferencias" J. Acoust. Soc. A.m.
66 JS Lienard y MG Di Benedetto, "Efecto del esfuerzo vocal sobre las propiedades espectrales de las
125, 2072-2082 (2009).
vocales" J. Acoust. Soc. A.m. 106 ( 1), 411–442 (1999). 32 M. Cipriano, A. Astolfi y D. Pelegr ın-García, "Efecto combinado del ruido y la acústica de la sala
77 H. Traunmuller y A. Eriksson, "Efectos acústicos de la variación en el esfuerzo vocal de
sobre el esfuerzo vocal en las aulas simuladas".
hombres, mujeres y niños" J. Acoust. Soc. A.m. 107 ( 6), 3438-3451 (2000).
J. Acoust. Soc. A.m. 141, EL51 – EL56 (2017).
33 P. Bottalico, S. Graetzer y EJ Hunter, "Efectos del estilo del habla, la acústica de la sala y la fatiga
8 H. Cheyne, K. Kalgaonkar, M. Clements y P. Zurek, "Efectos de la distancia del hablante al
vocal en el esfuerzo vocal". J. Acoust. Soc. A.m. 139 ( 5), 2870–2879 (2016).
oyente en la producción y percepción del habla" J. Acoust. Soc. A.m. 126 ( 4), 2052-2060 (2009).
34 A. Carullo, A. Vallan y A. Astolfi, "Problemas de diseño para un analizador vocal portátil" IEEE
99 D. Michael, G. Siegel y H. Pick, Jr., "Efectos de la distancia en la intensidad vocal" J. Discurso
Trans. Instrum. Medida 62 ( 5), 1084-1093 (2013).
Escucha. Res. 38, 1176-1183 (1995). 35 A. Carullo, A. Vallan y A. Astolfi, "Una plataforma de bajo costo para el monitoreo de voz", en Actas
10 D. Pelegr ın-Garc ì, “Comentario sobre 'Aumento del nivel de voz y comodidad del orador en las salas de de la IEEE International Instrumentation and Measurement Technology Conference:
conferencias' [J. Acust. Soc. A.m. 125, 2072–2082 (2009)] ” Instrumentation and Measurement for Life, I2MTC, Minneapolis, MN (6–9 de mayo de 2013),
J. Acoust. Soc. A.m. 129 ( 3), 1161-1164 (2011). Artículo No. 6555383.
11 M. Barron y LJ Lee, "Relaciones energéticas en auditorios de conciertos I" 36 A. Carullo, A. Penna, A. Vallan, A. Astolfi, L. Pavese y GE Puglisi, "Trazabilidad e incertidumbre

J. Acoust. Soc. A.m. 84 ( 2), 618-628 (1988). de los parámetros vocales estimados a través de un micrófono de contacto", en Actas del
12 D. Pelegr ın-Garc ía y J. Brunskog, "Comodidad de los oradores y variación del nivel de voz en las noveno simposio internacional IEEE sobre mediciones y aplicaciones médicas, MeMeA, Lisboa,
aulas: investigación de laboratorio" J. Acoust. Soc. A.m. 132 ( 1), 249–260 (2012). Portugal (11-12 de junio de 2014), artículo No. 68600128.

13 P. Bottalico, A. Astolfi y EJ Hunter, "Períodos de voz y silencio de los maestros durante el 37 P. Bottalico, I. Passione, A. Carullo, A. Astolfi y EJ Hunter, "Precisión de las cantidades medidas
discurso continuo en las aulas con diferentes tiempos de reverberación". J. Acoust. Soc. A.m. 141 por cuatro dosímetros vocales y su incertidumbre". J. Acoust. Soc. A.m. 143 ( 3), 1591-1602

( 1), EL26 – EL31 (2017). (2018).

2550 J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 Astolfi et al.
38 HA Cheyne, HM Hanson, RP Genereux, KN Stevens y RE Hillman, "Desarrollo y prueba de un 47 JG ^
Svec, IR Titze y PS Popolo, "Estimación de los niveles de presión sonora del habla
acumulador vocal portátil" sonora a partir de la vibración de la piel del cuello" J. Acoust. Soc. A.m. 117 ( 3), 1386-1394
J. Speech Lang. Oír. Res. 46 ( 6), 1457–1467 (2003). (2005).
39 A. Castellana, A. Carullo, A. Astolfi, GE Puglisi y U. Fugiglando, "Variabilidad entre hablantes y 48 WA Dreschler, H. Verschuure, C. Ludvigsen y S. Westermann, "Ruidos ICRA: señales de ruido

entre hablantes en el nivel de presión del sonido del habla en lecturas repetidas". J. Acoust. Soc. artificiales con propiedades espectrales y temporales similares al habla para la evaluación de los

A.m. 141 ( 4), 2353–2363 (2017). audífonos". Audiología 40 ( 3), 148-157 (2001).
40 A. Carullo, A. Astolfi, A. Castellana, GE Puglisi, F. Casassa y L. Pavese, "Comparación de

rendimiento de diferentes micrófonos de contacto utilizados para el monitoreo de voz", en Actas 49 ISO 3741: Acústica: determinación de los niveles de potencia acústica y los niveles de energía

del Congreso Internacional sobre Sonido y Vibración 22, Florencia, Italia (12-16 de julio de 2015). acústica de las fuentes de ruido utilizando la presión acústica. Métodos de precisión para salas de
prueba de reverberación ( Organización Internacional de Normalización, Ginebra, Suiza, 2010).
41 G. Calosso, GE Puglisi, A. Astolfi, A. Castellana, A. Carullo y F. Pellerey, "Un estudio longitudinal
de un año escolar de los parámetros de voz de los maestros de secundaria y la influencia de la 50 JD Gibbons y S. Chakraborti, Inferencia estadística no paramétrica

acústica en el aula". J. Acoust. Soc. A.m. 142 ( 2), 1055-1066 (2017). (Taylor y Francis, Londres, 2003), págs. 215–223.
51 A. Astolfi, A. Castellana, A. Carullo y GE Puglisi, "Incertidumbre de los parámetros de nivel de voz
42 GE Puglisi, A. Astolfi, LC Cantor Cutiva y A. Carullo, “Estudio de seguimiento de cuatro días medidos con un dispositivo basado en un sensor de contacto y un micrófono con auriculares" J.
sobre el monitoreo de la voz de los maestros de primaria: relaciones con conversaciones Acoust. Soc. A.m. 143 ( 6), EL496 – EL502 (2018).
acústica de tareas y aula "
52 Y. Xu, "En defensa del discurso de laboratorio" J. Fonética 38 ( 3), 329-336 (2010).
J. Acoust. Soc. A.m. 141 ( 1), 441–452 (2017).
43 P. Bottalico y A. Astolfi, "Investigaciones sobre dosis vocales y parámetros pertenecientes a

maestros de primaria en las aulas" J. Acoust. Soc. A.m. 131 ( 4), 2817–2827 (2012). 53 ME Beckman, "Una tipología del habla espontánea", en Prosodia informática, editado por Y.

Sagisaka, N. Campbell y N. Higuchi (Springer, Nueva York, 1997), págs. 7–26.


44 J. Szudek, A. Ostevik, P. Dziegielewski, J. Robinson-Anagor, N. Gomaa,
54 NV Welham y MA Maclagan, "Fatiga vocal: conocimiento actual y direcciones futuras" J. voz 17 ( 1),
B. Hodgetts y A. Ho: “¿Puedes escucharme ahora? Validación de una prueba de detección de pérdida
auditiva basada en iPod " J. Otolaryngol. Cabeza Cuello Surg. 41 ( 1), S78 – S84 (2012). 21-30 (2003).
55 E. Campione y J. Veronis, "Un estudio multilingüe a gran escala de la duración de la pausa
45 JC Wang, S. Zupancic, C. Ray, J. Cordero y JC Demke, "Aplicación de prueba de audición útil para la silenciosa", en Actas de la Speech Prosody Conference, editado por B. Bel e I. Marlien

detección inicial, la investigación original muestra" Oír. J. 67, (Aix-en-Provence, Laboratoire Parole et Language, Francia, 2002), págs. 199-202.
32-35 (2014).
46 A. Carullo, A. Vallan, A. Astolfi, L. Pavese y GE Puglisi, "Validación de procedimientos de 56 P. Sarkar y KS Rao, "Pausas de modelado para la síntesis del estilo de narración de cuentos usando

calibración y estimación de incertidumbre de analizadores vocales basados ​en micrófonos de características de palabras sin supervisión" Procedia Comp. Sci. 58,
contacto". Medición 74, 130-142 (2015). 42-49 (2015).

J. Acoust. Soc. A.m. 145 ( 4), abril de 2019 Astolfi et al. 2551

También podría gustarte