Está en la página 1de 7

Subestilos de Belting: características fonatorias y resonantes

INTRODUCCIÓN

El término "voz a todo volumen" se refiere a la producción de voz parecida a un


discurso, un grito o un grito que se escucha en subestilos vocales comerciales como pop,
rock, R&B, jazz, country y música del mundo, así como en el teatro musical. Se diferencia
sustancialmente de la estética de la tradición vocal clásica occidental. Tradicionalmente, la
voz a todo volumen se ha descrito como fuerte, nasal y más parecida a los gritos que a la
estética operística del canto.

Con el tiempo, este sonido, tal como se usa en el mundo del teatro musical
profesional, ha evolucionado hacia una serie de subestilos discernibles, que podrían
denominarse belting de timbre cobrizos, nasales, de habla y pesados.1 En el canto de teatro
musical, cada subestilo representa y mejora la representación de los personajes en el
escenario. Los subestilos se utilizan comúnmente también en otros tipos de la llamada
música comercial contemporánea.

Hollien y Miles señalaron la necesidad de una descripción científica de la banda


sonora.2 Los hallazgos fisiológicos que diferencian la producción de voces clásicas y de
belting han mostrado muchas diferencias importantes que incluyen variaciones en los
patrones vibratorios de las cuerdas vocales, cocientes de velocidad y cocientes cerrados de
las cuerdas vocales, presión del aire, diferencias de inclinación del cartílago de la tiroides y
cartílagos cricoides, la posición del hioides hueso, afectación de los músculos
supralaríngeos, características de resonancia y altura laríngea comparativa.

En una investigación de un solo tema, Estill 3 analizó las características acústicas y


fisiológicas de los belting en comparación con los modos de "habla" y "ópera". Descubrió
que el uso del belting era considerablemente más fuerte que estos estilos y también que se
producía con un alto grado de actividad EMG en el músculo vocal.

Además, descubrió que el cociente de contacto, medido a partir de un


electroglotograma (EGG), era más alto en el belting y más bajo en la ópera. También notó
diferencias en las señales del electromiograma (EMG) registradas en varios músculos
laríngeos extrínsecos.

Schutte y Miller compararon los estilos de canto '' no clásico '' y operístico con
respecto a las mediciones de presión espectrográfica, electroglotográfica y sub y
supraglótica y llegaron a una definición de '' Belting'' sobre la base de sus hallazgos: ''
Belting es una forma de cantar fuerte que se caracteriza por el uso constante del registro de
'pecho' (> 50% de la fase cerrada de la glotis) en un rango en el que la elevación de la
laringe es necesaria para hacer coincidir el primer formante con el segundo armónico en
abierto (F1 alto ) vocales, es decir ∼G4-D5 en voces femeninas ''.

Bestebreurtje y Schutte estudiaron las estrategias de resonancia y los cocientes de


contacto EGG que su único sujeto usaba al cantar y un estilo de canto "similar al habla no
optimizado" en algunas vocales cantadas en los tonos G4 y B4-bemol.
Encontraron que para / e /, el segundo formante F2 estaba cerca del quinto armónico
parcial, mientras que para / i /, F1 estaba a medio camino entre el primer y el segundo
parciales. Concluyeron que el sonido fuerte y brillante del estilo belting se logra mediante la
implementación de estrategias de resonancia que mejoran los armónicos más altos. El
cociente de contacto para belting promedió por encima del 52%.

En un tercer estudio de un solo tema, Evans y Howard 6 compararon el cociente de


contacto en los estilos belting y ópera en algunas vocales cantadas en los tonos C4, E4, C5
y E5. Para el estilo de ópera, el cociente de contacto varió en el rango de 18 a 34%,
mientras que en el belting varió en el rango de 43 a 57%. Se observó alguna variación con
F0.

El propósito del presente estudio fue identificar propiedades características en


algunos subestilos belting. Se registraron ejemplos de los diversos subestilos de belting
producidos por un solo sujeto. Para asegurarse de que estos ejemplos fueran
representativos de los subestilos respectivos, un panel de expertos llevó a cabo una prueba
de escucha. Los ejemplos se analizaron con respecto a la presión subglótica, la fuente de la
voz y las características de la frecuencia de los formantes.

MÉTODO

El único sujeto del estudio fue el coautor L.P., quien es entrenador de voz y cantante
profesional. Ella interpretó ejemplos de cinco subestilos de belting que se escuchan
comúnmente en el teatro musical: pesado, metálico, con timbre, nasal y con forma de habla,
y también producción de voz clásica para comparar.1

El material de la canción fue un extracto tomado de ''Everything's Coming Up Roses


'' de Gypsy (1959, música de Jule Styne y letra de Stephen Sondheim), Figura 1. Ella cantó
este ejemplo primero dos veces con la letra original y luego dos veces con la sílaba / pae /
reemplazando las sílabas de la letra. Finalmente, cantó diminuendos repitiendo la sílaba /
pae / en el tono de Fa # 4 (370 Hz). El sujeto cantó cada uno de estos ejemplos en cada
uno de los cinco subestilos de belting y también, para fines de comparación, en un estilo
clásico de canto.

Las grabaciones se realizaron en la cámara anecoica del Departamento de


Lingüística de la Universidad de Estocolmo. La Figura 2 muestra la configuración
experimental en términos de un diagrama de bloques. La señal de audio fue captada por un
micrófono de condensador Bru € el & Kjaer (Naerum, Dinamarca) (B&K 4190 2435611) a
una distancia de 30 cm. Se utilizó un transductor de presión S7b Gaeltec (Dunvegan, Isla de
Skye, Escocia), que la cantante sostenía en la comisura de la boca, para capturar la presión
oral. La presión oral durante la oclusión de la consonante / p / se utilizó como una
estimación de la presión subglótica. La señal de electroglotografía se registró a partir de una
electroglotografía de dos canales EG2 de Glottal Enterprises (Syracuse, NY). Estas tres
señales se digitalizaron y grabaron en diferentes canales de un archivo wav utilizando el
software SoundSwell (Hitech Development, Solna, Suecia). La señal de audio se calibró
sosteniendo una vocal, cuyo nivel de presión sonora (SPL) se midió por medio de un
sonómetro Ono Sokki LA-210 (Ono Sokki Co., Ltd., Yokohama, Japón) colocado junto al
micrófono de grabación. El valor de SPL así observado se anunció en la grabación. El
transductor de presión se calibró sumergiéndolo primero en agua a una profundidad que se
midió y anunció en la grabación y luego manteniéndolo al aire libre.

Como el experimento se llevó a cabo en un solo sujeto, era importante evaluar los
ejemplos de los distintos subestilos vocales registrados. Esto se hizo en términos de una
prueba de escucha con ocho expertos. Todos los expertos fueron activos como profesores
profesionales de canto en estos estilos y, por lo tanto, estaban completamente
familiarizados con los estilos en cuestión. En la prueba, los estímulos se dividieron en tres
grupos, (1) el extracto de la canción con la letra original, (2) el extracto de la canción
cantada en la sílaba / pae / y, (3) los cuatro primeros tonos (más fuertes) de la diminuendos
en la sílaba / pae /, todos producidos en cada uno de los seis estilos vocales. Los estímulos
se copiaron en tres archivos de prueba, uno por grupo de estímulos. En cada grupo, cada
estímulo ocurrió dos veces. Los estímulos fueron separados por pausas de 5 segundos y
aparecieron en orden aleatorio. La duración total de los tres archivos de prueba fue de 460
segundos.

Los archivos de prueba se copiaron en un CD y se enviaron a cada miembro del


panel. Su tarea consistía en clasificar los estímulos en hojas de papel. Antes de la prueba
se presentaron los estímulos de ancla adecuados, propios de los distintos subestilos
vocales (Tabla 1).

La fuente de voz se analizó mediante el filtrado inverso de la señal de audio


mediante el programa Decap a medida (Svante Granqvist, KTH, Suecia), complementado
con la derivada de la forma de onda EGG (dEGG). Se aplicaron dos criterios para ajustar
los filtros inversos: (1) una fase cerrada sin rizado y (2) sincronicidad del pico positivo
principal del dEGG y discontinuidad de la forma de onda de flujo que representa el cierre de
la glotis.7 Las frecuencias y anchos de banda de la La configuración del filtro inverso y los
glottogramas de flujo resultantes se guardaron en archivos junto con sus derivadas y las
señales dEGG. A partir del glotograma de flujo se determinaron (1) el período T0, (2) la fase
cerrada, (3) la amplitud del pulso, (4) la tasa máxima de declinación del flujo (MFDR) y (5) el
nivel de la fuente de voz fundamental en relación con el de el espectro de la segunda fuente
parcial, H1-H2. El cociente cerrado Qclosed se calculó como la relación entre la duración de
la fase cerrada y T0, y el cociente de amplitud normalizada (NAQ) se calculó como la
relación entre la amplitud del pulso y el producto de MFDR y T0. Desafortunadamente, los
ejemplos de habla / pae / -diminuendo no se pudieron filtrar a la inversa debido a la
nasalización, ya que la nasalización hace que la función de transferencia del órgano de la
voz sea demasiado compleja.

RESULTADO

Para comprobar la coherencia de los miembros del panel de escucha, cada estímulo
se produjo dos veces, en un orden aleatorio, en la prueba. Los números de la Tabla 2
muestran la consistencia de las clasificaciones de los oyentes en términos del porcentaje de
clasificaciones idénticas de estímulos repetidos. Las clasificaciones dadas por el oyente 8
fueron descartadas porque eran mucho menos consistentes que las de los expertos
restantes. El resto de oyentes respondieron consistentemente entre el 61% y el 100% de los
estímulos. Esto sugiere que sus clasificaciones representaban información bastante
confiable.
Los resultados anteriores no revelan cuán representativos fueron los diversos
estímulos para los diferentes estilos. Esto, sin embargo, se puede ver en la Tabla 3, que
muestra los porcentajes de clasificaciones que estuvieron de acuerdo con las intenciones
del cantante. En la mayoría de los casos, los estilos previstos por el cantante dieron como
resultado altos porcentajes. Esto implica que la mayoría de los ejemplos fueron
representativos.

Como era de esperar, los estímulos formados por los cuatro primeros tonos de los
diminuendos de la sílaba / pae / parecían algo más difíciles de clasificar que los estímulos
de la canción. Clásico, discurso y pesado recibieron el mayor número de clasificaciones
"intencionadas", mientras que ringy, nasal y brassy recibieron los números más bajos. El
estímulo de cuatro tonos en el estilo Ringy en realidad se clasificó de maneras que se
desvían de las intenciones del cantante en la mayoría de los casos.

En resumen, la prueba de escucha mostró que la mayoría de los estímulos eran


bastante fáciles de clasificar y que, en la mayoría de los casos, las clasificaciones
realizadas por los oyentes expertos coincidían con las del cantante. Esto apoyó la
suposición de que era significativo analizar con más detalle las características de fonación y
resonancia de estos estímulos.

Propiedades de la fuente de voz

La Figura 3 muestra la presión subglótica Psub y el nivel de sonido equivalente Leq,


promediado a través de los tonos para los diferentes estilos vocales en la versión / pae / del
extracto de la canción y en el diminuendo. Debido a problemas técnicos, no se obtuvieron
datos Psub para el ejemplo de la canción en clásico. Heavy se produjo con las presiones
más altas y también mostró la mayor variación de presión, como lo indica la alta desviación
estándar en la canción.

La Figura 4A-E muestra el MFDR, el cociente cerrado, NAQ, H1-H2 y la amplitud del
pulso, respectivamente, para los datos observados en el filtrado inverso de las secuencias
de diminuendo de / pae /. Los símbolos grandes incluidos en los mismos gráficos se refieren
a valores observados en la versión / pae / del extracto de la canción producida en un F0
dentro de ± 1 semitono del F0 utilizado en las secuencias de diminuendo de / pae /.

Heavy produjo valores extremos tanto en Psub como en los diversos parámetros del
glottograma; MFDR y Qclosed fueron altos, mientras que H1-H2 y NAQ fueron bajos.
Classical asumió el extremo opuesto, en el sentido de que Psub, MFDR y Qclosed fueron
bajos y H1-H2 y NAQ altos. Brassy mostró alto Qclosed y bajo H1-H2.

Para heavy y brassy, los valores del extracto de la canción están razonablemente
cerca de los valores observados en el material de diminuendo. Para ringy, por otro lado, el
extracto de la canción arrojó valores bastante separados de los valores de diminuendo.
Speechlike asumió una posición con Psub medio, un MFDR bajo, H1-H2 y NAQ, y alto en
Qclosed. En todos estos parámetros, excepto en NAQ, el sonido parecido al habla estuvo
cerca de ser metálico. La amplitud de pulso no mostró diferencias claras entre los estilos
vocales, ni para la versión / pae / -diminuendo ni para la versión / pae / de la canción.

La Figura 5A-E resume los datos que se muestran en la Figura 4 en términos de


promedios y desviaciones estándar de MFDR, Qclosed, H1-H2, NAQ y amplitud de pulso,
respectivamente, como funciones de la Psub promedio para las secuencias diminuendo de /
pae / . Como era de esperar, heavy asume una posición extrema no solo con respecto a
Psub sino también a MFDR, H1-H2 y NAQ, mientras que el clásico asume las posiciones
extremas opuestas no solo con respecto a un Psub bajo sino también a un Qclosed bajo y
un H1- alto. H2. Brassy y ringy están cerca uno del otro con respecto a Psub, MFDR, NAQ y
amplitud de pulso, mientras que brassy en comparación con ringy es más alto en Qclosed y
más bajo en H1-H2. Las desviaciones estándar son en su mayoría pequeñas para clásico y
pesado.

Las curvas de espectro promedio a largo plazo (LTAS) de las diferentes versiones de
la canción se muestran en la Figura 6. La música clásica se destaca por sus bajos niveles
entre 500 y 3000 Hz, un pico marcado a 1600 Hz y un nivel comparativamente alto entre
3000 y 3000 Hz. 4000 Hz. También nasal muestra un pico cercano a los 1600 Hz. Todos los
demás subestilos muestran un mínimo marcado a 2500 Hz. El pico más alto aparece cerca
de 350 Hz para música clásica. Esto está cerca del F0 promedio de 345 Hz del ejemplo de
la canción; por lo que este pico de LTAS simplemente refleja un fuerte fundamental. Los
otros subestilos muestran un pico alto cerca de 750 Hz, es decir, al doble de la media F0;
así que en estos estilos, el segundo parcial tendía a ser fuerte. Heavy, ringy y brassy tienen
niveles altos entre aproximadamente 1000 y 1700 Hz, produciendo los niveles más altos de
LTAS. Todos los estilos, excepto el clásico, muestran un pico marcado cerca de los 3000 Hz.
Sin embargo, debe tenerse en cuenta que el ejemplo no tenía más de unos 10 segundos de
duración y, sin tener en cuenta la nota única, corta y penúltima, tenía un ambito de no más
de un tercio menor.

Las frecuencias de formantes derivadas del análisis de filtro inverso de las diversas
sílabas de las letras se muestran en la Figura 7. La variación entre estilos parece no ser
sistemática excepto para F1 en clásico, que es marcadamente más bajo que en los
subestilos de bandas. Los valores F1 más altos en los subestilos de belting reflejarían
características articulatorias, como una abertura de la mandíbula más ancha, una faringe
más estrecha y / o labios abiertos.

Las curvas de puntos en la Figura 7 muestran las frecuencias de los tres parciales
de espectro más bajos. Las frecuencias formantes no muestran una tendencia consistente a
coincidir con los dos parciales más bajos. El primer formante se acerca al segundo parcial
en no más de dos casos, en la vocal (e) en la palabra grande, F0 z 343 Hz, y en la vocal []
en la palabra the, F0 z 332 Hz, donde el El segundo parcial fue aproximadamente 15 y 10
dB más fuerte que el fundamental, respectivamente. La diferencia de nivel entre los
parciales 1 y 2 en el espectro parecía variar dependiendo de F0 y vocal.

DISCUSIÓN

Nuestra investigación se ha centrado en un solo tema, lo que pone en duda la


validez general de los hallazgos. Para contrarrestar esto, presentamos una prueba de
escucha a un panel de expertos familiarizados con los estilos de canto en cuestión. El
resultado de esta prueba reveló que todos los oyentes excepto uno clasificaron el mismo
estímulo de la misma manera en las dos ocasiones en que ocurrió en la prueba de escucha.
Por tanto, las clasificaciones parecían causar dificultades bastante limitadas al panel.
Además, las clasificaciones del panel coincidieron en su mayoría con las intenciones del
tema cantante; por lo que parece justo concluir que los ejemplos analizados fueron
representativos de los estilos considerados y, por lo tanto, merecen un análisis detallado.
Además, analizar un solo sujeto implica que se usó el mismo órgano vocal en todos los
estilos, lo que implica la ventaja del método de que el sujeto sirve como su propio control.

Schutte y Miller 4 informaron que el cinturón y los estilos legítimos de canto diferían
de varias maneras. Primero, el cinturón se produce con una posición elevada de la laringe ''
necesaria para hacer coincidir el primer formante con el segundo armónico en vocales
abiertas (F1 altas), es decir, G4-D5 en voces femeninas ''. Recientemente, Bourne y
Garnier8 señalaron que F1, a la que se refieren como R1, era más alta en '' cinturón de
pecho '' que en legítimo e informó que '' 'La calidad de cinturón de pecho' 'se caracterizaba
por una afinación de R1 a 2f0, mientras que' Legit 'no mostrar algún ajuste de resonancia en
particular ”. Nuestros análisis se referían principalmente a tonos en el rango F4-Ab4, pero
hubo varios ejemplos de vocales F1 altas. Como se muestra en la Figura 7, no hubo
tendencia a que F1 se acercara al segundo parcial del espectro. Esta observación
concuerda con los hallazgos recientemente reportados por Lebowitz y Baken.9 De hecho,
en la palabra gonn (a), el primer formante estaba bastante cerca del tercer parcial. En el
espectro de la fuente, por otro lado, el primer parcial fue mucho más fuerte en los estilos
clásicos que en los de cinturón, particularmente en los pesados.

No encontramos diferencias notables en la frecuencia de los formantes entre los


estilos, excepto que el clásico tenía un F1 consistentemente más bajo en todas las vocales
analizadas. Como los ejemplos sonaban claramente diferentes, como lo demuestra
cuantitativamente la prueba de escucha, este resultado implica que la fuente de voz fue el
factor principal que distingue los estilos. Se ha encontrado que el ajuste de bandas se
produce con Psub alto y en registro modal. Nuestros análisis de las propiedades de la
fuente de voz produjeron distribuciones bien estratificadas de parámetros de datos. En
promedio, en todos los tonos y tonos, Psub fue más alto en pesado y más bajo en clásico,
ringy y brassy siendo similares entre sí en este parámetro. Ringy, en particular, estaba
bastante cerca de lo clásico. Como el belting se produce en registro modal, se puede
suponer que las cuerdas vocales son gruesas, por lo que se requieren altas presiones de
conducción.

Un apoyo adicional para esta suposición lo proporciona Qclosed, que estaba cerca
de 0.5 en heavy y brassy y no más de 0.25 en classic. Ringy mostró un promedio cerrado
intermedio de alrededor de 0,3. El bajo cociente de la música clásica puede reflejar un
efecto de registro; en la región F0 en cuestión, las cantantes de formación clásica rara vez
utilizan un registro modal puro.

El fundamental de la fuente de voz fue bastante dominante en el clásico y mucho


más débil en los otros estilos, mostrando el más débil, como podría esperarse de los datos
de Qclosed. El promedio de amplitud de pulso fue bastante similar para los diferentes
subestilos de bandas. Esto no es del todo sorprendente, dadas sus diferencias Psub. Un
aumento de Psub, una disminución de la aducción glótica y una disminución de la fase
cerrada tienden a contribuir a un aumento de la amplitud del pulso. NAQ, inversamente
relacionado con el grado de presión percibido, 11 fue bajo para pesado y más alto y similar
para los otros estilos, incluido el clásico.

MFDR merece un análisis especial porque refleja la fuerza de excitación del tracto
vocal, es decir, la contribución de la fuente de voz al nivel de sonido irradiado. Heavy mostró
los valores MFDR más altos, lo que indica que aquí la fuente de voz contribuía
sustancialmente a la sonoridad vocal. Los medios para brassy, classic y ringy eran todos
similares, y el orden de rango era el mismo que para el Leq.

Mostramos los resultados de los promedios de los parámetros de la fuente de voz en


función de Psub. Este puede ser un método prometedor para describir el uso de la voz en
un estilo particular de canto. Los tres principales parámetros de control de la fuente de voz
son Psub, F0 y aducción glotal. Los dos primeros son fáciles de medir; pero en la presente
investigación, F0 varió dentro de un rango muy estrecho, no más de un tercio menor, si se
ignora un solo tono bajo. Por tanto, F0 no parecía un parámetro importante. La aducción de
la glándula, por el contrario, fue ciertamente un parámetro de fuente relevante, y Qclosed,
H1-H2 y NAQ separaron los diferentes estilos más o menos claramente. En la actualidad,
parece difícil decidir qué parámetro o combinación de estos parámetros refleja con mayor
fidelidad la aducción glotal. En futuras investigaciones de estilos vocales, puede ser útil
trazar los datos de la fuente de voz en un gráfico tridimensional con Psub, F0 y aducción
glotal como dimensiones.

También podría gustarte