Está en la página 1de 22

VISUALIZACIÓN EN TIEMPÓ REAL DEL

LÓUDNESS A LÓ LARGÓ DE
DIFERENTES ESCALAS DE TIEMPÓ
RESUMEN
Proponemos un conjunto de criterios de diseño para visualizar las características de
volumen de una señal de audio, medidas a lo largo de diferentes escalas de
tiempo. Se presenta un nuevo medidor de sonoridad en tiempo real, basado en
estos criterios. El medidor muestra simultáneamente la sonoridad a corto plazo, la
sonoridad a largo plazo y el nivel máximo. El volumen a corto plazo se muestra
mediante un gráfico de barras circular. El medidor muestra el volumen a largo
plazo por medio de un gráfico circular envolvente, organizado de acuerdo con una
escala de tiempo absoluta, similar a una pantalla de radar. Típicamente, el volumen
medido durante la última hora es visible. Los algoritmos subyacentes a las
mediciones de nivel de volumen y pico del medidor tienen en cuenta las recientes
recomendaciones del UIT-R (ITU-R en inglés) y la investigación sobre el
modelado de volumen.

Este artículo presenta un prototipo de un nuevo medidor de sonoridad en tiempo


real, que muestra simultáneamente la sonoridad a corto plazo, la sonoridad a largo
plazo y el nivel máximo. Las tres funciones de medición se han elegido para
satisfacer las necesidades de transmisión, así como en otros entornos de
producción donde una diversidad de material de programa debe alinearse en el
nivel percibido y al mismo tiempo mantenerse dentro de los límites técnicos. Un
medidor en sí mismo no alinea los niveles: un operador está (idealmente) presente
para atender los ajustes, asistido por herramientas visuales como medidores.

1. INTRODUCCIÓN
Las características de una señal de audio que varían en el tiempo se pueden
visualizar de diferentes maneras. Dichas características pueden ser medidas
objetivas o pueden representar propiedades perceptivas de la señal. Las

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
características discutidas en este documento son de dos tipos: 1) el volumen de la
característica perceptiva, y 2) la medida objetiva del valor pico real.

En la medición de las características, el análisis de la señal de audio se realiza a lo


largo del tiempo, de modo que las características están representadas por escalares
que varían en el tiempo (es decir, vectores), uno para cada característica. La
resolución básica del tiempo del análisis debe adaptarse a la granularidad
perceptiva o técnicamente relevante. Este objetivo podría estar en conflicto con las
posibilidades de una visualización adecuada. El gran desafío de la visualización es
presentar la cantidad deseada de información de tal manera que sea fácil de
comprender, y sin perder el acceso a los detalles.

1.1. Escalas de tiempo para mostrar

Para nuestra aplicación, es deseable la visualización simultánea a lo largo de tres


escalas de tiempo diferentes. Una escala de tiempo es un valor instantáneo, que
reacciona rápidamente a la función medida y, por lo general, mantiene la
indicación de una posible condición de alarma (por ejemplo, sobrecarga) durante
un corto tiempo, para permitir que un operador la vea.

Una indicación de movimiento más lento es útil para ayudar al operador a ajustar
el sistema de sonido, generalmente la ganancia. Esta indicación debería reaccionar
y moverse con una velocidad similar a la percepción general de la característica.
Por ejemplo, el discurso de un hablante capacitado puede considerarse de
volumen constante a pesar de que ocurren fluctuaciones a corto plazo. La pantalla
debe reflejar este hecho.

Finalmente, un registro o historial de las fluctuaciones de una característica puede


ser deseable. Tal registro podría, por ejemplo, usarse para verificar que el volumen
esté alineado apropiadamente entre diferentes segmentos de una transmisión.

1.2. Estandarización

Dentro de la UIT-R (Unidad Internacional de Telecomunicaciones - Sector de


Comunicaciones por Radio), un grupo de estudio ha estado trabajando en los
métodos de sonoridad y medición de nivel de pico real, y recientemente presentó
dos nuevas recomendaciones: [1] y [2]. El primero describe los algoritmos de
medición, mientras que [2] describe la presentación visual de las mediciones. Se
Ars Novo Record 2020®
https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
reconoce la necesidad de una medida de sonoridad tanto a corto como a largo
plazo, pero solo con el método de medición a largo plazo especificado en la
actualidad. Además, se describen métodos para estimar confiablemente el
verdadero valor pico.

El paradigma de visualización presentado en este artículo es una alternativa, o


suplemento, al descrito en [2].

2. NECESIDAD DE MEDICIÓN DEL VOLUMEN


El contenido de audio en los numerosos formatos en uso se procesa de forma
dinámica, espectral y, a veces, incluso espacialmente, de acuerdo con las
propiedades de los medios, el formato y las condiciones de reproducción, ver p. Ej.
[3, 4]. Cada formato requiere diferentes configuraciones óptimas de ancho de
banda, rango dinámico, etc., en función de las condiciones de escucha esperadas y
también de las propiedades del canal de transmisión o medio de almacenamiento
disponible, como la velocidad de datos.

Estas configuraciones óptimas diferentes se suman al procesamiento dinámico


necesario para reducir las variaciones de volumen no deseadas. Por lo tanto, se
requiere un medidor de volumen como complemento de la medición de nivel
tradicional.

En muchos casos, sería deseable una forma totalmente automática de establecer


los parámetros de procesamiento de acuerdo con los diferentes requisitos. Es
posible que este objetivo no sea trivial, pero en todos los casos se necesita una
función de monitoreo: un medidor que pueda mostrar las propiedades perceptivas
relevantes, es decir, el volumen a corto y largo plazo. Además, se requiere una
función para controlar el nivel máximo medido como ayuda para evitar el recorte.
Tal medida técnica se requiere, además de las medidas perceptivas (de volumen),
debido a las limitaciones del canal de transmisión.

2.1. Medidores de nivel previos: VU y PPM

Tradicionalmente, el objetivo principal de los medidores de nivel ha sido de


naturaleza técnica: sirven como ayuda para cumplir ciertos criterios técnicos, como
obtener una buena relación señal/ruido en un medio analógico. Aquí, se discuten
los tipos estandarizados de medidores de nivel VU y PPM [5, 6, 7].
Ars Novo Record 2020®
https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
El medidor VU (unidad de volumen) [5] mide el nivel rectificado de onda completa
(es decir, valor absoluto) con una constante de tiempo relativamente lenta. El
tiempo de respuesta del medidor a los niveles ascendentes y descendentes es
(idealmente) idéntico. Para juzgar el nivel general, el medidor de VU puede ser
bastante útil, pero debido a su algoritmo de medición, el medidor de VU no es
adecuado para la medición de volumen. Teniendo en cuenta las características de
saturación suave de las grabaciones de cintas analógicas, el medidor VU se ha
utilizado con éxito durante años para establecer el nivel de grabación correcto, a
menudo complementado por una lámpara indicadora de pico, ya que el medidor
es demasiado lento para reaccionar en transitorios cortos. La escala del medidor
VU se muestra en la Figura 1. Normalmente se emplea un instrumento mecánico
con una aguja indicadora delgada. Ten en cuenta el contraste en el medidor y la
escala curva con una escala de voltaje aproximadamente lineal y, por lo tanto,
intervalos no lineales en la escala de dB. La sección de sobrecarga (por encima del
100%) es de color rojo.

Figura 1: escala del medidor VU de [5].

Para un control más preciso de los niveles máximos, como los necesarios en la
transmisión de radio y televisión por razones técnicas y legales, se creó otro tipo de
medidor: el medidor de programa pico (PPM) [6], [7]. En realidad, existen dos
generaciones de PPM: una con respuesta instantánea a niveles crecientes y otra
con un tiempo de respuesta corto (unos pocos milisegundos). El algoritmo de
medición consiste en tomar el valor máximo de la señal rectificada de onda
completa. El tiempo de caída se elige para que sea lo suficientemente largo como
para que un operador pueda notar incluso picos breves, pero no se vea afectado
por el parpadeo del medidor. Los picos muy cortos, que pueden causar problemas
en los sistemas de transmisión y almacenamiento digital, se subestiman en el PPM

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
original debido al tiempo de respuesta, por lo que para las mediciones pico en el
dominio digital, se mide el valor máximo de la muestra [7].

Aunque el PPM no fue diseñado para, y no es realmente adecuado para, la


medición y la alineación del volumen, se pueden establecer algunas reglas para
ayudar a un operador a usar el PPM para ese propósito de todos modos [8], secc.
5.2. Una desventaja importante de estas reglas es que requieren el conocimiento
del tipo o género real del material fuente. Los estándares describen diferentes
escalas de visualización apropiadas, su contraste, brillo, color, etc. El factor humano
se tiene en cuenta en las especificaciones para el tiempo de caída y el tiempo de
retención de pico. Se han especificado escalas de medidor para pantallas
mecánicas y optoelectrónicas. La figura 2 muestra una de las escalas para la
pantalla mecánica; ten en cuenta la escala lineal de dB.

Figura 2: escala PPM de [6].

La pantalla optoelectrónica, como se muestra en la Figura 3, presenta una


correspondencia no lineal entre la longitud de la barra y dB, pero diferente del
medidor VU con su escala de voltaje lineal. En cambio, el tipo de barra de PPM
aprovecha la tecnología digital y adapta la graduación de la escala a las
necesidades de los usuarios, proporcionando una resolución fina a altos niveles y
un amplio rango dinámico. Se especifica un mínimo de 100 segmentos para el
instrumento de tipo barra con el fin de proporcionar una longitud de la barra que
cambie suavemente.

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
Figura 3: escala PPM de tipo barra de [7].

Las pantallas de medidores de nivel tradicionales, como se describió anteriormente,


fueron determinadas por una mezcla de factores técnicos y humanos, algunos de
los cuales tienen una base científica, mientras que otros se basan en la experiencia
de su dominio de aplicación. Aunque ninguno de estos medidores es
particularmente adecuado para medir el volumen, partes de sus propiedades de
visualización se han aplicado a nuestro medidor de volumen presentado y la
pantalla asociada descrita en la sección 3.

2.2. Normalización del medidor de sonoridad dentro de la UIT

Los algoritmos de medición y los requisitos de visualización para el volumen y los


medidores de nivel de pico verdadero se han descrito recientemente en las
recomendaciones [1] y [2] de la UIT. Aunque los algoritmos especificados pueden
no ser los mejores disponibles, ahora se han estandarizado para que se puedan
hacer nuevos medidores, proporcionando una mejor estimación del volumen
percibido que un medidor VU o PPM. De hecho, la medición de sonoridad
especificada en [1] no mide realmente la sonoridad, sino más bien una estimación
de la compensación de ganancia requerida para hacer coincidir la sonoridad de un
clip de sonido con la de un sonido de referencia.

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
Debido a los aspectos no lineales de la audición, esta compensación de ganancia y
el cambio correspondiente en el volumen pueden diferir. Este problema se
reconoce en la recomendación. Sin embargo, para fines operativos, la
compensación de ganancia puede ser bastante útil, ya que el operador tiene
herramientas de ajuste de ganancia fácilmente disponibles.

El algoritmo de medición de volumen consiste en un valor RMS ponderado en


frecuencia, desarrollado con intervalos de tiempo de medición del orden de 10-30
segundos, es decir, un Leq (nivel equivalente). En el caso de una entrada multicanal,
se calcula un solo valor de volumen basado en una suma de energía ponderada. Un
período de medición de 10 segundos es a largo plazo en lugar de a corto plazo, y
no es directamente adecuado para un medidor en tiempo real. Pero como no se
disponía de datos de referencia para la coincidencia de sonoridad continuamente
variable, no se pudo probar la precisión de una medición a corto plazo.

Se han especificado tres pantallas diferentes en [2], una de las cuales se muestra en
la Figura 4. En comparación con los medidores VU y PPM, observa los
relativamente pocos segmentos y la escala lineal en LU (Unidades de volumen -
equivalente a dB). Además, el rango de la escala es bastante pequeño, lo que está
de acuerdo con el propósito principal del medidor como una ayuda para alinear el
volumen y no un medidor de nivel de propósito general.

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
Figura 4: Pantalla del medidor de volumen, de acuerdo con [2].

Después de seguir de cerca el proceso de la UIT de crear estas dos


recomendaciones desde 2003, nos gustaría hacer algunas Observaciones: El
contenido de las recomendaciones no siempre es el de la ciencia más sólida, sino
más bien una combinación de ciencia, intereses personales (o
institucionales/empresariales) y negociaciones políticas. En el lado positivo, [1]
contiene una apertura para mejorar los algoritmos de medición de volumen que no
son tan fáciles de engañar como la simple medida de energía ponderada en
frecuencia. Desafortunadamente, las estadísticas que describen los resultados son
insuficientes para permitir una comparación científicamente válida entre el método
recomendado y los métodos alternativos. Falta información sobre la incertidumbre
estadística, la variabilidad de los oyentes, etc. [9, 10]. Además, el estándar [1]
requiere un algoritmo de medición de volumen a corto plazo, que ciertamente es
necesario para la medición (y el control) en tiempo real.

3. UN NUEVO MEDIDOR DE SONORIDAD


Ars Novo Record 2020®
https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
En el medidor de volumen que presentamos aquí, hemos empleado principios de
visualización exitosos de medidores de nivel anteriores, en combinación con un
nuevo tipo de visualización del historial de volumen a largo plazo. El medidor
muestra el volumen a corto plazo y el volumen a largo plazo durante un período
de tiempo, junto con las señales y las indicaciones de sobrecarga. Nuestro diseño
de los algoritmos de medición y la pantalla del medidor ha evolucionado como una
mezcla entre ciencia, intuición y experiencia empírica.

3.1. Algoritmos de Medida

3.1.1. Medición de sonoridad

La sonoridad, como tal, es una propiedad perceptiva del sonido, pero puede
modelarse utilizando diferentes algoritmos y, por lo tanto, puede medirse como
una propiedad objetiva del sonido.

La investigación sobre modelos psicoacústicos de percepción de sonoridad se lleva


a cabo durante décadas. Lo más destacado es que el modelo de sonoridad de
Zwicker se ha estandarizado como ISO-532B [11]; sin embargo, estos modelos se
desarrollaron para medir el volumen de los sonidos con propiedades estacionarias,
como el ruido y los tonos, y por lo tanto no son adecuados para aplicaciones de
medición [10]. Más recientemente, Glasberg y Moore han presentado
investigaciones sobre el modelado del volumen variable en el tiempo de ciertas
clases de señales [12, 13]. Para aplicaciones de medidores de volumen, se han
desarrollado algoritmos de medición simplificados, p. [14]

El medidor actual mide el volumen de la señal de entrada mediante un modelo


simple de percepción de volumen, pero no requiere ningún modelo de volumen
particular. Para señales de entrada multicanal, se calcula una sola medición de
volumen, combinando la contribución de cada canal.

El medidor de volumen utiliza la unidad de medida de LU (Unidades de volumen).


La LU es una medida en dB, con 0 LU correspondiente a un nivel de volumen de
referencia. El nivel de volumen de referencia y el rango aceptable de fluctuación a
su alrededor pueden depender de la política relativa al canal de transmisión
particular que el medidor está monitoreando.

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
En nuestro prototipo de medidor, se empleó el algoritmo TC LARM [10], aunque
alternativamente se podrían usar otros algoritmos. La precisión del algoritmo TC
LARM se evaluó en [10], frente a un conjunto de datos de referencia subjetivos,
utilizando una amplia selección de material de voz y música. En comparación con el
algoritmo de medición de Leq ponderado en [1], se encontró que la precisión de
TC LARM era al menos igual de buena.

Las mediciones de volumen a corto y largo plazo que muestra el medidor utilizan
el mismo algoritmo de medición subyacente. Sin embargo, la duración de la
ventana de análisis y la visualización de las mediciones difieren para el volumen a
corto y largo plazo. Las propiedades temporales de la medición de la sonoridad a
corto plazo se desarrollaron con varios criterios prácticos en mente. Por ejemplo:
¿cuánto disminuye la sonoridad a corto plazo, en los períodos 'silenciosos' que
están presentes en el habla normal? ¿Cuánto aumenta el volumen a corto plazo al
ritmo del snare en la música pop/rock? Del mismo modo, la medición a largo plazo
se desarrolló para proporcionar una medición constante, dentro de más/menos un
par de LU, para material con un volumen percibido constante global (ver también
la sección 3.2.4). En la implementación actual de nuestro prototipo de medidor de
sonoridad, utilizamos las siguientes longitudes de las ventanas de análisis:
sonoridad a corto plazo: 0,5 s; Sonoridad a largo plazo: 2.5 s.

3.1.2. Nivel máximo

Está bien establecido [15, 1] que el verdadero valor pico de una señal digital puede
estar significativamente por encima de la magnitud de las muestras reales.
Especialmente las señales que se han recortado o procesado de otra manera no
linealmente exhiben esta propiedad. Cuando permanezca dentro del dominio
digital y no realice un procesamiento posterior, esto no planteará problemas
(excepto por la distorsión inherente al procesamiento no lineal). Sin embargo, al
cambiar el dominio o la frecuencia de muestreo, el valor pico verdadero, y
posiblemente más alto, puede aparecer en el nuevo dominio. De esa forma, puede
producirse una sobrecarga y una distorsión audible adicional.

Los picos no representados directamente por las muestras se pueden estimar de


manera fácil y precisa mediante el uso de una técnica de interpolación, como se
utiliza en el sobremuestreo y la conversión de D a A [1]. Un filtro de paso bajo

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
corto (FIR) cerca de la frecuencia Nyquist y un factor de interpolación de 4-8
producirán buenas estimaciones del verdadero valor pico. Dicha técnica se emplea
en el medidor presentado.

En nuestro prototipo de medidor de volumen, solo se muestran las indicaciones


esenciales sobrecargadas y de "señal presente", para cada canal de entrada.

3.2. Visualización de medidas

3.2.1. Visualización de volumen a corto plazo

La Figura 5 muestra la pantalla del medidor de volumen desarrollado, en una


versión en escala de grises (para una mejor impresión). En el medidor de volumen,
un gráfico de barras circular muestra el volumen a corto plazo de la señal de
entrada, medido por el algoritmo de volumen subyacente. Este gráfico de barras
corresponde a la intensidad ‘actual’ que percibiría un oyente. Si el sonido tiene un
volumen bastante constante, el gráfico de barras permanece bastante constante (a
diferencia de los medidores tradicionales, eso podría cambiar solo en función de la
amplitud de la señal). La región aceptable de volumen está codificada por colores:
si el volumen a corto plazo de un segmento del programa permanece dentro de la
región verde, el operador puede determinar fácilmente que el material no era ni
demasiado fuerte ni demasiado suave.

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
Figura 5: Una versión en escala de grises de la pantalla del medidor de volumen desarrollado.

El rango de la escala de sonoridad a corto plazo es mayor que en el medidor ITU,


cf. Figura 4. La región superior de -20 a +15 LU utiliza una escala lineal, similar a la
recomendación de la UIT. Los tics de escala en la región superior corresponden a
los minutos en un reloj analógico, y dependiendo de la tecnología utilizada, se
puede lograr una resolución de pantalla de 0.1-0.5 LU. Esta resolución permite una
visualización que cambia suavemente sin parpadeo perceptible. La región de nivel
inferior de la pantalla puede ser útil como una indicación más detallada de "señal
presente", como en la pantalla tipo barra PPM (Figura 3).

Varias propiedades de la pantalla de volumen a corto plazo están de acuerdo con


el conocimiento sobre la percepción visual humana, por ejemplo, capítulos 6 y 8 en
[16]. Una de esas propiedades es la redundancia, que aumenta la robustez de las
lecturas. El volumen a corto plazo se señala no solo por una posición (del extremo
del arco/barra curva) sino también por el tamaño del arco, es decir, el ángulo
cubierto. Además, el final del arco cambia de ángulo de acuerdo con el volumen
actual. Como el ojo es más sensible al movimiento angular que al movimiento
"lineal", esto aumenta la legibilidad de la pantalla. Finalmente, los colores se usan
para codificar regiones relevantes. Juntas, estas propiedades también ayudan a
Ars Novo Record 2020®
https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
garantizar que el volumen a corto plazo sea evidente, incluso si a un operador
humano se le presentaron varias pantallas simultáneas, o si leía el medidor desde la
distancia.

3.2.2. Pantalla de volumen a largo plazo

El volumen a largo plazo se muestra en el centro del medidor de volumen, por


medio de un gráfico de envolvente circular. El gráfico de envolvente está
organizado de acuerdo con una escala de tiempo absoluta, similar a los relojes
analógicos familiares. De este modo, el volumen a largo plazo de la señal de
entrada durante la última hora se muestra en todo momento. En la Figura 5, el
tiempo es 9:13, por lo tanto, el volumen actual a largo plazo se muestra en la
posición "13 minutos después de la hora". Cuanto más "viejo" sea la entrada de
volumen a largo plazo, más se desvanecerá en el fondo (blanco en la Figura 5,
negro en la Figura 6). Por lo tanto, la pantalla de volumen a largo plazo aparece
como una "pantalla de radar" que está escaneando en sentido horario.

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
Figura 6: Una versión en color de la pantalla del medidor de volumen desarrollado, con una señal de entrada mono.

Cuanto más lejos del centro está el gráfico de volumen a largo plazo, más fuerte
era el sonido en ese momento. Las diferentes regiones de color corresponden a
"volumen de referencia inferior",..., "volumen de referencia superior" (Figura 6).

Como una característica adicional, el volumen a largo plazo que se muestra podría
cubrir cualquier período de tiempo, desde el último minuto (el tiempo se amplía)
hasta las últimas 12 horas (el tiempo se aleja por completo). Además, un solo
medidor de volumen podría registrar o log el historial de volumen de varias
fuentes simultáneas, entre las cuales el operador podría cambiar mientras
monitorea las fuentes.

Hemos implementado el medidor de volumen como un prototipo virtual


(software). La Figura 6 muestra la visualización del prototipo.

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
3.2.3. Nivel de señal y pantalla de sobrecarga

El indicador de nivel de señal del medidor de volumen consta de una columna de


componentes de tipo LED para cada canal de audio de la fuente de entrada. El
indicador rojo se enciende, durante un breve período, cuando se detecta una
sobrecarga de señal. Típicamente, la sobrecarga se indica cuando el nivel está cerca
o por encima de 0 dBFS, pero alternativamente se podrían usar niveles más bajos,
dependiendo de la política relativa a la fuente en particular. El indicador verde se
enciende cuando el nivel de la señal está por encima de (digamos) -50 dBFS, para
indicar que hay una señal en el canal correspondiente, por el contrario, para indicar
un abandono de la señal.

Además, el indicador de sobrecarga de señal podría mostrar, utilizando un punto


de color, cualquier sobrecarga de señal (en cualquier canal) que haya ocurrido
durante la última hora (Figura 5). Estos puntos se muestran a lo largo de la
circunferencia de la pantalla de volumen a largo plazo, donde sus ubicaciones se
utilizan para indicar que ciertos eventos ocurrieron en el momento
correspondiente. Incluso se podrían usar diferentes colores para indicar (otros)
problemas técnicos que ocurrieron en el pasado, como la pérdida de señal o la
pérdida de sincronización del reloj para una entrada digital.

3.2.4. Ejemplo

Aunque un medidor de volumen es inherentemente un instrumento para ser


utilizado en tiempo real, para fines de ilustración, los datos de medición de
volumen pueden extraerse y trazarse. Los tres gráficos en la Figura 7 muestran las
mediciones de sonoridad a corto y largo plazo y la amplitud de la señal, en función
del tiempo, utilizando una señal de prueba como entrada al medidor. Esto
demuestra cómo (mucho) las dos medidas de volumen fluctúan para diferentes
tipos de material de audio.

Una señal de prueba estaba compuesta por dos segmentos de audio, cada uno de
15 segundos de duración, que representaban señales características: habla y
música pop (Tabla 1). Mientras que la señal de voz es una grabación bastante
"seca", la pista pop sin duda ha sido procesada con compresión dinámica y otras
técnicas de masterización. Cada uno de los segmentos se 'normalizó por nivel'
individualmente, es decir, se escalaron para alcanzar un pico a 0 dBFS.
Ars Novo Record 2020®
https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
Tabla 1: El contenido de la señal de prueba, que se muestra en la Figura 7.

El gráfico de volumen a corto plazo revela que el segmento del habla consta de dos
oraciones habladas, pero también que el hablante logra un volumen bastante
constante, con variaciones dentro de +/− 5 LU. Aunque ambos segmentos se
normalizaron en el pico, el gráfico de volumen a largo plazo muestra que el
segmento pop es consistentemente más fuerte que el segmento del habla. De
hecho, el segmento pop logra mantenerse 6-8 LU por encima del nivel de volumen
de referencia, prácticamente sin variación.

Imagínate que estos dos segmentos se transmitieron por radio, sin procesamiento
adicional, mientras el medidor de volumen estaba "escuchando" la señal. El
historial de sonoridad a largo plazo del medidor podría sugerir que el segmento
pop debería haber sido atenuado, digamos, 5 dB, para evitar que los oyentes
aumenten notablemente la sonoridad. Lund describe la aplicación del medidor de
volumen en el contexto de la transmisión para TV digital y otros medios [17].

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
Figura 7: El volumen a corto plazo, el volumen a largo plazo y la amplitud de una señal de prueba que consta de 2
segmentos. Primeros 15 segundos: habla femenina; Últimos 15 segundos: Madonna - Hung Up.

4. HACIA LA EVALUACIÓN
La efectividad de cualquier medidor de volumen dependerá tanto de la apariencia
gráfica como del comportamiento dinámico de su pantalla, así como de sus
algoritmos de medición subyacentes. Todos estos factores deben tenerse en
cuenta al evaluar la calidad general y la usabilidad del medidor.

La evaluación formal de un sistema de visualización, como el que se describe en


este documento, es un desafío: en primer lugar, se debe definir una o más métricas
para evaluar la pantalla. La correspondencia entre el sonido escuchado y la imagen
vista es un aspecto a evaluar. Otra métrica podría caracterizar la velocidad de

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
lectura confiable del medidor. Un medidor de alto contraste y parpadeo podría
causar fatiga ocular (a pesar de que tal pantalla podría ser inmediatamente más
legible). La utilidad de tener varios tipos de mediciones de volumen disponibles de
un vistazo puede ser difícil de medir directamente, pero tiene que ver con la
compacidad de la pantalla, que nuevamente determina dónde puede caber la
pantalla en la aplicación, y cuántas fuentes independientes pueden ser se muestra
en medidores individuales, en un espacio de trabajo dado.

Hasta ahora, nuestro medidor de volumen solo se ha verificado de manera


informal: hemos recibido respuestas positivas de usuarios potenciales en diferentes
áreas de aplicación. Todavía no se ha intentado una evaluación experimental
sistemática del medidor propuesto.

4.1. Un ejemplo de un método de evaluación.

En [18] se ha propuesto un método para diseñar y evaluar un medidor de volumen


a corto plazo. El propósito de ese estudio fue abordar la necesidad expresada por
la UIT en [1]. Se describen al menos dos desafíos en [18]: Primero, se debe
encontrar una forma de crear una medida continuamente variable del volumen
percibido, es decir, un conjunto de datos de referencia para evaluar la medición por
el medidor. En segundo lugar, estos datos de referencia que varían en el tiempo
deben compararse con la pantalla del medidor. Como resultado de la evaluación,
los parámetros técnicos del medidor (o su algoritmo de medición) pueden
establecerse en los valores apropiados.

En lugar de capturar el volumen que varía en el tiempo, la tarea de los sujetos en


[18] era ajustar continuamente un control de ganancia para mantener constante el
volumen, es decir, se registró un factor de corrección de ganancia que varía
continuamente. Se encontraron un par de dificultades al usar este método: 1)
Cuando los sujetos ajustaban la ganancia, tendían a sobrepasar un poco. Esto debe
tenerse en cuenta al analizar los datos. 2) Los sujetos tendían a la deriva en su
referencia de volumen. Esto significa que su factor de corrección de ganancia para
segmentos de sonido idénticos cambió con el tiempo.

Para evaluar las variaciones de un medidor de sonoridad a corto plazo, la salida del
algoritmo de medición de sonoridad de la UIT utilizando diferentes longitudes de
la ventana de tiempo de análisis se trazó frente a los datos subjetivos de ajuste de

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
ganancia. La evaluación consistió en una inspección visual de estas parcelas, y en
base a eso se eligió una ventana de tiempo de 3 segundos como óptima para una
medición de "sonoridad a corto plazo".

4.2. Un método de evaluación propuesto

Un medidor de volumen con sus algoritmos de medición subyacentes y métodos


de visualización contiene muchos parámetros, más de lo que podría ajustarse
fácilmente en un experimento de tipo de ajuste tradicional. Además, la tarea de
evaluar el medidor completo en un experimento requeriría una cantidad
considerable de tiempo, ya que la inclusión de un historial de señales depende de
escuchar varios segmentos de sonido en una sola sesión.

Una forma de superar las dificultades de realizar un experimento de ajuste


multiparamétrico sería presentar varios medidores completos diferentes, con
variaciones preestablecidas de los algoritmos subyacentes y sus parámetros, y tal
vez incluso mostrar tipos. En ese caso, la tarea de los sujetos de prueba sería
calificar los diferentes medidores de acuerdo con criterios específicos (como las
métricas mencionadas anteriormente), así como la impresión general subjetiva.

5. CONCLUSIÓN
Hemos propuesto algunos criterios de diseño para visualizar las características de
volumen de una señal de audio, medidas a lo largo de diferentes escalas de
tiempo. Luego presentamos un nuevo medidor de volumen, que muestra
simultáneamente tres características que varían en el tiempo de una señal de audio:
volumen a corto plazo, historial de volumen a largo plazo y un indicador de
sobrecarga. Nuestro medidor muestra el volumen a corto plazo utilizando un
gráfico de barras circular.

El volumen a largo plazo se muestra mediante un gráfico de envolvente circular,


organizado de acuerdo con una escala de tiempo absoluta, que se parece a una
pantalla de radar. El medidor de sonoridad en tiempo real presentado proporciona
así una solución completa a los requisitos para un medidor de sonoridad efectivo.
Los algoritmos subyacentes a la medición del nivel de volumen y el volumen del
prototipo del medidor tienen en cuenta las recientes recomendaciones del UIT-R y

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
la investigación sobre el modelado de volumen. Finalmente, se discutieron
diferentes aspectos de la evaluación de un medidor de volumen.

6. REFERENCIAS
[1] UIT-R [ITU-R] (2006) "Rec. UIT-R BS.1770, Algoritmos para medir el volumen del
programa de audio y el nivel de audio de pico real", Unión Internacional de
Telecomunicaciones.

[2] UIT-R (2006) "Rec. UIT-R BS.1771, Requisitos de sonoridad y medidores de


indicación de pico verdadero", Unión Internacional de Telecomunicaciones.

3] Emmett, J. (2003) "Niveles de audio: en el nuevo mundo de los sistemas


digitales", EBU Technical Review, vol.2003: enero.

[4] Moerman, J.P. (2004) "Loudness in TV Sound", en Proc. de la AES 116a Conv.

[5] IEC (1990) "IEC 268-17. Equipo de sistema de sonido - Parte 17: Indicadores de
volumen estándar", Comisión Electrotécnica Internacional.

[6] IEC (1991) "IEC 268-10. Equipo de sistema de sonido - Parte 10: Medidores de
nivel de programa pico", Comisión Electrotécnica Internacional.

[7] IEC (1995) "IEC 268-18. Equipo de sistema de sonido - Parte 18: Medidores de
nivel de programa pico - Medidor de nivel de audio digital", Comisión
Electrotécnica Internacional.

[8] Dickreiter, M. (1987) "Handbuch der Tonstudiotechnik, Band 1" (5. Auflage. Ed.),
München: K. G. Saur.

9] Skovenborg, E., Quesnel, R. y Nielsen, S.H. (2004) "Loudness Assessment of Music


and Speech", en Proc. de la 116ª Convención AES, Berlín.

[10] Skovenborg, E. y Nielsen, S.H. (2004) "Evaluación de diferentes modelos de


sonoridad con música y material de habla", en Proc. de la 117a Convención AES,
San Francisco.

[11] ISO (1975) "Acústica. Método para calcular el nivel de sonoridad. Norma
Internacional ISO 532 (1.ed.)", Organización Internacional de Normalización.

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
[12] Glasberg, B.R. & Moore, B.C.J. (2002) "Un modelo de sonoridad aplicable a
sonidos que varían en el tiempo", Journal of the Audio Engineering Society, vol.50:
5, pp.331-342.

[13] Moore, B.C.J., Glasberg, B.R. & Stone, M.A. (2003) "¿Por qué son tan ruidosos
los comerciales? - Percepción y modelado de la sonoridad del discurso comprimido
en amplitud", Journal of the Audio Engineering Society, vol.51: 12, pp.1123-1132.

[14] Jones, B.L. & Torick, E.L. (1982) "Un nuevo indicador de sonoridad para su uso
en la radiodifusión", en Proc. de la 71ª Convención AES, Montreux.

[15] Nielsen, S.H. & Lund, T. (2003) "Sobrecarga en la conversión de señal", en Proc.
de la 23ª AES Intl. Conf.

[16] Goldstein, E.B. (1989) "Sensación y percepción" (3ª ed.), Belmont: Wadsworth
Publishing Company.

[17] Lund, T. (2006) "Control de la sonoridad en la televisión digital", en Proc. de la


Convención NAB-2006.

[18] Soulodre, G. y Lavoie, M.C. (2006) "Desarrollo y evaluación de medidores de


sonoridad a corto plazo", en el Proc. De la 121ª convocatoria AES.

Acerca del autor

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
Un verdadero veterano de la industria de la música y la docencia, Juan Oscar
Morat ha trabajado como productor, ingeniero de grabación, guitarrista y
tecladista, compositor y arreglador para una gran variedad de artistas de
grabación, películas y programas de televisión. También ha ejercido como docente
en la carrera de Ingeniería de Sonido en diversas Universidades de Argentina y ha
extendido su enseñanza en el ámbito privado creando su propia Academia.
Actualmente Juan se desempeña como Ingeniero en Jefe en Elektriqus Studios
para Sony/ATV en el departamento de mezcla y mastering. También lleva
adelante su sello Ars Novo Records y su propio estudio de Mixing & Mastering
Online "Estudios Del Gnomo", donde también da cursos de Grabación, Mezcla y
Mastering.

https://www.facebook.com/juanoscar.morat

https://twitter.com/IBETCEBEL

https://www.instagram.com/juanoscarmorat

arsnovorecord@yahoo.com.ar

Ars Novo Record 2020®


https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks

También podría gustarte