Documentos de Académico
Documentos de Profesional
Documentos de Cultura
LÓUDNESS A LÓ LARGÓ DE
DIFERENTES ESCALAS DE TIEMPÓ
RESUMEN
Proponemos un conjunto de criterios de diseño para visualizar las características de
volumen de una señal de audio, medidas a lo largo de diferentes escalas de
tiempo. Se presenta un nuevo medidor de sonoridad en tiempo real, basado en
estos criterios. El medidor muestra simultáneamente la sonoridad a corto plazo, la
sonoridad a largo plazo y el nivel máximo. El volumen a corto plazo se muestra
mediante un gráfico de barras circular. El medidor muestra el volumen a largo
plazo por medio de un gráfico circular envolvente, organizado de acuerdo con una
escala de tiempo absoluta, similar a una pantalla de radar. Típicamente, el volumen
medido durante la última hora es visible. Los algoritmos subyacentes a las
mediciones de nivel de volumen y pico del medidor tienen en cuenta las recientes
recomendaciones del UIT-R (ITU-R en inglés) y la investigación sobre el
modelado de volumen.
1. INTRODUCCIÓN
Las características de una señal de audio que varían en el tiempo se pueden
visualizar de diferentes maneras. Dichas características pueden ser medidas
objetivas o pueden representar propiedades perceptivas de la señal. Las
Una indicación de movimiento más lento es útil para ayudar al operador a ajustar
el sistema de sonido, generalmente la ganancia. Esta indicación debería reaccionar
y moverse con una velocidad similar a la percepción general de la característica.
Por ejemplo, el discurso de un hablante capacitado puede considerarse de
volumen constante a pesar de que ocurren fluctuaciones a corto plazo. La pantalla
debe reflejar este hecho.
1.2. Estandarización
Para un control más preciso de los niveles máximos, como los necesarios en la
transmisión de radio y televisión por razones técnicas y legales, se creó otro tipo de
medidor: el medidor de programa pico (PPM) [6], [7]. En realidad, existen dos
generaciones de PPM: una con respuesta instantánea a niveles crecientes y otra
con un tiempo de respuesta corto (unos pocos milisegundos). El algoritmo de
medición consiste en tomar el valor máximo de la señal rectificada de onda
completa. El tiempo de caída se elige para que sea lo suficientemente largo como
para que un operador pueda notar incluso picos breves, pero no se vea afectado
por el parpadeo del medidor. Los picos muy cortos, que pueden causar problemas
en los sistemas de transmisión y almacenamiento digital, se subestiman en el PPM
Se han especificado tres pantallas diferentes en [2], una de las cuales se muestra en
la Figura 4. En comparación con los medidores VU y PPM, observa los
relativamente pocos segmentos y la escala lineal en LU (Unidades de volumen -
equivalente a dB). Además, el rango de la escala es bastante pequeño, lo que está
de acuerdo con el propósito principal del medidor como una ayuda para alinear el
volumen y no un medidor de nivel de propósito general.
La sonoridad, como tal, es una propiedad perceptiva del sonido, pero puede
modelarse utilizando diferentes algoritmos y, por lo tanto, puede medirse como
una propiedad objetiva del sonido.
Las mediciones de volumen a corto y largo plazo que muestra el medidor utilizan
el mismo algoritmo de medición subyacente. Sin embargo, la duración de la
ventana de análisis y la visualización de las mediciones difieren para el volumen a
corto y largo plazo. Las propiedades temporales de la medición de la sonoridad a
corto plazo se desarrollaron con varios criterios prácticos en mente. Por ejemplo:
¿cuánto disminuye la sonoridad a corto plazo, en los períodos 'silenciosos' que
están presentes en el habla normal? ¿Cuánto aumenta el volumen a corto plazo al
ritmo del snare en la música pop/rock? Del mismo modo, la medición a largo plazo
se desarrolló para proporcionar una medición constante, dentro de más/menos un
par de LU, para material con un volumen percibido constante global (ver también
la sección 3.2.4). En la implementación actual de nuestro prototipo de medidor de
sonoridad, utilizamos las siguientes longitudes de las ventanas de análisis:
sonoridad a corto plazo: 0,5 s; Sonoridad a largo plazo: 2.5 s.
Está bien establecido [15, 1] que el verdadero valor pico de una señal digital puede
estar significativamente por encima de la magnitud de las muestras reales.
Especialmente las señales que se han recortado o procesado de otra manera no
linealmente exhiben esta propiedad. Cuando permanezca dentro del dominio
digital y no realice un procesamiento posterior, esto no planteará problemas
(excepto por la distorsión inherente al procesamiento no lineal). Sin embargo, al
cambiar el dominio o la frecuencia de muestreo, el valor pico verdadero, y
posiblemente más alto, puede aparecer en el nuevo dominio. De esa forma, puede
producirse una sobrecarga y una distorsión audible adicional.
Cuanto más lejos del centro está el gráfico de volumen a largo plazo, más fuerte
era el sonido en ese momento. Las diferentes regiones de color corresponden a
"volumen de referencia inferior",..., "volumen de referencia superior" (Figura 6).
Como una característica adicional, el volumen a largo plazo que se muestra podría
cubrir cualquier período de tiempo, desde el último minuto (el tiempo se amplía)
hasta las últimas 12 horas (el tiempo se aleja por completo). Además, un solo
medidor de volumen podría registrar o log el historial de volumen de varias
fuentes simultáneas, entre las cuales el operador podría cambiar mientras
monitorea las fuentes.
3.2.4. Ejemplo
Una señal de prueba estaba compuesta por dos segmentos de audio, cada uno de
15 segundos de duración, que representaban señales características: habla y
música pop (Tabla 1). Mientras que la señal de voz es una grabación bastante
"seca", la pista pop sin duda ha sido procesada con compresión dinámica y otras
técnicas de masterización. Cada uno de los segmentos se 'normalizó por nivel'
individualmente, es decir, se escalaron para alcanzar un pico a 0 dBFS.
Ars Novo Record 2020®
https://www.facebook.com/groups/Cursosdegrabacionytallerdemusica/?ref=bookmarks
Tabla 1: El contenido de la señal de prueba, que se muestra en la Figura 7.
El gráfico de volumen a corto plazo revela que el segmento del habla consta de dos
oraciones habladas, pero también que el hablante logra un volumen bastante
constante, con variaciones dentro de +/− 5 LU. Aunque ambos segmentos se
normalizaron en el pico, el gráfico de volumen a largo plazo muestra que el
segmento pop es consistentemente más fuerte que el segmento del habla. De
hecho, el segmento pop logra mantenerse 6-8 LU por encima del nivel de volumen
de referencia, prácticamente sin variación.
Imagínate que estos dos segmentos se transmitieron por radio, sin procesamiento
adicional, mientras el medidor de volumen estaba "escuchando" la señal. El
historial de sonoridad a largo plazo del medidor podría sugerir que el segmento
pop debería haber sido atenuado, digamos, 5 dB, para evitar que los oyentes
aumenten notablemente la sonoridad. Lund describe la aplicación del medidor de
volumen en el contexto de la transmisión para TV digital y otros medios [17].
4. HACIA LA EVALUACIÓN
La efectividad de cualquier medidor de volumen dependerá tanto de la apariencia
gráfica como del comportamiento dinámico de su pantalla, así como de sus
algoritmos de medición subyacentes. Todos estos factores deben tenerse en
cuenta al evaluar la calidad general y la usabilidad del medidor.
Para evaluar las variaciones de un medidor de sonoridad a corto plazo, la salida del
algoritmo de medición de sonoridad de la UIT utilizando diferentes longitudes de
la ventana de tiempo de análisis se trazó frente a los datos subjetivos de ajuste de
5. CONCLUSIÓN
Hemos propuesto algunos criterios de diseño para visualizar las características de
volumen de una señal de audio, medidas a lo largo de diferentes escalas de
tiempo. Luego presentamos un nuevo medidor de volumen, que muestra
simultáneamente tres características que varían en el tiempo de una señal de audio:
volumen a corto plazo, historial de volumen a largo plazo y un indicador de
sobrecarga. Nuestro medidor muestra el volumen a corto plazo utilizando un
gráfico de barras circular.
6. REFERENCIAS
[1] UIT-R [ITU-R] (2006) "Rec. UIT-R BS.1770, Algoritmos para medir el volumen del
programa de audio y el nivel de audio de pico real", Unión Internacional de
Telecomunicaciones.
[4] Moerman, J.P. (2004) "Loudness in TV Sound", en Proc. de la AES 116a Conv.
[5] IEC (1990) "IEC 268-17. Equipo de sistema de sonido - Parte 17: Indicadores de
volumen estándar", Comisión Electrotécnica Internacional.
[6] IEC (1991) "IEC 268-10. Equipo de sistema de sonido - Parte 10: Medidores de
nivel de programa pico", Comisión Electrotécnica Internacional.
[7] IEC (1995) "IEC 268-18. Equipo de sistema de sonido - Parte 18: Medidores de
nivel de programa pico - Medidor de nivel de audio digital", Comisión
Electrotécnica Internacional.
[8] Dickreiter, M. (1987) "Handbuch der Tonstudiotechnik, Band 1" (5. Auflage. Ed.),
München: K. G. Saur.
[11] ISO (1975) "Acústica. Método para calcular el nivel de sonoridad. Norma
Internacional ISO 532 (1.ed.)", Organización Internacional de Normalización.
[13] Moore, B.C.J., Glasberg, B.R. & Stone, M.A. (2003) "¿Por qué son tan ruidosos
los comerciales? - Percepción y modelado de la sonoridad del discurso comprimido
en amplitud", Journal of the Audio Engineering Society, vol.51: 12, pp.1123-1132.
[14] Jones, B.L. & Torick, E.L. (1982) "Un nuevo indicador de sonoridad para su uso
en la radiodifusión", en Proc. de la 71ª Convención AES, Montreux.
[15] Nielsen, S.H. & Lund, T. (2003) "Sobrecarga en la conversión de señal", en Proc.
de la 23ª AES Intl. Conf.
[16] Goldstein, E.B. (1989) "Sensación y percepción" (3ª ed.), Belmont: Wadsworth
Publishing Company.
https://www.facebook.com/juanoscar.morat
https://twitter.com/IBETCEBEL
https://www.instagram.com/juanoscarmorat
arsnovorecord@yahoo.com.ar