Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El Camino Hacia Nirvana Sonoridad PDF
El Camino Hacia Nirvana Sonoridad PDF
El camino hacia el nirvana de la Sonoridad
Nivelación de audio con EBU R 128
Artículo original de Florian Camerer (ORF)
Traducción elaborada por:
1 / 10
NOTA:
Este documento es la traducción del documento “On the way to Loudness nirvana” escrito por
Florian Camerer (coordinador del grupo PLOUD de la UER) y al que se puede acceder en
http://tech.ebu.ch/docs/techreview/trev_2010-Q3_loudness_Camerer.pdf.
2 / 10
El camino hacia el nirvana de la
La Recomendación EBU R 128 [1] establece un método definido y predecible para medir el nivel de
sonoridad 1 en programas de noticias, deportes, anuncios, series dramáticas, música, espacios
promocionales, películas, etc. a lo largo de toda la cadena de radiodifusión y por lo tanto ayuda a los
profesionales a crear una especificación robusta para la adquisición, producción, transmisión y distribución a
una gran variedad de plataformas. La UER ha creado cuatro documentos para ayudar a los profesionales a
cumplir la Recomendación R 128. Dicha recomendación está
basada en su totalidad en estándares abiertos y pretende
armonizar la manera en la que producimos y medimos el
audio internacionalmente. Junto a la medida de Sonoridad
de Programa, la R 128 introduce dos descriptores más: el
margen de sonoridad y el pico máximo verdadero. Estos
tres descriptores se han diseñado para trabajar en conjunto,
formando un concepto único que caracteriza la señal de
audio.
La medición de sonoridad y la normalización de
sonoridad representan una verdadera revolución en el
mundo de la nivelación de audio (ver figura 1). Además, este
nuevo paradigma de nivelación de sonoridad afecta a todas
Figura 1 las etapas de una señal de radiodifusión de audio, desde la
Normalización de picos vs. normalización de adquisición hasta la distribución y transmisión. Por lo tanto, el
sonoridad de una secuencia de programas objetivo final no es solo armonizar los niveles de sonoridad
en una misma emisora, sino también entre emisoras diferentes y así alcanzar un nivel de sonoridad único
y universal para el beneficio de los oyentes. Pero que quede claro: el nivel de sonoridad puede (¡y debe!)
variar de acuerdo con criterios artísticos y técnicos a lo largo de un programa. Sin embargo, el método de la
normalización de sonoridad utiliza el promedio de sonoridad de un programa entero, garantizando que los
niveles entre programas y canales sea consistente.
La experiencia de varios miembros de la UER ha puesto de manifiesto que trabajar con el paradigma de
sonoridad resulta liberador y satisfactorio. La lucha por "quien suena mas fuerte" desaparece, las mezclas
pueden ser mas dinámicas, hay menos efectos audibles de compresión ("pumping") y en consecuencia
1 La sonoridad se refiere a la intensidad sonora percibida de un fragmento de audio (música, voz, efectos sonoros,
etc.) La sonoridad depende entre otros factores, del nivel, frecuencia, contenido y duración de la señal de audio
3 / 10
¡Una mejora general de la calidad de audio!. Los productores de contenidos que en el pasado preferían
mezclas mas dinámicas quedan liberados de restricciones y compromisos ya que su programa no suena
mas flojo que programas más comprimidos. Con la normalización de la sonoridad, este compromiso
desaparece. ¡El nirvana está mas cerca que nunca!
Cuando alguien desde su hogar cambia de un canal así a un canal que no se ha sumado a la "guerra de
sonoridad", o si salta la publicidad durante un programa con un margen dinámico mas elevado, hay un salto
de nivel y el oyente tiene que usar el mando a distancia para adecuar el volumen a un nivel confortable. En
el caso de anuncios muy altos, el volumen se tendrá que ajustar de nuevo cuando vuelva el programa
principal. No es de extrañar pues que las emisoras reciban tantas quejas al respecto. Otras personas
solucionan el problema silenciando el audio por completo durante las pausas publicitarias, de manera que
su mensaje queda gravemente mermado.
4 / 10
Es un estándar robusto que tiene
la ventaja de tener una
implementación simple.
Resumidamente, define una curva
de ponderación K ("K-weighting")
que no es mas que un filtro paso-
alto modificado, y que forma la
base para la equivalencia entre
una sensación inherentemente
subjetiva (sonoridad) y una
medida objetiva.
BS.1770 también define y recomienda el uso de un picómetro verdadero para la medida de picos. Un
picómetro de este tipo funciona a un múltiplo de la frecuencia de muestreo (habitualmente sobremuestreo
4x) para cazar los picos inter-muestra que de otra manera podrían sobrepasar los 0 dBFS y por lo tanto
causar distorsión en fases posteriores de la cadena.
ITU-R BS.1770 supone la base para la recomendación EBU 128, la cual extiende dicho estándar definiendo
un nivel destino específico (ver abajo)
La R 128 y la ITU-R BS.1770 son la base. para la normalización de sonoridad, así
como un método de umbral de puerta
Cuatro documentos adicionales que mejora la equivalencia de sonoridad
proporcionan los detalles. en programas que contengan largos
periodos de silencio.
La recomendación EBU fue desarrollada para satisfacer las necesidades de los creadores de contenidos,
con el particular objetivo de disponer de herramientas para medir mezclas completas (en vez de un solo
componente, por ejemplo, diálogos) y el margen de sonoridad de un programa. Para ello, la UER especifica
tres nuevos parámetros:
Sonoridad de programa
La Sonoridad de Programa describe la sonoridad integrada a largo plazo a lo largo de todo un programa. En
la R 128, la definición de la palabra "programa" se usa también para referirse a anuncios, cabeceras de
5 / 10
programa y otros distintivos de emisora. Este parámetro consiste en un número (expresado en LUFS 2 ), con
un dígito después del punto decimal, que indica "cuan alto suena el programa en promedio". Este
parámetro se mide con un medidor que cumpla la ITU-R BS.1770 con la inclusión de la función gating. El
umbral de puerta sirve para pausar la medida de sonoridad cuando la señal baje de un cierto umbral. Sin
esta función gating, los programas con largos periodos de silencio, sonido ambiente o ruido de fondo de
bajo nivel, mostrarían un valor de sonoridad muy bajo en promedio, aunque los momentos en los que no
hay silencio tengan un nivel adecuado. En consecuencia, estos programas sonarían demasiado fuertes en
emisión.
Tras una serie de pruebas, se acordó un umbral de puerta situado a -8 dB en relación a la medida LUFS
"no-puerteada", con una longitud de bloque de 400 ms. Junto a otras conclusiones, estas pruebas también
confirmaron la elección de un nivel de sonoridad destino al cual todas las señales de audio deberán
normalizarse. Se trata de:
Margen de Sonoridad
Otra consideración importante fue la de valorar el margen o rango de sonoridad necesario para acomodar
todos los programas (teniendo en cuenta de no superar el margen de sonoridad tolerable para uso
doméstico). El descriptor "margen de sonoridad" (LRA, Loudness Range) cuantifica (en LU) la variación en
la medida de la sonoridad a lo largo
de un programa. Está basado en la El margen de sonoridad es un descriptor
distribución estadística de la
sonoridad durante un programa,
genérico que ayuda a decidir si se
excluyendo los extremos. Por lo tanto, necesita compresión de dinámica.
un único disparo no será capaz de
polarizar el resultado del cálculo de LRA. La recomendación R 128 no especifica un margen de sonoridad
máximo permitido, ya que depende de factores tales como la ventana de tolerancia a la emisora del oyente
medio, la distribución de géneros televisivos de la emisora, etc. Sin embargo, la R 128 anima a usar el LRA
para decidir si es necesario usar procesamiento dinámico en las señales de audio y para adecuar la señal a
los requerimientos de un determinado canal o plataforma. El documento EBU Tech Doc 3342 [4] describe
con mas detalle el LRA.
2
LUFS indica el valor de la sonoridad ponderada K en referencia al fondo de escala digital. La UER recomienda esta
unidad para salvar una inconsistencia entre la ITU-R BS.1770 y la ITU-R BS.1771. Esta unidad cumple la ISO 80000-8.
6 / 10
Tenga en cuenta que algunos puntos de
la cadena, tales como retransmisores Los medidores de pico
analógicos y codificadores de bajo bitrate sobremuestreados aproximan bien el
requerirán un nivel de pico verdadero
inferior. La guía de distribución de PLOUD
nivel de pico verdadero de una señal de
(EBU Tech Doc 3344 [5]) contiene audio. Los medidores de pico por
información detallada al respecto. muestras, no.
El documento EBU Tech Doc 3343[3] proporciona una guía práctica para la nueva manera de trabajar con
los niveles de audio.
Desde el punto de vista del consumidor, también habría dos maneras básicas de conseguir normalización
de sonoridad. La primera es la normalización de la fuente, de manera que los programas son igual de
sonoros desde su origen. La otra manera es la de usar un metadato de sonoridad que describe cuan
sonoro es un programa. Para este último, los niveles de sonoridad promediados de diferentes programas
no tienen que estar normalizados y de hecho pueden variar mucho del uno al otro. Para aquellos
consumidores que tengan receptores actuales, la normalización puede llevarse a cabo en el hogar, leyendo
el metadato del programa en cuestión y ajustando la ganancia de reproducción hasta conseguir un mismo
valor para todos los canales y en todo momento para un mismo canal.
Abreviaciones
dBFS dBs relativos al fondo de escala digital LU Unidades de sonoridad
dBTP dBs relativos al fondo de escala digital, LUFS Unidades de sonoridad, ponderación K,
medidor de picos verdaderos referidas al fondo de escala digital
FM Modulación de frecuencia PML Nivel máximo permitido
LKFS Sonoridad, ponderación K, referida al PPM Picómetro de programa
fondo de escala
LRA Margen de sonoridad QPPM Cuasi-picómetro de programa
7 / 10
En producción se recomienda la
En el contexto del paradigma de nivelación EBU
normalización de sonoridad de la R 128, se anima a usar la primera solución
fuente, debido a la simplicidad y la debido a las siguientes ventajas:
mejora potencial de calidad.
‐ simplicidad
‐ mejora potencial de la calidad en origen.
La segunda solución no se prohíbe (ver también la guía de distribución EBU Tech Doc 3344 [5]), pero el
hecho de tener un único número (-23 LUFS) tiene mucha fuerza a la hora de difundir el concepto de
sonoridad normalizada, ya que es fácil de entender y actuar en consecuencia. Y la normalización activa en
origen "castiga" también el uso de hipercompresión y por lo tanto anima automáticamente a los productores
de contenidos a pensar en técnicas más dinámicas y creativas para provocar impacto. Dicho en otras
palabras, el cambio técnico en el nivel de origen a través de normalización activa a -23 LUFS tiene
consecuencias directas en el proceso artístico, ¡Y de un modo positivo!
Sin embargo hay que decir que ambos métodos pueden complementarse mutuamente: No hay que
considerarlos "oponentes" en un escenario blanco o negro. Ambas filosofías forman parte de la R 128, pero
debido a las ventajas antes expuestas, se recomienda la normalización en origen.
En cambio, el paradigma de nivelación por sonoridad se puede asemejar a "flotar en el espacio", como se
puede observar en el medidor de la figura 5. La figura 6 muestra un hipotético medidor por software con una
aguja especial.
La UER no especifica detalles sobre aspectos visuales de la interfaz gráfica de un medidor de sonoridad de
manera deliberada, pero en cambio si especifica mejoras del algoritmo BS.1770, así como dos escalas:
Ambas escalas pueden mostrar o bien valores relativos expresados en LU, o el valor absoluto, en LUFS.
Los fabricantes de medidores miembros del grupo PLOUD se han puesto de acuerdo para implementar el
Figura 5
Una representación esquemática de las dos Figura 6
escalas de sonoridad (aquí en LU) tal como Una representación esquemática de un medidor de
describe el documento EBU Tech 3341 sonoridad emulado con una "aguja flexible"
"modo EBU" para asegurar una calibración equivalente en todos ellos. Muchos otros fabricantes de
medidores también han adoptado el "modo EBU" o están en ello.
8 / 10
Un medidor con "modo EBU", tal como se define en EBU Tech Doc 3341 [6] ofrece tres escalas temporales
diferenciadas:
Las ventanas temporales M y S 3 deberán usarse para la mezcla y nivelación de señales de audio en tiempo
real. El ajuste de nivel inicial se realizará observando la medida momentánea M, ajustando el nivel de los
elementos clave (voz, música o efectos sonoros) para situarlos alrededor del nivel destino de -23 LUFS. Se
recomienda cautela al ajustar los niveles inicialmente, ya que resulta mas fácil aumentar gradualmente la
sonoridad integrada durante una mezcla que reducirla. Normalmente, un moderado incremento a lo largo de
un programa resulta mas "natural" y una estrategia inicialmente "defensiva" proporciona al ingeniero de
mezclas mas margen de maniobra en el caso de señales o eventos imprevistos o impredecibles.
Una vez ajustados los niveles, el ingeniero de mezclas puede seguir mezclando "a oído" tranquilamente. Un
vistazo ocasional a la medida momentánea y al valor integrado de sonoridad deberían confirmar que la
mezcla está dentro del margen de tolerancia alrededor del Valor Destino. La visualización numérica del
valor I, con una precisión de un punto decimal, o una visualización gráfica de resolución similar nos permitirá
anticipar tendencias y tomar las contramedidas correspondientes.
En resumen… el hecho de sustituir los picómetros por medidores de sonoridad se acerca a la mejor de las
herramientas de medida: el oído humano.
Mas que medir la sonoridad de programas individuales, la empresa de distribución monitorea el servicio
durante 24 horas, teniendo especial cuidado cuando se trate de servicios conmutados o compartidos.
Asimismo, se monitorea cualquier metadato de sonoridad que pueda acarrear el servicio digital, lo que
permite comparar el valor declarado con el valor medido. (¡Ambos deberán ser -23 LUFS por supuesto!)
Una vez al día, se analizan los datos obtenidos, y cuando se observe una desviación de 0,9 LU respecto al
nivel destino, se aplicará un desplazamiento de nivel (el valor y el método exactos se están discutiendo
todavía) para corregir el promedio a largo plazo, que deberá coincidir con el nivel destino ± 1 LU.
Consecuencias empresariales
Dado que el paradigma de nivelación por sonoridad afecta a todas las etapas de una señal de radiodifusión,
desde la adquisición hasta la transmisión, y dado que el fin último es el de armonizar los niveles de
sonoridad en un canal y entre distintos canales a un único nivel de sonoridad universal que beneficie a los
oyentes, todos los profesionales y todos los equipos de medición de audio en todas las partes de la
cadena se verán afectados por este cambio.
Para muchos, una cuestión fundamental será si se deberán reemplazar todos los cuasi-picómetros
existentes y si todo el personal involucrado necesitará formación para adaptarse a la nueva manera de
trabajar. A largo plazo, la respuesta sin duda es "si", pero la transición no ha de llevarse a cabo de golpe
necesariamente. Sin embargo, como mínimo algunos medidores de sonoridad deberán ser puestos en
servicio cuanto antes, junto a los cuasi-picómetros existentes. La sustitución de medidores puede llevarse a
cabo aprovechando los ciclos de renovación de equipamiento habituales, durante la remodelación de
3
“M” y “S” se usan habitualmente en estereofonía para denominar las señales “Mid” y “Side”. Para distinguir los tiempos
de integración “momentáneo” y “corto plazo”, se pueden usar las versiones “MLK” y “SLK”, Así como “ILK”. “LK” significa
“Nivel, con ponderación K” y cumple con los requisitos del estándar internacional ISO 80000-8.
9 / 10
instalaciones o paso a paso como proyectos separados. El personal se podrá formar en el momento
adecuado. Aquellos responsables de la adquisición de equipos deberán tener en cuenta que los limitadores
de pico que previenen la sobremodulación deberán trabajar en modo pico verdadero y tendrán que ser
ajustados al nivel de pico verdadero máximo adecuado, tanto en producción como a la salida del control
maestro, en la cabecera de la distribución y en centro de emisión.
Conclusiones
La recomendación EBU R 128 y los cuatro documentos adjuntos proporcionan
una manera de acabar por fin con la "guerra de sonoridad". El uso de la
dinámica de audio vuelve a convertirse en una herramienta creativa. Todavía
quedan cosas por aprender y la gente tardará en acostumbrarse a la nueva
manera de trabajar, pero el esfuerzo valdrá la pena.
Más de 230 participantes se han unido al grupo UER PLOUD (Agosto 2010).
Los intercambios de e-mails muestran un índice de actividad nunca antes visto
y los fabricantes de medidores han presentado unidades en la IBC 2010 antes
incluso que la especificación fuera publicada.
Referencias
[1] EBU Technical Recommendation R 128: Loudness normalisation and permitted maximum level of
audio signals
Florian Camerer trabaja como ingeniero senior en la ORF, la corporación de radiodifusión austríaca
con sede en Viena. Su labor comenzó en el área de producción sonora, ampliándose mas adelante a
edición y mezcla de audio. Su campo de especialización fueron los documentales, donde también
desarrolló especial interés por las técnicas de sonido surround. Mezcló su primer documental para la
ORF en sonido multicanal 5.1 en 1995 y ha estado activo en el área de sonido surround desde
entonces, ayudando a la ORF a convertirse en el primer radiodifusor europeo que transmitió una señal
surround 5.1 en directo (Concierto de Año Nuevo, 2003).
En 2008, Florian Camerer propuso a la UER la creación de un grupo de trabajo que estudiase los
problemas de sonoridad, lo que llevo a la creación del grupo PLOUD que preside. PLOUD es el grupo
de trabajo más grande y más activo de la UER, lo que se refleja en el abundante material publicado.
Florian Camerer practica la docencia a nivel internacional en temas de sonido surround y sonoridad.
[2] ITU-R BS.1770: Algorithms to measure audio programme loudness and true-peak audio level
[3] EBU Tech Doc 3343: Practical Guidelines for Production and Implementation in accord- ance
with EBU Technical Recommendation R 128 – publication awaited
[4] EBU Tech Doc 3342: Loudness Range: A descriptor to supplement loudness normalisa- tion in
accordance with EBU R 128
[5] EBU Tech Doc 3344: Practical Guidelines for Distribution of Programmes in accordance with
EBU R 128 – publication awaited.
[6] EBU Tech Doc 3341: Loudness Metering: ‘EBU Mode’ metering to supplement loudness
normalisation in accordance with EBU R 128.
10 / 10