Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AND CRITICAL
LISTENING
Technical Ear Training
JASON COREY
El software de acompañamiento
Debido a la naturaleza algo abstracta de la simple lectura sobre escucha crítica,
se han incluido varios módulos de software con este libro para ayudar al lector
a practicar la audición de varios tipos de procesamiento de señales que se
describen aquí. Los módulos de práctica de software que lo acompañan son
interactivos, lo que permite al usuario ajustar los parámetros de cada tipo de
procesamiento y recibir retroalimentación auditiva inmediata, imitando lo que
sucede en el estudio de grabación y mezcla. Aunque algunos de los módulos
simplemente proporcionan ejemplos de procesamiento de sonido, otros
ofrecen ejercicios que implican la coincidencia y la identificación absoluta de
los parámetros de procesamiento de oído. El beneficio de los ejercicios de
emparejamiento radica principalmente en brindar la oportunidad de confiar
completamente en lo que se escucha sin tener que traducirlo a una
representación verbal de un sonido.
El uso de grabaciones digitales para la práctica de entrenamiento
auditivo tiene una ventaja sobre las grabaciones analógicas o los sonidos
acústicos en el sentido de que las grabaciones digitales se pueden reproducir
varias veces exactamente de la misma manera. En el libro se sugieren algunas
grabaciones de sonido específicas, pero hay otras ubicaciones para obtener
muestras de sonido útiles para enfocarse en diferentes tipos de
procesamiento. Al momento de escribir este artículo, las muestras de un solo
instrumento y los stem de mezcla se pueden descargar de muchos sitios web,
como los siguientes:
http://bush-of-ghosts.com/remix/bush_of_ghosts.htm
www.freesound.org
www.realworldremixed.com/download.php
www.royerlabs.com
Además, los programas de software como Logic y GarageBand de Apple
incluyen bibliotecas de sonidos de un solo instrumento que pueden servir
como fuentes de sonido en los módulos de práctica del software.
Este libro no se enfoca en modelos específicos de software o hardware
de procesamiento de audio disponibles comercialmente, pero trata cada tipo
de procesamiento como típico de lo que se puede encontrar entre los
dispositivos y software de audio profesionales. Los módulos de procesamiento
de audio que están disponibles comercialmente varían de un modelo a otro, y
el autor siente que la capacitación discutida en este libro y aplicada en los
módulos de software sirve como un punto de partida sólido para el
entrenamiento del oído y puede extrapolarse a la mayoría de los modelos
comerciales.
Lo que este libro no intenta hacer es brindar recomendaciones para la
configuración de procesamiento de señales o técnicas de micrófono para
diferentes instrumentos o configuraciones de grabación. Es imposible tener un
enfoque único para la producción de audio, y el objetivo es ayudar al lector a
escuchar más críticamente y con más detalles para dar forma a cada grabación
individual.
Todos los módulos de software se incluyen en el CD-ROM adjunto, y las
actualizaciones del software se publicarán periódicamente en la página web
del autor: www.personal.umich.edu/~coreyja.
https://sites.google.com/a/umich.edu/jason-corey/technical-ear-
training?authuser=0
https://webtet.net/apcl/#/
Capítulo 1
LISTENING
1
Los ingenieros de sonido en vivo, por otro lado, que están afinando un sistema de sonido para una
interpretación de música en vivo, a menudo usarán analizadores espectrales en tiempo real. La diferencia es
que tienen una referencia, que a menudo es ruido rosa o una grabación, y el analizador compara el espectro
de la señal de audio original (una referencia objetiva conocida) con la salida de los altavoces. El objetivo en
esta situación es un poco diferente de lo que es para grabar y mezclar porque un ingeniero de sonido en vivo
está ajustando la respuesta de frecuencia de un sistema de sonido para que la referencia de entrada y los
balances espectrales de salida del sistema sean lo más similares posible.
en tiempo real no ofrecen una imagen lo suficientemente clara. del
contenido de frecuencia de una grabación de música para depender de
él para tomar decisiones sobre cómo aplicar la ecualización a una señal
de música. Además, no hay una indicación clara de cómo “debería”
verse el gráfico espectral porque no hay una referencia objetiva.
Las señales musicales generalmente exhiben fluctuaciones
constantes, sean grandes o pequeñas, en frecuencia y amplitud de cada
armónico y sobretono presente. Debido a la naturaleza en constante
cambio de una señal musical típica, resulta difícil obtener una lectura
clara de la amplitud de los armónicos. Tomar una instantánea de un
diagrama espectral de un momento específico en el tiempo sería más
claro visualmente, pero no brinda una visión lo suficientemente amplia
de la forma espectral general de una señal de audio a lo largo del
tiempo. La situación se complica un poco más porque con cualquier
análisis espectral objetivo existe un compromiso entre la resolución de
tiempo y la resolución de frecuencia. Con los aumentos en la resolución
de tiempo, la resolución de frecuencia disminuye mientras que la
visualización de la respuesta de frecuencia se actualiza a una velocidad
tan rápida que es difícil ver los detalles con precisión mientras se
reproduce una señal de audio. Por lo tanto, las medidas físicas
actualmente disponibles no son apropiadas para determinar qué
ecualización aplicar a una señal musical, y se debe confiar en el sistema
auditivo para tomar decisiones sobre la ecualización.
Figura 2.1 La ruta de la señal que muestra la transmisión de una señal de audio como una señal eléctrica a un altavoz
donde se convierte en una señal acústica, modificada por una sala de escucha y finalmente recibida por el oído y procesada
por el sistema auditivo. Cada etapa resalta los factores que influyen en el equilibrio espectral de una señal, tanto físico
como perceptivo, a lo largo del camino.
Figura 2.9 Un diagrama de bloques de la ruta de la señal para el módulo de práctica del entrenador del oído técnico para
la ecualización paramétrica.
3.1.1.2 Distancia
Aunque la percepción humana de la distancia absoluta es limitada, la distancia
relativa de los sonidos dentro de una imagen estéreo es importante para dar
profundidad a una grabación. Es probable que los grandes conjuntos grabados
en espacios acústicamente en vivo exhiban una sensación natural de
profundidad, análoga a lo que escucharíamos como miembro de la audiencia
en el mismo espacio. Con grabaciones realizadas en espacios acústicamente
secos, como estudios, los ingenieros a menudo buscan crear profundidad
utilizando delays y reverberación artificial. Los ingenieros pueden controlar la
distancia de la fuente de sonido ajustando parámetros físicos como los
siguientes:
• Nivel de sonido directo. Los sonidos más silenciosos se consideran más
lejanos porque hay una pérdida de intensidad del sonido de 6 dB por
duplicar la distancia desde una fuente. Esta señal puede ser ambigua
para el oyente porque un cambio en el volumen puede ser el resultado
de un cambio en la distancia o un cambio en la potencia acústica de una
fuente.
• Nivel de reverberación. A medida que una fuente se aleja más del oyente
en una habitación o pasillo, el nivel de sonido directo disminuye y el
sonido reverberante permanece igual, lo que reduce la relación entre el
sonido directo y el reverberante.
• Distancia de los micrófonos a las fuentes de sonido. Mover los
micrófonos más lejos disminuye la relación directa a reverberante y, por
lo tanto, crea una mayor sensación de distancia.
• Ubicación y nivel del micrófono de la sala. Los micrófonos colocados en
el lado opuesto de una habitación o pasillo desde donde se encuentran
los músicos captan el sonido que es principalmente reverberante o
difuso. Las señales del micrófono de la sala pueden considerarse como
un retorno de reverberación en un mezclador.
• Filtrado de paso bajo de sonidos directos con micrófonos cercanos. Las
frecuencias altas se atenúan más que las frecuencias más bajas debido
a la absorción de aire. Además, las propiedades acústicas de las
superficies reflectantes de una habitación afectan el espectro del sonido
reflejado que llega a los oídos del oyente.
3.1.2.3 Espacialidad
La espacialidad representa la percepción de las características físicas y
acústicas de un espacio de grabación. En la acústica de una sala de conciertos,
está relacionada con la envolvente, pero con solo dos altavoces en
reproducción estéreo, es difícil lograr una verdadera envolvente. Podemos
usar el término espacialidad para describir la sensación de espacio dentro de
una grabación.
Resumen
Este capítulo cubre los atributos espaciales del sonido, centrándose
principalmente en la reverberación y el procesamiento mid-side. El objetivo
del módulo de práctica del software de reverberación es familiarizar
sistemáticamente a los oyentes con aspectos de la reverberación artificial y
aumentar la sensibilidad auditiva al procesamiento de efectos basados en el
tiempo. Al comparar dos escenas de audio de oído, un oyente puede hacer
coincidir uno o más parámetros de reverberación artificial con una referencia
elegida aleatoriamente por el software. Los oyentes pueden pasar de las
comparaciones que utilizan fuentes de sonido de percusión y una resolución
aproximada entre los valores de los parámetros a grabaciones musicales más
estables y una resolución más fina entre los valores de los parámetros. A
menudo, cambios muy pequeños en los parámetros de reverberación pueden
tener una influencia significativa en la profundidad, la mezcla, la amplitud y la
claridad de la mezcla final de una grabación de sonido.
Capítulo 4
CONTROL DE RANGO DINÁMICO
Figura 4.1 El valor RMS de una onda sinusoidal es siempre el 70,7% del valor pico, lo que equivale a decir que el valor RMS
está 3dB por debajo del nivel pico. Esto solo es cierto para una onda sinusoidal. El factor de cresta es la diferencia entre
los niveles pico y RMS, generalmente medidos en dB. Una onda sinusoidal tiene un factor de cresta de 3dB.
Figura 4.2 Una onda cuadrada tiene niveles de pico y RMS iguales, por lo que el factor de cresta es 0.
Figura 4.3 Una onda de pulso es similar a una onda cuadrada, excepto que estamos acortando el tiempo que la señal está
en su nivel máximo. La longitud del pulso determina el nivel RMS, donde un pulso más corto dará un nivel RMS más bajo
y por lo tanto un factor de cresta más grande.
4.2.1 Threshold
Un ingeniero generalmente puede establecer el nivel de umbral de un
compresor, aunque algunos modelos tienen un nivel de umbral fijo con una
ganancia de entrada variable. Un compresor comienza a reducir la ganancia de
una señal de entrada tan pronto como la amplitud de la propia señal o una
señal de entrada de cadena lateral supere el umbral. Los compresores con una
entrada side-chain o clave pueden aceptar una entrada de señal alternativa
que se analiza en términos de su nivel y se utiliza para determinar la función
de ganancia que se aplicará a la entrada de señal de audio principal. La
compresión de la señal de entrada se activa cuando la señal de la cadena
lateral se eleva por encima del umbral, independientemente del nivel de la
señal de entrada.
4.2.2 Attack Time
Aunque el compresor comienza a reducir la ganancia de la señal de audio tan
pronto como su amplitud se eleva por encima del umbral, por lo general lleva
algo de tiempo lograr la máxima reducción de ganancia. La cantidad real de
reducción de ganancia aplicada depende del ratio y qué tan lejos está la señal
por encima del umbral. En la práctica, el tiempo de ataque puede ayudar a un
ingeniero a definir o redondear el ataque de un sonido de percusión o el
comienzo de una nota musical. Con el ajuste apropiado del tiempo de ataque,
un ingeniero puede ayudar a que una grabación de pop o rock suene más
"punchy".
4.2.3 Release Time
El tiempo de liberación es el tiempo que tarda un compresor en dejar de
aplicar la reducción de ganancia después de que una señal de audio ha pasado
por debajo del umbral. Tan pronto como el nivel de la señal cae por debajo del
umbral, el compresor comienza a devolverlo a la ganancia unitaria y alcanza la
ganancia unitaria en la cantidad de tiempo especificada por el tiempo de
liberación.
4.2.4 Knee
El knee describe la transición del control de nivel desde debajo del umbral (sin
reducción de ganancia) a por encima del umbral (reducción de ganancia). Una
transición suave de uno a otro se denomina soft knee, mientras que un cambio
abrupto en el umbral se conoce como hard knee.
4.2.5 Ratio
La relación de compresión determina la cantidad de reducción de ganancia
aplicada una vez que la señal sube por encima del umbral. Es la relación entre
el nivel de entrada y el nivel de salida en dB por encima del umbral. Por
ejemplo, con una relación de compresión de 2: 1 (entrada: salida), la parte de
la señal de salida que está por encima del umbral será la mitad del nivel (en
dB) de la señal de entrada que está por encima del umbral en dB. Los
compresores ajustados a relaciones de aproximadamente 10: 1 o más se
consideran generalmente limitadores. Las relaciones más altas darán más
reducción de ganancia cuando una señal supere el umbral y, por lo tanto, la
compresión será más evidente.
4.2.6 Tiempo de detección de nivel
Para aplicar una función de ganancia a una señal de entrada, los procesadores
de dinámica deben determinar la amplitud de una señal de audio y compararla
con el umbral establecido por un ingeniero. Como se mencionó anteriormente,
existen diferentes formas de medir la amplitud de una señal, y algunos
compresores permiten que un ingeniero cambie entre dos o tres opciones.
Normalmente, las opciones difieren en la rapidez con la que la detección de
nivel responde al nivel de una señal. Por ejemplo, la detección de nivel pico es
buena para responder a transitorios pronunciados y la detección de nivel RMS
responde a señales menos transitorias. Algunos procesadores dinámicos
(como el controlador de rango dinámico GML 8900) tienen ajustes de
detección de RMS rápidos y lentos, donde el RMS rápido promedia durante un
período de tiempo más corto y, por lo tanto, responde más a los transitorios.
Cuando un compresor está configurado para detectar niveles usando
RMS lento, es imposible que el compresor responda a transitorios muy cortos.
Debido a que la detección de RMS promedia a lo largo del tiempo, un
transitorio pronunciado no tendrá mucha influencia en el nivel de señal
promedio.
Figura 4.4 Esta figura muestra la señal de entrada a un compresor (a) que es una onda sinusoidal modulada en amplitud
y la salida del compresor muestra la respuesta al escalón para tres tiempos de ataque y liberación diferentes: largo (b),
medio (c) y corto. (d).
Figura 4.5 El mismo tono sinusoidal modulado de 40 Hz a través de un compresor analógico disponible comercialmente
con un tiempo de ataque de aproximadamente 50 ms y un tiempo de liberación de 200 ms. Note la diferencia en la curva
de la Figura 4.4. Parece haber un rebasamiento en la cantidad de reducción de ganancia en el ataque antes de que se
establezca en un nivel constante. Una representación visual de los tiempos de ataque y liberación de un compresor como
este no es algo que se incluiría en las especificaciones de un dispositivo. La diferencia que es evidente entre las Figuras 4.4
y 4.5 suele ser algo que un ingeniero escucharía pero no podría visualizar sin realizar la medición.
Figura 4.6 Desde una señal de audio (arriba) enviada a la entrada de un compresor, se deriva una función de ganancia
(media) basada en los parámetros del compresor y el nivel de la señal. La salida de la señal de audio resultante (abajo) del
compresor es la señal de entrada con la función de ganancia aplicada. La función de ganancia muestra la cantidad de
reducción de ganancia aplicada a lo largo del tiempo, que varía con la amplitud de la entrada de la señal de audio. Por
ejemplo, una ganancia de 1 (ganancia unitaria) no produce ningún cambio de nivel y una ganancia de 0,5 reduce la señal
en 6 dB. El umbral se estableció en -6dB, que corresponde a 0.5 en la amplitud de la señal de audio, por lo que cada vez
que la señal supera los 0.5 en el nivel (-6dB), la función de ganancia muestra una reducción en el nivel.
Figura 4.9 Una captura de pantalla de la interfaz de usuario del software para el módulo de práctica Technical Ear Trainer
para compresión de rango dinámico.
5.1 Ruido
Aunque algunos compositores e intérpretes utilizan intencionalmente el ruido
para lograr un efecto artístico, analizaremos algunos de los tipos de ruido que
no son deseados y, por lo tanto, restan valor a la calidad de una grabación de
sonido. A través de una conexión a tierra y blindaje inadecuados, sonidos
exteriores fuertes, interferencia de radiofrecuencia y ruido de calefacción,
ventilación y aire acondicionado (HVAC), existen muchas fuentes y tipos de
ruido que los ingenieros buscan evitar al realizar grabaciones en el estudio.
Con frecuencia, el ruido está en un nivel bajo pero aún audible y, por lo tanto,
no se registrará significativamente en un medidor, especialmente en presencia
de señales de audio musicales.
Algunas de las diversas fuentes de ruido incluyen las siguientes:
• Clics. Sonidos transitorios resultantes de un mal funcionamiento del
equipo o errores de sincronización digital
• Pops. Sonidos resultantes de sonidos vocales ocultos
• Zumbido y zumbido de tierra. Sonidos que se originan en sistemas mal
conectados a tierra
• Silbido, que es esencialmente ruido blanco de bajo nivel. Sonidos que se
originan en electrónica analógica, dithering o cinta analógica
• Sonidos acústicos extraños. Sonidos que no están destinados a grabarse
pero que existen en un espacio de grabación, como sistemas de
tratamiento de aire o fuentes de sonido fuera de una sala de grabación.
5.1.1 Clics
Los clics son varios tipos de sonidos transitorios de corta duración que
contienen una energía significativa de alta frecuencia. Pueden tener su origen
en un equipo analógico que funciona mal, por el acto de conectar o
desconectar señales analógicas en una bahía de conexión, o por errores de
sincronización en la interconexión de equipos digitales.
Los clics que resultan del mal funcionamiento del equipo analógico a
menudo pueden ser aleatorios y esporádicos, lo que dificulta identificar su
origen exacto. En este caso, los medidores pueden ser útiles para indicar qué
canal de audio contiene un clic, especialmente si los clics se producen en
ausencia de material de programa. Una indicación visual de un medidor con
retención máxima puede ser invaluable para perseguir un equipo
problemático.
Con las conexiones digitales entre equipos, es importante asegurarse de
que las velocidades de muestreo sean idénticas en todos los equipos
interconectados y que las fuentes de reloj sean consistentes. Sin fuentes de
reloj adecuadamente seleccionadas en audio digital, los clics son casi
inevitables y probablemente ocurrirán a intervalos regulares, generalmente
espaciados por varios segundos. Los clics que se originan en fuentes de reloj
inadecuadas suelen ser bastante sutiles y requieren vigilancia para
identificarlos audiblemente. Dependiendo de las interconexiones digitales en
un estudio, la fuente de reloj para cada dispositivo debe ser interna, entrada
digital o word clock.
5.1.2 Pops
Los pops son sonidos transitorios de baja frecuencia que tienen un sonido
parecido a un golpe. Por lo general, los estallidos ocurren como resultado de
oclusivas vocales que se producen frente a un micrófono. Las oclusivas son
sonidos consonantes, como los que resultan de pronunciar las letras p, b y d,
en los que se produce una explosión de aire en la creación de los sonidos. Una
ráfaga de aire resultante de la producción de un oclusivo que llega a la cápsula
del micrófono produce un sonido de baja frecuencia similar a un golpe. Por lo
general, los ingenieros intentan contrarrestar los estallidos durante la
grabación vocal colocando un filtro de pop frente a un micrófono vocal. Los
filtros anti-pop generalmente están hechos de tela delgada estirada a lo largo
de un marco circular.
Los pops no son algo que se escucha de un cantante cuando se escucha
acústicamente en el mismo espacio que el cantante. El artefacto pop es
simplemente el resultado de un micrófono cerca de la boca de un vocalista,
que responde a una ráfaga de aire. Los pops pueden distraer a los oyentes de
una interpretación vocal porque no esperan escuchar un golpe de baja
frecuencia de un cantante. Por lo general, los ingenieros pueden filtrar un pop
con un filtro de paso alto insertado solo durante el breve momento mientras
suena un pop.
5.1.3 Hum and Buzz
Los circuitos analógicos y las cadenas de señales mal conectados a tierra
pueden provocar la introducción de ruido en forma de zumbido en las señales
de audio analógicas. Ambos están relacionados con la frecuencia de las fuentes
de energía eléctrica de corriente alterna (CA), que en algunos lugares se
denomina frecuencia de red. La frecuencia de una fuente de energía será de
50 Hz o 60 Hz dependiendo de la ubicación geográfica y la fuente de energía
que se utilice. La distribución de energía en América del Norte es de 60 Hz, en
Europa es de 50 Hz, en Japón será de 50 o 60 Hz dependiendo de la ubicación
específica dentro del país, y en la mayoría de los demás países es de 50 Hz.
Cuando hay un problema de tierra, se genera un hum o un buzz con una
frecuencia fundamental igual a la frecuencia de corriente alterna de la fuente
de poder, 50 o 60 Hz, con armónicos adicionales por encima de la fundamental.
Un hum se identifica como un sonido que contiene principalmente armónicos
más bajos y un buzz como el que contiene armónicos superiores más
prominentes.
Los ingenieros quieren asegurarse de identificar cualquier hum o buzz
antes de grabar cuando el problema es más fácil de resolver. Es posible
intentar eliminar esos ruidos en la posproducción, pero llevará más tiempo.
Debido a que un hum o buzz incluye numerosos armónicos de 50 o 60 Hz, se
necesitan varios filtros de nodo, cada uno sintonizado en un armónico, para
eliminar efectivamente todo el sonido ofensivo. Aunque no vamos a discutir
los problemas técnicos y de cableado exactos que pueden causar hum y buzz
y cómo estos problemas podrían resolverse, hay muchas referencias
excelentes que cubren el tema con gran detalle, como el libro de Giddings
titulado Diseño e instalación de sistemas de audio ( 1990).
Al subir los niveles del monitor mientras los músicos no están tocando,
a menudo se expone cualquier zumbido de suelo de bajo nivel que pueda estar
ocurriendo. Si se aplica compresión de rango dinámico a una señal de audio y
la reducción de ganancia se compensa con ganancia de compensación, los
sonidos de bajo nivel, incluido el ruido de fondo, se elevarán a un nivel más
notable. Si un ingeniero puede detectar cualquier zumbido del suelo antes de
llegar a ese escenario, la grabación será más limpia.
5.1.4 Sonidos acústicos extraños
A pesar de la esperanza de que los espacios de grabación sean perfectamente
silenciosos, a menudo existen numerosas fuentes de ruido tanto dentro como
fuera de un espacio de grabación que deben tratarse. Algunos de estos son
sonidos relativamente constantes y de estado estable, como el ruido de la
manipulación del aire, mientras que otros sonidos son impredecibles y algo
aleatorios, como las bocinas de los coches, la gente hablando, los pasos o el
ruido de las tormentas.
Con la mayor parte de la población concentrada en las ciudades, el
aislamiento acústico puede ser particularmente desafiante a medida que
aumentan los niveles de ruido y aumenta nuestra proximidad física a los
demás. Además del ruido aéreo, también hay ruido transmitido por
estructuras, donde las vibraciones se transmiten a través de las estructuras de
los edificios y terminan produciendo sonido en un espacio de grabación.
5.2 Distorsión
Aunque los ingenieros generalmente quieren evitar o eliminar ruidos como los
que se enumeraron anteriormente, la distorsión, por otro lado, se puede usar
de manera creativa como un efecto, o puede aparecer como un artefacto no
deseado de una señal de audio. A veces, la distorsión se aplica
intencionalmente, como a la señal de una guitarra eléctrica, para mejorar el
timbre de un sonido, agregando a la paleta de opciones disponibles para la
expresión musical. En otras ocasiones, una señal de audio puede
distorsionarse debido a una configuración incorrecta de los parámetros, un
equipo defectuoso o un equipo de baja calidad. Ya sea que la distorsión sea
intencional o no, un ingeniero debe poder identificar cuándo está presente y
darle forma para lograr un efecto artístico o eliminarlo, de acuerdo con lo que
sea apropiado para una grabación determinada.
Afortunadamente, los ingenieros tienen una ayuda para ayudar a
identificar cuando una señal se corta de una manera objetable. Los medidores
digitales, medidores de picos, luces de clip u otros indicadores de la fuerza de
la señal están presentes en la mayoría de las etapas de entrada de los
convertidores de analógico a digital, preamplificadores de micrófono y muchas
otras etapas de ganancia. Cuando una etapa de ganancia está sobrecargada o
una señal cortada, una luz roja brillante proporciona una indicación visual tan
pronto como una señal supera el nivel de un clip y permanece encendida hasta
que la señal cae por debajo del nivel del clip. Una indicación visual en forma
de pico de luz, que está sincronizada con el inicio y la duración de un sonido
distorsionado, refuerza la conciencia de un ingeniero de la degradación de la
señal y ayuda a identificar si una señal se ha cortado y cuándo.
Desafortunadamente, cuando se trabaja con una gran cantidad de señales de
micrófono, puede ser difícil captar cada destello de una luz de clip,
especialmente en el dominio analógico. Los medidores digitales, por otro lado,
permiten la retención de picos de modo que, si no se ve una luz indicadora de
clip en el momento del recorte, continuará indicando que se produjo un clip
hasta que un ingeniero lo restablezca manualmente. Para los indicadores de
clip momentáneos, es mucho más importante confiar en lo que se escucha
para identificar los sonidos sobrecargados porque puede ser fácil pasar por
alto el destello de una luz roja.
En el proceso de grabación de cualquier interpretación musical, los
ingenieros configuran los preamplificadores de micrófono para ofrecer un
nivel de grabación lo más alto posible, lo más cerca posible del punto de corte,
pero sin pasarse. El objetivo es maximizar el error de señal a ruido o de señal
a cuantificación mediante la grabación de una señal cuyos picos alcanzan el
nivel máximo de grabación, que en audio digital es de 0 dB a escala completa.
El problema es que el nivel máximo exacto de una interpretación musical no
se conoce hasta después de que ha ocurrido. Los ingenieros establecen la
ganancia del preamplificador en función de una prueba de sonido
representativa, lo que les da cierto margen en caso de que los picos sean más
altos de lo esperado. Cuando la interpretación musical real ocurre después de
una prueba de sonido, a menudo el nivel máximo será más alto que durante la
prueba de sonido porque los músicos pueden estar actuando a un nivel
dinámico más entusiasta y más alto que durante la prueba de sonido.
Aunque es ideal tener una prueba de sonido, hay muchos casos en los
que los ingenieros no tienen la oportunidad de hacerlo y deben saltar
directamente a la grabación, esperando que sus niveles estén configurados
correctamente. Tienen que estar especialmente preocupados por monitorear
los niveles de señal y detectar cualquier recorte de señal en este tipo de
situaciones.
Existe una gama de sonidos o cualidades de sonido que podemos
describir como distorsión en una grabación de sonido. Entre estos sonidos no
deseados se encuentran las amplias categorías de distorsión y ruido. Podemos
ampliar estas categorías y describir varios tipos de cada una:
• Clipping fuerte o sobrecarga. Esto suena duro y es el resultado de que
los picos de una señal se cuadren cuando el nivel supera el nivel máximo
de entrada o salida de un dispositivo.
• Clipping suave o overdrive. Suena menos áspero y, a menudo, más
deseable para la expresión creativa que el clipping duro, generalmente
resulta de la activación de un tipo específico de circuito diseñado para
introducir un clipping suave, como un amplificador de guitarra.
• Distorsión por error de cuantificación. Como resultado de una
cuantificación de bits baja en audio digital PCM (por ejemplo,
conversión de 16 bits por muestra a 8 bits por muestra). Tenga en
cuenta que no estamos hablando de codificación perceptual de baja
tasa de bits, sino simplemente de reducir el número de bits por muestra
para cuantificar la amplitud de la señal.
• Distorsión del codificador de percepción. Hay muchos artefactos
diferentes, algunos más audibles que otros, que pueden ocurrir al
codificar una señal de audio PCM en una versión con datos reducidos
(por ejemplo, MP3 o AAC). Las tasas de bits más bajas muestran más
distorsión.
Hay muchas formas y niveles de distorsión que pueden estar presentes
en el sonido reproducido. Todo el sonido reproducido por los altavoces está
distorsionado hasta cierto punto, aunque sea insignificante. Los equipos con
una distorsión excepcionalmente baja pueden ser particularmente costosos de
producir y, por lo tanto, la mayoría de los sistemas de audio de consumo
promedio presentan niveles de distorsión ligeramente más altos que los
utilizados por ingenieros de audio profesionales. Los ingenieros de audio y los
entusiastas de los audiófilos hacen todo lo posible (y costos) para reducir la
cantidad de distorsión en su cadena de señal y altavoces.
La mayoría de los demás dispositivos de reproducción de sonido
comúnmente disponibles, como intercomunicadores, teléfonos y auriculares
económicos conectados a reproductores de música digital, tienen distorsión
audible. Para la mayoría de situaciones, como la comunicación por voz,
siempre que la distorsión sea lo suficientemente baja como para mantener la
inteligibilidad, la distorsión no es realmente un problema. Para sistemas de
reproducción de audio económicos, el nivel de distorsión generalmente no es
detectable por un oído inexperto. Esta es parte de la razón del éxito masivo
del MP3 y otros formatos de audio codificados perceptivamente que se
encuentran en el audio de Internet; la mayoría de los oyentes ocasionales no
perciben la distorsión y la pérdida de calidad, pero el tamaño de los archivos
es mucho más manejable y los archivos de audio son mucho más fácilmente
transferibles a través de una conexión de red informática que sus equivalentes
PCM.
La distorsión suele deberse a la amplificación de una señal de audio más
allá del nivel de salida máximo de un amplificador. La distorsión también se
puede producir aumentando el nivel de una señal más allá del nivel máximo
de entrada de un convertidor de analógico a digital (ADC). Cuando un ADC
intenta representar una señal cuyo nivel está por encima de 0 dB de escala
completa (dB FS), llamado over, el resultado es una distorsión de la señal con
un sonido áspero.
Resumen
En este capítulo exploramos algunos de los sonidos indeseables que pueden
aparecer en una grabación. Al practicar con el módulo de entrenamiento
auditivo del software de distorsión incluido y completar los ejercicios,
podemos ser más conscientes de algunas formas comunes de distorsión.
En el Capítulo 4 discutimos la modificación de la envolvente de amplitud de
una señal de audio a través del procesamiento dinámico. En este capítulo
exploraremos la envolvente de amplitud y el entrenamiento técnico del oído
desde una perspectiva ligeramente diferente: la de un editor de audio.
El proceso de edición de audio digital, especialmente con música clásica
o acústica utilizando un método de origen-destino, ofrece una excelente
oportunidad para entrenar el oído. Asimismo, el proceso de edición musical
requiere que un ingeniero tenga un buen oído para el empalme transparente
de audio. La edición de música implica hacer conexiones transparentes o
empalmes entre tomas de una pieza musical y, a menudo, requiere especificar
ubicaciones de edición precisas de oído. En este capítulo exploraremos cómo
los aspectos de la edición digital pueden usarse sistemáticamente como un
método de entrenamiento auditivo, incluso fuera del contexto de una sesión
de edición. El capítulo describe una herramienta de software basada en
técnicas de edición de audio que es un entrenador auditivo eficaz que ofrece
beneficios que se transfieren más allá de la edición de audio.
Figura 6.1 Una vista típica de una forma de onda en un editor digital con el marcador de punto de edición que indica dónde
ocurrirá el punto de edición y el audio se fundirá en una nueva toma. La ubicación del marcador, indicada por un corchete
grande, es ajustable en el tiempo (izquierda / antes o derecha / después). La flecha indica simplemente que el soporte se
puede deslizar hacia la izquierda o hacia la derecha. El ingeniero de edición escuchará el audio hasta este corchete grande
con un tiempo de pre-roll predeterminado que suele oscilar entre 0,5 y 5 segundos.
Figura 6.2 El ingeniero de edición escucha los archivos de audio de origen y de destino, hasta un punto de edición elegido,
generalmente al comienzo de una nota o tiempo. En una sesión de edición, los dos clips de audio (origen y destino) serían
de material musical idéntico, pero de tomas diferentes. El ingeniero hace una audición de los extractos de audio hasta un
punto de edición elegido, generalmente ubicado a la mitad del ataque de una nota o ritmo fuerte. Uno de los objetivos
del ingeniero es responder a la pregunta, ¿el punto final en la fuente coincide con el del destino? Cuanto mayor sea la
similitud entre los dos timbres de corte, más exitosa será la edición. El módulo de software que se presenta aquí recrea el
proceso de escuchar un clip de sonido hasta un punto predefinido y hacer coincidir ese punto final en un segundo clip de
sonido.
Figura 6.3 Las líneas de tiempo de la forma de onda de origen y destino se muestran aquí en forma de bloque junto con
un ejemplo de cómo un conjunto de tomas (fuente) podría encajar para formar una actuación completa (destino). En este
ejemplo se asume que las tomas 1, 2 y 5 serían del mismo material de programa musical y, por lo tanto, se podría producir
una versión compuesta de las mejores secciones de cada toma para formar lo que se etiqueta como el destino en esta
figura.
Figura 6.4 Clips de una grabación de música de cuatro longitudes diferentes: 825 ms, 850 ms, 875 ms y 900 ms. Este
ejemplo particular muestra cómo el final del clip puede variar significativamente según la duración elegida. El oyente
puede concentrarse en la calidad del sonido de percusión al final del clip para determinar cuál suena más como la
referencia. El clip de 825 ms de duración contiene un leve sonido de percusión al final del clip, pero debido a que la nota
que comienza a sonar (un golpe de batería en este caso) se corta casi por completo, sale como un clic corto. En este
ejemplo específico, el oyente puede concentrarse en la calidad de percusión, el timbre y la envolvente del golpe de batería
entrante al final del clip para determinar la duración correcta del clip de sonido.
Después de decidir la duración de un clip, se puede presionar el botón
"Comprobar respuesta" para encontrar la respuesta correcta y continuar
escuchando los dos clips para esa pregunta. El software indica si la respuesta
a la pregunta anterior fue correcta o no y si es incorrecta, indica si el clip 2 fue
demasiado corto o demasiado largo y la magnitud del error. La figura 6.5
muestra una captura de pantalla del módulo de software.
No hay una vista de la forma de onda como se vería normalmente en un
editor digital porque el objetivo es crear un entorno en el que debamos confiar
únicamente en lo que se escucha con información visual mínima sobre la señal
de audio. Sin embargo, hay una barra negra que aumenta en longitud sobre
una línea de tiempo, siguiendo la reproducción del clip 2 en tiempo real, como
una indicación visual de que se está reproduciendo el clip 2. Además, los
botones de reproducción de los clips respectivos se vuelven verdes
brevemente mientras se reproduce el audio y luego vuelven a gris cuando el
audio se detiene.
Con este método de entrenamiento auditivo, el objetivo es comparar un
sonido con otro e intentar igualarlos. No es necesario traducir la característica
de sonido a una descripción verbal, sino que la atención se centra únicamente
en las características de la señal de audio. Aunque hay una pantalla numérica
que indica la duración del clip de sonido, este número sirve solo como
referencia para realizar un seguimiento de dónde se establece el punto final.
El número no tiene ninguna relación con las características de sonido que se
escuchan, salvo en un extracto específico. Por ejemplo, un clip de 600 ms
elegido al azar tendrá características de punto final diferentes de la mayoría
de los otros clips de 600 ms elegidos al azar.
Figura 6.5 Una captura de pantalla del software de formación. Los cuadrados grandes con "1" y "2" son botones de
reproducción para los clips 1 y 2, respectivamente. El clip 1 (la referencia) tiene una duración desconocida y la longitud
del clip 2 debe ajustarse para que coincida con el clip 1. Debajo del botón de reproducción del clip 2 hay dos barras
horizontales. El superior indica, con una barra vertical, la duración del clip 2, en la línea de tiempo de 0 a 2000
milisegundos. La barra inferior aumenta en longitud (de izquierda a derecha) hasta la línea vertical en la barra superior,
siguiendo la reproducción del clip 2, para servir como una indicación visual de que se está reproduciendo el clip 2.
Resumen
Este capítulo describe un método de entrenamiento auditivo basado en la
técnica de edición de audio de origen-destino. Debido a la escucha crítica
requerida para realizar una edición de audio precisa, el proceso de encontrar
y hacer coincidir los puntos de edición puede servir como una forma eficaz de
entrenamiento auditivo. Con el módulo de ejercicios de software interactivo,
el objetivo es practicar la coincidencia de la longitud de un fragmento de
sonido con un fragmento de referencia. Al centrarse en el timbre y la
envolvente de amplitud de los milisegundos finales del clip, el punto final se
puede determinar en función de la naturaleza de los transitorios o la longitud
de las señales sostenidas. Al no incluir descriptores numéricos verbales o
significativos, el ejercicio se centra únicamente en la señal de audio percibida
y en hacer coincidir el punto final de las señales de audio.
Después de centrarnos en los atributos específicos del sonido grabado, ahora
estamos listos para explorar una perspectiva más amplia de la calidad del
sonido y la producción musical. La experiencia de practicar con cada uno de
los módulos de software y los tipos específicos de procesamiento descritos en
los capítulos anteriores nos prepara para centrarnos en estas características
sónicas dentro de un contexto más amplio de sonido grabado y acústico.
Una grabación de sonido es una interpretación y representación
específica de una interpretación musical. Escuchar una grabación es diferente
a asistir a una actuación en vivo, incluso para grabaciones con poco
procesamiento de señal. Una grabación de sonido puede ofrecer una
experiencia más enfocada y más clara que una actuación en vivo, al mismo
tiempo que crea una sensación de espacio. Es una perspectiva paradójica
escuchar a los músicos con un alto grado de claridad y, al mismo tiempo, tener
la experiencia de escuchar desde un lugar más distante debido al nivel de
energía reverberante. Además, un ingeniero de grabación y un productor a
menudo hacen ajustes en el nivel y el procesamiento durante el transcurso de
una pieza musical que resaltan los aspectos más importantes de una pieza y
guían al oyente a una experiencia musical específica.
Cada grabación tiene algo único que contar en términos de sus
cualidades tímbricas, espaciales y dinámicas. Es importante escuchar una
amplia variedad de grabaciones de muchos géneros musicales diferentes y
examinar las opciones de producción que se hicieron para cada grabación. Un
ingeniero puede familiarizarse con la grabación y mezcla de estéticas para
diferentes géneros de música que pueden informar su propio trabajo. Cuando
llega el momento de hacer una grabación, un ingeniero puede confiar en las
referencias internas para la calidad del sonido y el equilibrio de la mezcla para
ayudar a guiar un proyecto. Para cada grabación que parezca interesante
desde el punto de vista de la producción y la calidad del sonido, tome nota de
los créditos del personal de producción, incluidos el productor, el ingeniero de
grabación, el ingeniero de mezcla y el ingeniero de masterización. Con las
grabaciones distribuidas digitalmente, los créditos de producción no siempre
se enumeran con el audio, pero se pueden consultar a través de varios sitios
web como www.allmusic.com .Encontrar grabaciones adicionales de
ingenieros y productores a los que se hizo referencia anteriormente puede
ayudar en el proceso de caracterizar varios estilos y técnicas de producción.
Resumen
El análisis del sonido, ya sea puramente acústico o procedente de altavoces,
presenta oportunidades para deconstruir y descubrir características y rasgos
de una imagen sonora. Cuanto más se escuchan grabaciones y sonidos
acústicos con participación activa, más características sonoras se pueden
identificar y enfocar. Con el tiempo y la práctica continua, la percepción de
eventos auditivos se abre y uno comienza a notar características sónicas que
antes no eran audibles. Cuanto más se descubre a través de la escucha activa,
más profundo puede volverse el disfrute del sonido, pero requiere práctica
dedicada a lo largo del tiempo. Del mismo modo, las habilidades de escucha
más enfocadas y efectivas conducen a una mayor eficiencia y efectividad en la
grabación, producción, composición, refuerzo y desarrollo de productos de
sonido. El entrenamiento técnico del oído es fundamental para cualquier
persona involucrada en la ingeniería de audio y la producción musical, y las
habilidades auditivas críticas están al alcance de cualquier persona que esté
dispuesta a dedicar tiempo a estar atento a lo que está escuchando.
Estos son algunos consejos finales: Escuche tantas grabaciones como
sea posible. Escuche a través de una amplia variedad de auriculares y sistemas
de altavoces. Durante cada sesión de escucha, toma notas sobre lo que se
escucha. Descubra quién diseñó las grabaciones más admiradas y encuentre
más grabaciones de los mismos ingenieros. Tenga en cuenta las similitudes y
diferencias entre varias grabaciones de un ingeniero, productor o sello
discográfico determinado. Tenga en cuenta las similitudes y diferencias entre
varias grabaciones de un artista determinado que ha trabajado con una
variedad de ingenieros o productores.
La actividad más difícil de realizar mientras se trabaja en cualquier
proyecto de audio es la escucha activa continua. La única forma de saber cómo
tomar decisiones sobre qué equipo usar, dónde colocar los micrófonos y cómo
configurar los parámetros es escuchando atentamente cada sonido que
emana de los monitores y auriculares. Al escuchar activamente en todo
momento, uno puede obtener información esencial para servir mejor a la
visión musical de cualquier proyecto de audio. En la grabación y producción de
sonido, el sistema auditivo humano es el juez final de la calidad y la visión
artística.