Está en la página 1de 35

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING.

RODRIGO ROBLES

Edición II:
Introducción:
Este documento es el resultado de la adaptación del contenido original en ingles de los libros
“Digital Audio Editing: Correcting and Enhancing Audio in Pro Tools, Logic Pro, Cubase y Estudio
One” de Simon Langford y “Pro Tools 10 Advanced Music Production Techniques” de Robert
Campbell al castellano y otras fuentes web adicionales como Ask.audio y Sound on Sound (SOS),
con propósitos educativos y formativos en las técnica de edición de audio digital para corregir,
crear y restaurar tomas de grabación.

La edición puede ser abordada desde 3 ángulos o filosofías, el correctivo mediante el cual, el
objetivo principal es la manipulación del audio para reparar imperfecciones y enfatizar de manera
positiva (razonablemente) la interpretación musical. Estas técnicas son aplicables al entorno de la
edición para audio de televisión e incluso radio, pero el contenido será enfocado al audio musical,
ya que es el que posee una mayor complejidad a nivel estético y artístico.

El ángulo o filosofía creativa, en el cual la edición busca la creación de nuevos patrones basados en
audios pregrabados, usando las mismas herramientas que para la edición correctiva pero con la
diferencia de un uso de técnicas y métodos de trabajo diferentes.

Por último el ángulo o filosofía de la restauración del audio, el cual puede llegar a ser entendido
como una combinación de los dos puntos de vista anteriores, ya que involucra ambas visiones
cuando lo que hay que reparada ha perdido sus propiedades.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

PARTE I:
Edición correctiva:

Introducción:
La intensión de la edición correctiva es, a grandes rasgos, resolver problemas originados durante la
etapa de grabación y lograr obtener la mejor versión de interpretación del músico de aquellas
grabaciones.

Las herramientas más usadas para la corrección de audio siguen siendo la opción de cortar, copiar,
pegar y mover, desde las etapas más tempranas de la edición. Dichas herramientas serán
igualmente necesarias en las dos categorías restantes (edición creativa y restaurativa) por lo que
su uso es menester para una edición fluida.

(continuar)

I.I. Aspectos Importantes de la Edición de Audio:
1- ¿Dónde debe empezar la edición?

El verdadero principio de la edición se remonta al proceso de grabación.

Donde sea posible, debemos evitar que, el hecho de tener a nuestra disposición las excelentes
herramientas disponibles en la actualidad, permita que el proceso de grabación sea descuidado y
flojo. Está claro que la mayoría de las veces no estaremos involucrados en la etapa de grabación,
pero si posible estarlo, debemos mantener este principio en mente, la edición comienza en la
grabación. La razón es muy sencilla, si invertimos tiempo en la grabación, nos ahorraremos mucho
tiempo en la edición, debido a que a mejor tomas de grabación, menor cantidad de edición se
hará.

Por esta razón, debemos evitar a toda costa la actitud de “esto se arregla luego”, pues, habrá
oportunidades donde la entrega debe ser hecha pronto y no se dispondrá del tiempo necesario.

2- Calidad de las ediciones:

Habrá situaciones donde una edición deberá hacerse en el medio de una palabra, por lo que el
desarrollo de técnicas de edición muy sutiles de edición deberán ser desarrolladas para una buena
calidad de la edición.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

En todos los casos de edición la principal herramienta es el oído. Si algo no suena bien, no está
bien, así de simple, ya sea que este en solo o en contexto, la edición debe funcionar para ambos
casos.

3- Ediciones en punto de cruce Cero:

Un aspecto importante al realizar ediciones a la mitad de una palabra o un sonido es ¿Cuál es el
mejor punto para realizar un corte? Donde la edición tiene más posibilidades de no ser escuchada
o detectada, un buen lugar para lograrlo es el punto donde la tranciente pasa por el punto cero de
amplitud, es decir, la línea divisoria entre la fase positiva y negativa de la señal. De esta forma se
evita en gran medida, la aparición de “clips”.

Este clip digital, es debido a la manera en la que funciona un monitos o parlante, el cono imita el
comportamiento de la señal eléctrica que recibe desde la computadora, produciendo la onda
acústica equivalente, si durante este proceso de reproducción, la señal emite un cambio muy
drástico de fase, el cono será forzado a un movimiento muy repentino, debido a una edición hecha
en medio de un ciclo o lejano al punto cero, lo cual genera esas imperfecciones e impurezas típicas
de una edición de mediana a baja calidad.

Una última consideración, será ver en qué parte o fase del ciclo o tranciente estamos realizando la
edición, ya que uno de los aspectos más importante del sonido son sus transientes, cada
instrumento contiene un patrón muy característico de sus transientes, si removemos demasiado,
alteraremos el sonido y comportamiento de ese instrumento, por lo que debemos ser muy
cuidadosos en la elección del lugar de corte.

Nunca se deben tomar decisiones basadas en como se ve una edición sino en como de hecho
suena, este es un aspecto fundamental de la edición.

4- Edición Multi-tracks:

Hasta ahora hemos considerado la edición de un solo canal a la vez, pero muchas situaciones
implican una edición de múltiples canales simultáneamente. El caso por excelencia de ediciones
multicanal es el de la batería con un amplio set de micrófonos.

Como sabemos, el problema con las grabaciones de múltiples micrófonos, es la cancelación de
fase si se modifica la duración individualmente, así sea un ciclo de una onda. Es por ésta razón,
que la edición debe ser hecha de manera simultánea en todos los canales, mediante el uso de
grupos de pista en Pro Tools.

Las mismas consideraciones de fase y punto cero deben tomarse para los fines de la edición multi-
tracks, aun si los puntos cero de todas las pistas no llega a coincidir, el punto es lo más cercano
posible dentro del una edición multi-tracks sin generar problemas de fase.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

5- Posibles Problemas:

Tal vez resulte obvio para muchos, pero el hecho de que una grabación haya sido hecha o no,
mediante el uso de un metrónomo, puede resultar muy problemática para propósitos de edición,
por ejemplo al copiar una sección de la guitarra desde el coro 1 al coro 2 si ambas secciones no se
encuentra al mismo tempo, será aun mas difícil, por lo que es un tema para tener en
consideración. ¿Eso significa que si no está grabado a tempo, no hay nada que se pueda hacer?
Claro que lo hay, existe una cantidad razonable de cosas que se pueden hacer para corregirlo, la
mala noticia es que podría implicar un trabajo manual y hasta artesanal muy intenso, todo va a
depender del material raíz.

Existen procesos que afirman ser capaces de hacer algunas tareas de edición automáticamente,
pero la mejor manera de editar es haciéndolo uno mismo.

Herramientas de Pro Tools:

Pro Tools posee una cantidad muy considerable de herramientas que, en combinación con algunos
comandos o shortcuts, permite aplicar los procesos básicos de edición (cortar, copiar, pegar y
mover). Las herramientas disponibles para estas tareas son:

• Trimer Tool: El trimer tool (Estándar-Standard) posee adicionalmente 3 modalidades mas,
TCE, Bucle (Loop) y búsqueda (Scrub)
• Selector Tool: Simplemente nos permite realizar una selección en la región.
• Grabber Tool: Posee otras 3 modalidades, Tiempo (Time), Separación (Separation) y
Objeto (Object)
• Smart Tool: Localizada en la parte superior de la pantalla de Pro Tools.

Smart Tool es una combinación de las primeras 3 herramientas, permitiéndonos manipular cada
una de ellas solo variando la posición del mouse en la región de audio.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Fades y Cross-fades:
1- Diferencia entre un Fade y un Crossfade:

Los Fade y Crossfade, son muy útiles a la hora de dar una transición suave a los inicios y finales de
una región de audio. Las diferencias entre uno y otro son meramente funcionales. Si no hay una
sobre posición de regiones, entonces debemos usar un Fade lineal, pero si por el caso contrario,
nos encontramos frente a una sobre posición de regiones dentro del mismo canal debemos usar
un Crossfade. Lo mismo puede ser logrado si las regiones esta en diferentes canales mediante el
uso de Fades lineales.

Una tercera manera de lograr aplicar fades a dos regiones sobre puestas en el mismo canal podría
separar ambas regiones en canales separados, de esta forma podríamos aplicar diferentes formas
de Fade o incluso de diferente duración, lo cual no es posible con el uso de Crossfades, como
explicaremos en el punto siguiente.

2- Diferentes formas de Fade:

Existe cierto número de formas que podemos encontrar un Fade, todas ellas son una referencia
visual del comportamiento sobre la ganancia de la región mientras dure el Fade, puede que
algunos DAW ofrezcan la opción de modificar la forma del Fade de maneras adicionales, pero los
preset serán los básicos descritos a continuación:

a- Fade Lineal: es el más simple de todos, simplemente una línea recta la cual representa
una caída uniforme a lo largo de la sección que ocupe el Fade. Sin embargo, como ya
sabemos, un aumento o disminución de la ganancia de forma lineal no significa una
percepción auditiva del aumento o disminución de volumen lineal.

En el diagrama siguiente podemos ver a la izquierda la forma del fade en cuestión y a la derecha la
grafica de la percepción del volumen:

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Desde el punto de vista del Crossfade, la respuesta lineal implica que, en el punto donde se
conectan las dos regiones es exactamente la mitad, a un 50%, debido a esto, al encontrarse ambas
señales se produce una suma que le devuelve lo que resulte de la suma entre ambas regiones.
Asumiendo que ambas señales contengan un nivel igual o muy cercano, la señal recuperara su
50% de disminución por la creación del Crossfade.

Debemos ser consientes del resultado auditivo de cada Fade, ya que estamos trabajando con un
fenómeno puramente sonoro.

b- Fade Logarítmico: Tiene sentido que si la respuesta de un fade lineal tiene un efecto
logarítmico en la señal, podemos decir, que un fade logarítmico puede tener un efecto
lineal en la señal. Este tipo de fades pueden ser usados para fade outs de larga duración,
como el de los finales de algunas canciones. Pueden ser muy útiles al trabajar con canales
con información de ambientes, donde la respuesta neutral o lineal ofrece un cambio más
proporcional en términos de percepción de volumen.
A la izquierda de la siguiente grafica podemos observar la forma logarítmica del Fade y a
la derecha su percepción auditiva de volumen:

Otro uso muy útil de este tipo de fade, es la de ediciones que se encuentran dentro de una
palabra o frase música, haciendo el paso de región aun más suave y natural.



c- Fade Exponencial: en muchas maneras, los fades de tipo exponencial son el extremo
opuesto exacto de los fades logarítmicos. En primer lugar, visto desde un punto de vista de
fade-in, incrementa el volumen de la región muy lentamente para posteriormente
presentar un aumento súbito de la percepción de volumen al final del fade. Desde el
punto de vista de un fade-out, parece decaer muy abruptamente mientras que en un
punto, hacia el final del fade, su caída se hace mucho más lenta.

Analicemos un momento la naturaleza de este tipo de fade. Puede crear un efecto similar
al de un “acercamiento” de la señal muy rápido y resulta bastante particular. Puede ser
usado para la creación de efectos en un contexto muy particular.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Los Crossfade creados con este tipo de respuesta exponencial resultaran en una región
con un vacio o disminución muy perceptible en el centro. El grado en que estos tipos de
fade puedan ser útiles depende mucho del material a editar y el contexto de la sesión.

d- Curva-S (Curve-S): Este tipo de fade resultan más complejos de explicar que los anteriores,
debido a que su comportamiento no es ni lineal, ni exponencial ni tampoco logarítmico, lo
sino una especie de combinación entre un fade logarítmico y uno exponencial. Hay dos
tipos de Curva-s, el primer tipo se comporta en principio como lo haría un fade
exponencial y en el punto medio del fade tendrías un comportamiento logarítmico, lo que
producirá una señal con un principio de lento inicio seguido por un aumento lineal desde
el punto de vista auditivo. El fade se comportara de forma logarítmica al comienzo y
finalmente de forma exponencial.
Las curvas-s tipo 2 resultan en una inversión del tipo 1, comportándose de forma
logarítmica hasta la mitad del fade y luego de forma exponencial hasta el final.



En el siguiente diagrama podemos observar del lado izquierdo la curva s tipo 1 junto a su
percepción auditiva y del lado izquierdo la curva-s tipo 2 junto a su correspondiente percepción de
volumen.

Las características de este tipo de fades pueden ser aprovechadas para la aplicación de Crossfades
de larga duración.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

3- Cancelaciones de fase:

Como sabemos, la cancelación de fase ocurre cuando un sonido cambia la relación en grados con
otra señal, esto ocurre todo tiempo en la naturaleza y es responsable de los cambios de timbre en
recintos y el color que producen ciertas configuraciones de reverberación, pero en el contexto de
la edición, debemos cuidar y mantener esta relación en grados de todas las regiones, en la medida
de lo posible y el efecto que los fades pueden tener en la misma. Para entender como la edición
puede alterar la fase usemos un ejemplo que involucre dos sonido que no están relacionados.

Imaginemos que tenemos una guitarra y un bajo eléctrico, ambas interpretaciones ocurren
simultáneamente, pero sus fases se encuentran desalineadas, es evidente que el bajo y la guitarras
no ocupan exactamente el mismo rango del espectro de frecuencias, pero si pueden llegar a
encontrarse en algún punto, si esto ocurre, y la fase esta desalineada en esa frecuencia, se
producirá una cancelación en esas frecuencias específicamente, lo cual puede resultar muy
negativo para ambos elementos.

Otro caso para considerar es el uso de Crossfades y su relación con la fase, ya que ambas regiones
generalmente guardan una relación muy estrecha (puede tratarse de una misma región cortada y
unida nuevamente) lo cual puede producir un efecto de filtro de peine en el área que ocupe el
Crossfade si la relación de la fase no es conservada.

Este fenómeno se debe a la naturaleza de los parlantes explicada anteriormente, en la que si el
parlante debe reproducir dos sonidos que se encuentran en lados opuestos de la fase,
simplemente se cancelara en la medida que uno afecte al otro, es decir, si tenemos un tono de
1kHz en la guitarra y el mismo tono en otra guitarra pero del lado opuesto de la fase, se producirá
una cancelación de esta frecuencia. Sabemos que las formas de onda de sonidos más complejos
que una onda senoidal serán más complicadas de interpretar pero hay un método que se puede
emplear para facilitar el trabajo.

A la izquierda podemos observar el efecto un Crossfade sobre dos señales que no guardan relación de fase
(con una desalineación de 180°) y a la derecha el efecto sobre la fase perfectamente alineada.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

• Buscar patrones periódicos en la señal:

La mejor manera de evitar este tipo de efectos es buscar los patrones periódicos de la señal, si
estamos tratando de unir regiones con un contenido similar, lo más probable es que seamos
capaces de encontrar un patrón repetitivo que nos indique en que ciclo de la fase se encuentra la
señal y, de esta manera evitar cancelaciones durante el Crossfade.

Podemos observar un patrón repetitivo de la señal, lo cual puede permitirnos en qué momento del ciclo se
encuentra la señal al momento de la edición.

En el caso de regiones con ligeras diferencias en tonalidad o timbre, podríamos comenzar con
duraciones muy cortas del Crossfade e ir incrementando su duración hasta conseguir la sonoridad
correcta, este método evita que se produzcan grandes cancelaciones y minimiza el riesgo de
efectos secundarios de la edición. Si cambiar el largo del fade no corrige el cambio abrupto de
timbre, podríamos probar con el cambio de forma del fade e incluso realizar una modificación
asimétrica de la curva hasta conseguir el resultado.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Ejemplo de Crossfade asimétrico

Control de Niveles:
Muchos opinan que la configuración de los niveles de la señal debería ser dejada para la etapa de
mezcla, lo cual tiene mucho sentido, pero, en el sentido estricto de la edición, de lo que estamos
hablando es de la corrección de problemas y anomalías en los niveles.

Es importante decir, que estamos hablando de evitar sorpresas desagradables en la etapa de
mezcla, por lo que, si podemos ahorrar el trabajo de nivelación de niveles de ganancia durante la
edición, el trabajo del ingeniero de mezcla resultara más sencillo y artística, siempre y cuando se
mantenga un margen razonable de movilidad, es decir, que el audio no debe ser procesado
mediante ningún tipo de compresión, pues esto significa reducir el rango dinámico de la señal a
nivel micro, lo que tratamos de hacer es reducir diferencias de nivel a nivel macro tales como picos
o disminuciones de ganancia muy altas y nada musicales.

Existe una línea divisoria muy delgada en cuanto a lo que se debe hacer en la edición y lo que pudo
hacerse, esto dependerá de cada persona, pero existen ciertos objetivos o tareas donde la
manipulación de los niveles de la señal es completamente necesaria durante la edición y de no
realizarse dichas tareas, los problemas pueden ser exagerados posteriormente. Un ejemplo de
este tipo de tareas que involucran la manipulación del nivel de ganancia son los ruidos y sonidos
de ambientes que logran introducirse en la grabación en los espacios de silencio entre frases
musicales, golpes de cables o movimientos del músico. Antes de profundizar en este tipo de casos
debemos definir dos formas de edición mediante el control de niveles llamadas “Edición
Destructiva” y “Edición No-destructiva”.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Edición destructiva:

La edición destructiva básicamente consiste en realizar cambios que afecten el archivo raíz de
audio de forma permanente.

Partiendo de la idea general de balancear o equilibrar la ganancia de una señal a lo largo del
tiempo de forma destructiva existe una herramienta que permite aplicar un cambio de esta
naturaleza al audio llamada Normalización.

El funcionamiento de esta herramienta es en realidad bastante simple, se realiza un escaneo de la
señal y determina su nivel máximo actual y posteriormente aplica un cambio de ganancia a toda la
señal con el fin de incrementar los niveles de pico al máximo posible. Esto no significa que la
totalidad de la señal alcanzara su nivel máximo, es decir, no será limitada por la normalización.

Este proceso no es muy recomendado, ya que cualquier proceso adicional que pretenda
incrementar la ganancia de la señal resultara en clip digital y distorsión.

La mayoría de las estaciones de trabajo, ofrecen la posibilidad de realizar cambios de ganancia
sobre la señal de forma puntual y mucho más precisa que la aplicación de la Normalización, siendo
capaces de aplicar cambios mucho más complejos donde es requerido.

Edición No-Destructiva:

Este tipo de edición consiste en cambios que no afectan de forma permanente el archivo raíz.

Básicamente la edición No-Destructiva puede agruparse en 3 categorías:

• Estática: La forma más simple de aplicar una edición no-destructiva sobre una señal es
sencillamente subir o bajar la ganancia, sin embargo, se debe tener presente que, al
realizar maniobras de esta naturaleza, la respuesta de plugins que sean dependientes de la
ganancia (compresores, puertas de ruido, etc.) se verá completamente alterada mas alla
de un cambio en el volumen. Por el otro lado, puede ser esto lo que se desea, por
ejemplo, en una sección donde la compresión es demasiado fuerte y deseamos suavizarla,
una manera de lograrlo sin alterar la configuración del compresor será alterar la ganancia
de la señal, otro ejemplo podría ser una región que por su bajo nivel no logra activar la
puerta de ruido, por lo que variando el nivel de ganancia podríamos lograr que la señal sea
procesada de la forma en la se necesita por la compuerta.
Una función que puede ser útil para este tipo de variación de ganancia es la línea de
ganancia, que permite escribir directamente las variaciones en la línea de tiempo, aunque
esta opción está diseñada para variaciones mucho más sutiles, funciona bien para el
cambio de ganancia de regiones completas. En todo caso, el objetivo principal de este tipo
de modificaciones de la señal deben ser hechas con el fin único de corregir anomalías o

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

problemas, no como parte de un proceso creativo a no ser que esta edición forma parte
del proceso de mezcla propiamente dicho.
• Variable: Este tipo de edición es muy similar a la forma estática, pero con un nivel mayor
de control, es decir, de una forma más focalizada en los detalles de la interpretación. Un
ejemplo puede ayudarnos a entender: Imaginemos que deseamos crear un canal definitivo
(Master) de la voz principal a partir de diferentes tomas y notamos que en la toma que
deseamos añadir, el cantante ejecuto una nota en el medio de una palabra con más fuerza
que en la toma que deseamos reemplazar, por lo que la diferencia entre las dos tomas es
evidente, es por esto que debemos aplicar una alteración de la ganancia con el fin de
homogenizar la transición entre las tomas. Es importante darnos cuenta de la delgada
línea entre la edición y la mezcla que existe en este tipo de edición, pero, debido a que
esta técnica es usada con el fin de recolectar las mejores tomas y unirlas con la edición
más invisible posible, podemos considerar este proceso como parte de la edición.
Generalmente, es en este punto, donde muchos tienen el impulso de ir más allá y realizar
cambios más drásticos bajo un criterio creativo, pero debemos mantener una disciplina
para mantener el enfoque correcto y objetivo con respecto al trabajo que se espera del
editor y no realizar este tipo de cambios.
• Automática: En esta tipo de edición se debe ser muy cuidadoso, ya que implica ir mucho
más allá mediante el uso de plug-in para realizar cambios en los picos excesivamente altos
de la señal, sin afectar en lo absoluto el valor promedio de la señal, solo valores puntuales.
Un ejemplo de esto es el de una batería que contienen picos puntuales a lo largo de la
señal que resultan excesivos para lo que se espera de ese material en la mezcla, por lo que
podríamos usar un compresor con una configuración muy gentil (no más de un ratio de 4:1
y un Umbral 2 o 3 decibeles por encima del nivel de la señal promedio), este tipo de
configuración no tendrá ningún tipo de efecto sobre la señal, a excepción de los picos de
muy alto nivel. Si observamos que el compresor actúa muy frecuentemente debemos
reajustar el Umbral hasta limitar su acción. Para procesamientos de este tipo, los plugins
que son los más adecuados son aquellos más transparentes. Este tipo de procedimientos
dependerá completamente de la naturaleza del cliente y del material musical.

I.II. Pareo Tonal (Tonal Matching):

El pareo tonal consiste en tratar de hacer corresponder la respuesta de frecuencia de
diferentes regiones de audio o tomas de un mismo instrumento. Esta técnica se
fundamenta en que las diferentes tomas de un mismo instrumento tienen el potencial de
experimentar diferencias tonales entre ellas. Esto puede deberse, por ejemplo, a que un
micrófono posee una respuesta de frecuencia diferente dependiendo de la distancia o

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

dirección del mismo con respecto a la fuente. Debido a este comportamiento, es posible
que la fuente se desplace con respecto al micrófono a lo largo de las diferentes tomas. Un
ejemplo sería el de un guitarrista que se ha movido o cambiado ligeramente su posición
durante la grabación de las tomas. Otro ejemplo es que diferentes tomas hayan sido
grabadas con diferentes micrófonos o en diferentes habitaciones, esto no es muy común
pero puede pasar, sobre todo si esas tomas han sido grabadas en momentos y lugares
diferentes.

Otra posibilidad es que el cantante haya ejecutado de forma ligeramente diferente (por
fatiga o estado emocional) cada toma. Un violinista puede haber tocado una cuerda de
forma diferente en varias tomas y esto produce una diferencia tonal. La naturaleza de
estos cambios puede ser sutil o por el contrario ser muy drástica.

Estas diferencias pueden ser corregidas mediante un sencillo procedimiento pero que
requiere un buen par de oídos.

Mediante el uso de EQ podemos realizar modificaciones de la amplitud especifica de
ciertas frecuencias pon el fin de emparejar las diferencias entre tomas de un mismo
elemento, adicionalmente existen plugins con la opción de Matching EQ, sin embargo,
este tipo de procesos no siempre resultan 100% fiables, por lo que el oído debe ser la
principal herramienta.

A pesar de no ser 100% efectivo, el EQ Matching puede ser un buen punto de partida,
desde este punto de vista, podemos aplicar un análisis mediante el plugin para luego
intentar copiar el resultado en otro plugin de EQ mas preciso y de esta forma, usar la
opción de Matching como un punto de partida.

Debido al consumo de tiempo y esfuerzo que esta técnica puede abarcar, es
recomendable dejarlo para una etapa posterior a la de compilación de tomas, es decir,
una vez que este claro que tomas usaremos y cuales serán desechadas. Esto se debe a
que, no tenemos manera de saber que tomas necesitaran de Matching hasta tener la
siguiente toma y comparar su respuesta.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

I.III. Recopilación y Alternar Tomas:

La recopilación de tomas consiste en tomar las mejores tomas de una serie de grabaciones
para la creación de una versión final o master. Es una técnica muy común, pero es
especialmente usada para la voz.

¿Por qué se realiza esta recopilación?

Es una verdad que, el ser humano no es capaz de alcanzar un 100% de perfección en la
interpretación en el 100% de las veces que la realiza. Incluso, los más expertos de los
músicos puede experimentar las secuelas de la presión que puede vivirse dentro de un
estudio de grabación y, sobre todo, cuando alguien está preparado para dar lo mejor que
tiene, no puede esperar hacerlo durante un tiempo prolongado.

Es por este motivo que comúnmente son realizadas repetidas tomas de una misma
sección, esto es gracias al hecho de que ahora los discos duros son capaces de almacenar
grandes cantidad de información, por lo que se debe aprovechar este recurso para tener
la mayor cantidad de muestras que sean necesarias para realizar una versión final con la
mayor cantidad de recursos disponibles. Aunque no es menos cierto que puede que
veamos casos que la interpretación resulta perfecta en unas pocas tomas, tampoco es
menos cierto que este no es un caso común. Adicionalmente, dos tomas pueden resultar
perfectas y aun así, ser diferentes en muchos aspectos, por lo tanto podríamos crear una
versión incluso mejor, si disponemos de varias tomas de buena calidad.

¿Cómo elegir una toma sobre otra?

En el proceso de recopilación de archivos, puede ser difícil en algunas ocasiones, elegir
una toma o una sección para que ocupe un lugar definitivo en la versión final de la toma,
por lo que a continuación se explican varios punto para tener en cuenta que pueden
resultar muy útiles y prácticos al momento de tomar este tipo de decisiones.

1- Ordenar las tomas en grados: Me refiero a grado de importancia o calidad,
podemos organizar las tomas en relación a la calidad de la interpretación para de
esta manera poder trabajar en base a una toma que posea un mayor porcentaje de
calidad por sobre las demás. Para esto, hace falta escuchar cada toma, incluso más
de una vez, para determinar este orden de forma correcta. Para este proceso es
muy útil el uso de colores de los track y región.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

En este orden de ideas, elegiremos un color para las tomas con mayor
probabilidades de pertenecer a la versión final, otro color para las que son usables
para la sustitución de frases o palabras, otro color para aquellas de las que no
estemos realmente seguros y otro para las que presentan mayores problemas.
El procedimiento debe comenzar de macro a micro, es decir, primero debemos
elegir la mejor toma de cada parte de la canción o secciones, por ejemplo, coro,
verso 1, puente, etc. Posteriormente realizar un separado por palabras o frases y
elegir la mejor, de esta manera, el proceso se hace de forma más ordenada y
metódica.
Podríamos considerar este paso como uno muy artístico, debido a que la elección
de tomas será hecha a partir de, por un lado, un criterio objetivo de interpretación
en cuanto a la afinación, el tempo, pronunciación de las palabras en el caso de la
voz y, por el otro lado, al tener dos tomas correctas, nuestra elección es basada en
la cualidad artística entre ambas opciones y esta es un medida muy subjetiva.

2- El tono correcto: Puede ocurrir, que el tono de las diferentes tomas sea
ligeramente diferente, como vimos en un apartado previo de este documento.
Debemos tomar en cuenta el tono como uno de los criterios para recopilar tomas,
por lo que además de ser una buena interpretación, un criterio adicional ser que
posean el tono más parecido posible, para que la aplicación de EQ sea lo más sutil
posible.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Parte 2: Edición Creativa:
II.I. Time-Stretching:

En términos generales, el procedimiento de Time-Stretching describe la compresión
(compresión de tiempo) o la expansión de un archivo de audio. En los tiempos de la
producción musical en cinta, esta compresión/expasión era lograda alterando la velocidad
de la reproducción de las maquinas en ligeras cantidades.

Este proceso alteraba en pequeñas cantidades la altura tonal del tema, si se reproducían a
una velocidad menor, el pitch bajaba y viceversa. El margen para que dicha reducción o
aumento de altura tonal se mantuviese por debajo de un semitono es menos del 7% de la
velocidad de reproducción, de hecho, un cambio de 5,946% en la velocidad de
reproducción, resultaría en un semitono de alteración.

Debemos recordar, que las transientes son las que nos permiten identificar los sonidos
correctamente y, cualquier alteración de las misma, incluso en pequeñas cantidades,
puede afectar la manera en la que los sonidos son interpretados, aun si la relación de los
armónicos no es alterada.

Con la introducción del audio digital, fue posible separar la duración (tempo) de la altura
tonal (pitch), pero a pesar de ser revolucionarias, las primeras versiones de Time-
Stretching no se asemejan a las opciones disponibles hoy en día en cuanto a calidad. Los
avances en la investigación de la Psico-acústica han mejorado nuestra compresión de
cómo percibimos el sonido y a través de ello ha mejorado la calidad y versatilidad de los
sistemas de Time-Stretching o también conocidos como “Algoritmos”.

Adicionalmente, el avance en los sistemas de almacenamiento y procesamiento han sido
muy importantes en la transformación del sistema de Time-Stretching, el cual, paso de ser
un sistema Off-line, lo que quiere decir que el proceso debía ser calculado para saber el
resultado, a ser un sistema de procesado de la señal a tiempo real como el que
conocemos hoy en día.

Ahora bien, ¿Por qué resulta tan difícil simplemente aumentar o disminuir la duración de
una región de audio?

Estudiemos un ejemplo sencillo de cómo podríamos aumentar la duración de una
grabación de forma manual:

Supongamos que tenemos una grabación de una onda senoidal de 100Hz que dura 1
segundo, para alargar la duración sin alterar el pitch, digamos un 25%, simplemente
AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

realizamos el cálculo de los ciclos que harían falta para completar en un 25% la duración
de la toma. Al duplicar los ciclos en la cantidad calculada podemos obtener la duración
deseada.

Este sistema de cálculo para alterar la duración de una región, solo funciona si no existen
cambios de amplitud, tono o frecuencia, como es el caso de los instrumentos musicales y
los sonidos presentes en la naturaleza.

Teoría de la compresión/expansión del audio:

Cada sonido tiene una firma única, la cual, los hace reconocibles por el cerebro, esta firma
está constituida no solamente por la frecuencia fundamental y la envolvente de la
transiente sino adicionalmente sus armónicos y cambios a través del tiempo, ya que la
frecuencia fundamental puede permanecer a lo largo del tiempo, pero sus armónicos van
desapareciendo a medida que se desarrolla el sonido. En teoría, todo sonido puede ser
descompuesto en una serie finita de armónicos y si son analizados con un suficiente nivel
de detalle sus características de amplitud a través del tiempo, podríamos entender la
firma de cada sonido y con la cantidad suficientes de osciladores podríamos incluso
recrear cualquier sonido existente. Esta teoría no solo es la base de algunos aspectos del
Time-Stretching sino que nos recuerda a la teoría de la síntesis aditiva.

A continuación, se explican las consideraciones sobre el análisis que debe hacerse sobre el
audio para lograr la expansión y compresión de tiempo:

Análisis Armónico y Transiente (Aditive Approach):

Existen dos consideraciones que se deben tener presentes, la primera es que el proceso
de expansión de la duración de un sonido en el tiempo sin alterar su timbre no debe
incluir a la transiente inicial pues, como sabemos, esta parte del audio es la que permite
reconocer los sonidos, y la segunda es que la relación entre los armónicos cambiara si la
frecuencia fundamental es alterada, es decir, si cambia la nota fundamental de un sonido,
la relación matemática que hay entre los armónicos también cambiara.

En base a estas dos consideraciones previas, podemos decir que el análisis de una forma
de onda para su expansión debe incluir ambos criterios, el primero es que no debe
cambiar la relación entre los armónicos y la segunda es que el procesamiento debe dejar
intacta la transiente inicial.

Entonces, para lograr una expansión, se tienen que realizar una serie de análisis
matemáticos complejos para determinar exactamente en qué proporción serán

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

multiplicados los ciclos de una onda. Estudiemos un ejemplo práctico de la expansión
manual:

Asumiendo que hemos realizado todos los cálculos referentes a la distancia entre
armónicos, incluso si la frecuencia fundamental es alterada y, que tomamos en cuenta la
duración de la transiente inicial, en teoría, somos capaces de expandir una región de
audio, con una duración de 2 segundos para llevarla a 4 segundos.

Fácilmente podríamos decir, que simplemente haría falta multiplicar por un factor de 2,
pero existe un problema con este método, no se ha considerado el tiempo de la transiente
inicial, que podemos suponer que es de 0.2 segundos, por lo que la duración real del audio
que deseamos expandir es de 1.8 segundos, esto altera la proporción en la que la región
será expandida para alcanzar los 4 segundos de duración, es decir, el audio debe ser
expandido de 1.8 a 3.8 segundos, el factor multiplicador ahora será de 2,11, dicho factor
es hallado mediante la aplicación de una regla de tres simple:

Si decimos que 1.8 multiplicado por 2 es 3.6, ¿cuál será el nuevo factor multiplicador para
alcanzar los 3.8 que hacen falta?

3.6---------2

3.8---------X

Esto nos lleva a la conclusión, de que el algoritmo debe ser eficaz detectando las
transientes y el contenido armónico de la señal para lograr su alteración de tiempo sin
alterar el tono del sonido ni sus características que lo hacen reconocible por el cerebro.

Análisis Granular (Granular Approach):

Otro método de edición que aplican algunos programas para la expansión y compresión
de tiempo está basado en la misma teoría de la síntesis granular, la cual hace referencia a
la división de un audio en pequeñas muestras. Digamos por ejemplo que logramos separar
un sonido en pequeñas partes o “granos” y deseamos comprimir la región en un 50% (la
mitad) de su duración, en esta situación, podemos aplicar dos métodos básicos:

1- Se puede acortar la duración de cada grano a la mitad, esto reduciría la reproducción
total de la región, pero existe un posible problema con este método, para lograrlo se
deben realizar cross-fades para suavizar las transiciones entre cada muestra y algunos
tipos de cross-fades pueden cambiar el tono o producir ruidos por la forma en la que

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

ambas regiones es mezclada por la otra (ver sección de cross-fades) adicionalmente el
hecho de no reproducir el grano completo puede alterar el sonido de la región.

2- El otro método consiste en solo reproducir la mitad de las muestras, es decir, eliminar
la mitad de los ciclos para comprimir la región, el problema es que la omisión de algunos
granos puede resultar en un cambio drástico del timbre por su contenido armónico.

Ambos métodos resultan difíciles y no toman en cuenta la duración de la transiente inicial.
Debido a que la síntesis granular dice que si logramos establecer duraciones de granos lo
suficientemente cortas, estaríamos trabajando esencialmente con formas de onda
estáticas por cada grano. Pero como sabemos, las transientes son ricas en contenido en
más de una frecuencia, con alta energía distribuida en periodos cortos de tiempo, por este
motivo, es muy difícil establecer una duración estable para cada grano que no altere el
timbre de un sonido.

Para trabajar efectivamente con la técnica granular, necesitamos un sistema efectivo para
la detección de las transientes para excluirlas del proceso de compresión/expansión.

O por el otro lado, la transiente debe ser incluida en un solo grano. Si normalmente un
grano tiene una duración de unos pocos milisegundos y la transiente tiene una duración
de 100ms, ésta no será incluida en un solo grano, para corregir esto, simplemente
podemos aumentar la duración de cada grano a 100ms. Adicionalmente debemos tener el
cuidado de no repetir este primer grano que involucra a la transiente inicial.

Esta técnica es muy efectiva para la expansión y compresión de baterías, pero puede ser
usada en algunas consonantes de la voz como la “T”, “K” y “D”.

La ventaja de este método, es que no requiere un análisis de todo el archivo para conocer
su comportamiento en el tiempo, por eso, resulta efectivo en aplicaciones a tiempo real.
La desventaja es que depende mucho del material y podría no ser muy tan efectivo como
otros métodos.

Time-Stretching (¿Para qué se usa?):

Lo primero que se debe considerar antes de usar cualquier técnica o programa de Time-
Stretching es cuanta expansión o compresión se va a aplicar al audio, esto dependerá de
varias circunstancias:

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

1- Ajustar una canción a una duración de tiempo especifica. Por ejemplo, ajustar una pieza
musical a la duración de un comercial de trece segundos a la perfección. Este tipo de
compresión está basada en términos de “tiempo absoluto”.

2- Ajustar el tempo de un loop o frase musical al tempo de una sesión. Por ejemplo, un
loop de batería con un tempo de 110bpm a una sesión con un tempo de 120bpm. Esta
compresión está basada en términos de “tempo”.

3- Ajustar un audio con una duración de compases, a otra duración. Por ejemplo, un audio
con una duración de 9 compases a una duración de 8 compases. Este tipo de compresión
está basada en términos de “duración de compas”.

Nota: Una característica del Time-Stretching es que no puede hacerse a tiempo real y es
una forma destructiva de edición, lo que significa que cualquier cambio creara un nuevo
archivo de audio y si se necesita volver a realizar otro cambio, es necesario buscar el audio
original para realizar nuevamente la expansión o compresión off-line.

II.II. Elastic Audio (Time):

Definición de Elastic Audio:

La idea de Elastic Audio que es posible únicamente por los avances en la tecnología del
procesamiento de las computadoras, pues, en esencia, se trata de otra forma de realizar
el Time-Stretching pero con dos diferencias fundamentales:

• Se realiza en tiempo real
• Se trata de un proceso no destructivo

El proceso de compresión/expansión a través de Elastic Audio consiste en realizar cambios
a tiempo real sin afectar de forma definitiva el audio sobre el cual se escribe la nueva
información, únicamente se guardan estos cambio al aplicar los cambios de manera
definitiva.

Diferentes Algoritmos:

1- Polyphonic: Este algoritmo está diseñado para material con contenido tonal variable y
complejo, como por ejemplo una guitarra o una canción completa, es considerado el
AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

algoritmo multi-propósito por excelencia. La expansión/compresión de material de esta
naturaleza es complicada por el amplio contenido de transientes y armónicos.

Este algoritmo está basado en la creación de granos de la síntesis granular.

El plug-in incluye dos controles que permiten calibrar el algoritmo para mejores
resultados:

La ventana de control de duración (Window Length Control):

Este control permite asignar la duración de las secciones de audio en la que será dividida
la región, también llamada tamaño de grano o “Grain Size”. Permite una duración entre
6ms y 185ms para cada porción.

Valores pequeños producen una respuesta uniforme y transientes más precisas pero
puede producir un artifact con un sonido granulado. Valores altos mantiene la calidad en
sonidos continuos pero puede producir flaming y repetición de transientes. Con esto en
consideración, podemos categorizar dos rangos para diferentes instrumentos:

a- Percucion: 20ms o menos

b- Material continuo con legato como Pads o parecidos: 60ms o mayor

c- Para usos generales: 30ms-40ms

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Follow Control:

Este control activa el seguimiento de la envolvente de la señal original, lo que quiere decir
que la calidad de la dinámica original será impuesta a la versión procesada, esta opción
permite mantener el carácter del sonido original.

2- Rhythmic:

El algoritmo rítmico funciona de manera granular, considerando un espacio antes del
procesamiento para la transiente inicial de 70ms aproximadamente. A partir de este
momento, se realizan una serie de copias de la forma de onda con las características del
decay de la señal, variando su amplitud en el tiempo hasta llegar a -60db.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

En la imagen es posible apreciar la manera en la que se repiten ciclos para expandir el
audio guardando la relación de armónicos pero la transiente inicial permanece sin
alteración alguna.

Nota: La expansión de la imagen es una versión llevada al límite y corregida en ganancia
para poder apreciar con el mismo nivel de zoom dónde y cómo se produce la expansión
mediante un enfoque granular.

3- Monophonic: El algoritmo monofónico altera la duración de la misma manera en la que
lo hace el algoritmo rítmico, pero con la principal diferencia en que esta no posee un
control adicional para el control de ningún parámetro. El algoritmo realiza la copia de los
ciclos desde el principio, lo que resulta en la manipulación de la transiente inicial.

Como se observa en la figura superior, la señal procesada posee repeticiones de cada
ciclo, incluyendo el contenido de la primera transiente.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

En la imagen siguiente se puede observar con un nivel mayor de detalle donde comienza
la repetición del segundo ciclo y cuantas veces es duplicado, en color rojo el primer ciclo y
en amarillo el segundo ciclo. Este procesamiento ha sido hecho de la forma más agresiva
posible con el objetivo de ilustrar el funcionamiento del plug-in.

4- Varispeed: Este algoritmo realiza la expansión y compresión con alteración del pitch,
puede ser muy útil para crear efectos sonoros creativos pero no funciona para tareas más
técnicas de corrección transparente, ya que funciona de la misma manera en la que lo
hace una maquina de cinta, si se disminuye la velocidad para que el audio aumente su
duración, el pitch desciende y viceversa.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

En la siguiente imagen se puede apreciar que la versión procesada es igual a la versión
original, pero con la relación de distancia entre armónicos completamente diferente.

5- X-Form: Este algoritmo es diferente a los demás, debido a que no puede usarse en
tiempo real. Puede ser usado para variar la duración de un archivo de audio como una
canción completa.

Quality Control:

Este control determina la calidad del audio y su velocidad de procesamiento, a mayor
calidad, menor velocidad en el procesamiento off-line.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Formant Control:

Este control permite conservar las formantes más claras del material.

Nota: La formante es la forma de una señal que resulta de la fuerza o amplitud de los
armónicos, esta fuerza es la que determina el carácter de un sonido.

Análisis del Algoritmo:

Como se menciono anteriormente, para poder realizar la expansión o compresión del
audio, se debe realizar un análisis previo de la señal para determinar las proporciones de
sus componentes armónicos, transiente y formante. Los algoritmos de Elastic Audio
realizan este análisis automáticamente al ser insertados en un canal.

En la imagen se observa el lugar donde se inserta el plug-in:

Posteriormente el plug-in realiza un análisis de la forma de onda, el mismo puede tardar
dependiendo de la duración del clip de audio y el algoritmo aplicado.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Para gver las marcas de evento de transiente o “Event Transient Markers” que ha
generado el algoritmo se debe cambiar la visualización del canal a su formato de análisis.

Estas marcas denotan los picos más altos (de mayor amplitud) de la forma de onda. Para
agregar marcas que no se hayan generado se oprime Control+Grabber tool (Mac)
Menú+Grabber tool (Pc).

Deformación (Warp):

La deformación es el proceso a través del cual se logra realizar la expansión o compresión
del audio. Este proceso es posible gracias a los Markers de Deformación:

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Existen dos tipos de Markers, los de Evento y los de Deformación, en la imagen superior
en rojo se resaltan los Markers de Deformación en color rojo y en color amarillo el Marker
de Evento que es generado en el momento del análisis del algoritmo.

Para producir lo que se conoce como deformación o “warp” se debe cambiar la vista del
canal (en esta vista es posible generar Markers de Deformación):

Existen varias técnicas para el uso del Warp explicadas a continuación:

• Range Warp (Deformación de Distancia):

Esta técnica de deformación permite modificar una sección del audio creando dos markers
de deformación automáticamente en los extremos del punto que será movido, se realiza
manteniendo presionada la tecla Shift mientras se hace click en el lugar preciso del

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

marker. El algoritmo realiza la deformación comprimiendo de un lado mientras expande
del otro para situar el punto central donde es requerido.

• Telescoping Warp (Deformación Telescópica):

Este tipo de deformación es aplicada sobre todo el audio y no sobre una sección
específica. Para realizar este tipo de deformación, simplemente debemos situar el cursor
sobre cualquier Marker de evento generada durante el análisis (No deben de haber
Markers de Deformación)

• Acordion Warp (Deformación de Acordeón):

Este tipo de deformación solo es posible cuando existe un solo Marker de Deformación
dentro de la región de audio.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Parte 3: Edición Restaurativa:
III.I. Edición Espectral:

Podemos imaginar la edición de sonidos que se filtran en la grabación simplemente
acortando la región que contiene la fuga y de esta forma eliminar la contaminación del
canal. Pero ¿qué sucede si la fuga o contaminación se encuentra dentro del audio y no
sobre regiones de silencio? ¿Es realmente posible limpiar esos sonidos?

Un ejemplo de esta contaminación podría ser una sirena de ambulancia dentro de una
grabación de una guitarra o locución o el sonido de un auto pasando justo en el momento
que se graba la voz. Este tipo de casos son frecuentes en lugares sin aislamiento acústico.

En los estudios tratados acústicamente, es común que los músicos generen ruidos que
pueden afectar la grabación y ser igualmente pasados por alto, tal es el caso del ruido que
se produce al golpear el paral que sostiene el micrófono o un sonido de teléfono celular
sonando a bajo nivel, el sonido de un collar o incluso el sonido de los zapatos del músico al
moverse. Todos estos ejemplos son comunes en todos los entornos de grabación y
pueden ser pasados por alto hasta la etapa de edición e incluso de la mezcla.

El tratamiento para este tipo de material, debe ser capaz de extraer esos ruidos sin afectar
la señal de forma significativa o destructiva.

Para ello, existen una serie de técnicas que implican la aplicación de procesos
tradicionales de ecualización, compresión y procesos dedicados a esta clase de tareas.

III.II. Ecualización en la edición espectral:

Para entender esta técnica, debemos recordar, que un sonido está compuesto por una
serie de ondas con una relación matemática, los armónicos, los cuales, componen el
carácter de los sonidos y los hace reconocibles. Estos armónicos nacen de una onda
fundamental.

Con ese principio en mente, para remover un sonido que esta sobre otro ruido, se debe
identificar la frecuencia fundamental del ruido y reducirla junto a sus respectivos
armónicos:

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

En la imagen, se puede apreciar una onda con su armónico justo encima, en esta
representación la señal es representada en el tiempo por la horizontal, la frecuencia en la
vertical y la amplitud se representa en la intensidad del brillo.

Por lo tanto, se debe aplicar un análisis espectral del audio para conocer la frecuencia
exacta y su comportamiento a través del tiempo para eliminarla con precisión.

Con esta información, es posible automatizar los parámetros de un ecualizador para que
realice la limpieza. Se debe aplicar una reducción tanto de la fundamental, como de cada
uno de los armónicos para que el sonido desaparezca por completo.

Este tipo de tratamiento puede llegar a ser complejo y muy difícil de lograr con la
precisión suficiente para que la edición sea imperceptible, sin embargo, es posible y
algunos casos resultan más sencillos que otros.

Debido a la complejidad y el tiempo que puede consumir esta técnica para la edición de
sonidos que son de características en el tiempo variables, ya sea la amplitud o la
frecuencia, es más recomendable usarla en material con un comportamiento más
uniforma como el sonido de un golpe o ruido de artículos como collares o ruido de
zapatos que son de naturaleza mas uniformes y momentáneas ya que existen otras
herramientas disponibles para tratamientos más complejos.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

III.III. Compresión multi-banda en la edición espectral:

La misma técnica empleada en la ecualización para la edición espectral puede ser aplicada
en un compresor con múltiples bandas, la diferencia fundamental entre ambas es que esta
vez se aplica un reducción de la amplitud basada en los cambios de amplitud, es decir, si la
señal cambia su amplitud, la reducción será mayor y mas uniforma para sonidos con un
comportamiento variable de esta característica a través del tiempo. Sin embargo, esta
técnica posee la misma complejidad para la automatización de múltiples variables como la
frecuencia y la amplitud en el tiempo simultáneamente.

Esta técnica ofrece las mismas ventajas y desventajas en cuanto a la edición de material
más complejo como por ejemplo una sirena de ambulancia o el ruido de fondo como la
calle o gente caminando.

III.IV. Plug-in de restauración:

Existen una gran variedad de plug-in dedicados al tratamiento de ruidos producidos tanto
por la contaminación sónica del ambiente, como para defectos puntuales como los clips
de una edición o el sonido de un aire acondicionado, algunos funcionan creando un perfil
de ruido a cancelar o mediante el análisis de la duración de ciertos perfiles configurados
en el software.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

III.V. Posibilidades de edición de los DAW:

Las estaciones de trabajo de hoy ofrecen herramientas mucho más avanzadas para la
edición espectral que las técnicas que se han descrito previamente, resolviendo el
problema de complejidad en la automatización de parámetros de un plug-in para
conseguir una limpieza eficiente de los ruidos y contaminación de las señales grabadas.

Incluso existen DAWs dedicados exclusivamente a la edición, un ejemplo de este tipo de
sistemas es el SpectraLayer Pro de la compañía SONY. Este software permite la
identificación, selección individual y tratamiento de cualquier sonido presente en una
señal mediante la descomposición de su contenido armónico, a través de una interfaz
grafica que permite su manipulación intuitivamente e incluye herramientas especializadas
para la edición de esta naturaleza.

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

En la imagen, puede apreciarse encerrada en un círculo rojo el comportamiento en el
analizador de espectro del SprectraLayer Pro 4 el sonido de una ambulancia dentro de
una locución de un presentador de televisión.

Las herramientas de este programa permiten seleccionar de forma individual esta
frecuencia mediante una herramienta diseñada para tal propósito y reducir o eliminar su
presencia sin alterar las características del audio de forma evidente o destructiva.

Software gratuito:

Hay herramientas para la edición espectral en software como Audacity disponible hasta su
versión 2.1.2 actualmente, es gratuito y su aplicación está disponible para Pc y Mac.

III.VI. Aplicaciones para en aéreas:

Restauración y análisis forense:

AUDIOPLACE: Academia de Ingeniería y Producción Musical

EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES

Las implicaciones de este tipo de tratamiento van más allá de aplicaciones musicales o de
audiovisuales con propósitos de entretenimiento, adicionalmente es aplicada en la
recuperación y autentificación forense de evidencia de audio y reconocimiento biométrico
de la voz. Un ejemplo de restauración de audio con propósitos forenses puede ser el
procesamiento del audio de una caja negra de un accidente de aviación para eliminar el
ruido del motor o algún otro defecto en la grabación.

El mismo procedimiento que se aplica para eliminar una conversación lejana puede ser
usado para aislar esa misma conversación, sin embargo, este procedimiento puede
resultar mucho más difícil, pero ciertamente posible.

Demixing:

Se refiere al proceso de obtener canales individuales de un archivo estéreo, es decir,
realizar el proceso inverso de mezcla, sustrayendo sonidos individuales de audios
complejos. Este proceso esta aun en desarrollo y resulta con una calidad de audio media,
pero todo depende de la meta que se persiga, pues, para aislar un sonido como una
conversación o un sonido de automóvil de una entrevista puede ser realmente eficaz,
pero resulta limitado para extraer partes individuales de los elementos de un material
musical, debido a la estrecha relación entre los armónicos de los instrumentos, sin
embargo, es posible aislar, por ejemplo, una voz de una canción en formato estéreo.

Dado que las frecuencias y sus armónicos en el material musical está relacionado, resulta
difícil separar elementos basados en su análisis espectral sin alterar el tono de otros
elementos con los cuales esté relacionado armónicamente, por lo tanto, si imaginamos
una guitarra que tiene una frecuencia fundamental en un momento dado de 440Hz y
resulta que la voz coincide con esta frecuencia en algún punto con la guitarra, entonces, al
extraer la voz, se afectara el tono de la guitarra en esos momentos precisos.

Por lo tanto, la técnica de Demixing aun presenta inconvenientes y necesidad de una
manera más eficiente de detectar y separar frecuencias de dos instrumentos que estén
relacionados, al menos, en material musical complejo. Para otras aplicaciones, puede
llegar a ser muy eficaz.

AUDIOPLACE: Academia de Ingeniería y Producción Musical