Está en la página 1de 48

Diplomatura en Audio Digital

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 2

Módulo 2: Edición de Audio y Proceso de Señales


Digitales

Unidad 1: Edición de Audio Digital

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 3

Presentación:
En esta unidad vemos en profundidad el uso de software de edición desctructiva de audio,
utilizando el software libre y de código abierto Audacity.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 4

Objetivos:
Que los participantes:
 Se familiaricen con el software libre y de código abierto Audacity y con las
principales técnicas de edición destructiva de audio.

 Conozcan las ventajas y las desventajas de la edición destructiva con respecto a la


edición no destructiva de audio.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 5

Bloques temáticos:
1. Introducción a la edición de audio digital.
2. Manipulación de archivos de audio:
 Abrir y guardar archivos en Audacity.
3. Exportación en diferentes formatos.
4. Navegación.
5. Selección y edición básica (borrar, copiar, cortar y pegar).
6. Grabación.
7. Generación de señales:
 Ruido.
 Tono.
 Chirp.
8. Edición de amplitud:
 Fundidos de entrada y salida.
 Normalización.
 Clipping
9. Metadatos.
10. Espectrograma y análisis de espectro.
11. Reducción de ruido.
12. Ejercicio.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 6

Consignas para el aprendizaje colaborativo


En esta Unidad los participantes se encontrarán con diferentes tipos de actividades que,
en el marco de los fundamentos del MEC*, los referenciarán a tres comunidades de
aprendizaje, que pondremos en funcionamiento en esta instancia de formación, a los
efectos de aprovecharlas pedagógicamente:

● Los foros proactivos asociados a cada una de las unidades.


● La Web 2.0.
● Los contextos de desempeño de los participantes.

Es importante que todos los participantes realicen algunas de las actividades sugeridas y
compartan en los foros los resultados obtenidos.

Además, también se propondrán reflexiones, notas especiales y vinculaciones a


bibliografía y sitios web.

El carácter constructivista y colaborativo del MEC nos exige que todas las actividades
realizadas por los participantes sean compartidas en los foros.

* El MEC es el modelo de E-learning colaborativo de nuestro Centro.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 7

Tomen nota:
Las actividades son opcionales y pueden realizarse en forma individual, pero siempre es
deseable que se las realice en equipo, con la finalidad de estimular y favorecer el trabajo
colaborativo y el aprendizaje entre pares. Tenga en cuenta que, si bien las actividades
son opcionales, su realización es de vital importancia para el logro de los objetivos de
aprendizaje de esta instancia de formación. Si su tiempo no le permite realizar todas las
actividades, por lo menos realice alguna, es fundamental que lo haga. Si cada uno de los
participantes realiza alguna, el foro, que es una instancia clave en este tipo de cursos,
tendrá una actividad muy enriquecedora.

Asimismo, también tengan en cuenta cuando trabajen en la Web, que en ella hay de todo,
cosas excelentes, muy buenas, buenas, regulares, malas y muy malas. Por eso, es
necesario aplicar filtros críticos para que las investigaciones y búsquedas se encaminen a
la excelencia. Si tienen dudas con alguno de los datos recolectados, no dejen de consultar
al profesor-tutor. También aprovechen en el foro proactivo las opiniones de sus
compañeros de curso y colegas.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 8

1. Introducción a la edición de audio digital

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 9

En su forma más básica, la edición de audio digital puede ser simplemente editar un
archivo de audio para eliminar los silencios que se encuentren al principio o al final de
éste, para reemplazar una sección de audio en dicho archivo por otra perteneciente a
otro, o para remover titubeos y trastabilleos en la grabación de una entrevista. Una forma
más compleja de edición de audio podría ser montar una numerosa cantidad de efectos
de sonido y mezclarlos junto con diálogo y música para crear el diseño de sonido de una
película.

Una de las etapas pertinentes a la masterización de un álbum de música involucra edición


de audio tal como la trataremos en esta Unidad. En esta etapa del máster se concatenan
múltiples pistas en un editor de audio para determinar la duración final de cada una de
ellas incluyendo silencios; además, pueden ser realizadas algunas correcciones de
amplitud general de cada pista en caso de que sea necesario.

La edición de audio también es utilizada en post-producción de medios audiovisuales


lineales, donde el audio obtenido durante las grabaciones en los sets es utilizado solo
como guía y es reemplazado posteriormente, durante el procedimiento llamado ADR
(automatic dialogue replacement, reemplazo automático de diálogo), por grabaciones
realizadas en mejores condiciones acústicas que son sincronizadas al movimiento de
labios de los actores en la imagen. Además, podría ser requerido agregar efectos de
sonido extraídos de un banco de efectos específico para reforzar comportamientos
existentes en el video; doblajes en lenguaje foráneo podrían requerir proceso adicional de
estirado o compresión en el eje temporal, sin alteración de altura tonal, para lograr una
sincronización labial más convincente. Cada una de estas fuentes de audio puede requerir
ecualización, compresión o algún otro tipo de proceso como reverberación antes de ser
incorporado a la mezcla, procesos que trataremos en este Módulo.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 10

La edición de audio digital suele ser categorizada en "edición destructiva" y "edición no


destructiva". En el primer caso, todos los procesos realizados sobre el audio son
aplicados en el momento sobre el archivo original o sobre la copia en memoria que
generó el programa que estemos utilizando, por lo cual este proceso sería offline (no
estaría siendo aplicado en tiempo real al audio al momento de la reproducción) y
naturalmente liviano en recursos de procesamiento, con la desventaja de que la
posibilidad de modificar los parámetros de algunos de los procesos previamente
realizados es muy limitada, y que corremos el riesgo de perder el audio original en caso
de no haber realizado copias de resguardo adecuadamente. Dadas las características de
la edición destructiva de audio, en un software que utilice este tipo de edición es posible
realizar modificaciones de gran precisión, pudiendo manipular información de la señal de
audio a nivel muestra. En esta Unidad nos dedicaremos exclusivamente a este tipo de
edición, y para ello utilizaremos el software Audacity. Trataremos la edición no-destructiva
de audio en la última Unidad de este Módulo, pero, dicho de manera simple, este tipo de
edición modifica la forma en la que se reproducen los archivos de audio en tiempo real,
manteniendo intactos los archivos originales; de esta manera, todos los procesos que
realicemos sobre el audio a editar, ya sean cambios de volumen, ecualizaciones,
compresiones dinámicas, etcétera, se aplicarían al audio en el momento de la
reproducción, lo que implicaría además un coste de procesamiento no despreciable que
dependerá de la cantidad de procesos que deseemos realizar.

Audacity es un software libre y de código abierto que se encuentra disponible en múltiples


plataformas distribuido bajo licencia GPL. Es necesario aclarar que todos los
procedimientos a realizar en esta Unidad pueden realizarse de igual manera en cualquier
software de edición destructiva de audio, y que la decisión de utilizar Audacity para este
curso reside en que es un software que alcanzó cierta madurez, es libre, gratuito y de
código abierto.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 11

En el Módulo 1 vimos cómo se compone una cadena de audio, cómo llevamos una señal
acústica a un medio digital y viceversa:
Señal > Transducción > Codificación > MEDIO DIGITAL > Decodificación > Transducción > Señal

También exploramos algunas formas en las que podemos visualizar las señales de audio
digital, como oscilogramas y espectrogramas. Es momento de ver cómo podemos
modificar las señales digitales y qué usos prácticos tienen estos procesos.

Es importante tener en cuenta que muchos conceptos a utilizar en este Módulo fueron
tratados en profundidad en el Módulo I: Introducción al Audio Digital. Por favor, dirijan
todas las dudas con respecto a estos conceptos al foro de debate correspondiente a esta
Unidad.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 12

2. Manipulación de archivos de audio:

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 13

Cada programa de audio funciona a su manera con respecto a la manipulación de


archivos, pero por lo general caen en dos categorías:

• Los que trabajan sobre archivos de audio directamente


• Los que trabajan sobre un proyecto del propio programa
Por ejemplo, Sound Forge, Wavosaur y Ocenaudio son programas que caen dentro de la
primer categoría; Audacity, Reaper y Logic en la segunda.

 Abrir y guardar archivos en Audacity


Si vamos al menú Archivo > Abrir en Audacity vamos a ver la ventana que nos permite
buscar en nuestras carpetas y abrir archivos. Desde esta ventana podemos abrir archivos
de audio (WAV, FLAC, AIFF, etc.) o proyectos de Audacity, estos son archivos con
extensión AUP que van acompañados de una carpeta que contiene archivos de datos
necesarios para el proyecto.

Pero, como hemos visto, Audacity no trabaja directamente sobre los archivos de audio,
por eso si abrimos uno de estos lo que va a hacer el programa es crear un nuevo proyecto
vacío e importar el archivo de audio dentro del proyecto.

Es importante notar que cuando abrimos el programa éste nos presenta con un proyecto
nuevo y vacío al que podemos importar audio desde Archivo > Importar > Audio, y este
procedimiento nos da el mismo resultado que abrir un archivo de audio directamente.

Como Audacity trabaja con proyectos, la opción Archivo > Guardar no refiere a guardar
los cambios en el archivo de audio sino al proyecto, por lo tanto va a mostrarnos una
ventana para que nombremos y guardemos nuestro proyecto. Esto sucederá la primera
vez que guardemos cada proyecto, las siguientes veces la opción guardar sobrescribirá el
archivo de proyecto que estamos usando.

Para guardar un archivo de audio desde Audacity, el proceso será diferente, debemos ir a
Archivo > Exportar audio, se nos presentará una ventana donde podemos seleccionar la
carpeta, nombrar el archivo, elegir el formato y cambiar las opciones de formato en el que
se exportará. En este caso los archivos del proyecto no se verán afectados.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 14

3. Exportación en diferentes formatos

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 15

Cuando exportemos audio desde un programa vamos a tener que seleccionar un formato,
ya sea con o sin compresión, con o sin pérdida. Cuando seleccionemos un formato se nos
darán ciertos parametros a ajustar dependiendo del formato seleccionado.

Por ejemplo, al exportar en PCM podremos seleccionar la tasa de muestreo y la


profundidad de bits, al exportar en OGG la calidad del audio comprimido, en MP3 la tasa
de bits y si es fija o variable. Las opciones dadas también dependerán del programa en
cuestión.

En Audacity la frecuencia de muestreo del archivo exportado será la misma que la del
proyecto, que aparece abajo a la izquierda en la ventana principal del programa, por lo
tanto esta opción no se muestra al exportar un archivo. En la lista de formatos de la
ventana de exportación aparecen los formatos más conocidos, sin embargo si
seleccionamos otros archivos sin comprimir nos presentará una lista adicional de
formatos, también podemos seleccionar custom FFmpeg Export y se nos dará acceso a la
amplísima variedad de formatos y opciones del programa FFmpeg. Para nuestros
procesos habituales exportaremos en formato WAV (Microsoft) PCM de 16 bit con signo,
que es la opción de formato por defecto.

Hay que tener en cuenta que la extensión del archivo y su formato no siempre van de la
mano, por ejemplo, un archivo con formato PCM puede tener extensión WAV o AIFF, o un
audio con compresión AAC puede estar contenido en un archivo de extensión MP4 o M4A
de igual manera. Es por eso que además de elegir el formato de codificación debemos
escribir, en el nombre de archivo, la extensión que vamos a usar. Ésta tiene que ser
compatible con el formato seleccionado; de todas formas, Audacity nos dará aviso si
estamos intentando exportar un archivo de audio usando un formato no compatible con su
extensión.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 16

Figura 1.1

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 17

4. Navegación

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 18

Cada editor presenta su propia forma de manipular la vista de la señal de audio, pero hay
ciertos comportamientos presentes en todos ellos. En la vista principal se nos presenta la
forma de onda en dos ejes: amplitud en el Y y tiempo en el X. En la parte superior de la
forma de onda vemos la regla temporal que puede aparecer en minutos, segundos y
milisegundos, en muestras, o en compases según el tempo asignado. A su vez, a la
izquierda de la forma de onda vemos una regla que representa la amplitud en una escala
lineal o logarítmica (en decibeles). En Audacity, para ver la forma de onda del audio en
escala logarítmica debemos hacer clic en la pequeña flecha a la derecha del nombre del
archivo en el panel de control de pista, y seleccionar Forma de onda (dB) en el menú
desplegable. Podemos trasladar la vista hacia la derecha e izquierda para visualizar
diferentes segmentos de tiempo de la señal y también podemos hacer zoom horizontal y
vertical.

En Audacity podemos movernos por la vista de forma horizontal con la barra que aparece
debajo de la forma de onda, o colocando el cursor del mouse sobre la forma de onda,
manteniendo presionada la tecla Shift y moviendo la rueda del mouse.

Movernos verticalmente nos sirve para visualizar varias pistas en caso de que nuestro
proyecto las posea. Esto se puede realizar con la barra que aparece a la derecha de la
forma de onda o con la rueda del mouse.

Para hacer zoom horizontal podemos usar los botones que aparecen en la barra de
herramientas o, con el cursor del mouse sobre la forma de onda, manteniendo presionada
la tecla Control y moviendo la rueda del mouse. En este último caso la vista hará zoom
centrándose en la posición del cursor del mouse.

Para hacer zoom vertical podemos hacer clic en la regla de amplitud; haciendo clic
derecho o Shift+clic izquierdo reducimos el zoom. Generalmente, a medida que hacemos
zoom horizontal en un editor de audio veremos tres representaciones diferentes de la
forma de onda.

Cuando tenemos el zoom al mínimo, es decir, cuando vemos en pantalla un gran


segmento de audio, en lugar de representar la señal y sus muestras, presenta una versión
condensada de los picos máximos de amplitud cada cierta cantidad de muestras. En el
caso de Audacity también nos muestra, con otro color más claro, la amplitud RMS
condensada.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 19

Figura 1.2
Si aumentamos el zoom horizontal lo suficiente vamos a ver la forma de onda
representada por una línea continua, esta es una interpolación de las muestras que
conforman la señal, como conectando los puntos, pero no se pueden ver con claridad las
muestras.

Figura 1.3
La tercera representación aparece cuando hacemos máximo zoom; así, podremos ver
cada muestra representada como un punto. Los puntos están unidos por lineas para
hacer la visualización más fácil.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 20

Figura 1.4
Los diferentes editores pueden diferir en la forma en la que representan la unión entre las
muestras y algunos editores nos permiten elegir cómo se realiza esta representación.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 21

Figura 1.5
Si hacemos clic en cualquier lugar de la forma de onda aparecerá el cursor de edición en
ese lugar, este es el punto donde se realizarán las acciones que le indiquemos al

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 22
programa. Por ejemplo, si hacemos clic en el botón Play/Reproducir en la barra de tareas
o presionamos la barra espaciadora en el teclado el programa comenzará a reproducir
desde el punto donde está el cursor de edición.

Cuando reproducimos audio aparece otro cursor, este es el cursor de reproducción. Este
se moverá hacia la derecha indicando la posición de reproducción en el archivo que
estemos reproduciendo, y si hacemos clic en el botón Pausa éste se quedará quieto en su
posición. En Audacity podemos diferenciarlos por los íconos que aparecen en la regla de
tiempo junto a los cursores, una flecha gris apuntando a la izquierda para el cursor de
edición y una flecha verde apuntando hacia abajo para el cursor de reproducción.

Figura 1.6

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 23

5. Selección y edición básica (borrar, copiar, cortar y


pegar)

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 24

Si hacemos clic sobre la forma de onda y arrastramos hacia la derecha o hacia la


izquierda vamos a poder seleccionar un segmento de audio, esto nos va a permitir aplicar
acciones a dicho segmento. También podemos colocar el cursor de edición en el punto
donde queremos comenzar la selección y manteniendo presionado Shift hacer clic en el
punto donde queremos que la selección termine. Otra forma mucho más precisa de
seleccionar es manteniendo presionado Shift y usando las flechas del teclado hacia la
derecha o hacia la izquierda, esto generará una selección a partir del cursor de edición.

Podemos eliminar el segmento seleccionado haciendo clic en Editar > Borrar o


presionando Suprimir en el teclado. Esto suprimirá el audio seleccionado concatenando el
segmento siguiente al anterior, es decir, no quedará un espacio vacío o de silencio en el
lugar sino que se producirá un salto en la señal.

Una función interesante relacionada con la selección es la detección de cruce por cero.
Luego de seleccionar una porción de audio, sus límites pueden ser ligeramente ajustados
al cruce por cero más cercano utilizando la opción que encontramos en el menú Editar >
Encontrar cruces en cero (o con el atajo de teclado Z). Esta función es útil para extraer
segmentos de audio que no generen clics al reproducir en bucle, y para exportar archivos
que comiencen y terminen en cruce por cero, para asegurarnos que la reproducción de
estos archivos en cualquier programa o plataforma sea lo más correcta posible.

Podemos copiar o cortar el segmento seleccionado seleccionando la opción deseada en


el menú Editar, con el botón designado en la barra de tareas o presionando Control+C en
el teclado para copiar o Control+X para cortar. Cortar tendrá el mismo efecto que copiar y
luego borrar la selección.

Podemos pegar el audio que copiamos o cortamos en cualquier lugar donde coloquemos
el cursor de edición con la opción de pegar del menú, el botón en la barra de tareas o
presionando Control+V en el teclado. Al pegar un segmento de audio el programa
insertará la nueva porción de audio en el lugar del cursor de edición corriendo toda la
señal que haya a continuación. Si queremos reemplazar un segmento de audio con otro
que hayamos copiado o cortado debemos seleccionar el segmento a reemplazar y luego
pegar.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 25

6. Grabación

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 26

La grabación de audio digital es el proceso mediante el cual capturamos las señales que
recibimos desde la entrada de nuestra cadena de audio. Lo que hace un programa al
grabar es leer los datos que están pasando por la cadena luego de la digitalización y
guardarla en un archivo PCM en el disco rígido o la memoria RAM de nuestra
computadora.

El proceso de grabación en un programa de edición de audio (a diferencia de uno de


grabación y mezcla multipista, como veremos más adelante) es bastante simple, pero
antes de comenzar a grabar debemos tener en cuenta algunas cosas: - Debemos tener
una cadena de audio funcionando, la fuente de sonido que vamos a grabar debe estar
conectada a la entrada de audio de la placa de audio de nuestra computadora. - El
sistema operativo o el controlador de la placa de audio debe estar configurado para recibir
la señal del canal que estamos utilizando. - La amplitud de la señal debe ser adecuada en
todas las etapas de la cadena, en la fuente, en la placa de sonido y en el programa que va
a realizar la captura. Generalmente los programas tienen un medidor de nivel de entrada
para verificar esto.

Con todo lo anterior en regla solo resta hacer clic en el botón Grabar y el programa
empezará a capturar audio a partir de la posición del cursor de edición; cuando
terminemos nuestra captura solo hace falta hacer clic en Detener. En algunos programas
puede aparecer una ventana luego de la grabación que nos dará la opción de descartar,
renombrar o guardar los archivos que se crearon con la captura.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 27

7. Generación de señales:

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 28

Los programas de edición de audio generalmente incluyen opciones de síntesis para


generar audio. Audacity trae varios generadores de señales y también permite que
instalemos otros. Si hacemos clic en el menú Generar veremos la lista de generadores de
señales más comunes y la opción Añadir / eliminar complementos... que nos permitirá
modificar dicha lista. Al seleccionar un generador aparecerá una ventana que nos
permitirá elegir sus propiedades antes de generar la señal deseada. Ésta se insertará a
partir del punto donde se encuentre el cursor de edición y ocupará el segmento de tiempo
que le indiquemos en cuadro del generador. Si realizamos una selección antes de abrir un
generador, el cuadro de duración tomará el tiempo de la selección que hemos hecho.

Veamos a continuación algunos de los generadores que incluye Audacity y las opciones
que nos permite manipular en cada uno:

 Ruido
• Ruido: Podemos elegir el tipo de ruido a generar, blanco, rosa o Browniano.
• Amplitud: La amplitud de la señal generada en un valor lineal de 0 a 1.
• Duración: La duración de la señal generada en horas, minutos y segundos.

Figura 1.7

 Tono
Genera una señal de onda periódica y nos ofrece varios tipos de forma de onda.

• Forma de onda: Nos permite seleccionar entre las siguientes Sinusoide, Cuadrada,
Diente de sierra y Cuadrada sin alias.
• Frecuencia: La frecuencia en Hz de la fundamental de la onda generada.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 29
• Amplitud: La amplitud de la señal generada en un valor lineal de 0 a 1.
• Duración: La duración de la señal generada en horas, minutos y segundos.

Figura 1.8

 Chirp
Genera una señal de onda periódica como el generador de tono pero nos permite asignar
frecuencias y amplitudes iniciales y finales. El tono generado tendrá una envolvente de
frecuencia, subiendo o bajando desde la frecuencia de inicio hasta la frecuencia final, y
una envolvente de amplitud, aumentando o disminuyendo desde la amplitud inicial hasta
la amplitud final. La velocidad de los barridos depende de la duración de la señal
generada.

• Forma de onda: Nos permite seleccionar entre las siguientes Sinusoide, Cuadrada,
Diente de sierra y Cuadrada sin alias.
• Frecuencia: La frecuencia inicial y final en Hz de la fundamental de la onda generada
• Amplitud: La amplitude de inical y final de la señal generada en un valor lineal de 0 a
1.
• Duración: La duración de la señal generada en horas, minutos y segundos.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 30

Figura 1.9

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 31

8. Edición de amplitud:

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 32

Podemos modificar la amplitud de una señal de varias formas. En todos los programas de
edición existe esta opción y se puede aplicar a todo el audio o a un segmento
seleccionado. En Audacity, esta opción se encuentra en el menú Efecto > Amplificar.... Al
hacer clic en esta opción se nos muestra una ventana donde podemos indicar el cambio
de amplitud positivo o negativo que deseamos aplicar con un control deslizable y una caja
de texto en decibeles. También nos indica cuál será el nuevo pico máximo, o podemos
ingresar el valor en dB para el pico y el programa calculará el valor de amplificación.

Figura 1.10

 Fundidos de entrada y salida


Los fundidos de entrada y salida (o, en inglés, fade-in y fade-out) se producen
aumentando gradualmente la amplitud de la señal desde cero o disminuyéndola desde la
amplitud original hasta cero respectivamente. Basta con seleccionar la sección de audio a
la que se desea aplicar el fundido y seleccionar el tipo de fundido requerido. Los
programas de edición de audio ofrecen varias curvas de fundido y varias formas de
aplicarlos.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 33

Figura 1.11
En Audacity podemos aplicar un fundido de entrada o de salida seleccionando el
segmento de audio deseado y haciendo clic en Efecto > Aparecer progresivamente o
Desvanecer progresivamente, respectivamente. Esta opción realiza un fundido lineal pero,
en el menú Efecto > Complemento 1 a 15 > Adjustable Fade..., Audacity nos ofrece una
forma más compleja de realizar fundidos permitiéndonos definir una amplitud inicial, una
amplitud final y el porcentaje de amplitud al que queremos que ajuste el punto medio del
fade, es decir la curvatura de la pendiente. También nos ofrece programas predefinidos
con curva lineal, logarítmica y exponencial entre otras. Si seleccionamos uno de estos
programa, el procesador hará caso omiso de los demás controles.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 34

Figura 1.12

 Normalización
Normalizar una señal es elegir una amplitud de pico o RMS máxima y aumentar o reducir
la amplitud de toda la señal para que corresponda con el valor seleccionado. A menos
que se especifique lo contrario, siempre que nos referimos a la normalización estamos
hablando en cuanto a valores de amplitud de pico, no de amplitud RMS.

Figura 1.13

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 35
La desalineación DC se produce cuando una señal posee mayor amplitud positiva que
negativa o viceversa; en el oscilograma podemos reconocer este fenómeno si vemos la
forma de onda desalineada con el centro de la regla de amplitud.

Figura 1.14
Para normalizar una señal en Audacity debemos hacer clic en Efecto > Normalizar... En la
ventana que aparece, la opción principal es la de normalizar la amplitud pico máxima al
valor deseado en dB. También nos ofrece la opción de eliminar la desalineación DC para
centrar la señal y que las amplitudes positiva y negativa sean iguales, de esta forma se
puede calcular mejor la normalización. Por último nos permite normalizar los canales del
audio independientemente; esta opción nos sirve si tenemos una diferencia de amplitud
entre canales y deseamos que el normalizador las iguale.

 Clipping
Podemos configurar Audacity para que nos muestre el clipping que podría llegar a haber
en nuestro audio marcando la casilla que se encuentra en el menú Ver > Mostrar recorte.
De esta manera, el software dispondrá unos marcadores rojos en los lugares donde la
forma de onda llegue al máximo de amplitud. Una solución muy básica y posiblemente
inadecuada para abordar este problema podría ser utilizar la Herramienta de dibujo que
aparece en la barra de tareas de Audacity para alterar la muestra en cuestión de manera
tal que posea menos amplitud, al mismo tiempo que intentamos mantener la forma de
onda que intuimos que hubiese estado representada. Lo ideal sería, en caso de que el
archivo de audio haya sido grabado por nosotros, volver a realizar la grabación para que
esto no suceda, o normalizar el audio a una amplitud menor a 0 dB, por ejemplo, -0.3 dB,
Centro de e-Learning SCEU UTN - BA.
Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 36
y luego modificar las muestras a mano. Lamentablemente, el clipping es un tipo de
distorsión la mayoría de las veces muy audible y que siempre suele requerir tratamiento.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 37

9. Metadatos

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 38

Los archivos de audio pueden almacenar otro tipo de información junto con las señales,
esta información es llamada metadatos. En Audacity podemos editar los metadatos
haciendo clic en Archivo > Editar etiquetas de metadatos. Aquí podemos ingresar los
datos de artista, nombre de pista, título del álbum entre otras cosas, incluso podemos
agregar los metadatos que queramos, estos datos quedarán plasmados en el archivo de
audio cuando lo exportemos, y otros programas y dispositivos pueden leerlos al cargar
dicho archivo y analizar esta información. Por ejemplo, los programas preparados para
actuaciones en vivo generalmente utilizan el tempo guardado en los metadatos para
sincronizar la pista en lugar de detectar el tempo, lo cual consume más recursos de
procesamiento.

En muchos programas de edición de audio podemos agregar marcas y regiones que


luego quedarán guardadas como metadatos en los archivos. Las marcas son puntos
específicos en el audio; éstas se colocan en una muestra determinada y es posible
asignarles un nombre. Las regiones funcionan de una forma similar a las marcas pero
éstas poseen dos puntos, uno de inicio y uno de final, definiendo un segmento de audio.
En Audacity podemos insertar algo similar a las marcas y regiones, son llamadas
etiquetas y se insertan en la posición del cursor de edición o la selección al hacer clic en
Pistas > Añadir etiqueta en la selección. Las etiquetas pueden ocupar un punto definido o
una sección. Sin embargo estas etiquetas no se guardan como metadatos, sino que se
almacenan con el proyecto de Audacity.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 39

10. Espectrograma y análisis de espectro

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 40

El espectrograma y el diagrama de análisis de espectro son dos herramientas esenciales


de cualquier editor de audio. El espectrograma muestra la amplitud espectral en función
del tiempo (eje X) y la frecuencia (eje Y), a través de un mapa de color o escala de grises.
El mapa de color suele ser una escala convencional que va desde colores oscuros o fríos
y hasta colores brillantes o cálidos.

En la Figura 1.15 se muestra la visualización de espectrograma disponible en Audacity.


Para acceder a esta vista debemos hacer clic en la pequeña flecha que se encuentra en
el panel de control de pista a la derecha del nombre de la pista y seleccionar
"Espectrograma" en el menú desplegable.

Figura 1.15
Aunque requiere cierta práctica, el espectrograma es muy útil para detectar visualmente
eventos acústicos particulares como canto de aves, habla humana, ruido de vehículos,
etcétera. En las Figuras 1.16, 1.17 y 1.18 se muestra el espectrograma de un tono puro
sinusoidal, un ruido blanco y un ruido rosa, respectivamente.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 41

Figura 1.16

Figura 1.17

Figura 1.18
Es importante notar que, por defecto, el espectrograma de Audacity muestra frecuencias
desde 0 hasta 8 kHz, pero es posible aumentar o disminuir el nivel de zoom haciendo clic

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 42
en la escala mientras presionamos (o no) la tecla Shift. También es posible seleccionar
para ver una sección específica del espectro cliqueando y arrastrando el mouse entre dos
frecuencias de la escala. La segunda frecuencia puede incluso estar por fuera del rango
original.

En general, un rango de hasta 5 kHz nos permite ver todos los detalles relevantes al audio
cotidiano como voces humanas, sonidos de animales, motores, vehículos, etcétera. Para
apreciar patrones característicos de eventos cortos podría resultar necesario definir
apropiadamente el nivel de zoom vertical y horizontal. Es posible también arrastrar hacia
abajo el límite inferior de la pista para que ésta ocupe más espacio vertical en la pantalla.
La otra herramienta de análisis de frecuencia es el análisis de espectro. Una vez que la
región temporal a analizar haya sido seleccionada, podemos ver un diagrama de la
energía de las diferentes bandas de frecuencia seleccionando la opción del menú de
Audacity Analizar y luego Análisis de espectro. La Figura 1.19 muestra un ejemplo de
ventana de análisis de espectro. Es posible cambiar diferentes parámetros del análisis
tales como el tipo y tamaño de ventana de análisis como sea necesario.

Figura 1.19

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 43

11. Reducción de ruido

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 44

Finalmente, como es el caso de la mayoría de los editores de audio digital, Audacity


posee un algoritmo de reducción de ruido. Antes que nada es importante tener en cuenta
que el objetivo de un algoritmo de reducción de ruido es el de eliminar un componente
sistemático de ruido. De todas maneras, dado un intervalo que incluya señal y ruido, el
algoritmo no tiene forma de discriminar entre señal y ruido. Esta es la razón por la cual es
necesario proveer al algoritmo de cierto intervalo de audio donde solo esté presente el
ruido que deseamos reducir o eliminar. La Figura 1.20 muestra la ventana que se abre
cuando seleccionamos la opción del menú Efecto > Reducción de ruido....

Figura 1.20
El procedimiento consiste en lo siguiente: 1. Seleccionar un intervalo de tiempo en el
audio que posea solo el ruido en cuestión y presionar el botón Obtener perfil de ruido. El
algoritmo computa el espectro promedio y lo guarda para posterior uso. Luego la ventana

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 45
se cierra. 2. Seleccionar el intervalo de tiempo en el audio al que deseamos aplicar la
reducción de ruido, volver a abrir la ventana anterior con Efecto > Reducción de ruido... y
ajustar los parámetros a los niveles deseados y presionar Ok para reducir el ruido.
En esencia, el algoritmo de reducción de ruido implementa una compuerta de ruido (noise gate)
multibanda. En ambas etapas de la reducción es utilizada una FFT (fast Fourier transform,
transformada rápida de Fourier) de 2048 muestras, que provee un espectro de 1024 bandas. El
perfil de ruido es básicamente un porcentaje alto (un valor cercano al máximo) del espectro
durante el intervalo de solo ruido. Para reducir el ruido se calcula este espectro de 1024 bandas
para ventanas consecutivas (o, más bien, superpuestas) de 2048 muestras. Por cada ventana, el
algoritmo descubre si la señal excede o no cierto umbral basado en el perfil de ruido y el
parámetro Sensibilidad (que indica cuántos decibeles por encima del perfil de ruido está este
umbral). Si la respuesta es sí, no se realiza nada. Si es no (es decir, la señal es posiblemente solo
ruido), la señal es reducida por el número de decibeles indicado en el parámetro Reducción de
ruido (dB).

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 46

12. Ejercicio
Realizar las siguientes ediciones sobre el audio que se encontrará para descargar en el
módulo de tarea de esta Unidad: - Eliminar el silencio al principio del archivo. - Copiar y
pegar toda la pista de manera tal que el archivo se repita dos veces. - Realizar un fundido
de salida. - Agregar un segundo de silencio al final del archivo, luego del fundido de
salida. - Normalizar a -3 dBFS. - Analizar y especificar la respuesta en frecuencia del
archivo de audio. - Analizar y especificar la amplitud máxima pico y RMS del archivo
original.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 47

Bibliografía utilizada y sugerida


Libros y otros manuscritos
 Farnell, Andy. Designing Sound. MIT Press; 2010.

 Miyara, Federico. Software-Based Acoustical Measurements. Springer; 2017.

 Pohlmann, Ken C. Principles of Digital Audio. McGraw-Hill; 2010.

 Roads, Curtis. The Computer Music Tutorial. MIT Press; 1996.

 Watkinon, John. The Art of Digital Audio. Focal Press; 2000.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 48

Lo que vimos:
En esta Unidad tratamos en profunidad el uso de software de edición destructiva de audio.

Lo que viene:
En la siguiente Unidad nos adentraremos en el mundo de los procesadores de señales
digitales.

Centro de e-Learning SCEU UTN - BA.


Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning

También podría gustarte