Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentación:
En esta unidad vemos en profundidad el uso de software de edición desctructiva de audio,
utilizando el software libre y de código abierto Audacity.
Objetivos:
Que los participantes:
Se familiaricen con el software libre y de código abierto Audacity y con las
principales técnicas de edición destructiva de audio.
Bloques temáticos:
1. Introducción a la edición de audio digital.
2. Manipulación de archivos de audio:
Abrir y guardar archivos en Audacity.
3. Exportación en diferentes formatos.
4. Navegación.
5. Selección y edición básica (borrar, copiar, cortar y pegar).
6. Grabación.
7. Generación de señales:
Ruido.
Tono.
Chirp.
8. Edición de amplitud:
Fundidos de entrada y salida.
Normalización.
Clipping
9. Metadatos.
10. Espectrograma y análisis de espectro.
11. Reducción de ruido.
12. Ejercicio.
Es importante que todos los participantes realicen algunas de las actividades sugeridas y
compartan en los foros los resultados obtenidos.
El carácter constructivista y colaborativo del MEC nos exige que todas las actividades
realizadas por los participantes sean compartidas en los foros.
Tomen nota:
Las actividades son opcionales y pueden realizarse en forma individual, pero siempre es
deseable que se las realice en equipo, con la finalidad de estimular y favorecer el trabajo
colaborativo y el aprendizaje entre pares. Tenga en cuenta que, si bien las actividades
son opcionales, su realización es de vital importancia para el logro de los objetivos de
aprendizaje de esta instancia de formación. Si su tiempo no le permite realizar todas las
actividades, por lo menos realice alguna, es fundamental que lo haga. Si cada uno de los
participantes realiza alguna, el foro, que es una instancia clave en este tipo de cursos,
tendrá una actividad muy enriquecedora.
Asimismo, también tengan en cuenta cuando trabajen en la Web, que en ella hay de todo,
cosas excelentes, muy buenas, buenas, regulares, malas y muy malas. Por eso, es
necesario aplicar filtros críticos para que las investigaciones y búsquedas se encaminen a
la excelencia. Si tienen dudas con alguno de los datos recolectados, no dejen de consultar
al profesor-tutor. También aprovechen en el foro proactivo las opiniones de sus
compañeros de curso y colegas.
En su forma más básica, la edición de audio digital puede ser simplemente editar un
archivo de audio para eliminar los silencios que se encuentren al principio o al final de
éste, para reemplazar una sección de audio en dicho archivo por otra perteneciente a
otro, o para remover titubeos y trastabilleos en la grabación de una entrevista. Una forma
más compleja de edición de audio podría ser montar una numerosa cantidad de efectos
de sonido y mezclarlos junto con diálogo y música para crear el diseño de sonido de una
película.
En el Módulo 1 vimos cómo se compone una cadena de audio, cómo llevamos una señal
acústica a un medio digital y viceversa:
Señal > Transducción > Codificación > MEDIO DIGITAL > Decodificación > Transducción > Señal
También exploramos algunas formas en las que podemos visualizar las señales de audio
digital, como oscilogramas y espectrogramas. Es momento de ver cómo podemos
modificar las señales digitales y qué usos prácticos tienen estos procesos.
Es importante tener en cuenta que muchos conceptos a utilizar en este Módulo fueron
tratados en profundidad en el Módulo I: Introducción al Audio Digital. Por favor, dirijan
todas las dudas con respecto a estos conceptos al foro de debate correspondiente a esta
Unidad.
Pero, como hemos visto, Audacity no trabaja directamente sobre los archivos de audio,
por eso si abrimos uno de estos lo que va a hacer el programa es crear un nuevo proyecto
vacío e importar el archivo de audio dentro del proyecto.
Es importante notar que cuando abrimos el programa éste nos presenta con un proyecto
nuevo y vacío al que podemos importar audio desde Archivo > Importar > Audio, y este
procedimiento nos da el mismo resultado que abrir un archivo de audio directamente.
Como Audacity trabaja con proyectos, la opción Archivo > Guardar no refiere a guardar
los cambios en el archivo de audio sino al proyecto, por lo tanto va a mostrarnos una
ventana para que nombremos y guardemos nuestro proyecto. Esto sucederá la primera
vez que guardemos cada proyecto, las siguientes veces la opción guardar sobrescribirá el
archivo de proyecto que estamos usando.
Para guardar un archivo de audio desde Audacity, el proceso será diferente, debemos ir a
Archivo > Exportar audio, se nos presentará una ventana donde podemos seleccionar la
carpeta, nombrar el archivo, elegir el formato y cambiar las opciones de formato en el que
se exportará. En este caso los archivos del proyecto no se verán afectados.
Cuando exportemos audio desde un programa vamos a tener que seleccionar un formato,
ya sea con o sin compresión, con o sin pérdida. Cuando seleccionemos un formato se nos
darán ciertos parametros a ajustar dependiendo del formato seleccionado.
En Audacity la frecuencia de muestreo del archivo exportado será la misma que la del
proyecto, que aparece abajo a la izquierda en la ventana principal del programa, por lo
tanto esta opción no se muestra al exportar un archivo. En la lista de formatos de la
ventana de exportación aparecen los formatos más conocidos, sin embargo si
seleccionamos otros archivos sin comprimir nos presentará una lista adicional de
formatos, también podemos seleccionar custom FFmpeg Export y se nos dará acceso a la
amplísima variedad de formatos y opciones del programa FFmpeg. Para nuestros
procesos habituales exportaremos en formato WAV (Microsoft) PCM de 16 bit con signo,
que es la opción de formato por defecto.
Hay que tener en cuenta que la extensión del archivo y su formato no siempre van de la
mano, por ejemplo, un archivo con formato PCM puede tener extensión WAV o AIFF, o un
audio con compresión AAC puede estar contenido en un archivo de extensión MP4 o M4A
de igual manera. Es por eso que además de elegir el formato de codificación debemos
escribir, en el nombre de archivo, la extensión que vamos a usar. Ésta tiene que ser
compatible con el formato seleccionado; de todas formas, Audacity nos dará aviso si
estamos intentando exportar un archivo de audio usando un formato no compatible con su
extensión.
Figura 1.1
4. Navegación
Cada editor presenta su propia forma de manipular la vista de la señal de audio, pero hay
ciertos comportamientos presentes en todos ellos. En la vista principal se nos presenta la
forma de onda en dos ejes: amplitud en el Y y tiempo en el X. En la parte superior de la
forma de onda vemos la regla temporal que puede aparecer en minutos, segundos y
milisegundos, en muestras, o en compases según el tempo asignado. A su vez, a la
izquierda de la forma de onda vemos una regla que representa la amplitud en una escala
lineal o logarítmica (en decibeles). En Audacity, para ver la forma de onda del audio en
escala logarítmica debemos hacer clic en la pequeña flecha a la derecha del nombre del
archivo en el panel de control de pista, y seleccionar Forma de onda (dB) en el menú
desplegable. Podemos trasladar la vista hacia la derecha e izquierda para visualizar
diferentes segmentos de tiempo de la señal y también podemos hacer zoom horizontal y
vertical.
En Audacity podemos movernos por la vista de forma horizontal con la barra que aparece
debajo de la forma de onda, o colocando el cursor del mouse sobre la forma de onda,
manteniendo presionada la tecla Shift y moviendo la rueda del mouse.
Movernos verticalmente nos sirve para visualizar varias pistas en caso de que nuestro
proyecto las posea. Esto se puede realizar con la barra que aparece a la derecha de la
forma de onda o con la rueda del mouse.
Para hacer zoom horizontal podemos usar los botones que aparecen en la barra de
herramientas o, con el cursor del mouse sobre la forma de onda, manteniendo presionada
la tecla Control y moviendo la rueda del mouse. En este último caso la vista hará zoom
centrándose en la posición del cursor del mouse.
Para hacer zoom vertical podemos hacer clic en la regla de amplitud; haciendo clic
derecho o Shift+clic izquierdo reducimos el zoom. Generalmente, a medida que hacemos
zoom horizontal en un editor de audio veremos tres representaciones diferentes de la
forma de onda.
Figura 1.2
Si aumentamos el zoom horizontal lo suficiente vamos a ver la forma de onda
representada por una línea continua, esta es una interpolación de las muestras que
conforman la señal, como conectando los puntos, pero no se pueden ver con claridad las
muestras.
Figura 1.3
La tercera representación aparece cuando hacemos máximo zoom; así, podremos ver
cada muestra representada como un punto. Los puntos están unidos por lineas para
hacer la visualización más fácil.
Figura 1.4
Los diferentes editores pueden diferir en la forma en la que representan la unión entre las
muestras y algunos editores nos permiten elegir cómo se realiza esta representación.
Figura 1.5
Si hacemos clic en cualquier lugar de la forma de onda aparecerá el cursor de edición en
ese lugar, este es el punto donde se realizarán las acciones que le indiquemos al
Cuando reproducimos audio aparece otro cursor, este es el cursor de reproducción. Este
se moverá hacia la derecha indicando la posición de reproducción en el archivo que
estemos reproduciendo, y si hacemos clic en el botón Pausa éste se quedará quieto en su
posición. En Audacity podemos diferenciarlos por los íconos que aparecen en la regla de
tiempo junto a los cursores, una flecha gris apuntando a la izquierda para el cursor de
edición y una flecha verde apuntando hacia abajo para el cursor de reproducción.
Figura 1.6
Una función interesante relacionada con la selección es la detección de cruce por cero.
Luego de seleccionar una porción de audio, sus límites pueden ser ligeramente ajustados
al cruce por cero más cercano utilizando la opción que encontramos en el menú Editar >
Encontrar cruces en cero (o con el atajo de teclado Z). Esta función es útil para extraer
segmentos de audio que no generen clics al reproducir en bucle, y para exportar archivos
que comiencen y terminen en cruce por cero, para asegurarnos que la reproducción de
estos archivos en cualquier programa o plataforma sea lo más correcta posible.
Podemos pegar el audio que copiamos o cortamos en cualquier lugar donde coloquemos
el cursor de edición con la opción de pegar del menú, el botón en la barra de tareas o
presionando Control+V en el teclado. Al pegar un segmento de audio el programa
insertará la nueva porción de audio en el lugar del cursor de edición corriendo toda la
señal que haya a continuación. Si queremos reemplazar un segmento de audio con otro
que hayamos copiado o cortado debemos seleccionar el segmento a reemplazar y luego
pegar.
6. Grabación
La grabación de audio digital es el proceso mediante el cual capturamos las señales que
recibimos desde la entrada de nuestra cadena de audio. Lo que hace un programa al
grabar es leer los datos que están pasando por la cadena luego de la digitalización y
guardarla en un archivo PCM en el disco rígido o la memoria RAM de nuestra
computadora.
Con todo lo anterior en regla solo resta hacer clic en el botón Grabar y el programa
empezará a capturar audio a partir de la posición del cursor de edición; cuando
terminemos nuestra captura solo hace falta hacer clic en Detener. En algunos programas
puede aparecer una ventana luego de la grabación que nos dará la opción de descartar,
renombrar o guardar los archivos que se crearon con la captura.
7. Generación de señales:
Veamos a continuación algunos de los generadores que incluye Audacity y las opciones
que nos permite manipular en cada uno:
Ruido
• Ruido: Podemos elegir el tipo de ruido a generar, blanco, rosa o Browniano.
• Amplitud: La amplitud de la señal generada en un valor lineal de 0 a 1.
• Duración: La duración de la señal generada en horas, minutos y segundos.
Figura 1.7
Tono
Genera una señal de onda periódica y nos ofrece varios tipos de forma de onda.
• Forma de onda: Nos permite seleccionar entre las siguientes Sinusoide, Cuadrada,
Diente de sierra y Cuadrada sin alias.
• Frecuencia: La frecuencia en Hz de la fundamental de la onda generada.
Figura 1.8
Chirp
Genera una señal de onda periódica como el generador de tono pero nos permite asignar
frecuencias y amplitudes iniciales y finales. El tono generado tendrá una envolvente de
frecuencia, subiendo o bajando desde la frecuencia de inicio hasta la frecuencia final, y
una envolvente de amplitud, aumentando o disminuyendo desde la amplitud inicial hasta
la amplitud final. La velocidad de los barridos depende de la duración de la señal
generada.
• Forma de onda: Nos permite seleccionar entre las siguientes Sinusoide, Cuadrada,
Diente de sierra y Cuadrada sin alias.
• Frecuencia: La frecuencia inicial y final en Hz de la fundamental de la onda generada
• Amplitud: La amplitude de inical y final de la señal generada en un valor lineal de 0 a
1.
• Duración: La duración de la señal generada en horas, minutos y segundos.
Figura 1.9
8. Edición de amplitud:
Podemos modificar la amplitud de una señal de varias formas. En todos los programas de
edición existe esta opción y se puede aplicar a todo el audio o a un segmento
seleccionado. En Audacity, esta opción se encuentra en el menú Efecto > Amplificar.... Al
hacer clic en esta opción se nos muestra una ventana donde podemos indicar el cambio
de amplitud positivo o negativo que deseamos aplicar con un control deslizable y una caja
de texto en decibeles. También nos indica cuál será el nuevo pico máximo, o podemos
ingresar el valor en dB para el pico y el programa calculará el valor de amplificación.
Figura 1.10
Figura 1.11
En Audacity podemos aplicar un fundido de entrada o de salida seleccionando el
segmento de audio deseado y haciendo clic en Efecto > Aparecer progresivamente o
Desvanecer progresivamente, respectivamente. Esta opción realiza un fundido lineal pero,
en el menú Efecto > Complemento 1 a 15 > Adjustable Fade..., Audacity nos ofrece una
forma más compleja de realizar fundidos permitiéndonos definir una amplitud inicial, una
amplitud final y el porcentaje de amplitud al que queremos que ajuste el punto medio del
fade, es decir la curvatura de la pendiente. También nos ofrece programas predefinidos
con curva lineal, logarítmica y exponencial entre otras. Si seleccionamos uno de estos
programa, el procesador hará caso omiso de los demás controles.
Figura 1.12
Normalización
Normalizar una señal es elegir una amplitud de pico o RMS máxima y aumentar o reducir
la amplitud de toda la señal para que corresponda con el valor seleccionado. A menos
que se especifique lo contrario, siempre que nos referimos a la normalización estamos
hablando en cuanto a valores de amplitud de pico, no de amplitud RMS.
Figura 1.13
Figura 1.14
Para normalizar una señal en Audacity debemos hacer clic en Efecto > Normalizar... En la
ventana que aparece, la opción principal es la de normalizar la amplitud pico máxima al
valor deseado en dB. También nos ofrece la opción de eliminar la desalineación DC para
centrar la señal y que las amplitudes positiva y negativa sean iguales, de esta forma se
puede calcular mejor la normalización. Por último nos permite normalizar los canales del
audio independientemente; esta opción nos sirve si tenemos una diferencia de amplitud
entre canales y deseamos que el normalizador las iguale.
Clipping
Podemos configurar Audacity para que nos muestre el clipping que podría llegar a haber
en nuestro audio marcando la casilla que se encuentra en el menú Ver > Mostrar recorte.
De esta manera, el software dispondrá unos marcadores rojos en los lugares donde la
forma de onda llegue al máximo de amplitud. Una solución muy básica y posiblemente
inadecuada para abordar este problema podría ser utilizar la Herramienta de dibujo que
aparece en la barra de tareas de Audacity para alterar la muestra en cuestión de manera
tal que posea menos amplitud, al mismo tiempo que intentamos mantener la forma de
onda que intuimos que hubiese estado representada. Lo ideal sería, en caso de que el
archivo de audio haya sido grabado por nosotros, volver a realizar la grabación para que
esto no suceda, o normalizar el audio a una amplitud menor a 0 dB, por ejemplo, -0.3 dB,
Centro de e-Learning SCEU UTN - BA.
Medrano 951 2do piso (1179) // Tel. +54 11 4867 7589 / Fax +54 11 4032 0148
www.sceu.frba.utn.edu.ar/e-learning
p. 36
y luego modificar las muestras a mano. Lamentablemente, el clipping es un tipo de
distorsión la mayoría de las veces muy audible y que siempre suele requerir tratamiento.
9. Metadatos
Los archivos de audio pueden almacenar otro tipo de información junto con las señales,
esta información es llamada metadatos. En Audacity podemos editar los metadatos
haciendo clic en Archivo > Editar etiquetas de metadatos. Aquí podemos ingresar los
datos de artista, nombre de pista, título del álbum entre otras cosas, incluso podemos
agregar los metadatos que queramos, estos datos quedarán plasmados en el archivo de
audio cuando lo exportemos, y otros programas y dispositivos pueden leerlos al cargar
dicho archivo y analizar esta información. Por ejemplo, los programas preparados para
actuaciones en vivo generalmente utilizan el tempo guardado en los metadatos para
sincronizar la pista en lugar de detectar el tempo, lo cual consume más recursos de
procesamiento.
Figura 1.15
Aunque requiere cierta práctica, el espectrograma es muy útil para detectar visualmente
eventos acústicos particulares como canto de aves, habla humana, ruido de vehículos,
etcétera. En las Figuras 1.16, 1.17 y 1.18 se muestra el espectrograma de un tono puro
sinusoidal, un ruido blanco y un ruido rosa, respectivamente.
Figura 1.16
Figura 1.17
Figura 1.18
Es importante notar que, por defecto, el espectrograma de Audacity muestra frecuencias
desde 0 hasta 8 kHz, pero es posible aumentar o disminuir el nivel de zoom haciendo clic
En general, un rango de hasta 5 kHz nos permite ver todos los detalles relevantes al audio
cotidiano como voces humanas, sonidos de animales, motores, vehículos, etcétera. Para
apreciar patrones característicos de eventos cortos podría resultar necesario definir
apropiadamente el nivel de zoom vertical y horizontal. Es posible también arrastrar hacia
abajo el límite inferior de la pista para que ésta ocupe más espacio vertical en la pantalla.
La otra herramienta de análisis de frecuencia es el análisis de espectro. Una vez que la
región temporal a analizar haya sido seleccionada, podemos ver un diagrama de la
energía de las diferentes bandas de frecuencia seleccionando la opción del menú de
Audacity Analizar y luego Análisis de espectro. La Figura 1.19 muestra un ejemplo de
ventana de análisis de espectro. Es posible cambiar diferentes parámetros del análisis
tales como el tipo y tamaño de ventana de análisis como sea necesario.
Figura 1.19
Figura 1.20
El procedimiento consiste en lo siguiente: 1. Seleccionar un intervalo de tiempo en el
audio que posea solo el ruido en cuestión y presionar el botón Obtener perfil de ruido. El
algoritmo computa el espectro promedio y lo guarda para posterior uso. Luego la ventana
12. Ejercicio
Realizar las siguientes ediciones sobre el audio que se encontrará para descargar en el
módulo de tarea de esta Unidad: - Eliminar el silencio al principio del archivo. - Copiar y
pegar toda la pista de manera tal que el archivo se repita dos veces. - Realizar un fundido
de salida. - Agregar un segundo de silencio al final del archivo, luego del fundido de
salida. - Normalizar a -3 dBFS. - Analizar y especificar la respuesta en frecuencia del
archivo de audio. - Analizar y especificar la amplitud máxima pico y RMS del archivo
original.
Lo que vimos:
En esta Unidad tratamos en profunidad el uso de software de edición destructiva de audio.
Lo que viene:
En la siguiente Unidad nos adentraremos en el mundo de los procesadores de señales
digitales.