Está en la página 1de 39

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

Principios del sonido digital


Autora: Sergi Jord Puig Edicin y actualizacin: Diego F. Gat

1.1. Introduccin El principio fundamental del audio digital consiste en tomar muestras de las seales sonoras continuas (como las que encontramos a la salida de los micrfonos normales) para convertirlas en secuencias de nmeros. El muestreo de estas seales se lleva a cabo en dos niveles diferentes, el temporal y el de la amplitud. En la figura 1 se muestra una seal continua, muestreada slo en el tiempo (cuadros blancos) y en el tiempo y la amplitud (puntos negros). Ntese que, al hacer este redondeo para encajar el valor de la muestra en la cuadrcula, segn tiempo y amplitud, se produce una desviacin respecto de el valor original. Por lo tanto, cuanto menor sea la cuadrcula, o sea, cuando ms frecuentemente se tomen las muestras y con mayor exactitud respecto de su amplitud, mayor similitud existir entre la seal original y la seal digitalizada. El proceso de muestreo es, como se ha explicado, tomar muestras de la amplitud del sonido en cada momento del tiempo. Al proceso de muestreo se le suele llamar Sampleo (muestra=sample) o discretizacin. Este trmino es otra mala traduccin de discreet que en esta acepcin no supone ser discreto, sino que quiere decir de cantidad acotada o finita.

Figura 1. Muestreo de una seal continua Lo que obtenemos, luego de la digitalizacin, es una secuencia de nmeros que corresponden a los valores de amplitud tomados a intervalos regulares de tiempo. 1.2. Comparacin con el cine y el vdeo digital Para aclarar algunos conceptos, haremos una analoga con el cine y el vdeo digital. En ambos medios, existe un muestreo temporal (incluso en el caso del cine que no es un medio digital). En el cine, la unidad de muestreo temporal es el fotograma (24 fotogramas por segundo), mientras que en el video esta unidad se suele denominar con el trmino ingls frame o simplemente cuadro

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

(dependiendo del sistema, este valor suele ser de 25 30 frames/segundo). Esto correspondera, en el audio, al muestreo temporal. Pero en el caso del vdeo digital se producen dos muestreos adicionales. La segunda convierte cada frame en una matriz de puntos (por ejemplo 756x568), y la tercera asigna un nmero (de entre un conjunto finito de valores) a cada punto, de forma que cada uno de estos nmeros corresponde a un color y un brillo determinado. Es obvio que cuantos ms puntos apliquemos, y cuantos ms nmeros utilicemos para cada punto, mayor ser la similitud entre la seal analgica original y la seal digitalizada. Si disponemos de pocos puntos, la imagen aparecer cuadriculada, y si el nmero de valores posibles para cada punto es pequeo, perderemos matices en los colores y en los brillos. En la figura 2 se muestran estos casos. Algo parecido sucede con el sonido.

Figura 2. Ejemplos de imgenes deficientemente digitalizadas 1.3. Muestreo del sonido - Frecuencia de muestreo La palabra muestreo es el equivalente del trmino ingls sampling, o su castellanizacin sampleo y se utiliza para indicar la accin de tomar muestras a intervalos de tiempo regulares. Para digitalizar un sonido es necesario muestrearlo, pero con qu frecuencia? En el apartado anterior comentbamos que para la imagen de cine, la frecuencia de muestreo suele estar entre los 24, 25 30 fotogramas por segundo. Con esta frecuencia se consigue engaar a la

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

retina, hacindole creer que lo que recibe no son imgenes discontinuas, sino un flujo continuo de luz, pero estos valores son totalmente insuficientes en el caso del sonido. Para comprender este fenmeno observemos la figura 3 que representa una seal sinusoidal de 30 Hz. (el ciclo se repite 30 veces por segundo) Que ocurre si la muestreamos a una frecuencia de 20 Hz? En este caso, estaremos tomando el valor de la onda original cada 0,05 segundos (corresponden a los seis cuadros de la figura). La nueva seal obtenida juntando los puntos muestreados tiene un perodo aparente de 0,1 segundos, es decir una frecuencia de 10 Hz, lo cual no se corresponde en absoluto con la seal original!

Figura 3. Seal muestreada incorrectamente Cual sera la mnima frecuencia de muestreo correcta? El teorema del muestreo o teorema de Nyquist, afirma que para muestrear correctamente una seal de X Hz, se requiere como mnimo una frecuencia de muestreo de 2X Hz. En nuestro ejemplo anterior, una frecuencia de 60 Hz hubiese pues bastado para muestrear correctamente la seal original que era de 30Hz. Pero tal como sabemos, el odo humano es capaz de detectar frecuencias sonoras de hasta aproximadamente 20.000 Hz, por lo que, para muestrear correctamente cualquier sonido se necesitar una frecuencia de muestreo superior o igual a 40.000 Hz. De aqu proceden los famosos 44.100 Hz. utilizados en los discos compactos. 1.4. Muestreo con frecuencias inferiores - El aliasing Si muestreamos a una frecuencia inferior, como por ejemplo a 30.000 Hz, los resultados que obtengamos podrn ser correctos para las frecuencias por debajo de los 15.000 Hz (la mitad de la frecuencia de muestreo). Para las aplicaciones que no precisen de la mxima fidelidad, esto es ms que suficiente. El sonido ser un poco menos brillante, pero se parecer todava bastante al original, pues la zona frecuencial con mayor energa suele estar aproximadamente entre los 1.000 y los 3.000 Hz. Existe, sin embargo un problema adicional, algo complicado de entender. Tal como vimos en el ejemplo grfico anterior, al muestrear con frecuencias

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

inferiores, surgen frecuencias "fantasmas" que realmente no estn en el sonido original (como los 10 Hz que aparecan misteriosamente en nuestro ejemplo) y que alteran el sonido muestreado. Este fenmeno recibe el nombre de aliasing. El aliasing "inventa" frecuencias de valores aproximados a la diferencia entre la frecuencia original y la frecuencia de muestreo. Para evitarlo, cuando se desee muestrear a frecuencias inferiores a 44.100 Hz, se debera filtrar previamente la seal entrante, eliminando todos sus valores por encima de la mitad de la frecuencia de muestreo. Si decidimos muestrear a 20.000 Hz, deberamos filtrar la seal original, eliminando todos sus componentes por encima de 10.000 Hz. En definitiva, como siempre pueden existir seales de frecuencias muy altas (an por encima de lo que podamos percibir), siempre se debe filtrar el sonido a digitalizar con un filtro pasabajos sintonizado en la mitad de la frecuencia de muestreo. 1.5. Nmero de bits, resolucin y rango dinmico Hasta aqu, hemos resuelto la primera parte terica de la digitalizacin, consistente en obtener una serie de muestras a intervalos regulares. Falta todava la segunda parte, que consiste en asignar a la amplitud de cada una de estas muestras un valor numrico que pueda ser manejado por una computadora. Como sabemos, la computadora solo entiende valores 0 o 1, y no valores decimales. Por eso utilizamos el sistema binario para representar cualquier valor. Para ello, volveremos momentneamente al ejemplo del vdeo digital, que para muchos resultar ms familiar. La resolucin de color de una imagen (y de las placas de vdeo) se mide en bits. As, un pxel con 8 bits de profundidad de color, podr incluir 256 (28) colores diferentes, mientras que una imagen con pixeles de 24 bits de profundidad de color podr representar ms de 16 millones (224) de colores. Con el sonido sucede algo parecido: cuantos ms bits apliquemos, ms niveles o escalones tendr el sonido digitalizado y ms parecido ser en consecuencia al sonido analgico original (que al ser continuo, posea un nmero infinito de niveles). Una resolucin de 8 bits permite manejar valores de entre 0 a 255 (256 valores). Dicho de otra forma, para representar una seal mxima de 255 necesitar 8 dgitos binarios (0 o 1) y en este ejemplo, 255 es 11111111 en binario (8 dgitos 1). Una palabra1 de 16 bits maneja un valor mximo de 65535 (65536 si contamos el 0 como valor), 1111111111111111=65535. La palabra de 24 bits, tiene 16777216 valores posibles. De esta forma, cada una de las 44100 capturas realizadas en cada segundo contienen un valor codificado en una cantidad determinada de bits. Cuanto mayor sea esa cantidad (la resolucin) ms calidad tendr la grabacin. Tanto la frecuencia de muestreo como la resolucin tienen incidencia directa en la calidad de la grabacin y reproduccin de audio digital.
1

Llamamos palabra al grupo de bits que representan, en nmeros binarios, el valor de una muestra.

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

La resolucin, por su parte, tambin tiene incidencia directa en el rango dinmico o relacin seal-ruido de la grabacin (abreviada S/R o S/N en ingls y se mide en dB). Existe una relacin que indica que esta relacin S/N es igual al resultado de multiplicar la resolucin de bits por 6. Una grabacin a 8 bits posee una relacin S/N de 54dB, una de 16 bits 96dB y 144dB a 24 bits. Tengamos en cuenta que estos dB son valores tericos y que en la prctica bajan sustancialmente debido a los componentes analgicos de los grabadores placas de sondo, etc. Lo normal es que un grabador a 16 bits alcance los 90 a 92dB y lo extraordinario es que efectivamente nos entregue una S/N de 96dB. Para nosotros, los humanos, un rango dinmico de entre 90 y 100dB es suficiente. Estas cifras salen del propio rango dinmico humano, la diferencia entre el umbral de dolor y el umbral de audicin 1.6. La calidad del sonido digital Estos valores de 44.100 Hz y 16 bits adoptados en el disco compacto y otros dispositivos digitales, son los que nos llevan a afirmar que el sonido digital de alta fidelidad no es todo lo bueno que podra ser, ya que ciertos equipos analgicos superan estas cotas. No se puede negar sin embargo que el sonido digital ofrece muchas ventajas, entre las que hay que destacar el menor desgaste y sobretodo, la posibilidad de realizar copias idnticas, es decir, sin ninguna prdida. El formato digital permite adems, tal como iremos viendo, muchas ms posibilidades de manipulacin y procesado. Por otro lado, cuando no se necesite una calidad de alta fidelidad, se pueden utilizar especificaciones inferiores. En este sentido, una frecuencia de muestreo de 11.025 Hz y una resolucin de 8 bits, ofrecen una calidad comparable a la de una lnea telefnica convencional, por lo que sern suficientes para algunas aplicaciones de voz, donde lo que se busque sea la comprensin de un mensaje, al margen de preocupaciones estticas. Las aplicaciones profesionales de hoy en da trabajan siempre en 24 bits. La frecuencia de muestreo depende del destino final de la grabacin. Si est destinado a ser distribuido a su consumidor final en un CD de msica, cuya frecuencia de sampleo es de 44.1 KHz, lo ms probable es que sea grabado en 44.1 o en 88.2 KHz. En cambio, si el destino es cine o DVD, por ejemplo, es ms usual establecer 48 u 96 KHz. como frecuencia de sampleo desde la mismsima grabacin del sonido directo. Se desprende de todo lo anterior que la calidad del audio va en directa relacin con la frecuencia de sampleo y la cantidad de bits de la palabra digital. Cuanto mayor sea la frecuencia de sampleo y mayor la palabra digital, ms exactamente va a ser representada la seal analgica en la secuencia de nmeros que es la seal digital. 1.7. Los conversores A/D y D/A Hasta aqu la teora. Veamos ahora como funciona un sistema digitalizador de sonido. El sistema se compone de dos conversores: un conversor analgico/digital (a partir de ahora A/D) en la entrada, y un conversor digital/analgico (a partir de ahora D/A) en la salida. Ambos estn controlados

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

por un reloj digital que determina la frecuencia de muestreo (clock). Para evitar el aliasing se coloca en la entrada un filtro pasa-bajo que elimina de la seal analgica todos los componentes con frecuencias superiores a los 22.050 Hz. En el proceso de digitalizacin, el conversor A/D genera un nmero binario (de 8, 16 o 24 bits dependiendo del sistema) a cada pulso del reloj. Este nmero es almacenado en la memoria o grabado en un disco duro. Para la audicin de esta seal digital, es necesaria la reconversin inversa, de forma que los nmeros almacenados son enviados a un conversor D/A que los convierte en voltajes, a la misma frecuencia de reloj. Esta seal analgica es suavizada mediante un nuevo filtro, amplificada y enviada a unos altavoces, que con su vibracin, convierten finalmente los voltajes en variaciones de presin de aire. La figura 4 esquematiza este proceso.

Figura 4. Esquema de un sistema de conversin A/D y D/A

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

1.8. Breve historia del audio digital Los primeros experimentos en audio digital datan de finales de los cincuenta, cuando Max Mathews obtuvo en los laboratorios Bell los primeros sonidos generados por computadora. En esta poca, la escasa potencia de las computadoras no permita una velocidad suficiente para digitalizar el sonido. Los experimentos consistieron en obtener sonidos sintticos, generando los nmeros en el computadora. Tras muchos experimentos que ayudaron a comprender mejor la naturaleza del sonido digital, el primer grabador comercial, el Sony PCM-1, vio la luz en 1977. El conversor era de 13 bits y utilizaba como soporte cintas de vdeo Beta (al ao siguiente, el modelo PCM-1600, ya utilizaba conversin de 16 bits). En 1982 apareci el disco compacto, desarrollado conjuntamente por Sony y Philips, con un xito fulminante. A principios de los ochenta aparecieron tambin los primeros sintetizadores digitales y los primeros samplers. Los primeros sistemas domsticos de grabacin digital no llegaron hasta finales de los ochenta, inicialmente con la cinta DAT (Digital Audio Tape), y posteriormente con el DCC (Digital Compact Cassette), el MiniDisc, la grabacin a disco duro, los CD-R (grabadores de discos compactos) y varios formatos de multipistas digitales (Alesis ADAT, Tascam DA-88, etc.) . Las placas de sonido para computadoras, dotadas de conversores A/D y D/A, aparecidas en los ltimos aos de la dcada del 80, han supuesto la definitiva democratizacin del sonido digital. A ellas dedicamos el prximo captulo.

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

2 El audio digital en la computadora 2.1 Introduccin Hemos visto en el captulo anterior que para trabajar con sonido digital en una computadora, son necesarios como mnimo dos conversores (A/D y D/A) que cumplan la funcin de digitalizar y reconstituir posteriormente la seal analgica. En las PC esta posibilidad lleg hace varios aos de la mano de las primeras placas de sonido de tipo Sound Blaster, inicialmente con una calidad bastante lamentable, pero en otras computadoras ya era posible desde aos atrs. En esta obra nos centraremos bsicamente en las posibilidades de las computadoras PC compatibles actuales, dotados con una placa de sonido de 16 bits2, pero antes de entrar en materia repasaremos brevemente la historia del audio digital en las computadoras. 2.2. Un poco de historia 2.2.1. Los inicios Como se comenta en el captulo anterior, Max Mathews consigui sintetizar sonido digital en un computadora a finales de la dcada de los cincuenta! Aunque se tard unos aos ms en disponer de la velocidad suficiente para muestrear sonido analgico, las posibilidades abiertas por Mathews iniciaron dos largas dcadas de investigaciones en el terreno de la sntesis digital, llevadas a cabo inevitablemente en computadoras mainframes y estaciones de trabajo Unix, en centros universitarios o laboratorios de importantes empresas informticas. 2.2.2. Audio digital para las masas La Commodore Amiga fue la primera computadora domstica que incorpor, en 1985, ciertas posibilidades de audio digital. El Amiga dispona de cuatro conversores D/A de 8 bits. Careca de conversores A/D, por lo que si no se compraba un dispositivo muestreador adicional conectable al puerto paralelo, slo funcionaba como reproductor. Estos primeros conversores D/A adicionales eran realmente muy econmicos, pero tenan una limitacin muy importante: por motivos de velocidad de acceso al disco slo permitan muestrear en memoria RAM, y no directamente al disco duro, por lo que la duracin de los sonidos almacenables era muy limitada. Aun con todas estas limitaciones, que lo hacan inviable para un trabajo profesional, el Amiga supuso para muchos la entrada al sonido digital. Las primeras aplicaciones serias se dieron a finales de los ochenta en dos plataformas que ya de por si, no eran nada baratas (Apple Macintosh y NeXT). No eran productos "para las masas", pero los estudios de grabacin y algunos msicos profesionales se los pudieron ya permitir. Especialmente en el caso del Mac, el hardware y el software de Digidesign (Protools), que ofreca cuatro
2

La mayora se las PC hogareas llegan hoy a esa resolucin, an con las placas standard que vienen de fbrica. Aquellos que hayan agregado alguna placa de sonido medianamente buena, deberan llegar a poder trabajar a 24 bits.

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

canales de 16 bits, se convirti (y sigue siendo hoy) en un estndar de la grabacin y edicin de audio digital en disco duro. 2.2.3. ... Y las PCs comenzaron a sonar El bautismo sonoro del PC fue realmente tmido y tardo. En 1988, una compaa canadiense, Ad Lib, fabric las primeras placas de sonido. Soportaban tan solo cuatro voces con sonidos sintticos y, aunque muchos juegos comenzaron a tener en cuenta el nuevo hardware, los tipos de sonidos ofrecidos por el pequeo sintetizador permitan poco ms que generar una cierta musiquita de fondo, con una calidad sonora bastante infame. Al no disponer de sonido digitalizado, la Ad Lib no favoreca la reproduccin de efectos convincentes (golpes, motores, etc.) o voces (o gritos), que el mercado de los juegos estaba esperando. Un ao ms tarde, Creative Labs, una empresa de Singapur que haba trabajado en sntesis de voz, lanz al mercado la primera Sound Blaster, que aada a la compatibilidad con la Ad Lib unas pequeas posibilidades de audio digital. Pese a que estas posibilidades eran limitadas (dos canales de 8 bits) el xito fue tremendo y propuls a la compaa al primer puesto del mercado multimedia internacional. Aunque las placas de hoy han cambiado bastante desde las Sound Blaster iniciales, muchas de las mejoras y variaciones estn teniendo lugar en el terreno del MIDI.3 En lo referente a audio digital, casi todas las placas hogareas o sistemas integrados en los motherboards actuales ofrecen las mismas prestaciones: al menos dos canales de audio a 16 bits y hasta 48.000 Hz de frecuencia de muestreo4, con posibilidad de grabacin y reproduccin a disco duro. 2.3. Por qu la calidad CD no es siempre calidad CD?

Existe la creencia popular de que en el sonido digital no hay mejores ni peores, "como todo son ceros y unos, mientras no se confundan unos con otros ". Sin embargo, nada ms lejos de la realidad. Los fabricantes de equipos multimedia se escudan detrs de los 16 bits y 44.100 Hz, para colocar la indiscriminada etiqueta "calidad CD". Pero, se ha preguntado alguna vez por qu existen actualmente lectores de CD-ROM por menos de $100, mientras que se pueden adquirir lectores de CD Audio (que, por cierto, son siempre, como veremos ms adelante, de velocidad simple) por US$ 300? La respuesta est en los conversores D/A comentados en el anterior captulo, y en otros componentes electrnicos analgicos, que son los responsables finales del sonido. Es cierto que el lser no suele confundir los ceros con los unos, pero para que estos enteros binarios lleguen a sonar, tienen que pasar por un complicado proceso de conversin, que se puede realizar con muy diversos criterios de calidad.

MIDI (Musical Instrument Digital Interface) Es un sistema que permite mandar rdenes de un aparato MIDI compatible (una computadora, un teclado, un sampler, etc) a otro. Normalmente se usa para mandar rdenes de ejecutar determinadas notas musicales en determinados bancos de instrumentos pero tambin se pueden mandar datos para otro tipo de automatizaciones. No es audio lo que se enva sino la orden de reproducir tal o cual sonido que reside en el dispositivo esclavo. 4 Aunque se suele trabajar efectivamente a 44.100 muestras por segundo.

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

Un factor a tener en cuenta a la hora de evaluar la calidad de un dispositivo de audio digital, como una placa de sonido, puede ser la relacin seal/ruido comentada en el captulo anterior. Aunque muchas placas no incluyen estas especificaciones, es frecuente encontrarlas en los estudios comparativos realizados en revistas especializadas. Comentamos que el mximo terico alcanzable con 16 bits de resolucin es de 96 dB; una placa con niveles inferiores a 80 dB debera ser descartada por demasiado "ruidosa". 2.3.1 Tamaos en el audio digital Cuando las computadoras slo manejaban texto, un megabyte (aproximadamente un milln de caracteres) pareca una cifra monstruosa. Hoy en da, con la llegada del multimedia, los sonidos y especialmente las imgenes y videos digitales, han disparado estas cifras. Cunto ocupa un segundo de sonido digital estreo de 16 bits y 44.100 Hz? El clculo es sencillo: en un sonido de 16 bits, cada muestra ocupa dos bytes (un byte son ocho bits), y si la frecuencia de muestreo es de 44.100 Hz, significa que cada segundo requiere de 44.100 muestras. Si el sonido es estreo, utiliza dos canales, por lo que estas necesidades se ven duplicadas. 2 bytes/muestra x 44.100 muestras/segundo x 2 (canales) = 176.400 bytes/segundo 172,2 Kb/s. Esta es forzosamente la velocidad de transferencia de los lectores de CD Audio, y es la que se design como velocidad simple. A partir de aqu, se tom la costumbre de medir la velocidad de los lectores de CD-ROM en mltiplos de este valor x24, x50, etc. Realizando una multiplicacin ms, se observa que un minuto de sonido digital estreo de calidad, ocupa un valor muy cercano a los 10 Mb. Cuando el sonido no es estreo, estos tamaos descienden a la mitad, y lo mismo sucede si la resolucin es de 8 en lugar de 16 bits, o la frecuencia de muestreo es de 22.050 Hz. Por ello, limitando la calidad al mnimo, el tamao necesario para un minuto de sonido mono de 8 bits y 11.025 Hz, se reduce aproximadamente a 646 Kb. (estas condiciones suelen designarse como calidad telefnica). 2.3.2. Qu calidad seleccionar? No existe una respuesta unvoca a esta pregunta, ya que todo depende del uso que queramos dar a cada sonido. S que es posible indicar, a modo de gua, el orden de los pasos a seguir si necesitamos ahorrar memoria o espacio de disco duro. La reduccin de calidad menos perceptible es utilizar 22.050 Hz en lugar de 44.100 Hz. Si el efecto estreo no es importante, puede tambin limitar el sonido a un nico canal, pero manteniendo los 16 bits de resolucin. Con esto nos situamos a 42,05 Kb/segundo, y es el mnimo aconsejable para un sonido "musical". Si lo que desea es grabar mensajes de voz, puede seguir reduciendo la frecuencia, o pasar directamente a los 8 bits. El que se indiquen valores de frecuencia de 44.100, 22.050 11.025, no es casual, ya que stos son los valores estndar que soportan la mayora de las placas (aunque algunas soporten tambin frecuencias intermedias). 2.3.3 Formatos de sonido digital

10

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

La informacin incluida en un archivo de sonido digital no es ms que un array de bytes o de enteros de 16 bits, dependiendo de la resolucin aplicada. Pero a pesar de la sencillez de su contenido, la lista de formatos existentes es inmensa, pues cada plataforma, y a veces cada programa dispone de una serie de formatos preferidos con ligeras variaciones entre uno y otro. Las diferencias pueden radicar en el tipo aplicado a las muestras (por ejemplo enteros con o sin signo), el tipo de compresin utilizado (si es que lo hubiera) y la forma en que estas muestras se ordenan. Para un sonido estreo algunos formatos optan por guardar cada canal de forma independiente, mientras que otros eligen guardar muestras alternas de cada una de las pistas. Todos los formatos incluyen una cabecera (en la que se indica la resolucin, la frecuencia de muestreo, el nmero de canales, etc.) cuyo tamao, contenido y ordenacin vara tambin de un formato a otro. En Windows y ahora tambin en Mac, el formato estndar es el WAV, aunque algunos fabricantes disponen tambin de formatos nativos (como es el caso del VOC de Creative Labs, utilizado en las primeras placas Sound Blaster o el sd2 que se extendi con Protools en el pasado). Esta extensin es una abreviacin de la palabra inglesa wave, que significa ola u onda; por ello este tipo de archivos se conocen tambin como archivos de onda. Si slo trabaja con PC probablemente nunca tenga que preocuparse de otros formatos, salvo si desee importar archivos procedentes de otras plataformas. En el entorno Macintosh, uno de los formatos ms extendidos es el AIF pero hoy en da tanto PC como Mac pueden trabajar indistintamente con WAV o AIFF. Lo ms reciente de uso habitual en la actualidad en el BWF (Broadcast Wave File) que es la base de un WAV pero con algo ms de informacin (metadata) acerca de muchos aspectos como timecode, user bits, fechas, grabadores y otros datos. Los programas de edicin de audio ofrecen normalmente opciones para cargar y salvar formatos diferentes. En cualquier caso conviene tener en cuenta que dos archivos no comprimidos, y con la misma resolucin y frecuencia de muestreo, contendrn la misma informacin (aunque organizada de diversas formas) y sonarn exactamente igual, independientemente del formato. 2.3.4 Compresin de archivos de audio Dado el tamao que pueden adquirir los archivos de audio digital es lgico que se haya buscado formas de compresin que permitan reducir esta cantidad de informacin. Al igual que ocurre con la imagen, existen tcnicas sin perdida y tcnicas con perdida. Un factor importante en los sistemas de compresin de audio es que deben ser capaces de comprimir y descomprimir en tiempo real (para comprimir y descomprimir en diferido existen ya multitud de sistemas de uso general como el ZIP o el ARJ, que tambin pueden ser aplicados a archivos de audio). Las matemticas involucradas en cualquier sistema de compresin son demasiado complejas para ser tratadas con rigor ac, por lo que nos limitaremos a esbozar ciertas ideas. Muchos de estos sistemas son independientes de los formatos citados en el apartado anterior, de forma que un mismo formato de archivo puede soportar varios mtodos de compresin.

11

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

Probablemente le suenen las siglas ADPCM. Corresponden a Adaptative Delta Pulse Code Modulation, una forma de compresin de la que existen mltiples variantes, en la que se reduce el nmero de bits de la seal (por ejemplo a 4 bits) tratando nicamente las diferencia entre una muestra y la siguiente. Esto provoca una inevitable degradacin de la seal ya que el sistema es incapaz de representar saltos grandes de amplitud entre dos muestras.

Las compresiones m-law y A-law, utilizan un sistema de compresin no lineal que permite utilizar una resolucin de 8 bits, pero ofreciendo una calidad sonora y un rango dinmico prximos a los obtenidos con 14 bits. Son por lo general ms rpidos que los mtodos basados en ADPCM.

Otros mtodos como los utilizados por los grabadores digitales en formato DCC o MiniDisc (ATRAC), son variantes del sistema ADPCM, que eliminan de la seal original ciertos componentes que tericamente no son audibles por quedar enmascarados (es como si en una imagen 3D, eliminsemos toda la informacin de los objetos tapados por planos ms prximos al observador).

El MPEG 1 Layer3 o MP3, es otro formato muy popular en estos das que trabaja eliminando ciertas seales que en teora no son audibles por estar enmascaradas pero tambin reduce el stereo a mono en las bajas frecuencias que no son direccionales y otras reducciones no recuperables en decodificacin. La calidad del sonido resultante puede ser no muy mala o muy mala dependiendo de la cantidad de compresin que se haya realizado.

Algunos de estos sistemas se ven favorecidos por la presencia de hardware especializado como pueda ser la inclusin de un DSP (Digital Signal Processor o procesador digital de seal) en la placa de sonido, mientras que otros funcionan perfectamente por software (en este caso el trabajo de compresin y descompresin lo hace el procesador de la mquina utilizando algoritmos cargador por software) La compresin puede plantear problemas de compatibilidad entre diferentes computadoras, por lo que slo debera utilizarse en aquellos casos en los que el ahorro de espacio sea un imperativo. En la medida de lo posible, tampoco debera comprimir un archivo hasta que est seguro de que no va a manipularlo ms, pues aunque la perdida pueda ser poco perceptible, siempre es preferible trabajar sobre la seal original.

2.3.5 Obtencin de sonidos Existen dos formas de obtener un archivo de sonido digital: sintetizndolo desde la propia computadora o digitalizando el sonido de una fuente externa. El

12

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

primer mtodo fue tambin el que, por menores requerimientos de potencia (la mquina no necesita adquirir la informacin en tiempo real) se implement primero, hace unos cincuenta aos. Cuando grabamos un sonido que proviene de un micrfono estamos digitalizando desde una fuente externa.

13

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

5. Edicin de sonido por computadora 5.1. Introduccin Hemos visto cmo digitalizar un sonido procedente de diversas fuentes analgicas y almacenarlo en la memoria o el disco duro del computadora, pero el enorme potencial del audio digital por computadora no comienza a intuirse hasta que abrimos un potente editor grfico de audio. El paradigma de este tipo de aplicaciones es muy sencillo y vara muy poco de un programa a otro. Bsicamente consiste en aplicar procesos matemticos a un sonido (o a una porcin temporal), con la ayuda de un entorno grfico que permita seleccionar cmodamente los fragmentos a tratar y que muestre los resultados tanto sonora como visualmente. Mediante estos procesos se consigue corregir defectos en los sonidos originales, ensalzarlos, modificarlos ligeramente o generar otros nuevos totalmente irreconocibles. Todas estas posibilidades se fundamentan sobre una disciplina de investigacin que combina la ingeniera, la fsica y las matemticas, y que cuenta con varias dcadas de existencia: el procesado digital de seal. 5.2. Cmo elegir un programa de edicin Bsicamente existen dos tipos de programas que sirven para editar audio. Son aquellos que sirven para editar en multipista y aquellos que solo pueden procesar o reproducir un archivo (mono o stereo) por la vez. Programas como el WaveLab o el SoundForge son el ltimo caso y nos permiten editar un solo archivo a la vez. Sirven para manipular sonidos individualmente, grabarlos y masterizar pistas stereo terminadas incluso con referencia de imagen. Por el contrario, programas como Cubase, Nuendo, Sonar, Vegas o Cakewalk y el hermano mayor, el Protools, permiten no solo trabajar cada sonido por separado sino uno en funcin de los otros permitiendo editar bandas sonoras complejas donde varios sonidos deben procesarse y reproducirse simultneamente. Tambin permiten trabajar con referencia de imagen. Dependiendo de nuestra necesidad, elegiremos entre uno u otro grupo. De cualquier manera, con la capacidad de proceso de las computadoras actuales casi no tiene sentido usar un programa que no sea multipista. 5.3. Utilizacin y posibilidades de un editor grfico de audio digital Simplificando, la forma de trabajar con estos programas es la siguiente: se carga un archivo de sonido digital (normalmente de tipo .wav), o se digitaliza desde el mismo programa, teniendo en cuenta todas las consideraciones del captulo anterior. Inmediatamente, la onda queda representada grficamente en una ventana. Con el ratn se selecciona un fragmento (igual que seleccionara unas cuantas palabras contiguas en un procesador de texto) o el archivo en su totalidad. Mediante opciones de men o iconos se aplican a este fragmento algunos de los procesos de modificacin incluidos en el programa. Uno de los principales raseros con que valorar las prestaciones de estos programas es el nmero, calidad y versatilidad de los efectos disponibles, pero

14

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

existen otros factores importantes. Pasemos a enumerar y describir brevemente algunos de ellos: Deshacer (Undo). Dado que los archivos de sonido pueden llegar a ocupar decenas o centenares de Mb, el guardar varios niveles de anulacin puede en ocasiones ralentizar excesivamente la ejecucin, o resultar incluso inviable. En estos programas la opcin de deshacer es configurable por el usuario.

Zoom de visualizacin. Para trabajar los fragmentos con mayor detalle es conveniente poder modificar la escala de visualizacin. El zoom se puede aplicar a dos parmetros: el tiempo (eje horizontal) y la amplitud (eje vertical) independientemente. Esta ltima posibilidad es especialmente til cuando se trabaja sobre fragmentos de muy poco nivel (casi silenciosos), ya que de lo contrario estaremos viendo una lnea recta donde en realidad hay sonido.

Cambio de unidades temporales. Existen normalmente cuatro unidades alternativas para medir las coordenadas temporales: tiempo (ms), muestras, Time code y compases. Esta ltima es til cuando estamos editando un fragmento musical con un tempo preciso (que el usuario deber indicar) pero no tiene sentido para editar sonido para cine. En este caso se utiliza siempre TC que corresponde con el de la imagen.

Memoria de puntos clave. En un archivo largo es fcil perderse mientras se navega haca delante y hacia atrs utilizando el scroll horizontal. Por ello es muy til poder colocar marcas en algunos puntos importantes (inicio de un sonido, de una palabra, etc.).

Importacin/exportacin de otros formatos de onda. Los programas para Windows trabajan principalmente con el formato .wav, pero en ocasiones es necesario importar y/o exportar formatos diferentes como MP3, aif, SD2 o bwf. El nmero de formatos soportados vara de un programa a otro.

Posibilidad de salvar configuraciones de efectos o procesos. Muchos de los efectos aplicables comportan varios parmetros configurables. La posibilidad de salvar en disco cualquier conjunto de parmetros simplifica enormemente el trabajo.

Capacidad de sntesis. Adems de todas las posibilidades de procesado de archivos de sonido ya existentes, estos programas ofrecen algunas opciones para crear sonidos sintticos, es decir, partiendo de cero.

Dibujo a mano alzada. Dibujar ondas de sonido (con cierto control sobre los resultados) no es tarea fcil, pero en algunas ocasiones es la forma ms sencilla de resolver algn problema. La modificacin de

15

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

la forma de onda mediante el mouse, es por ejemplo un mtodo eficaz para eliminar clics u otros ruidos muy breves. Utilcelo con precaucin. Control de CD Audio - Extraccin digital directa. Ofrecen la posibilidad de controlar el reproductor de CD Audio para facilitar la grabacin de fragmentos de discos compactos.

Activacin va MIDI. Mediante esta opcin se pueden disparar archivos de onda (o fragmentos) a partir de mensajes MIDI, enviados, por ejemplo, desde un programa secuenciador, con lo que es posible sincronizar un tema MIDI con fragmentos de audio real (voces, guitarras, etc.).

5.4. Clasificacin de las herramientas de procesado digital de sonido Las posibilidades de modificacin del sonido digital almacenado en un archivo de computadora son interminables. Para estudiarlas de una forma concisa, pero clara y comprensible, en lugar de seguir los mens de opciones de un determinado programa, intentaremos establecer una taxonoma que nos permita organizar estos efectos de una forma coherente, as como explicar someramente algunos de los principios bsicos de procesado de seal involucrados. Una clasificacin de los efectos ms frecuentes slo puede ser aproximada, ya que muchos de ellos requieren de una combinacin de operaciones que los hace partcipes de varias categoras diferentes. Aun as, los dividiremos inicialmente en tres grandes grupos: los efectos que se aplican al tiempo, los que modifican la amplitud, y los que se aplican a la frecuencia y al timbre. 5.5. Efectos simples en el dominio temporal En la mayora de programas estos procesos suelen estar en la opcin de men Edit. Copiar, cortar y pegar, ocultan pocos secretos: se selecciona un fragmento con el mouse y se elimina o se inserta en otro lugar. En el estudio analgico (y en el cine), estas operaciones se han realizado durante dcadas, cortando y pegando fragmentos de cinta magntica. Pero a pesar de esa aparente sencillez, en el dominio digital estas operaciones no deben realizarse sin ciertos cuidados. Para evitar clics y ruidos, cuando eliminamos o insertamos un fragmento, no deberamos dejar una discontinuidad excesiva entre las nuevas muestras contiguas. La forma ms sencilla de preservar esta continuidad es, tal como se muestra en la figura 5.1, seleccionar fragmentos con inicio y final nulos. Algunos programas se pueden configurar para que cuando seleccionemos un fragmento, la seleccin se redondee hasta los ceros ms prximos. La forma segura de evitar estos clicks es agregando un pequeo fundido (de la duracin de un fotograma o menos) al comienzo o final de cada regin de audio. Una opcin complementaria, que no suele estar en otros tipos de programas, es la de Trim (que podramos

16

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

traducir como podar), que consiste en eliminar todo excepto la zona seleccionada.

Figura 5.1. Inicio correcto de una seleccin Reverse, o darle la vuelta a un sonido, es tambin un efecto que se viene realizando en cinta magntica desde hace dcadas. En la figura 5.2 se muestra un sonido y su inversin temporal.

Figura 5.2. Inversin temporal de un sonido Eliminar silencios, borra los fragmentos silenciosos. Suele utilizarse para eliminar los fragmentos al inicio y final de una grabacin. Dado que si el sonido se ha sometido a una conversin A/D sus silencios no sern nunca totalmente nulos, esta opcin permite definir el valor de amplitud por debajo del cual el sonido se considera silencio. De esta forma, el archivo resultante podr tener un tamao muy inferior pero sonar igual que el original.

17

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

5.6. Efectos simples sobre la amplitud Todos los efectos aqu descritos realizan diversas multiplicaciones a cada muestra de un fragmento. Modificar ganancia, o sea modificar la amplitud de la seal. Se expresa en dB.

Silenciar, consiste simplemente aplicar ganancia -infinito.

Puerta de ruido (noise gate), silencia las muestras por debajo de determinado valor umbral, introducido como parmetro. La figura 5.3 muestra el efecto de aplicar una puerta de ruido del 10% (silencia las muestras con una amplitud inferior al 10% del valor mximo posible5). Este efecto permite eliminar el ruido de fondo, aunque como veremos ms adelante, existen formas ms sofisticadas de reduccin de ruido, ya que este sistema slo puede eliminar el ruido en los fragmentos en los que no hay otra seal pero queda de fondo cuando hay seal. Tambin se utiliza mucho para procesar pistas de batera, con lo que se consiguen ataques y decaimientos ms definidos.

Figura 5.3. Un fragmento sonoro, antes y despus de aplicar una puerta de ruido del 10%, en Sound Forge Normalizar es un caso particular de modificacin de ganancia, que consiste en obtener la mxima amplitud posible sin que se produzca distorsin. Esto se consigue recorriendo la zona seleccionada y

El valor mximo posible es 0dBFS

18

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

guardando su amplitud mxima. Una vez obtenida sta, se multiplican todas las muestras del fragmento por el cociente mxima amplitud posible / mxima amplitud del fragmento. Si por ejemplo, la aplicacin detectara un mximo de 12.345, todas las muestras de la zona seleccionada se multiplicaran por 2,654273 (32.767 / 12.345). Fade in y fade out son dos envolventes particulares, que normalmente cuentan como opciones de men propias, por lo mucho que se utilizan. La primera (fundido de entrada), es una envolvente con valor inicial cero y valor final uno, que se aplica al inicio de un fragmento, mientras que la segunda (fundido de salida), se inicia con uno y termina con cero, y se aplica normalmente al final de un fragmento.

Figura 5.5. Fragmento sonoro antes y despus de aplicarle fade in y out La Modulacin de amplitud, consiste en multiplicar el fragmento por una seal peridica, normalmente sinusoidal, lo que en terminologa musical se denomina trmolo. Los parmetros son frecuencia y amplitud de la modulacin.

Invertir, no debe confundirse con la opcin reverse, indicada en el apartado 5.5, ya que con esta operacin se realiza una reflexin respecto al eje horizontal. De esta forma los valores positivos pasan a ser negativos y viceversa, con lo se consigue un cambio de fase. Es un efecto muy sutil que se percibe mejor cuando la inversin se aplica a un nico canal de un sonido estreo. Sirve para efectos o corregir problemas de fase originales.

5.7. Efectos simples aplicables a la frecuencia Existen varias operaciones sencillas que comportan modificaciones frecuenciales, y la comprensin de todas ellas es fundamental para poder trabajar con soltura con el sonido digital. 5.7.1. Modificacin de la frecuencia de muestreo Supongamos que tenemos un sonido digitalizado a 44.100 Hz. Si le cambiamos la frecuencia de muestreo a 22.050 sin modificar el sonido en s, el resultado

19

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

sonar una octava por debajo. Esta operacin equivale a reproducir una cinta o un disco de vinilo a velocidades diferentes de la original. Un LP de 33 r.p.m. reproducido a 45 r.p.m. sube la frecuencia en un 135 %. Frecuencias superiores hacen que el sonido resultante sea ms agudo, mientras que valores inferiores lo tornan ms grave. En el computadora, este efecto se consigue modificando tan slo el valor de frecuencia en la cabecera del archivo, sin modificar para nada los datos. Esta operacin conlleva adems la modificacin de la duracin del sonido (a una frecuencia doble, el sonido durar la mitad). Pero hay que notar que aumentar una frecuencia de muestreo no va a mejorar la calidad del sonido. 5.7.2. Resample Con este trmino, que podra traducirse por remuestreo, se designa la operacin consistente en modificar la frecuencia de muestreo de un archivo, sin alterar la frecuencia del sonido. Esto se consigue normalmente eliminando o repitiendo algunas muestras. Para pasar por ejemplo, de 44.100 Hz a 22.050, se elimina directamente una muestra de cada dos, mientras que para el realizar el cambio inverso, cada muestra es duplicada. En realidad, para obtener una mayor calidad se realiza una interpolacin, de forma que si una muestra vale 1000 y la siguiente 1020, la que se aade tomar el valor 1010 (cuando el cociente de las dos frecuencias no es un valor entero, las matemticas involucradas se complican un poco ms, pero el principio sigue siendo el mismo). Utilizaremos esta opcin cuando queramos reducir el tamao (y la calidad) de un archivo. Cuando la nueva frecuencia sea inferior a la antigua, es conveniente filtrar el sonido antes de remuestrear, para evitar el aliasing. Algunos programas ya realizan por defecto este filtrado, pero en otros las dos operaciones deben realizarse por separado. Cuando la nueva frecuencia sea superior a la anterior, no ser necesario filtrar, pero tenga en cuenta que en este caso, tampoco se obtendr ninguna mejora en la calidad del sonido, ya que no hay forma de reinventar la informacin que ya no existe (es como salvar con miles de colores una imagen de 16 colores). Aun as, esta operacin puede ser necesaria por razones de compatibilidad entre programas o archivos de sonido. 5.7.3. Transposicin El trmino musical transponer se utiliza para subir o bajar una nota o una meloda. En el tratamiento digital de sonido, transponer significa modificar la altura, pero manteniendo la frecuencia de muestreo (y la velocidad de reproduccin). El resultado sonoro es similar al de la modificacin de la frecuencia de muestreo del apartado 5.7.1, pero el efecto es en realidad una combinacin de los dos anteriores. El valor de la transposicin se puede indicar como un porcentaje, o bien como un intervalo musical (subir dos semitonos, etc.). 5.7.4. Pitch Bend Este efecto es una generalizacin de la transposicin, ya que permite

20

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

transponer el sonido de forma continua, a partir de la definicin de una envolvente de frecuencia (cuando esta envolvente sea una lnea recta, tendremos la transposicin del anterior apartado). Musicalmente, el efecto obtenido se conoce como glissando y es el que se obtiene por ejemplo, al desplazar rpidamente la mano izquierda sobre las cuerdas de un violn o una guitarra. 5.7.5. Recapitulacin Algunas de estas operaciones pueden llevarse a cabo mediante algoritmos alternativos que ofrecen una mayor calidad, pero que son tambin ms complicados de explicar y de comprender. Hemos preferido describirlas de la forma ms sencilla posible ya que son operaciones fundamentales, que ayudan a entender la naturaleza del sonido digital.

21

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

6. Conceptos avanzados de procesado digital de audio 6.1. Introduccin En el anterior captulo hemos estudiado algunas de las posibilidades ms sencillas en la edicin digital de audio. En este captulo seguiremos tratando el tema, introduciendo nuevos conceptos ms avanzados relacionados con la teora del proceso digital de seales. La mayora de las ideas barajadas se sustentan sobre complejas ecuaciones matemticas, que evitaremos conscientemente. Intentaremos, sin embargo, tratar todos los temas y conceptos con rigor y ofreciendo una visin global que los haga fcilmente comprensibles, de forma que lo que sigue sea algo ms que una simple enumeracin de opciones de mens. 6.1.1. Hard o Soft Los procesadores de audio pueden ser de hardware o de software. Los primeros son aparatos reales, que tienen conectores de audio en la parte trasera y controles como botones o perillas en la parte delantera. Los de software, tambin llamados plugins, son programas de computadora que corren dentro de otros. Por ejemplo, un ecualizador que fabrica Sony, puede correr como plugin en un programa fabricado por Sony, como el Vegas o en Protools que lo fabrica Digidesign. La ventaja de los plugins es que se pueden automatizar (cosa que la mayora de los procesadores de hardware no pueden) y que comprando uno solo, se puede usar simultneamente en muchos canales. 6.1.2. Tiempo Real o Render Existen dos maneras de procesar archivos de sonido dentro de una computadora. Una de las formas es el mtodo que se llama destructivo o por render que consiste en modificar el archivo que se encuentra en el disco rgido con el proceso deseado. Algunos programas operan sobre el archivo original y otros sobre una copia que generan a tal efecto. Luego de procesado el archivo de audio, la modificacin ya queda hecha y cada vez que se reproduzca el archivo va a sonar con esa modificacin. La otra forma es programar el software para que opere con el sonido que hay en un archivo cada vez que le toque reproducirlo, sin grabar el resultado en ningn lado. ste se llama proceso en tiempo real. El primer mtodo es til para determinadas operaciones de mstering, de generacin de sonidos sintticos y cuando trabajemos con computadoras lentas o antiguas. Tiene la ventaja de que no requiere que la computadora est procesando cada archivo, cada vez que lo tiene que reproducir. Por otro lado, tiene la desventaja de que puede generar una gran cantidad de archivos, algunos de los cuales no se van a usar nunca. Tambin tiene el problema de que, una vez hecha la modificacin, si nos arrepentimos o queremos cambiarla un poco, no es posible. Salvo por el undo, que est solo disponible inmediatamente, no podemos volver atrs o modificar parmetros.

22

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

El segundo mtodo, llamado en Tiempo Real o RT, tiene la desventaja de requerir que la computadora est todo el tiempo procesando el audio, segn lo que especificamos, cada vez que lo reproduce. Esto es un problema en las mquinas lentas pero ya casi no hay de esas en uso. La gran ventaja que tiene, y por eso es que se usan en aplicaciones profesionales, es que permite modificar parmetros, retocarlos y reajustarlos todas las veces que sea necesario y escuchar el resultado inmediatamente. Los procesos destructivos se aplican sobre las regiones (o clips) de audio mediante una ventana que nos permite ajustar los parmetros y un botn que dice process o procesar. La mquina hace el proceso, que muestra con una barra de progreso, y genera un archivo con ese audio procesado. Todo el archivo queda procesado con esa modificacin. Los procesos en tiempo real, tambin tienen una ventana similar a la de los anteriores pero sin el botn de process. stos se insertan en cada track y nos permiten automatizar envolventes para cada parmetro, de forma que es posible hacer que se modifiquen a lo largo del tiempo, tal como lo hacemos habitualmente con el volumen. Todos los efectos que figuran a continuacin pueden ser aplicados por render o en tiempo real, siendo este ltimo, el ms recomendado en casi todos los casos. 6.1.3. Conexin en serie o paralelo Cualquier plugin, sea de hard o soft que se conecte en tiempo real (todos los plugins de harware son escencialmente en tiempo real), puede ser conectado en serie o en paralelo. Cuando un procesador est conectado en serie, se inserta en la cadena de sonido de forma tal que el 100% de la seal obtenida es procesada. Cuando un procesador est conectado en paralelo, una copia de la seal original es procesada y el resultado sumado a la seal original. De esta forma, la proporcin de seal procesada y de seal no procesada es una opcin del operador. Algunos procesadores se conectan en serie y otros, en paralelo. Ms adelante veremos cul es cada caso.

Proceso

Proceso

100% del sonido procesado

% del sonido procesado y % del sonido sin procesar Paralelo

Serie

23

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

Los procesadores que se conectan en serie son los ecualizadores, compresores, limitadores, expansores, variadores de pitch entre otros. En estos casos, queremos procesar todo el sonido. No tendra sentido mezclar una parte ecualizada, por ejemplo, con una parte no ecualizada. Los procesarores que se conectan en paralelo son las reverbs y delays, entre otros, ya que el objetivo es sumar el efecto a la seal orignial tal como sucede en la vida real: una parte de lo que escuchamos es seal directa (de la fuente al odo), y a eso se le suma la parte reverberada (lo que rebot en paredes y piso antes de llegar al odo). En la prctica, la forma de conectar el serie en una consola es mediante un cable de insert en el jack que lleva la leyenda insert. La otra forma es, por ejemplo a la salida principal de la consola se conecta un ecualizador y luego al amplificador

IN

OUT

Jack de Insert. Es a la vez, entrada y salida

A travs de un jack de tres contactos detrs de la consola, podemos mandar la seal a un cable que tiene un plug de tres contactos en una punta y dos de dos contactos en la otrs punta. Cada una de esas dos fichas van a IN y OUT del ecualizador. La seal sale de la consola, entra al ecualizador, se procesa y sale del mismo nuevamente rumbo a la consola para seguir su camino. Toda la seal es procesada. El otro mtodo es seriar un equipo tras otro. De la salida de uno a la entrada del otro y as sucesivamente. Por ejemplo, a la salida de una consola podemos poner un ecualizador para procesar toda la mezcla insertado entre la consola y el amplificador.

24

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

IN L Y R (stereo)

OUT L Y R MAIN OUTS

IN L Y R

OUT (nivel de parlante)

La idea es que el ecualizador est insertado de la misma manera que si estuviera conectado con un cable de insert: toda la seal que termina llegando al amplificador y que finalmente escuchamos, pasa por l. Este es un caso habitual cuando el ecualizador grfico (en el dibujo) se usa para corregir defectos acsticos de la sala donde estn instalados los parlantes. Supongamos que la sala tiene una resonancia en 200Hz (por la distancia entre s y materiales de las paredes), entonces vamos a buscar el fader de los 200Hz y lo vamos a atenuar la cantidad justa (usando el odo o algn instrumento de medicin como un analizador de espectro) como para compensar lo que luego, acsticamente, se va a realzar. De esa forma lo que termina escuchando finalmente el pblico tiene un comportamiento plano. La forma de conectar un procesador en paralelo implica el uso de los envios auxiliares. Se conecta un cable (normalmente plug) a la salida auxiliar de la 25

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

consola y todos los canales que tengan el envo habilitado van a enviar una copia de la seal a ese jack. Eso va al procesador y vuelve a la consola por otro canal, para sumarse a la seal original. De esta forma, la proporcin de seal directa y procesada que escuchemos va a ser seleccionable moviendo los faders. Es el caso tpico de un procesador de reverb, donde, tal como en la vida real, la seal directa (sin reverberar) se suma a la seal reverberada y ambas suenan juntas. A medida que aumentamos la proporcin de seal reververada, damos la sensacin de alejamiento de la fuente.

Del envo auxiliar al IN del procesador Del OUT del procesador a la entrada del canal 2 de la consola

Control de envo auxiliar

6.2. Efectos que utilizan retardos o delays Muchos efectos se consiguen sumando a la seal original, varias copias retardadas y modificadas de diversas formas. De entre todos ellos, los ms tpicos son los de eco y reverberacin, aunque, como veremos, no son los nicos. Dependiendo del tipo de efecto buscado, los tiempos de estos retardos pueden valer entre las pocas milsimas y los varios segundos.

26

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

6.2.1. Naturaleza del eco y la reverberacin En una sala, la reverberacin se produce de forma natural porque los sonidos que nos llegan a los odos no proceden de un nico punto emisor, sino que recibimos tambin "copias" reflejadas por las paredes, el techo, el suelo, y otros objetos. Cuando ms distantes de nosotros estn estos reflectores, ms retardadas y tambin ms atenuadas recibiremos las copias. El tiempo de reverberacin es una propiedad de las salas, y se define como el lapso que debe transcurrir para que el sonido inicial se atene en 60 dB.6 En salas grandes, este tiempo puede durar algunos segundos. Otro factor que influye en la reverberacin es la absorcin de los materiales reflectantes. Superficies poco absorbentes, como el vidrio o el azulejo, acrecientan el tiempo de reverberacin, mientras que otras, como las cortinas o el propio pblico, hacen que este valor disminuya. Normalmente, la absorcin vara tambin con la frecuencia (los agudos se absorben ms que los graves). Todo ello hace que un buen algoritmo digital de reverberacin deba incluir muchos parmetros configurables. Cuando estos retardos son suficientemente grandes como para orse de forma aislada se denominan ecos, y slo pueden producirse en espacios muy amplios y con pocos obstculos (frente a una montaa, etc.). Si nos encontramos situados entre dos obstculos distantes, el sonido sufrir varias reflexiones antes de extinguirse, por lo que oiremos varios ecos sucesivos de intensidades decrecientes. 6.2.2. Reverberacin y eco digitales Dado que un alto porcentaje de la msica grabada se escucha en pequeas salas particulares con tiempos de reverberacin muy cortos, la mayora de grabaciones comerciales incorporan la reverberacin y otros efectos que emulan la acstica de grandes salas y las hacen ms gratas al odo. Pero los estudios de grabacin tampoco pueden ofrecer reverberaciones naturales convincentes, por lo que desde hace dcadas se ha investigado mucho en sistemas de reverberacin artificiales. En los aos 60 y 70 estos efectos se reproducan de forma analgica (utilizando cintas magnetofnicas) o incluso mecnica (mediante la disposicin de placas metlicas, micrfonos y altavoces), pero desde hace ya varios aos, los ecos y reverberaciones digitales han desbancado por completo a los antiguos sistemas. Dado que la absorcin de un sonido vara con su frecuencia, este tipo de procesos digitales involucran cambios en todos los niveles (tiempo, amplitud y frecuencia) aunque simplificando, pueden entenderse como una serie de repeticiones retardadas y atenuadas. 6.2.3. Algunos consejos prcticos Dado que cada uno de estos programas ofrece diferentes parmetros de configuracin, no hay mejor forma para familiarizarse con

Por eso se llama RT60

27

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

estos efectos, que ir probando y escuchando los resultados. Un buen punto de partida puede consistir en estudiar y modificar los presets que incorporan (catedral, sala de conciertos, etc.). Para emular la reverberacin natural puede tomar en cuenta los siguientes valores de tiempo de reverberacin como referencia segn lo que quiera conseguir. Cabina telefnica cerrada (0.10 ms), habitacin (entre 0.4 y 0.8 ms), gran living o saln (1.2 a 1.8 ms), iglesia o gimnasio cubierto (2 a 4 ms). Para lugares ms amplios, aumente el valor del pre-delay a ms de 40ms. Esto genera la sensacin de que las paredes ms cercanas estn lejos y por eso, las primeras reflexiones tardan en llegar. A ms distancia entre la fuente y el punto de escucha, ms ser el nivel de reverberacin comparado con la seal directa y viceversa. Cuando utilice retardos grandes (dcimas o varios segundos) en fragmentos musicales con un tempo claro, pruebe a aplicar valores relacionados de forma sencilla con el tempo musical. Los resultados sern ms interesantes. Si, por ejemplo, un fragmento est a un tempo de 120 (significa que se producen 120 negras por minuto), cada negra durar 0,5 segundos. Pruebe a utilizar entonces retardos de 0, 125 s, 0,25 s, 0,5 s, 1 segundo, etc. 6.2.4. Flanger y phaser Los retardos se utilizan tambin de forma menos evidente para crear otros tipos de efectos ms "electrnicos". En estos casos, los valores suelen ser breves (milsimas o centsimas de segundo). Con los trminos flange, flanger o flanging, se conoce el efecto consistente en mezclar la seal original con una copia con un retardo muy breve, pero variable de forma peridica. Los parmetros a configurar son como mnimo el porcentaje de seal retardada, el margen de variacin del retardo (entre varios unidades y varias decenas de milisegundos), la frecuencia de variacin de este retardo (normalmente entre algunas dcimas y varios hertzios), y el porcentaje de realimentacin. En la figura 6.3, se muestran dos ventanas de configuracin del flanger.

28

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

Figura 6.3. Configuracin del flanger en Wave y Cool Edit Dependiendo de estos valores, el efecto conseguido puede ser similar a los sonidos tpicos de las pelculas de marcianos de los aos cincuenta, o al sonido del pop psicodlico de finales de los sesenta (entonces se aplicaba frecuentemente a la guitarra y a la batera). En aquella poca, estos efectos se conseguan de forma analgica, mezclando la seal de dos grabadores, y retardando o acelerando ligeramente uno de ellos. Cuando no existe realimentacin, el efecto es ms discreto y suele denominarse phaser o phasing, y se encuentra con frecuencia en pedales para guitarra. 6.2.6. El chorus Este es otro efecto, normalmente sutil, pero muy utilizado en msica, con el que se intenta simular que un solo instrumento (o una sola voz), suene como varios instrumentos al unsono. Se consigue retardando y desafinando muy ligeramente la seal original. En la actualidad se aplica muchsimo a los cantantes, para dar ms presencia a la voz. 6.3. Procesadores de rango dinmico Recordemos que el rango dinmico de un fragmento sonoro viene dado por la diferencia (en dB) entre la intensidad ms fuerte y la ms dbil. Los efectos incluidos en este apartado, operan directamente sobre la amplitud de las muestras, aunque de formas ms sofisticadas que los descritos en el apartado 5.6, modificando de diversos modos el rango dinmico de un determinado fragmento. Los ms importantes son los compresores, los expansores, los limitadores y las puertas de ruido (comentadas ya en el apartado 5.6). Una buena forma de caracterizar estos procesos, es a travs de su funcin de transferencia, que establece una correspondencia entre las amplitudes de entrada y las amplitudes de salida. En la figura 6.4, se muestran varias funciones de este tipo, junto con los efectos que producen en un fragmento sonoro. La funcin 6.4.a es una recta con una inclinacin de 45o, lo que significa que, en este caso, no se produce ninguna modificacin del rango dinmico (a cualquier valor de amplitud de entrada, le corresponde el mismo valor en la salida). Algunos programas de edicin de audio permiten que el usuario dibuje manualmente la curva de transferencia, por lo que todos los efectos que se describen a continuacin, pueden considerarse como casos particulares de un proceso nico.

29

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

Figura 6.4. Funciones de transferencia de procesado de rango dinmico. En la segunda columna se muestra el efecto producido sobre un mismo sonido. 6.3.1. Los compresores y los limitadores Los compresores se utilizan para reducir el rango dinmico de una seal. Su uso es muy frecuente en la grabacin de partes vocales, ya que en muchos casos, la seal emitida por la voz y recogida por un micrfono, presenta mnimos muy dbiles que se confundiran con el ruido de fondo. Con una compresin ms exagerada se consigue un efecto intimista, ya que se acentan los sonidos de la respiracin y de los movimientos bucales (lengua, saliva, etc.). Este efecto tambin se utiliza mucho en las guitarras elctricas, creando el tpico sonido de guitarra heavy (fig. 6.4.b). Los limitadores son un caso extremo de compresores, que limitan la amplitud mxima posible a un valor umbral. Suelen utilizarse en grabaciones de conciertos para evitar que se pueda producir saturacin. Su funcin de transferencia presenta pendientes horizontales en los extremos (fig. 6.4.c). Los parmetros que determinan el comportamiento de los compresores son los siguientes: Umbral o Threshold: es un nivel que se elige para determinar a partir de qu nivel de la seal va a comenzar a actuar el compresor. Por ejemplo, se puede setear a -10 dBFS (si es un compresor digital) y la seal va a pasar sin ser

30

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

comprimida mientras su nivel est por debajo del umbral. Cuando la seal tome ms nivel y sobrepase el umbral, el compresor comienza a actuar. Ratio: es la relacin de compresin. Expresada como una relacin (2:1, 4:1, etc) indica cunto va a comprimir la seal cuando sta supere el umbral. Si este parmetro se setea en 1:1 el compresor no va a actuar. Si se setea en 10:1 o ms ya se considera un limitador porque la seal no va a superar casi el umbral. Attack: es el tiempo que tarda el compresor en comprimir, o sea, en reducir el volumen, a partir de que la seal supera el umbral. Se expresa en milisegundos. Un tiempo de ataque corto va a evitar que la seal tome nivel indeseado todo el tiempo. Es el que se usa tpicamente para dilogos. Los tiempos ms largos de ataque van a dejar que la seal tome el valor original para luego comenzar a comprimir. Esto permite dar una sensacin de alto nivel (dada por el nivel en el comienzo) pero controlar el nivel luego. Release: es el tiempo que tarda el compresor en dejar de actuar, una vez que la seal cae por debajo del umbral. Make up: Como es de esperar, al comprimir la seal, el nivel promedio de la grabacin cae, mucho o poco de acuerdo a la cantidad de compresin aplicada. El parmetro de make up, disponible en algunos compresores, nos permite subir el nivel de la seal algunos dB para compensar la prdida producida por la compresin. Algunos compresores tienen una funcin que se llama Auto Make up que compensa esto en forma automtica. Hay que tener en cuenta que al comprimir los picos y levantar todo el programa, estamos recudiendo el rango dinmico, que es lo que queramos. Pero tambin estamos empeorando la relacin seal/ruido. Si el ruido de fondo es muy alto, puede ser que la compresin haga que ste se escuche demasiado.

6.3.2. Los expansores Un expansor es el opuesto de un compresor. Acenta los cambios, disminuyendo los niveles dbiles, y aumentando los fuertes. Se utiliza frecuentemente en combinacin con puertas de ruido, y para realzar grabaciones antiguas que presentan un rango dinmico estrecho (fig. 6.4.d). Tambin son usados para despegar dilogos que estn grabados con mucho ruido de fondo. 6.3.3. La distorsin Este trmino tiene connotaciones peyorativas ya que normalmente define la perdida o la degradacin inevitables en una seal, ocasionadas por los diferentes dispositivos o procesos (micrfono, grabacin, amplificador, altavoces) a los que se ve sometida. Sin embargo, todos los efectos descritos anteriormente son, en realidad, casos particulares de distorsin, que, por su uso frecuente, reciben un nombre propio. Los programas de edicin de audio que permiten dibujar la funcin de transferencia, no imponen ninguna limitacin

31

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

sobre la forma de esta funcin, por lo que posibilitan cualquier distorsin arbitraria. 6.4. Los filtros 6.4.1. Definicin De forma rigurosa, cualquier algoritmo o proceso computacional, que a partir de una entrada (una secuencia de nmeros), genere una salida (otra secuencia de nmeros), puede considerarse como un filtro digital. Todos los procesos que hemos comentado hasta el momento representan, por lo tanto, casos diferentes de filtros digitales, pero en la prctica este trmino se acostumbra a reservar para aquellos dispositivos que modifican el espectro de una seal. No se asuste si lo que sigue le parece algo complicado. Piense que la teora de filtros digitales puede ocupar todo un curso en una carrera de ingeniera. Por ello, no trataremos aqu la forma de implementacin de estos filtros digitales, ni en las teoras matemticas sobre los que se apoyan. 6.4.2. Espectro de una seal Comentbamos que la mayora de sonidos estn compuestos por varias frecuencias diferentes. El teorema de Fourier afirma que toda seal peridica compleja puede descomponerse en una suma de seales sinusoidales de frecuencias y amplitudes diferentes. Esta descomposicin se denomina espectro de frecuencias, y se representa mediante un grfico con frecuencias en las abcisas y amplitudes en las ordenadas, en el que se visualizan las respectivas amplitudes de todas las frecuencias que componen un sonido. Esta teora, que data de ms de un siglo, se aplica de forma rigurosa a las seales totalmente peridicas, pero los sonidos nunca lo son plenamente, pues siempre varan a lo largo del tiempo. Afortunadamente, desde hace varias dcadas, mediante complejos procesos matemticos, el anlisis de Fourier se aplica tambin a seales variables en el tiempo. En este caso, la representacin espectral de un sonido no es ya una nica distribucin de frecuencias bidimensional, sino una superficie tridimensional, compuesta por una sucesin de "rebanadas" temporales, en la cada una muestra el aspecto del espectro en un instante dado, o por un grfico bidimensional que va cambiando en el tiempo, segn cambia el sonido. En la figura 6.6, se muestran varios de estos espectros tridimensionales. En ellos, la frecuencia se representa en el eje x, el tiempo en el eje y (aumenta al acercarse hacia el observador), y la amplitud de estas frecuencias en el eje z. Asimismo, en la parte derecha de estas figuras, se muestra el espectro de frecuencias o "rebanada" correspondiente al instante inicial t=0. Algunos programas de edicin de audio son capaces de realizar este anlisis para un fragmento seleccionado y de mostrar grficamente el resultado. Estos grficos permiten estudiar la evolucin temporal de los diferentes componentes frecuenciales que integran el sonido. 6.4.3. Tipos de filtros bsicos Un filtro se caracteriza por su curva de respuesta de frecuencia, que indica la forma en que las diferentes frecuencias en la entrada se atenan o amplifican.

32

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

Todos los componentes electrnicos de sonido poseen una curva de respuesta de frecuencia particular, aunque en la mayora de aparatos (micrfonos, amplificadores, conversores A/D y D/A, altavoces, etc.), lo ideal sera que esta curva fuese plana (una recta horizontal) entre los 20 y los 20.000 Hz, ya que toda desviacin acarrea una modificacin artificial del timbre o el color del sonido. Dejando al margen estos problemas de diseo, que seguirn llevando de cabeza a los diseadores de componentes electrnicos, los filtros ms usuales pueden clasificarse, de acuerdo con la forma de esta curva de respuesta, en cuatro grandes familias: pasa-bajo, pasa-alto, pasa-banda y rechazo de banda. El filtro pasa-bajo, deja pasar las frecuencias por debajo de un determinado valor, denominado frecuencia de corte. En un filtro ideal esta frecuencia debera suponer una discontinuidad en la curva de respuesta, de forma que toda frecuencia por encima de este valor se atenuar totalmente y toda frecuencia por debajo se dejar tal cual. En la prctica, esto no es posible y todos los filtros reales presentan una pendiente en la zona cercana a la frecuencia de corte. Cuanto ms inclinada sea esta pendiente de atenuacin, ms preciso ser el filtro.

El filtro pasa-alto, realiza la labor opuesta, ya que nicamente deja pasar las frecuencias superiores a la frecuencia de corte.

El filtro pasa-banda, deja pasar una banda de frecuencias, eliminando el resto. Se define a partir de la frecuencia central o de resonancia y el ancho de banda.

El filtro de rechazo de banda, acta de forma inversa al de pasa-banda. Al igual que ste, se caracteriza por la frecuencia de resonancia y el ancho de banda.

En la figura 6.5, se esquematizan las curvas de respuesta de frecuencia de estos cuatro filtros bsicos, y en la figura 6.6 se muestran los efectos de aplicar estos diferentes filtros a un mismo sonido.

33

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

Figura 6.5. Curvas de respuesta de frecuencia de los cuatro filtros bsicos

A. Sonido original

B. Filtrado pasa-bajo a 1.500 Hz

34

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

C. Filtrado pasa-alto a 1.500 Hz

D. Filtrado pasa-banda a 1.000-2.000 Hz

E. Filtrado rechazo de banda a 1.000-2.000 Hz

Figura 6.6. Ejemplos de filtrado con la evolucin temporal del espectro de frecuencias, su aspecto en el instante t=0 y el sonido resultante. 6.4.4. Ecualizadores Todos hemos visto alguna vez un ecualizador grfico. Este aparato consta de 35

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

varios potencimetros, cada uno de ellos asociado a una banda de frecuencia, que permiten amplificar o atenuar estos componentes frecuenciales. Cuantas ms bandas tenga el ecualizador, ms preciso ser el control sobre el espectro armnico y ms radicalmente se podr modificar el timbre de los sonidos procesados. Un ecualizador grfico se construye con un banco de filtros pasa-banda en paralelo. Otro tipo de ecualizadores son los paramtricos, que presentan menos bandas (tpicamente dos o tres), pero con frecuencias de corte y ancho de banda configurables. Los ecualizadores semiparamtricos no permiten seleccionar el ancho de banda sobre el que se opera, proporcionando un seteo fijo. 6.4.5. Implementacin de los filtros en los editores de audio Los diferentes programas de edicin de audio, ofrecen diversas alternativas a la hora de implementar los filtros digitales. Casi todos incorporan un ecualizador grfico de varias bandas, como el que se muestra en la figura 6.7, y los cuatro tipos bsicos en los que el usuario deber indicar la frecuencia de corte y la pendiente de atenuacin.

Figura 6.7. Ecualizador grfico en Sound Forge Los ms verstiles permiten adems dibujar curvas de respuesta de frecuencia arbitrarias, como la de la figura 6.8, e incluso interpolar entre dos curvas diferentes produciendo filtros variables en el tiempo, con lo cual se pueden conseguir interesantes efectos.

36

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

Figura 6.8. Curvas de respuesta de frecuencia en Cool Edit 6.4.6. Aplicaciones del filtrado digital Las posibilidades del filtrado digital son muchas; describiremos a continuacin algunas de las ms representativas. Filtrado pasa-bajo al reducir la frecuencia de muestreo. Comentbamos en el antes, que la reduccin de la frecuencia de muestreo provoca el fenmeno del aliasing, por el cual aparecen frecuencias fantasmas que no se encontraban en el sonido original. Para evitar el aliasing, antes de convertir un archivo a una frecuencia de muestreo inferior, deber aplicar un filtro pasa-bajo con frecuencia de corte igual a la mitad de la nueva frecuencia de muestreo. Si desea pasar un archivo grabado a 44.100 Hz a 22.050 Hz, deber, por lo tanto, filtrar el sonido, eliminando sus componentes frecuenciales por encima de 11.025 Hz. Programas como Sound Forge simplifican este proceso, ya que ofrecen la opcin de filtrar automticamente al pasar a una frecuencia menor.

Simulacin de dispositivos analgicos. Un filtrado selectivo puede emular las caractersticas sonoras de dispositivos de baja calidad, como telfonos, radios antiguas, megfonos, etc. Estos dispositivos se caracterizan por tener curvas de frecuencia bastante estrechas. En este caso, la herramienta ms sencilla suele ser el ecualizador paramtrico, seteando la banda de baja frecuencia en modo Hi pass y la banda de ms altas frecuencia en Lo Pass. Ajustando convenientemente las frecuencias de corte podremos conseguir el efecto deseado. Si el

37

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

programa dispone de presets de ecualizacin bastar con seleccionar el oportuno. Si no encuentra el preset que desea, una vez haya configurado convenientemente el ecualizador (por el mtodo de tanteo y error), no olvide salvar el preset para un posible uso futuro. El realzado sonoro, es especialmente eficaz y aconsejable con grabaciones de voz. Piense que muchas de las voces aterciopeladas y seductoras de los cantantes actuales son fruto directo del laboratorio. Pruebe a potenciar diferentes bandas de frecuencia en grabaciones de su propia voz (la voz humana posee componentes entre los 100 Hz y los 5.000 Hz aproximadamente).

Utilice el anlisis espectral. Para no trabajar a ciegas, el anlisis espectral (vase fig.6.6) es una herramienta muy til que nos puede dar una idea de las cualidades y carencias de cualquier sonido. En ocasiones, se infiltran en las grabaciones molestos ruidos con una frecuencia fija, causados por interferencias elctricas. El anlisis espectral nos permitir detectar estas frecuencias fastidiosas, para proceder a su filtrado posterior.

El filtrado creativo es una ciencia y un arte, que permite alterar radicalmente la naturaleza de cualquier sonido. Intente crear sonidos "musicales" a partir de modestos sonidos cotidianos.

Los ecualizadores paramtricos son los que ms se usan en postproduccin y tienen ms o menos los siguientes parmetros: Gain: es la ganancia, positiva o negativa, de esa banda. Est graduada en dB, normalmente suelen ser suficientes variaciones no mayores a 3 dB para conseguir los resultados deseados, aunque en situaciones extremas puede llegar a ser necesarios realces o atenuaciones de hasta 18dB. Frecuencia: es la frecuencia de corte de esa banda. Si es un HPF (hi pass filter o filtro pasa altos) es la frecuencia a partir de la cual van a pasar los sonidos. Sonidos con frecuencias menores no se van a escuchar. A la inversa con un LPF (lo pass filter o filtro pasa bajos) Si la banda est configurada en modo notch o bell, es la frecuencia central de la variacin. Q: es el ancho de banda afectado. Normalmente se expresa en fracciones de octava e implica cunto van a ser afectados los sonidos con frecuencias vecinas a la elegida. 6.5. Compresin y expansin temporal En el apartado 5.7 estudiamos diversas formas de cambiar la frecuencia y la duracin de un sonido. Existe una posibilidad adicional, que permite modificar la frecuencia sin alterar la duracin o viceversa. Ambas facetas utilizan un

38

Universidad de Buenos Aires FADU Carrera de Diseo de Imagen y Sonido Sonido I Ctedra Gat

mismo proceso denominado por extensin time-stretching o time compressionexpansion (compresin temporal). Las matemticas involucradas son enormemente complejas, por lo que el clculo de estos efectos suele ser un proceso lento. Veamos algunas posibles aplicaciones. Corregir un fragmento instrumental o vocal ligeramente desafinado. Las tcnicas descritas en 5.7, permitiran corregir esta desafinacin, pero a costa de modificar tambin la duracin del fragmento, lo cual puede no ser deseable si el fragmento est sincronizado con otros sonidos.

El caso contrario, es decir corregir incorrecciones rtmicas, preservando la afinacin.

Transponer varias veces un fragmento con intervalos diferentes y sumarlos todos al original, para crear coros o acordes.

Este proceso puede funcionar tambin como un "microscopio sonoro"; alargando en varios factores sonidos muy cortos, descubrir insospechadas nuevas sonoridades. En cine, conversin del sonido tomado con la cmara de imagen corriendo a 24 fps cuando, para emisin en video PAL, la imagen corre a 25fps. En este caso es necesario acelerar el sonido un 4% pero no queremos cambiar su tonalidad ya que un 4% de tono ms agudo sera notable.

39

También podría gustarte