Está en la página 1de 11

Introducción al Audio Digital Ver perfil usuario: gustavo23f

 
Índice de Materias
1-Introducción
2-Soporte digital y
analógico
 

¿Qué es el audio digital?

Podríamos definir audio digital como la representación de una señal de audio mediante números, en general codificados en forma
binaria (es decir con ceros y unos, el lenguaje interno de los ordenadores). Entendemos como señal de audio cualquier objeto sonoro
audible, el viento, el agua, nuestra voz, nuestra música preferida y evidentemente esos molestos "ruidos" nocturnos de los vecinos que
no nos dejan dormir. Cualquier sonido puede representarse en números, al igual que cualquier imagen o grafico.

En términos menos genéricos, también podemos llamar audio digital a la tecnología que permite grabar, editar, mezclar y masterizar
una señal de audio completamente en el dominio digital. Para ello existe un amplio surtido de aparatos y equipos que procesan la señal
de audio en el dominio digital, dominio que ofrece muchas más ventajas ya que es totalmente "tratable" por un ordenador, es decir,
permite un grado de manipulación sin precedentes.

1-Introducción

Para la gran industria de la música, el audio digital nació de una necesidad muy concreta; ahorrar tiempo de
producción. Antes del audio digital, el método de grabación era lo que hoy en día se conoce como
grabación analógica, los impulsos del sonio se registraban en una bobina o cinta. La edición de esa bobina
era un proceso muy largo y tedioso, en el que la precisión y paciencia eran algo obligado. Por otro lado,
obtener un buen equipo analógico era algo realmente caro. Hablando de creatividad de mezclas y
producción de audio, los procesos que podían aplicarse eran muy limitados comparados con los de hoy en
día. Por poner un ejemplo, si se requería una reverberación concreta el músico debía registrar su
interpretación en la sala que producía esa reverberación.

Estudio de grabación de audio analógico. La calidad de audio no es comparable a los


modernos sistemas digitales, aunque esta misma calidad nos ha servido durante muchos
años para escuchar nuestros discos favoritos.
Estudio de grabación de audio digital. El ordenador se encarga de registrar (primer monitor), mezclar y procesar
efectos (segundo monitor) así como generar sintetizadores y samplers virtuales (tercer monitor)

La introducción del audio digital ha revolucionado, sin duda alguna, toda la industria de la música, las empresas que construyen
instrumentos, los creadores o músicos, los procedimientos de edición y mezcla, y desde luego el soporte; es decir lo que nosotros oímos
en casa: un CD de audio o los tan famosos MP3. La tecnología del audio digital ha dado lugar a toda una nueva legión de instrumentos
musicales que prometen un grado de libertad de creación de sonidos sin precedentes (solo superada por al síntesis virtual). Estos
nuevos instrumentos han propiciado la existencia d nuevos estilos musicales que dependen en gran parte de esa tecnología. Un ejemplo
muy corriente puede ser lo que se conoce popularmente como música "dance" que no sólo se produce con instrumentos digitales sino
que parte de la composición es un puzzle de otras grabaciones digitales realizadas por terceros y mezcladas hasta formar una nueva
composición.

Ejemplos de los nuevos instrumentos digitales basados en la tecnología de captura y reproducción de audio digital. En la parte superior, el "sampler"
6000 y en la parte inferior el sintetizador Korg T
 

El músico tradicional ha tenido que adaptarse a esos cambios. Cuando nacieron los primeros instrumentos digitales los músicos eran
reacios a utilizarlos (el sintetizador el instrumento musical con más rechazo de toda la historia). Muchos pensaban que eran máquinas
malditas que pretendían sustituir o imitar instrumentos tradicionales. No les faltaba parte de razón. El audio digital son fotografías
digitales de sonido, por lo que no hacia falta tratar de imitar un piano, ya que tenemos la foto del sonido de un piano. La primera
consecuencia fue la drástica reducción de costes de grabación. Para grabar un piano hacen falta micrófonos. Los micrófonos deben
situarse correctamente según el ambiente y color que pretendemos dar a ese piano. Eso representa horas de pruebas y corrección de
pequeñas imperfecciones producidas por el solapamiento de las señales de los micros. Si utilizamos un instrumento digital con un buen
sonido de piano, sólo requerimos dos cables, izquierdo y derecho y siempre sonará igual de bien sea cual sea el entorno acústico.
Aunque los primeros instrumentos digitales eran muy caros, hoy en cualquier ordenador incluye un instrumento digital, la tarjeta de
sonido, que es muy limitada en comparación con los grandes sintetizadores de la industria , pero extremadamente más avanzada que
los primeros instrumentos digitales.

En el entorno del estudio de grabación, el audio digital también ha supuesto un importante avance. Ya no hace falta guardar
celosamente las bobinas master (para que el paso del tiempo no las merme) el audio digital es indestructible, sólo puede destruirse
deteriorando el medio en el que se almacena; un CD, un disco duro, etc.... También han desaparecido los tediosos procesos de cortar y
pegar (hechos literalmente con tijeras y cola). Ahora existe la edición no lineal que como veremos más adelante puede ser destructiva o
no. La ambientación de la mezcla ha pasado a ser una realidad palpable. Donde antes existían habitaciones enormes con paredes
móviles para recrear reverberaciones, ahora existen pequeños equipos de no más de 5kg que incluyen ambientes de salas y halls
famosos; podríamos cantar con el ambiente de en la opera de Sydney, aunque eso sólo existirá en nuestro cerebro, ya que en realidad
estaríamos solos delante de un ordenador. Existen otros detalles menores, como el hecho de que por primera vez el músico puede
grabar parte de su música en casa y luego seguir en un estudio, transfiriendo digitalmente las pistas. Esto ofrece una libertad de
mezclas y producción de audio increíbles: un usuario sin recursos puede acudir a un estudio y seguir editando sin perder la calidad
original.

Por último, tenemos el soporte digital, es decir el medio en el que recibimos el producto musical acabado. Donde ante teníamos los
discos de vinilo o las cintas de cassette, ahora tenemos el CD /DVD y el minidisc. Desde el punto de vista de fiabilidad, estos soportes
no fallan (¿cuantas veces se nos ha enganchado una cinta en el cabezal?) y físicamente son más duros y compactos, para que dejen de
funcionar hay que destruir el medio, no basta con una rayada.

2-Soporte digital y analógico

Veamos con detenimiento las diferencias más importantes entre el soporte analógico y el digital:

Soporte Analógico

Degradable: Cuantas más veces se usa, mayor degradación se obtiene. Los datos se almacenan físicamente sobre un sustrato que es
mucho más alterable con el paso del tiempo.

Lineal: El audio se graba secuencialmente en el tiempo y con el mismo orden de ejecución, de principio a
fin.
Grabador analógico de audio (2 pistas). Resulta
evidente comprobar que su acceso no es
aleatorio.

Calidad de audio: La calidad de un sistema de grabación analógico resulta inferior a la mínima calidad de audio ofrecida por un
sistema digital. En la práctica, un sistema analógico rara vez supera los 70dB de relación señal ruido (SNR). Un grabador profesional
analógico puede alcanzar los 85dB SNR. Una tarjeta como la nueva SoundBlaster Prodigy posee una relación señal ruido de 100dB.
Inicialmente, no es importante saber qué es la relación señal ruido, sino simplemente tener constancia de las distintas cifras que miden
esta importante característica de las tarjetas: existen tarjetas de audio con más de 115dB SNR. La explicación de la relación señal ruido
puedes encontrarla en este otro tutorial publicado en este misma página web "Características del audio digital".

Por otro lado, deberíamos evitar una sensación de triunfalismo absoluto del audio digital frente al analógico. En buen técnico de sonido
puede lograr que una canción suene increíblemente bien en sistemas analógicos, de hecho tenemos toda la industria de la música para
demostrarlo. Aunque el medio analógico sufre muchos problemas de calidad e inestabilidad, los grandes profesionales de producción
saben como solucionar estos problemas. ¿Qué problemas?

Por ejemplo, la diafonía e imperfecciones de la mecánica. Los distintos canales de una grabadora analógica suelen mezclarse, es decir,
parte de la señal de un canal también se percibe en otro canal. El propio medio analógico provoca que parte de la señal de un canal se
"cuele" en el otro canal. Un método para evitar este problema consiste en utilizar cintas más anchas, en las que las pistas ocupan más
espacio físico. Por otro lado, las imperfecciones de la mecánica empleada para la reproducción sonora dan lugar a problemas de wow,
flutter, tremolo, etc. Otras notables diferencias son la separación entre los canales izquierdo y derecho, la relación entre la señal y el
ruido de fondo, la linealidad de la respuesta en frecuencias y de fase, la relación entre el nivel más bajo y el más alto.

Edición destructiva: La edición de las grabaciones de audio en el mundo analógico es totalmente destructiva, baste un sólo ejemplo
para comprobarlo. Algo tan sencillo como copiar un fragmento del estribillo, significa grabar ese fragmento en otra cinta, reproducir
esta mientras la original inicia la grabación a partir del punto deseado. La edición en el mundo analógico es siempre destructiva e
incluso a veces se destruye parte del propio medio en el que reside la grabación, la cinta o bobina (en operaciones de copia en las que
se requiere cortar físicamente la cinta). Por otro lado, el tiempo invertido en la edición es extremadamente elevado así como los costes
en términos el precio en términos de pruebas fallidas y errores humanos.

Soporte Digital

No degradable: Una grabación de audio digital es una cadena gigante de 0 y 1 perfectamente ordenados. Es imposible que "el paso
del tiempo" convierte un 0 a un 1, es decir que pueda alterar esa cadena. Como mucho, es posible que una mala manipulación del
soporte (por ejemplo el CD) provoque que durante un instante aparezcan artefactos o ruidos que originalmente no estaban. Lo que
nunca ocurrirá es que el audio de ese soporte digital vaya apagándose , perdiendo brillo con el paso del tiempo. La durabilidad de los
datos es eterna, puesto que pueden ser almacenados en cualquier dispositivo de almacenamiento, como puede ser un disco duro, una
memoria, etc., y recuperados en cualquier momento

Si en el mundo analógico el tiempo es algo fijo e invariable (una canción


Lineal / No-lineal (acceso aleatorio):
se registra de principio a fin) en el mundo digital no tiene porque ser así. Existe un soporte digital llamado
DAT que está basado en cinta analógica aunque en ella se registran 0 y 1 como un en CD pero con una
calidad superior a éste. En este caso, la grabación y reproducción es lineal. Si deseo ir al final de la
canción, debo pulsar el botón Fast Foward y esperar a que la cinta llegue a su punto. Considerando el disco
duro de nuestro ordenador como soporte digital (archivos wav, aiff o MP3) llegamos a la inequívoca
conclusión de que es un soporte no lineal. Los 0 y 1 de las canciones que registramos se almacenan por
todo el disco duro sin orden alguno. El acceso a cualquier parte de esta canción (una vez grabada) es
instantáneo, no hay tiempo de espera, dicho de otra forma, se tarda tanto en reproducir desde el inicio de la
canción como, en mitad de ella: apenas unos milisegundos.

Grabador de audio digital multipista (8 pistas) basado en cinta de SVHS. Al basarse en cinta, la edición es lineal

Grabador de audio digital multipista (24 pistas) basado en disco duro. Al basarse en
disco duro, la edición es no lineal

Calidad de audio: La calidad de audio del soporte digital, es mayor que la del analógico. La respuesta de frecuencias, es decir el
espectro de frecuencias que el grabador digital es capaz de grabar es mucho mayor que el analógico, aunque en el caso del mundo
digital la teoría y la práctica siguen caminos que pueden ser muy distintos, es decir, la calidad teórica de un sistema de audio a 24 bits
es superior a la calidad que ofrece en la realidad, aunque esta realidad mermada es muy superior a la analógica; sea como sea, el audio
digital siempre puede tener más calidad que el analógico.

Diafonía imperceptible o casi nula: En los grabadores de audio digital, nunca ocurrirá que monitorizando una pista aislada podamos
oír parte de la señal de sus pistas adyacentes. Cada pista de ese grabador digital registra y reproduce sus propias cadenas gigantes de
0 y 1. Es imposible que el ordenador se equivoque y sume 0 y 1 de distintas pistas.

Edición no destructiva: El último aspecto es quizás el mas interesante dentro de la vertiente creativa del sonido. Por primera vez es
posible crear audio. La música siempre ha tenido efectos como reverberación, retardos, distorsiones y ecualización, pero por primera
vez estamos ante el nacimiento de nuevos efectos de indescriptibles resultados. En la película MATRIX, cuando Neo es desconectado del
mundo "Real" produce un interesante grito de dolor. Imaginemos a Andy Wachowski (director de MATRIX) diciéndole al técnico de audio
que desea un grito humano que vaya convirtiéndose progresivamente en un grito digital, una voz que denote la existencia de un mundo
digital, la sensación que debe percibir el espectador es la de que Neo abandona el mundo de los vivos para adentrase en el mundo de la
máquina MATRIX. Ese efecto de sonido que apenas dura 3 segundos, es materialmente imposible de recrear sin la tecnología de
procesado de audio digital. Si el grito de Neo original no hubiera sido grabado digitalmente en forma de 0 y 1, nunca se habría podido
aplicar ese grado de manipulación. El procesado de estos efectos puede ser destructivo, es decir alterando la grabación original (los 0 y
1) son manipulados y alterados o bien no destructiva en el que los cálculos se realizan a tiempo real, es decir, "mientras el audio
suena". En este caso el archivo original se mantiene intacto.

Características del audio digital Ver perfil usuario: gustavo23f

 
 
Índice de Materias
1-Frecuencia de
muestreo
2-Resolución de bits
2-Rango dinámico
 

1-Frecuencia de muestreo

El proceso de captura de audio a soporte digital ser conoce como "muestreo" (sampling, en el ámbito de los
DJ). Esta operación de codificación del audio analógico a 0, 1 tiene lugar a tiempo real, es decir mientras la
señal de audio analógico (audio "real") se reproduce. En los grabadores de audio digital, tanto en sistemas
dedicados como en las tarjetas de sonido populares, existe un componente llamado conversor AD
(analógico-digital, es decir el componente que se encarga de convertir señales eléctricas a cadenas
binarias). El proceso inverso, es decir la reproducción utiliza un conversor DA (digital-analógico). El
conversor aplica una "rejilla" de tiempo al audio y captura el audio comprendido en las casillas de la rejilla.
Podemos utilizar un ejemplo muy sencillo. Si queremos grabar un atleta que corre durante" x" metros en
una pista olímpica, necesitamos una cámara que corra junto a éste (imagina la clásica cámara montada en
raíles). Esta cámara capturará 25 fotos (frames, en el argot) por segundo. ¿25 y no 98 o 4.7? 25 fotos por
segundo es más que suficiente para engañar al ojo humano y hacerle creer que esta sucesión de fotos es un
movimiento real de un señor corriendo. Para capturar el audio de ese corredor necesitamos un micrófono y
un grabador de audio que "fotografíe" el sonido. Para engañar al oído, necesitamos más de 25 fotos por
segundo, bastantes más...44.100 fotos por segundo, para ser exactos.

Cuadro de diálogo de configuración del programa Pro


Tools Free. Desde esta pantalla indicamos la frecuencia
de muestreo que se utilizará en la sesión actual. Pro-Tools
sólo permite utilizar archivos con una sola frecuencia de
muestreo. Existen otros programas que permiten utilizar
archivos con múltiples frecuencias de muestreo en una
sola sesión. El programa convierte la frecuencia de
muestreo a tiempo real ya que un CD no soporta múltiples
frecuencias de muestreo

En el mundo del audio no se utiliza la expresión fotos por segundo, sino que se habla de la Frecuencia de Muestreo. Una frecuencia
de muestreo de 44.100 se conoce como 44.1 kHz (Kilo Hercios). Esta frecuencia de muestreo permitiría no diferenciar la fuente un
sonido que se produce en la habitación de al lado, oiríamos a un señor hablando y no sabríamos si es real o una grabación que se está
reproduciendo. Si la frecuencia de muestreo fuera menor, por ejemplo 22.050 kHz, ese señor tendría una voz muy opaca, como si
hablase con una mano tapándose la boca. Nos parecería muy raro, no seria una voz natural. ¡No podrían engañarnos!.

Existe una relación matemática que relaciona la frecuencia máxima registrable (es decir, hasta qué frecuencia podremos grabar) en
función de la frecuencia de muestreo. Estamos hablando del teorema de Nyquist y básicamente nos dice que si queremos grabar una
señal de audio que llega hasta "x" frecuencia, debemos utilizar una frecuencia de muestreo mínima de "2x", es decir el doble de la
frecuencia más alta originada en la señal que deseamos grabar. Por ejemplo, si queremos grabar una señal de audio que llega hasta los
20 KHz, Nyquist nos dice que necesitamos una frecuencia de muestreo mayor o igual a 40kHz. Todos los CD del mercado reproducen
audio con una frecuencia de muestreo de 44.1kHz, es decir, pueden reproducir perfectamente señales de audio con frecuencias de
hasta 22050Hz (que es justamente el límite de frecuencias teórico que podemos oír los humanos; los elefantes poseen un limite inferior
por debajo de los 10Hz y las hormigas mayor a 22kHz). La radio digital emplea una frecuencia de muestreo de 32kHz (hasta los
16000Hz) frente a los 96kHz del estándar DVD (hasta los 48000Hz). Por lo tanto...

Según Nyquist, es posible repetir con exactitud una señal de audio si la frecuencia de muestreo es
como mínimo el doble de la frecuencia de la componente de mayor frecuencia.

Observando la parte inferior de esta captura de pantalla (Sound


Forge 5.0) de ese archivo descubrimos que es un audio mono de 8
Cuadro de diálogo de grabación de audio del bits a 8.192Hz. Se trata de una captura de una emisión desde el
programa Wavelab 3.0 de Steinberg. Nótese que espacio registrada por el SETI. Esta frecuencia de muestreo es más
permite grabar audio con resoluciones de hasta que suficiente para el material de audio que tratan en este instituto
192kHz y 24 bits. de búsqueda s e señales de vida extraterrestre.

2- Resolución de bits

Ya sabemos que necesitamos tomar 44100 "fotos" del sonido por segundo, pero ¿estas fotos cómo se
almacenan?. En forma de bits, cadenas de 0 y 1 totalmente manejables por el ordenador. La cantidad de
bits que se utilizan para representar la muestra del audio es la resolución de la muestra. Una resolución de 8
bits (1 byte) permite manejar valores de entre 0 a 255 (256 valores). Dicho de otra forma, para representar
una señal máxima de 255 necesitaré 8 dígitos binarios (0 o 1) y en este ejemplo, 255 es 1111111 en binario
(8 dígitos 1). Una palabra de 16 bits (2 bytes) maneja un valor máximo de 65535 (65536 si contamos el 0
como valor), 1111111111111111=65535.
Archivo de audio cargado en WaveLab 3.0. Como siempre, en la
parte inferior nos muestran los "atributos" de dicho archivo, en este
caso, estéreo a 16 bits y 44.1kHz de frecuencia de muestreo.

De esta forma, cada uno de las 44100 capturas realizadas contienen un valor codificado en "x" bits. Cuanto mayor sea la resolución,
más calidad tendrá la grabación. Tanto la frecuencia de muestreo como la resolución tienen incidencia directa en la calidad de la
grabación y reproducción de audio digital. La resolución, por su parte, también tiene incidencia directa en el rango dinámico o relación
señal-ruido de la grabación (abreviada S/R o S/N en inglés y se mide en dB o decibelios). Existe una relación que indica que esta
relación S/N es igual al resultado de multiplicar la resolución de bits por 6. Una grabación a 8 bits posee una relación S/N de 54dB, una
de 16 bits 96dB y 144dB a 24 bits. Tengamos en cuenta que estos dB son valores teóricos y que en la práctica bajan sustancialmente
debido a los componentes analógicos de los grabadores tarjetas de sondo, etc... Lo normal es que un grabador a 16 bits alcance los 90-
92dB y lo extraordinario es que efectivamente nos entregue una S/N de 96dB. Para nosotros, los humanos, un rango dinámico de
entre 90 y 100dB es suficiente. Estas cifras salen del propio rango dinámico humano, la diferencia entre el umbral de dolor y el umbral
de audición

Existe una relación matemática entre los bits y la relación señal-ruido o rango dinámico: S/N = 6x(resolución de
bits)

 
Esta web es la única que permite buscar tarjetas de audio y software por
características. En este ejemplo el usuario está buscando una tarjeta de audio
con una frecuencia máxima de 48kHz, una resolución mayor de 16 bits (es
decir, 16, 24 o 32) y que funcione bajo Windows 95/98

El resultado de la búsqueda nos informa de la existencia de todos estos


modelos...¿sabrías decir cual suena mejor? Te ayudaré un poco, mejor "rango
dinámico".

3-Rango dinámico / Relación señal ruido

La relación señal ruido (S/N) es la diferencia entre el nivel de señal útil (música, sonido, etc...) y el nivel de ruido (ruido provocado por
señales eléctricas en el interior de un equipo electrónico). El ruido se mide sin ninguna señal a la entrada del equipo. Para calcular este
valor se toman mediciones del nivel de señal cuando se captura o se reproduce audio y se restan de las mediciones al mismo nivel sin
señal alguna en las que puede apreciarse el ruido inherente del propio aparato. Dicho de otra forma, es la diferencia entre el nivel de la
señal nominal y el nivel de la señal residual, al mismo nivel de trabajo. Una prueba muy sencilla, al escuchar música en tu mini-cadena
hi-fi, sube el volumen al máximo (en modo stop) y comprobarás como el ruido residual aumenta ¿te gusta?. Si con el volumen máximo
pulsases el "play", el audio se reproduciría a su máximo volumen, la diferencia de volumen entre ese audio "a tope" y ese ruido residual
es la S/N. Cuanto mayor sea la diferencia de volumen entre la señal útil y el ruido, mayor calidad tendrá el mismo. Técnicamente la
señal se mide en voltios y para pasar a dB se calcula el 20·log(S/N) donde S es el valor de la "Señal" y N el valor del "Ruido" o "Noise",
en inglés. Cuanto mayor sea el valor de S/N mayor calidad tendrá el audio.

Ahora planteémonos un problema muy interesante. El hombre, como especie animal, tiene una limitación en su oído; no podemos oír
toda la gran gama de frecuencias generadas en la naturaleza (o por medios artificiales, como esos antiguos mandos a distancia por
ultra-sonidos). A partir de las frecuencias cercanas a los 20.000Hz, el silencio penetra en nuestro oídos. ¿Qué puede ocurrir si registro
una señal de audio con un sonido que va más allá del umbral humano?

Imaginemos que estamos grabando audio con una frecuencia de muestreo de 44.1kHz y en ese audio se reproducen frecuencias
cercanas a los 29.000Hz (que naturalmente no podemos oír). Nuestra grabación registrará todas las frecuencias hasta los 22.050Hz
pero aparecerá un ruido de 15.1Hz (44.1kHz-29kHz), algo totalmente audible que en el original no existía. Estas frecuencias fantasma
se llaman "alias", dando nombre a una distorsión conocida como "aliasing". Para prevenir esto, tanto los sistemas de grabación de audio
como las tarjetas de sido incluyen un filtro "anti-alisasing" que no permite la entrada de frecuencias superiores a la mitad de la
frecuencia de muestro; estamos hablando otra vez de Nyquist .

Folleto publicitario del conversor ADDA de Pro Tools 888-24. Observa


sus características. ¿Te suenan?.

Folleto publicitario del sistema MOTU 1224 a 24 bits. Posee un rango


dinámico increíble, casi 116dB. ¿significa eso que es el que mejor
suena?.

Tarjeta Pulsar de Creamware junto con su panel de configuración. En


esta ocasión esta trabajando a 44.1kHz .
Santi Fernández: santi@dsp-world.com

También podría gustarte