Está en la página 1de 5

Tutorial sobre Profundidad de bits y Frecuencia de Muestreo - Masterización

Menú BUSCAR

Profundidad de bits y Frecuencia de Muestreo


Por Sergio Patiño | Versión Imprimible | Tutoriales >> Masterización

¿Por qué no más de 24 bits ni 48 KHz?

Si tuvieras un automóvil VW sedan y nos dijeran que alcanza 250 Km por hora ¿lo manejarías a esa velocidad?
Existen un millón de argumentos para no hacerlo pero todo se resume a una sencilla razón y es que no está equipado
para desarrollar esa velocidad, lo mismo ocurre con nuestras interfaces o placas de sonido que nos ofrecen 32 bits y
192 KHz pues no están equipadas para manejar estas altísimas resoluciones. Para explicar esto voy a dividir el tema
en dos grandes puntos: profundidad de bits ( bit depth o wordlength ) y frecuencia de muestreo ( sample rate ).

Lo primero que debemos considerar es que nuestras placas de sonido o interfaces son en realidad convertidores
analógico/digital/analógico y en términos simples lo que hacen es convertir el sonido a datos ( bytes ) para poderlos
procesar en nuestras computadoras y después los regresan de datos a sonido para que los podamos escuchar.

Al sonido, como a cualquier otra cosa, para representarlo en términos digitales se le debe asignar un tamaño de
muestra ( bits, cada 8 de estos conforman un byte ) y un número de muestras por segundo ( Hertz ).

Profundidad de Bits

Lo que la profundidad de bits nos dice es: de qué tamaño será cada una de las muestras, entre mayor sea el tamaño
de muestra mayor cantidad de información podremos tener de cada una y lógicamente nuestros archivos también
serán más grandes. Las diferentes profundidades que encontramos en audio son: 8, 16, 20, 24, 32 y 64 bits.

Si tenemos 24 bits para cada muestra ¿qué pasará al llegar al bit número 25? Cuando rebasamos el número de
espacios asignados para definir nuestra muestra (wordlength) significa que ya no hay manera de interpretar datos
para generar sonido y lo que obtenemos es lo que se conoce como ‘cama de ruido' a este fenómeno en el que se crea
ruido por ‘indefinición', porque ya no tenemos manera de expresar algo más allá del número de bits asignado y se le
llama ‘truncado de muestra'. En términos prácticos esto es el ‘Hiss' y es equivalente al ruido que encontramos en una
cinta analógica, la diferencia es que en un entorno analógico el ruido es producido por la fricción entre la cinta y la
cabeza lectora mientras que en el entorno digital el ruido es producto del ya mencionado truncado de muestra o
wordlength truncation . Y entre más bits de wordlength tengamos la cama de ruido estará más abajo en volumen. De
esto también se desprende el que entre más bits haya en el wordlength la información adicional que podemos captar
corresponderá a la parte más tenue del sonido. A este fenómeno se le conoce como ‘rango señal a ruido' o signal to
noise ratio

El volumen lo expresamos en deciBeles (dB) y contrario a lo que pudieramos pensar esta medida no corresponde a
volumen sino a presión (fuerza sobre una superficie), en el caso particular del sonido nos referimos a la presión del
aire sobre nuestros oídos y se abrevian dBSPL (en inglés deciBels Sound Pressure Level ) y sus valores van de 0
hacia (infinito). A su vez los aparatos de audio tienen su propia manera de ‘medir' el volumen y lo hacen a partir
de 0 como valor máximo hacia - o donde empiece la cama de ruido del sistema y siempre en números negativos,
esto representa el voltaje necesario para producir un cierto volumen o mejor dicho una cierta potencia; estos valores
corresponden a los deciBeles de escala completa o dBFS ( deciBels Full Scale ). Dentro de nuestro tema los dBFS
son lo que nos interesan pues así podemos calcular la cama de ruido para cada profundidad de bits así como algunas

http://www.yio.com.ar/contenido.php?artid=57[23/11/2017 01:05:41 a.m.]


Tutorial sobre Profundidad de bits y Frecuencia de Muestreo - Masterización

aproximaciones para entornos analógicos. En sistemas analógicos la cama de ruido es variable y en el entorno
digital la cama de ruido es exacta. Así obtenemos la siguiente tabla:

Debemos tener en cuenta que estos son valores teóricos, debido a muchísimos factores en la práctica en un
convertidor profesional de mínimo 5,000 dls. el valor más bajo está alrededor de -127 dBFS para 24 bits. Como
podemos ver el término ‘profundidad de bits' es debido a que los dBs van hacia abajo.

Hasta ahora entre más profundidad de bits mejor pero las cosas se complican cuando tenemos que llevar nuestras
grabaciones o masterizaciones a un medio de menor resolución, como lo dice la tabla si establecemos una
profundidad de 24 bits o grabamos en un DAT y su destino es un CD entonces al terminar debemos ‘bajar' el sonido
resultante a 16 bits el problema que esto representa se ilustra en el siguiente ejemplo:

Si dividimos el número 23 entre 7 el cociente será 3.28, ahora, digamos que solo tenemos dos dígitos para expresar
este cociente. La manera más sencilla sería truncar el número a 3.2 pero nos quedaríamos lejos del valor real, lo
correcto sería redondear la cantidad y así obtenemos 3.3 que está mucho más cerca del cociente en cuestión.

Supongamos ahora que los tres dígitos de 3.28 corresponden a un wordlength de 24 bits y los dos dígitos
corresponden a un wordlength de 16 bits, al truncar el número a 3.2 nos estamos perdiendo una parte de la
información y necesitaremos redondearla para obtener una mejor aproximación, regresando a nuestro tema, en el
audio lo que se utiliza para ‘redondear' la información es conocido como dither que mediante la introducción de una
señal aleatoria (ruido) hace un promedio con la información ‘enterrada' en el ruido del truncado y ‘rescata' parte de
esa información, luego, para terminar de ‘redondear' se utiliza el noiseshaping el cual introduce a la señal un ruido
controlado y difícil de escuchar para el oído humano para ‘enmascarar' el ruido restante del truncado.

Cada vez que tenemos que bajar de profundidad de bits ( downsampling ) debemos realizar este proceso pero como
todo en este mundo lo bueno cuesta y aunque tengamos 24, 32 o incluso 64 bits como nos lo ofrecen los fabricantes
debemos contar con un muy buen dither y noiseshaping que además de su elevado costo debemos tomar en cuenta
que los detalles que nos ofrecen las resoluciones de 24 y 32 bits se encuentran, como ya dijimos, en la parte más
tenue del sonido a la que no somos muy sensibles.

http://www.yio.com.ar/contenido.php?artid=57[23/11/2017 01:05:41 a.m.]


Tutorial sobre Profundidad de bits y Frecuencia de Muestreo - Masterización

Si por el contrario tenemos el número del ejemplo, 3.3 (16 bits) y lo queremos regresar a los 3 dígitos (24 bits) no
sabemos si provino de un 3.32 o de un 3.29 por lo que lo único que podemos hacer es agregarle ceros, 3.30 los
cuales no tienen ningún significado en cuanto a información hasta que a ese 3.30 se le aplique algún proceso en el
que se ‘llenen' esos ceros y al regresar a 16 bits necesitaremos usar de nuevo el dither por lo que así como su
explicación se convierte en un ir y venir de ruido.

En conclusión, si no tienes un estudio profesional grabar o masterizar en 24 bits sin un buen dither y noiseshaping
quedará igual o peor que hacerlo directamente en 16. En los estudios grandes se procesa el sonido en 24, 32 y 64
bits punto flotante y utilizan incluso módulos específicos de dithering y NS pero para un estudio casero sin el
monitoreo y acústica apropiados no vale la pena gastar en placas que nos ofrecen tal profundidad.

Frecuencia de Resolución

Este es el otro componente crucial del dominio digital pero ¿qué significa 44.1, 48, 96 y 192 KHz? En términos
sencillos esto quiere decir cuántas muestras se podrán analizar por segundo, si tenemos una profundidad de 24 bits a
48 KHz (que es la resolución de un DAT) significa que podremos procesar 48000 muestras por segundo de 24 bits
cada una, entre mayor sea la frecuencia de muestreo mayor número de muestras tendremos y por consiguiente
podremos analizar a mayor detalle.

Hasta ahora como en el caso de la profundidad de bits entre mayor resolución tengamos mejor pero en nuestro caso
no es así y es aquí donde vamos a resolver el mito de las altísimas frecuencias de muestreo que no nos dan un
beneficio y sin embargo entre mayor resolución mayor costo para nosotros.

La primera razón es la limitación de la frecuencia más alta para analizar:

Cómo sabemos el sonido también posee frecuencias y por supuesto esta también se mide en Hertz (Hz). La
frecuencia se define en términos sencillos como el número de ciclos completos por segundo que ocurren (un periodo
positivo y uno negativo), veamos la siguiente figura.

La línea horizontal del medio representa tiempo, en este caso fracciones de segundo, los rectángulos representan una
muestra de una resolución de supongamos 48 KHz, dentro de cada cuadro encontramos la fase positiva de una onda
y en el siguiente la fase negativa de la misma onda, ahora haciendo aritmética sencilla podemos notar que
necesitamos dos muestras (rectángulos) para analizar la onda completa (fase positiva y negativa) por tanto podemos
concluir que la frecuencia más alta que podemos analizar en un muestreo de 48 KHz es 24 KHz esto debido a que
separar una onda es sus componentes positivo y negativo es el tamaño más grande que podemos analizar; así
obtenemos las siguiente imagen:

Si tuvieramos una frecuencia de 48 KHz para analizar en una frecuencia de muestreo de igualmente 48 KHz
obtendríamos algo así:

http://www.yio.com.ar/contenido.php?artid=57[23/11/2017 01:05:41 a.m.]


Tutorial sobre Profundidad de bits y Frecuencia de Muestreo - Masterización

A todo esto debemos agregar que el oído humano promedio solo es sensible en un rango comprendido entre 22 Hz y
16 KHz mientras que un oído entrenado logra escuchar entre 20 Hz y 20 KHz por lo que aún la resolución de un CD
(44.1 KHz) quedará muy por encima de la frecuencia más alta que podemos oír, es decir puede analizar hasta 22.05
KHz. Con esto podemos asumir que el beneficio se obtiene para frecuencias más bajas pues las puede dividir en
‘rodajas' más pequeñas, el problema viene al momento de hacer la conversión analógico-digital-analógico.

El sonido que producimos con nuestros instrumentos se transmite en forma de vibraciones (Movimiento Armónico
Simple) y lo podemos traducir a impulsos eléctricos y magnéticos, esto es lo que corresponde al dominio analógico,
en otras palabras es una especie de ‘fotografía' electromagnética del sonido que escuchamos. Nuestras placas de
sonido o interfaces se encargan de traducir dichos impulsos en datos (1's y 0's). Es al momento de hacer esta
conversión analógico a digital ( A/D ) donde se presentan los problemas en resoluciones altas con equipo de bajo
costo pues al entrar el sonido se realiza lo que se comoce como Noise Reduction y que consiste en elevar a una
frecuencia mucho más alta de la que se va a trabajar, tomar el ruido y ‘subirlo' fuera del rango audible del ser
humano una vez hecho esto el sonido se regresa a la frecuencia de resolución establecida. En este tipo de
convertidores ADC ( Analog-Digital-Converter ) baratos los filtros establecidos para esta reducción de ruido
introducen un sonido ‘cajoso' similar al de los reproductores de CD baratos lo malo es que no podemos notar este
sonido al momento de grabar y mezclar debido a que queda enmascarado por efecto del jitter (estos conceptos se
explicarán posteriormente) que es un fenómeno pasajero y no se queda en nuestra grabación, sin embargo el sonido
‘cajoso' sí queda grabado y se traduce en un sonido chico y apagado. El aliasing también producto de un mal
filtrado interviene y consiste en que una alta frecuencia introduce ‘fantasmas' en el rango de fracciones de su valor o
viceversa, estos fantasmas son puntos en la frecuencia de muestreo que pueden corresponder a cualquiera de las dos
frecuencias, la original o su fracción y al momento de hacer la conversión D/A el convertidor no sabe de quién vino
esta señal.

En este ejemplo la frecuencia alta (en color rojo) tiene los mismos puntos de muestreo que una frecuencia baja (en
color azul). Supongamos que la frecuencia alta vale 48 KHz (que sería la más alta en un SR de 96 KHz) dado que
por cada ciclo completo en azul caben 10 ciclos completos en rojo tenemos que su valor es de un décimo de esta, es
decir 4.8 KHz que ya está dentro de nuestro rango audible, con un filtrado deficiente (que es justo lo que ocurre con
placas de tan altas resoluciones y bajos costos) el DAC no sabe a quién corresponde esa información y cada vez que
opte por los 4.8 KHz vamos a oír cosas (fantasmas) que no estaban ahí en un principio.

Por último tenemos el PLL ( Phase-Lock Loop ) que es el encargado de mover la información dentro del convertidor
bit por bit es decir, mueve los 0's y 1's uno a la vez y debe hacerlo a una velocidad altísima para que no lo notemos,
este chip está controlado por un cristal de cuarzo que debe ser extremadamente preciso y debe estar sincronizado
con el reloj que va a controlar la frecuencia de muestreo, si el PLL no es de buena calidad vamos a tener un sonido
muy malo en la conversión D/A pero no afectará la información dentro de la computadora, es decir, no va a

http://www.yio.com.ar/contenido.php?artid=57[23/11/2017 01:05:41 a.m.]


Tutorial sobre Profundidad de bits y Frecuencia de Muestreo - Masterización

distorsionar el sonido, por el contrario un mal PLL al momento de hacer la conversión de entrada (A/D) va a afectar
el sonido de manera permanente e irreversible.

En conclusión, el problema no es la alta resolución en sí sino la mala calidad de los componentes del convertidor
pues entre mayor resolución tengamos en una placa o interfaz de bajo costo mayor será el número de ‘artefactos' que
introducirán al sonido. Para darnos una idea una placa de sonido de 10 x 10 I/O que conocemos cuesta entre 400 y
1000 dls. mientras que un convertidor A/D de 8 entradas de la más alta calidad lo podemos comprar por la módica
cantidad de 8,500 dls. sin mencionar que nos hará falta un convertidor D/A del mismo precio, además
necesitaríamos una interfaz para que ese sonido digitalizado entre a nuestra estación de trabajo.

He ahí las razones de por qué no deberíamos pasar de una resolución de 48 KHz y de una profundidad de 24 bits
porque esas altísimas resoluciones nos son más que mercadotecnia pues realmente nos entregan lo que dicen pero a
costa de un gran daño a nuestro sonido.

Sergio Patiño (noisemastering)


Director General
Noise Mastering Studio®
www.noisemastering.com

[ Volver Masterización | Índice de categorías de tutoriales ]

http://www.yio.com.ar/contenido.php?artid=57[23/11/2017 01:05:41 a.m.]