Está en la página 1de 14

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

UNIDAD DIDACTICA 9: FUNDAMENTOS DEL SONIDO DIGITAL


9.1. Fundamentos
El audio digital introduce conceptos completamente nuevos y tcnicas muy distintas de las
utilizadas en la tecnologa de audio analgica. Con la tecnologa digital, debemos pensar en la
informacin, su almacenamiento y procesado de una nueva manera.
A estos efectos, unas comparaciones pueden sernos tiles a la hora de mostrar sus diferencias,
as como a la hora de hablar de ventajas y desventajas de una respecto a otra.
Imaginemos a dos ingenieros de sonido juntos, dispuestos a grabar a una orquesta. El primero
usa un rodillo de papel y un lpiz, el segundo un bloc de notas y otro lpiz.
Conforme empieza la msica, el primero comienza a dibujar una forma de onda continua que
sigue en amplitud y frecuencia a las variaciones de los sonidos que va produciendo la
orquesta, mientras el rodillo de papel va girando. El segundo, en cambio, va escribiendo
nmeros a alta velocidad (millones de dgitos por segundo).
Cuando termina la ejecucin de la orquesta, los dos ingenieros vuelven al comienzo de su
grabacin y comienzan a reproducirla.
Tanto uno como otro utilizan mtodos para formar una representacin de la msica intentando
hacerlo de la manera ms exacta posible. El sistema analgico se basa en obtener una rplica
continua de la forma de onda acstica. El sistema digital chequea peridicamente la forma de
onda y graba una aproximacin del valor instantneo. As su grabacin difiere
considerablemente de la grabacin analgica.
El mtodo analgico proporciona un juego de valores infinitos, mientras que el mtodo digital
proporciona muchas piezas discretas de informacin. El mtodo digital es altamente eficiente,
ya que los nmeros con los que almacena la informacin son fcilmente salvados y
recuperados.
Una seal analgica y otra digital pueden ser comparadas, segn la analoga de Blesser con un
balde de agua y otro de bolas de rodamientos. Tanto el agua como las bolas llenan sus
contenedores y sus volmenes pueden ser determinados por la cantidad de sus contenidos,
pero los procedimientos son distintos.
Con el agua, podramos pesar el balde lleno, el balde vaco, deducir el peso del agua y
calcular as el volumen que representa. O quizs, ir sacando el agua con un recipiente
calibrado, e ir sumando las cantidades sacadas. En cualquier caso corremos el riesgo de verter
agua dejar algo en el fondo del balde, de modo que nuestra medida sera imprecisa.
Con el balde de bolas, podramos simplemente contar cada una de ellas y calibrar el volumen
del balde en trminos de bolas que contiene. La medida sera relativamente precisa pero
bastante laboriosa (podramos dejar a un ordenador la tarea de contar). Las bolas representan
los valores discretos en un sistema digital y destacan el hecho de que con tcnicas digitales
seremos capaces de cuantificar nuestros valores y ganar informacin ms exacta acerca de
nuestra medida. En general, la precisin es fundamental en cualquier sistema digital. Por
ejemplo, un balde en el que hayamos medido 1 litro de agua, es menos til que un balde que
hayamos medido que contiene 6748 bolas. Adems, el balde de bolas es una situacin ms
permanente.
Si intentamos llevar el balde de agua de un sitio a otro, fcilmente podramos derramar parte
de su contenido. El balde de bolas se podra transportar ms fcilmente, con menos
oportunidad de prdida de informacin. La repetibilidad de cada caso es diferente.
Una vez hechas las medidas, podramos intentar recrearlas. Podramos llenar otro balde
distinto con 1 litro de agua, pero el balde puede ser de tamao distinto y podramos quedarnos
cortos largos. Por otro lado, las 6748 bolas pueden contarse con total fiabilidad en cualquier
contenedor y en cualquier momento.

U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 1

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

Conceptualmente, como vemos en esta analoga, el sistema digital es mucho ms simple ya


que contar nmeros es mucho ms fcil que tratar con flujos continuos de seal.
Es decir, es ms fcil usar datos para representar valores de una seal, que tratar con los
valores mismos directamente. Pero en la prctica, el equipo requerido para conseguir esta
simple tarea debe ser ms sofisticado que cualquier equipo analgico.
Por supuesto, la tecnologa de grabacin y reproduccin de audio implica algo ms que las
bolas, pero esta analoga es bastante descriptiva.
Con el audio digital, el evento analgico original se convierte en un flujo de datos binario que
se procesa, almacena y se distribuye como una representacin numrica. El proceso inverso,
esto es, el de conversin del dato a la forma analgica ocurre al reproducirse, en manos del
consumidor, eliminando as posibilidades de degradacin.
De todos modos, aunque los sistemas digitales carezcan de muchos problemas inherentes a los
sistemas analgicos, pueden exhibir anomalas propias, como lo es el de la aproximacin que
supone representar con nmeros finitos unos valores de amplitud variables infinitamente.
Podramos concluir en referencia al smil anterior que el audio analgico es exacto pero no
preciso (cantidad de agua), mientras que el audio digital es preciso, pero no exacto (nmero
de bolas).
9.2. Los sistemas de numeracin
En el audio digital usamos nmeros para representar totalmente la informacin
proporcionando un buen sistema para almacenamiento y procesamiento de datos, siempre y
cuando hayamos previsto un formato que no de lugar a falsas interpretaciones.

TABLA DE CONVERSIN DECIMAL / BINARIO / HEXADECIMAL

Hexadecimal
(Base 16)
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F

Decimal
(Base 10)
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

Octal
(Base 8)
0
1
2
3
4
5
6
7
10
11
12
13
14
15
16
17

Binario
(Base 2)
0000
0001
0010
0011
0100
0101
0110
0111
1000
1001
1010
1011
1100
1101
1110
1111

PAGINA 2

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

TABLA CONVERSIN SISTEMAS NUMERICOS

DECIMAL
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
DECIMAL

BINARIO
0000000
0000001
0000010
0000011
0000100
0000101
0000110
0000111
0001000
0001001
0001010
0001011
0001100
0001101
0001110
0001111
0010000
0010001
0010010
0010011
0010100
0010101
0010110
0010111
0011000
0011001
0011010
0011011
0011100
0011101
0011110
0011111
0100000
0100001
0100010
0100011
0100100
0100101
0100110
0100111
0101000
0101001
0101010
0101011
BINARIO

HEXADEC.
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
10
11
12
13
14
15
16
17
18
19
1A
1B
1C
1D
1E
1F
20
21
22
23
24
25
26
27
28
29
2A
2B
HEXADEC.

DECIMAL
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
DECIMAL

BINARIO
0101100
0101101
0101110
0101111
0110000
0110001
0110010
0110011
0110100
0110101
0110110
0110111
0111000
0111001
0111010
0111011
0111100
0111101
0111110
0111111
1000000
1000001
1000010
1000011
1000100
1000101
1000110
1000111
1001000
1001001
1001010
1001011
1001100
1001101
1001110
1001111
1010000
1010001
1010010
1010011
1010100
1010101
1010110
1010111
BINARIO

U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

HEXADEC.
2C
2D
2E
2F
30
31
32
33
34
35
36
37
38
39
3A
3B
3C
3D
3E
3F
40
41
42
43
44
45
46
47
48
49
4A
4B
4C
4D
4E
4F
50
51
52
53
54
55
56
57
HEXADEC.

DECIMAL
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127

BINARIO
1011000
1011001
1011010
1011011
1011100
1011101
1011110
1011111
1100000
1100001
1100010
1100011
1100100
1100101
1100110
1100111
1101000
1101001
1101010
1101011
1101100
1101101
1101110
1101111
1110000
1110001
1110010
1110011
1110100
1110101
1110110
1110111
1111000
1111001
1111010
1111011
1111100
1111101
1111110
1111111

HEXADEC.
58
59
5A
5B
5C
5D
5E
5F
60
61
62
63
64
65
66
67
68
69
6A
6B
6C
6D
6E
6F
70
71
72
73
74
75
76
77
78
79
7A
7B
7C
7D
7E
7F

DECIMAL

BINARIO

HEXADEC.

PAGINA 3

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

9.3. Parmetros fundamentales del audio digital


El uso de los mtodos digitales para la grabacin, reproduccin y almacenamiento de las
seales de audio digital introduce varios conceptos extraos a los mtodos del audio
analgico. De hecho, los sistemas de audio digital guardan poca relacin con los sistemas
analgicos, especialmente en trminos de procesamiento de la informacin de audio. Ya que
el audio o el sonido es, en s misma, de naturaleza analgica, los sistemas digitales utilizan el
muestreo y la cuantizacin, los dos pilares sobre los que se basa el audio digital, para
transformar la informacin de audio. Se deben tomar precauciones para combatir dos tipos
fundamentales de distorsin, el aliasing (generacin de frecuencias errneas) y el error
resultante de la cuantizacin de la forma de onda analgica.
9.4. El muestreo
La primera pregunta que surge en un sistema digital es cmo vamos a grabar nmeros que
corresponden a una forma de onda analgica cambiante en el tiempo. Pues bien, la
digitalizacin utiliza el muestreo en tiempo y la cuantizacin de amplitud para codificar la
forma de onda analgica variable (valores infinitos) como valores discretos en tiempo y
amplitud.
9.4.1. La naturaleza del muestreo
Pongamos un ejemplo: Un reloj analgico nos muestra el paso del tiempo que parece fluir
continuamente y sus manecillas barren la superficie del reloj cubriendo todo el tiempo que
discurre sobre l. Un reloj digital tambin nos da la hora, pero con una lectura digital con
valores discretos. En otras palabras, nos da el tiempo muestreado. Pues ocurre los mismo con
la msica. Esta vara continuamente en tiempo y puede ser grabada y reproducida bien en
forma analgica continua o bien en forma digital muestreada en tiempo. As como los dos
relojes nos dicen lo mismo, los dos tipos de grabacin reproducen la misma msica.
El muestreo en tiempo es el mecanismo esencial que define un sistema de audio digital,
permite su conversin analgico-digital y lo diferencia de un sistema analgico.
Pero si un sistema digital muestrea discretamente, qu ocurre entre las muestras?. No
perderemos informacin que ocurra entre los tiempos de muestra?. La respuesta es NO. Las
muestras contienen la misma cantidad de informacin como la seal sin muestrear.
Del mismo modo que los fotogramas discretos de una pelcula crean una imagen en
movimiento, las muestras de una grabacin de audio digital crean una msica que vara en el
tiempo; hay muy poca diferencia conceptual entre el sistema visual y el aural o sonoro. Del
mismo modo que no hay prdida de informacin entre los fotogramas de una pelcula grabada
adecuadamente, tampoco hay prdida de informacin entre las muestras de una grabacin de
audio digital.
El muestreo es, por tanto, un proceso sin prdidas si la seal es acondicionada
adecuadamente. Por tanto, en un sistema de audio digital, deberemos tratar la seal analgica
que vamos a digitalizar, es decir, la seal analgica se filtra con un pasa-bajos (las
frecuencias demasiado altas como para poder ser muestreadas correctamente se eliminan).
Evidentemente, disearemos el sistema de modo que el umbral de estas frecuencias filtradas
est por encima del lmite audible del odo humano.
9.4.2. El teorema del muestreo
Cuando la seal de entrada es filtrada pasa-bajo, podremos tericamente muestrear la seal de
forma que no haya prdida de informacin (debido al muestreo) entre la seal de salida
muestreada y la seal de entrada suavizada. Esto no es una aproximacin, sino tan exacto
como se demuestra en el teorema de muestreo de Nyquist.
U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 4

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

El mtodo de muestreo de tiempo discreto define solamente valores instantneos. De todas


formas, se puede demostrar matemticamente que una seal limitada en banda y muestreada
contiene la misma cantidad de informacin que la seal original suavizada sin muestrear.
Cuando la seal es suavizada, podemos calcular todos los valores que intervienen sin error y
as recrear la forma de onda original. La forma de onda analgica variable continuamente es
muestreada para crear una serie de pulsos; la amplitud de cada pulso se determina desde una
escala vertical que nos dar un nmero que representa la amplitud analgica en ese instante.
Para cuantificar la situacin, definimos el Rango de muestreo como el nmero de muestras
por segundo. Su recproco, el Tiempo de muestreo, es el tiempo entre cada muestra. Por
ejemplo, un tiempo de muestreo de 1/40.000 segundos corresponde a 40.000 muestras por
segundo.
Es obvio que una forma de onda que cambia rpidamente, esto es, una con altas frecuencias,
requerir un tiempo de muestreo ms corto. As, el rango de muestreo determinar la
respuesta de frecuencia y el ancho de banda del sistema de digitalizacin. La eleccin del
rango de muestreo es uno de los criterios de diseo ms importantes de un sistema de
digitalizacin ya que determina el ancho de banda del sistema de digitalizacin.
Pero, Cun a menudo deberemos muestrear para representar con exactitud una forma de
onda musical?.
El Teorema de muestreo responde esta cuestin del Rango de muestreo. Nyquist demostr
que son precisas S muestras por segundo para representar completamente una seal con un
ancho de banda de S/2 Herzios. En otras palabras, deberemos muestrear a un rango que es dos
veces la frecuencia ms alta de la seal a digitalizar, para obtener un muestreo sin prdidas.
As, una seal con una respuesta de frecuencia entre 20 Hz y 20.000 Hz, requerir
tericamente un rango de muestreo de 40 KHz para una codificacin digital adecuada.
Es crucial observar el criterio del teorema de muestreo para limitar la seal de entrada a no
ms que la mitad de la frecuencia de muestreo. Las frecuencias demasiado altas en un sistema
de digitalizacin causaran distorsin. Esto se examina en ms detalle en la seccin 2.2. Un
filtro pasa-bajos precede siempre al circuito de muestreo para remover las frecuencias por
encima de la mitad de la frecuencia de muestreo. A la salida del sistema de audio digital
tambin se coloca un filtro pasa-bajos para eliminar las altas frecuencias creadas internamente
por el sistema. Este filtro suaviza el efecto de peldaos en la forma de onda muestreada
reconstruida para obtener la forma de onda original.
Del teorema de muestreo podremos deducir que las bajas frecuencias sern fcilmente
muestreadas y, debido a sus largas longitudes de onda habr muchas muestras para
representar cada periodo. Pero conforme las frecuencias se hacen ms altas, las longitudes de
onda se hacen ms cortas y habr menos muestras por periodo. Finalmente, en el caso lmite
del muestreo crtico, habr solamente dos muestras por periodo. De todas maneras, incluso
dos muestras pueden representar correctamente una forma de onda.
En el muestreo crtico, no hay garanta de que los tiempos de muestreo coincidan con los
mximos y mnimos de la forma de onda. Las muestras pueden ser de partes de ms baja
amplitud de la forma de onda e incluso coincidir con el cruce por cero de la forma de onda.
En la prctica no hay ningn problema, ya que nunca se suele llegar al muestreo crtico por
utilizarse un margen de muestreo.
Para satisfacer el teorema de muestreo, los fabricantes disean filtros pasa-bajos en los
sistemas de digitalizacin colocndolos al principio de la cadena de seal. Ya que estos filtros
no pueden cortar la seal tan rpidamente como demanda el teorema de muestreo, se emplea
una banda de frecuencias de guarda. El codo del filtro pasa-bajos empieza unos miles de
Herzios antes de la frecuencia mxima a muestrear, para asegurar una atenuacin suficiente
de las frecuencias superiores a la misma.
U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 5

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

La cuestin, por supuesto, es la demanda que hacemos sobre el circuito digital y el medio de
almacenamiento. Rangos de muestreo ms altos requieren que el circuito funcione ms rpido
y que se almacenen ms cantidades de datos.
Estas dos cuestiones son aspectos econmicos, y los fabricantes han elegido una frecuencia de
muestreo estndar de 44,1 KHz para el Compact Disc, con un rango de frecuencias de 20Hz a
20.000 Hz, que puede ser producido de modo abordable.
Otro fenmeno que suele ocurrir consiste en que el muestreo crea duplicados del espectro de
la forma de onda que entra en el sistema, en forma de mltiplos de la frecuencia de muestreo
llamadas imgenes. Estas imgenes de alta frecuencia son eliminadas con otro filtro pasabajos (anti-imagen) a la salida del sistema de digitalizacin.
Con el muestreo, no hay ninguna prdida de informacin. El Teorema de muestreo de Nyquist
lo demuestra. Pero de todas formas, el muestreo temporal es slo parte del problema. Un
sistema digital debe tambin determinar los valores numricos correspondientes a cada
muestra de la seal para representar la amplitud de la forma de onda original.
9.4.3. Eleccin de la frecuencia de muestreo
En los primeros das de la grabacin digital, surgi la necesidad de un ancho de banda de 1
Mbit por segundo por canal de audio y este era difcil de almacenar. Los discos duros tenan
esa anchura de banda pero no capacidad para largos tiempos de grabacin. Se puso atencin
en los vdeograbadores, y se adaptaron para almacenar muestras de audio en una forma de
onda de pseudo-vdeo. El rango de muestreo de tales sistemas estaba condicionado
directamente por el rango de campos y estructura del estndar de televisin usado, de modo
que un nmero entero de muestras pudiera ser almacenado sobre cada lnea til de Televisin
en cada campo. Desafortunadamente, slo hay dos estndares:

525 lneas (35 lneas no tiles) y 59.94 Hz (frecuencia de campo) para el sistema
NTSC

625 lneas (37 lneas no tiles) y 50 Hz (frecuencia de campo) para el sistema PAL
Los valores de frecuencia de muestreo permitidos en estos pseudo-sistemas de vdeo pueden
ser deducidos multiplicando el numero de campos por el nmero de lneas activas en el campo
y, de nuevo, por el nmero de muestras en una lnea (cada componente RGB).
As, para el sistema NTSC, asumiendo 3 muestras por cada lnea nos dar:
S = (525 - 35/2) x 59,94 x 3 = 245 x 179,82 = 44,0559 KHz
y para el sistema PAL, asumiendo lo mismo:
S = (625 - 37/2) x 50 x 3 = 294 x 150 = 44,100 KHz
Solamente hay una diferencia del 0,1 % entre estas dos frecuencias.
Para el CD, paradjicamente aunque no tenga ningn circuito de tipo vdeo, se eligi como
frecuencia de muestreo estndar el de 44,1 KHz, ya que los equipos usados para hacer los
masters de CD estaban basados en vdeo y esto al final determin esa frecuencia de muestreo.
Para equipos profesionales se decidi utilizar 48 KHz como frecuencia de muestreo. Y para
aplicaciones de radio se decidi utilizar 32 KHz, limitando la anchura de banda a 15 KHz
9.5. Aliasing
Un problema particular de los sistemas de digitalizacin de audio es el del aliasing o
generacin de seales errneas que pueden aparecer en la banda de audio y que son
imposibles de distinguir de las seales legtimas.
Ya hemos visto que el muestreo es un proceso sin prdidas, bajo ciertas condiciones. La ms
importante es que la seal de entrada debe estar limitada en banda, esto es, que un circuito
pasa-bajos debe preceder al circuito de muestreo.

U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 6

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

Si esto no se hace, puede resultar en la generacin de efectos altamente indeseables, el


aliasing. Los cambios de amplitud en las seales de muy alta frecuencia no sern
adecuadamente codificados, de modo que perderemos informacin, pero adems , este
undersampling tambin crear seales errneas completamente nuevas, que es otra forma de
distorsin. (Recordemos el efecto de las ruedas de los carros en las pelculas antiguas de
vaqueros. Conforme el carro acelera, las ruedas giran en un sentido, parece que se ralentizan,
luego se paran y por ltimo empiezan a girar en sentido contrario).
El fenmeno del aliasing es una consecuencia de una condicin no permitida en la teora del
muestreo; Nyquist ha demostrado que la frecuencia ms alta de la seal en un sistema de
muestreo puede solamente ser igual menor que la mitad de la frecuencia de muestreo. Si la
frecuencia de esa seal es ms alta ocurrir inevitablemente el aliasing.
Conforme la frecuencia de la seal se hace mayor y mayor, el nmero de muestras por ciclo
se hace menor. Cuando se llega a la mitad de la frecuencia de muestreo, solamente hay dos
muestras por ciclo, el mnimo absoluto necesario para grabar la naturaleza bipolar de una
forma de onda. Si intentamos muestrear incluso frecuencias superiores, como la frecuencia de
muestreo permanece constante, las escasas muestras tomadas crean una informacin falsa
originndose nuevas frecuencias descendentes.
En general, si S es la frecuencia de muestreo y F es una frecuencia superior a la mitad de S,
entonces se genera una nueva frecuencia muestreada (aliasing) A cuya frecuencia ser:
A=SF
Por ejemplo, si S = 44 KHz y F = 32 KHz, se obtendr una A = 76 KHz y 12 KHz.
En otras palabras, aparece otras frecuencias de aliasing en la banda de audio. Las frecuencias
errneas que se generan ms all de la mitad de la frecuencia de muestreo (76 KHz) sern
eliminadas por el filtro pasa-bajos de salida, que usamos para suavizar el aspecto de escalera
de la forma de onda de salida, pero no as el resto (12 KHz).
Veamos otro ejemplo: supongamos un sistema digital donde S es de 44 KHz y que, de alguna
manera, una seal de 36 KHz se ha introducido en el mismo. El muestreo ser errneo y nos
dar una seal de 8 KHz y otra de 80 KHz. Despus del filtro pasa-bajos de salida, la seal de
36 KHz (la original) y la de 80 KHz sern eliminadas y nos quedar solamente la de 8 KHz.
Por tanto, las seales indeseadas afectan a la fidelidad de nuestro sistema de audio digital
causando distorsin.
9.5.1. Aliasing de imagen
Hay otras manifestaciones del aliasing. Los componentes de alias no solamente ocurren
alrededor de la frecuencia de muestreo, sino tambin en las imgenes producidas por el
muestreo (imaging). Por ejemplo, en un fenmeno de aliasing de imagen se producirn los
siguientes componentes: S F , 2S F , 3F S, 4F S, etc... es decir:
Ai = n S F
As, en el ejemplo del apartado anterior (S = 44 KHz y F = 36 KHz) se producirn los
siguientes componentes de frecuencia:
8 KHz, 52 KHz, 80 KHz, 96 KHz, 124 KHz, 140 KHz, etc..
Aunque solamente nos interesarn los componentes S - F, ya que son las que interferirn en la
banda de audio, las imgenes del muestreo continuarn afectando al ancho de banda de audio
independientemente de lo alto que pueda ser su frecuencia.

U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 7

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

9.5.2. Aliasing armnico


Tonos ms complejos exageran el problema. Nuestro tono sinusoidal simple de los ejemplos
anteriores, tiene frecuencias de aliasing relacionados con una nica frecuencia fundamental.
En cambio, con tonos complejos, las frecuencias de aliasing podran ser generadas
separadamente para cada armnico. Por ejemplo, el 2 armnico de una forma de onda
compleja con una fundamental de 11 KHz sera de 22 KHz, que sera muestreado de modo
crtico por una S de 44 KHz . pero el tercer armnico de 33 KHz originara una frecuencia de
aliasing de 11 KHz que se aadira a la fundamental, y el 6 armnico (66 KHz) creara otro
de 22 KHz a adir al 2 armnico. Por tanto, nos encontraramos con un espectro de seal
totalmente trastocado. Lo ms normal, de todos modos, es que la frecuencia fundamental y
sus armnicos no sean submltiplos de la frecuencia de muestreo. En la mayora de los casos,
el efecto del aliasing en el ancho de banda ser prcticamente imposible de escuchar, debido a
las bajas amplitudes de la mayora de los armnicos, siendo enmascarados por la propia
msica.
9.5.3. Solucin al aliasing
A pesar de lo malo que pueda ser a nivel terico, en la prctica, no es un problema serio. De
hecho en un sistema de grabacin digital bien diseado se previene que los componentes de
aliasing puedan ocurrir. La solucin es simple, basta con limitar la banda de las frecuencias de
entrada con un filtro pasa-bajos de pendiente elevada, llamado a veces filtro antialiasing, y
diseado para proporcionar una atenuacin elevada a la mitad de la frecuencia de muestreo.
Un filtro ideal que tiene una caracterstica brickwall y atenuacin infinita es muy difcil de
conseguir en la prctica y se busca una solucin de compromiso. Este filtro evitar que las
frecuencias fundamentales y armnicos no permitidos se introduzcan al sistema, evitando de
este modo el aliasing. En caso de que ocurra el aliasing, no existe ningn mtodo para
eliminar las frecuencias errneas generadas en la banda de audio.
Como veremos en el siguiente apartado, despus del filtro antialiasing, podra ocurrir todava
un aliasing armnico de muy bajo nivel debido al error de cuantizacin. Una seal llamada
dither se usa para eliminar esta distorsin.
9.6. Cuantizacin
Para grabar una seal de audio digital, deberemos almacenar dos dimensiones de informacin.
El Muestreo salva implcitamente informacin temporal y la Cuantizacin salva informacin
de Amplitud.
La Cuantizacin es, as, el valor medido de la seal analgica en un instante de muestreo
concreto. Con la cuantizacin, al igual que con las medidas de cualquier suceso analgico, la
exactitud est limitada por la resolucin del sistema. Ya que vamos a usar una palabra binaria
finita, la resolucin del sistema digital ser limitada, introducindose as un error de medida.
Este error es similar al ruido de un sistema analgico, aunque difieran, ya que su carcter
cambia con la amplitud de la seal.
9.6.1. Aproximacin Analgico-Digital
Vamos a ver un ejemplo para ilustrar el efecto de la cuantizacin y diferenciar su error del
error inherente en un sistema analgico. Supongamos que hemos conectado 2 voltmetros,
uno analgico y otro digital, a una consola de grabacin y al final de una pieza musical
leemos ambos medidores, midiendo la tensin correspondiente a la seal acstica de entrada.
Asumiendo un medidor analgico con escalas legibles y un ojo muy bueno, leemos de la
posicin de la aguja sobre la escala un valor de 1,27 Voltios. El medidor digital, muy barato,
solamente tiene dos dgitos y nos mide 1,3 Voltios.
U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 8

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

Si hubiramos pagado un poco ms para conseguir un voltmetro digital de 3 dgitos, la


lectura hubiera sido de 1,27, y en uno de 4 dgitos de 1,274 Voltios. De todos modos, los dos
tipos de medidores siempre tienen un error. El error en un medidor analgico es debido a la
balstica de su mecanismo y nuestra dificultad en leer la medida. Incluso bajo condiciones
ideales, en algn momento, la capacidad de cualquier medida analgica se pierde en el ruido
del propio dispositivo.
Con un medidor digital, la naturaleza del error es diferente. La exactitud est limitada por la
resolucin del medidor, esto es, por el nmero de dgitos mostrados. A ms dgitos, mayor
ser la exactitud, pero siempre el ltimo dgito ser redondeado con respecto al valor real, por
ejemplo, 1,27 ser redondeado a 1,3, Bajo las mejores condiciones, el ltimo dgito ser
completamente exacto, por ejemplo, una tensin de exactamente 1,3000 Voltios ser
mostrado como 1,3 y bajo las peores condiciones el redondeo ser de la mitad del mnimo
incremento leble. Por ejemplo, 1,250 ser redondeado a 1,2 1,3.
Si usamos un sistema binario para la medida, decimos que el error de resolucin del sistema
es de la mitad del bit menos significativo (LSB, Least Significant Bit).
Para ambos sistemas, el problema de medir un fenmeno analgico como la amplitud conduce
a un error. Decir si un sistema es mejor que el otro, es una cuestin filosfica que en muchos
casos se decide en el mercado, pero s hay un hecho a recalcar: la medida digital es un tipo de
medida inherentemente ms robusto. Obtendremos ms informacin de un evento analgico
cuando es caracterizado en trminos de datos digitales.
La Cuantizacin es, por tanto, la tcnica de evaluar numricamente un evento analgico para
formar un nmero discreto. Por supuesto, un sistema digital dicta generalmente el uso de un
sistema de numeracin binario; en trminos de hardware de cuantizacin, el nmero de
incrementos posibles a la hora de cuantizar est determinado por la longitud de la palabra de
datos que usamos para codificar la informacin de amplitud (por ejemplo: 8 bits = 2 8
incrementos = 256 niveles), esto es, el nmero de bits disponibles para la representacin.
As como el nmero de dgitos de nuestro voltmetro digital determinaba la resolucin de
nuestra medida, el nmero de bits de nuestro sistema de digitalizacin determinar la
resolucin del mismo.
9.6.2. Aproximacin en la medida
La tarea de grabar y reproducir msica puede ser resumida de una manera muy simple: se
pretende formar la representacin de la msica. Cuanto ms exacta sea esa representacin a la
seal original, mejor. Desafortunadamente, esta tarea es un esfuerzo considerable incluso
salvando la mayor cantidad de informacin que nos sea posible.
El problema esencial radica en la complejidad de incluso las formas de onda acsticas ms
simples, y en la naturaleza dual de la informacin que contiene. No importa que sistema de
grabacin empleemos, ya que para caracterizar un evento acstico, debemos mostrar una
informacin de tiempo y amplitud relacionados entre s. Por ejemplo, en un LP de vinilo, la
longitud del surco codifica, de modo implcito, el tiempo, y las variaciones laterales del
mismo codifican la amplitud. En un sistema digital, tanto el tiempo como la amplitud son
almacenados como piezas discretas de informacin.
Hemos discutido el muestreo, un mtodo para tomar peridicamente una medida y, por
supuesto, ste solamente tendr significado si se almacenan tanto las medidas de tiempo como
de valor. El muestreo representa el tiempo de la medida, y la cuantizacin representa el valor
de la medida, o en el caso del audio, la amplitud de la forma de onda en el tiempo de
muestreo. El muestreo y la cuantizacin son as, los componentes fundamentales de la
digitalizacin y, juntos, al menos en teora, pueden caracterizar cualquier evento acstico.

U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 9

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

Ya hemos visto que el muestreo de una seal acondicionada previamente (limitada en ancho
de banda), es un proceso sin prdida de informacin, pero el proceso de cuantizacin NO.
Cualquiera que sea la escala cdigos numricos que se utilicen resultar un valor numrico
que nunca codificar total y correctamente una seal analgica continua. Una seal analgica
tiene un nmero infinito de valores de amplitud, mientras que nosotros solamente podremos
elegir de entre un nmero finito de incrementos, de modo que el valor elegido ser siempre
una aproximacin del valor real. En otras palabras, con la cuantizacin, siempre hay un error.
9.6.3. Relacin Seal/error o Seal/Ruido
Con un sistema de numeracin binario, la longitud de la palabra que usamos determina el
nmero de incrementos posibles. Esto se calcula elevando la longitud de la palabra (n de bits)
al cuadrado.
Si N es el nmero de intervalos de cuantizacin posibles en una palabra binaria, tenemos que:
N = 2n
donde n = n de bits de la palabra, as tenemos por ejemplo:
21 = 2
22 = 4

26 = 64
27 = 128

211 = 2048
212 = 4096

216 = 65536
217 = 131072

221 = 2097152
222 = 4194304

23 = 8
24 = 16

28 = 256
29 = 512

213 = 8192
214 = 16384

218 = 262144
219 = 524288

223 = 8388608
224 = 16777216

25 = 32

210 = 1024

215 = 32768

220 = 1048576

225 = 33554432

As, por ejemplo, una palabra de 8 bits acomodar 2 8 = 256 incrementos posibles, y una
palabra de 16 bits, 216 = 65.536 incrementos. Cuanto ms bits, mejor ser la aproximacin de
la medida, pero como ya hemos visto, siempre habr un error asociado con la cuantizacin, ya
que el nmero finito de incrementos (N) disponibles en una palabra binaria de longitud n
nunca podrn definir un nmero infinito de incrementos en la seal analgica.
No importa de cuantos incrementos dispongamos, ya que siempre habr un valor analgico
entre ambos. Pero en cierto punto, el error de cuantizacin se hace audiblemente
indistinguible. La mayora de los fabricantes han acordado que 16 bits proporcionan una
representacin adecuada (no idnea). La longitud de la palabra determina la resolucin de
nuestro sistema de digitalizacin y, por tanto, proporciona una especificacin importante para
medir el rendimiento del sistema.
Algunas veces, el incremento elegido coincidir con el valor analgico. En el peor de los
casos, el valor analgico se encontrar justo en la mitad del mnimo incremento posible, esto
es, que habr un error de la mitad del bit menos significativo (L.S.B.) de la palabra de
cuantizacin.
Por ejemplo, supongamos que 101000 corresponde exactamente a 1,4 Voltios de la seal
analgica y 101001 a 1,5 voltios, y el valor analgico actual en el instante del muestreo es de
1,45 Voltios. Ya que no podemos cuantificarlo como 101000 1/2, tendremos que redondearlo
a 101001 o bien 101000, con lo cual tendremos un error de la mitad de un incremento.

U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 10

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

Al caracterizar el rendimiento de un sistema digital, podremos formular una relacin entre el


nmero total de intervalos (N - 1) de nuestra palabra de cuantizacin con respecto al mximo
intervalo de error, que sera:
relacin Seal/Error = mximo n de intervalos / error mximo
para el caso de 16 bits:
relacin Seal/Error = 65.535 / 0,5 = 131.070
Esta relacin es afn, aunque no idntica, a la relacin Seal/Ruido de un sistema analgico.
Ms rigurosamente, la relacin Seal/Error, vendr dada por:
Relacin Seal/Ruido = 2n (1,5)1/2
, que expresado en dB ser:
Relacin Seal/Ruido = 20 x log ( 2n (1,5)1/2) = 6,02 n + 1,76
, donde n = n de bits
Numero de bits
8
10
12
14
16
18
20
22
24

Relacin Seal/Ruido (dB)


50
62
74
86
98
110
122
134
146

9.6.4. Error de cuantizacin


El error de cuantizacin es la diferencia entre el valor analgico real en el instante de
muestreo y el valor del intervalo de cuantizacin elegido.
En un instante dado del muestreo, el valor de amplitud debe ser elegido desde el intervalo de
cuantizacin ms cercano. En el mejor caso la forma de onda coincide con el intervalo de
cuantizacin. En el peor de los casos la forma de onda est exactamente entre dos intervalos.
El error de cuantizacin, o sea, la diferencia entre el valor real y el medido, est limitado as a
la mitad del intervalo de cuantizacin en el instante de muestreo.
A la salida del sistema, cuando se usan los valores muestreados para recomponer la forma de
onda analgica original, el error se manifestar en la seal de salida. A nivel perceptivo, el
error de cuantizacin es similar al ruido blanco, pero el ruido de fondo de un sistema
analgico difiere completamente del error de fondo de un sistema digital. Por ejemplo, en un
sistema digital, cuando no hay seal, no hay error ni ruido, mientras que el ruido est siempre
presente en un sistema analgico.
9.6.5. Otros mtodos de cuantizacin
La cuantizacin no es solamente la longitud de la palabra, tambin es cuestin del diseo del
hardware y de los formatos. Hay muchas tcnicas disponibles para obtener la cuantizacin y
diferentes estrategias que determinan el modo en que la seal analgica se mapea en
incrementos.
Por ejemplo, podremos usar una distribucin de los intervalos de cuantizacin lineal o no
lineal, a lo largo de la escala de amplitud. Alternativamente podramos usar un sistema de
modulacin Delta, en el que solamente se usa 1 bit de cuantizacin para codificar la amplitud,
usndolo como bit de signo. Evidentemente, el mtodo de cuantizacin elegido determinar la
eficiencia de los bits disponibles as como los efectos relativos del error.
U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 11

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

Por ejemplo, un cuantizador lineal, produce un nivel de error relativamente alto con seales
de bajo nivel. Un sistema no lineal, podra solventar esto amplificando las seales de bajo
nivel para utilizar un barrido incremental lo ms amplio posible.
Los fabricantes, despues de evaluar diferentes sistemas de cuantizacin, han determinado que
el esquema lineal es el ms adecuado para grabaciones musicales.
9.7. Ruido de Granulacin
La naturaleza discreta del audio digital nos permite utilizar mtodos digitales potentes para el
procesamiento y almacenamiento. De todos modos, se pueden crear alinealidades. Si la seal
no cruza ningn incremento de cuantizacin originando una seal continua, esta seal
cuadrada creada a muy bajos niveles sugiere que en estas circunstancias, la cuantizacin acta
como un limitador muy duro, lo que es lo mismo, que da lugar a una distorsin muy fuerte.
Para poner las cosas peor, la onda cuadrada creada en estas circunstancias es muy rica en
armnicos impares, extendindose bastante ms lejos que la frecuencia de Nyquist (la mitad
de S) y por tanto se pueden originar componentes de aliasing despus del filtro pasa-bajos
antialiasing. La onda cuadrada aparece despus del muestreo, y este aliasing acenta el error
de cuantizacin creando un espectro de componentes de error. Esta fluctuacin cuantizada del
ruido de fondo se percibe como un tipo de sonido particularmente sucio llamado ruido de
granulacin, ya que ha sido descrito como un sonido "arenisco".
Consideremos el ejemplo de una onda cuadrada de bajo nivel de 15,333 KHz en un sistema
con una "S" de 44 KHz,. El tercer armnico (45,9 KHz) crea una componente alias de 1,999
KHz, y as sucesivamente originndose un espectro completo de errores de cuantizacin.
Estos son componentes completamente nuevos no enmascarados por la fundamental original o
sus armnicos.
Si los armnicos estn muy cerca de mltiplos de la frecuencia de muestreo, se originan
batidos que dan lugar a un sonido llamado birdsinging. El filtro antialias no puede hacer nada
para eliminar estos armnicos pues se originan en el canal de la seal despus de haber
pasado el filtro.
Para seales de entrada de gran amplitud y ancho de banda (msica), el error de cuantizacin
se percibe bsicamente como ruido blanco. De cualquier modo la calidad perceptual del error
es menos benigno para seales de baja amplitud y seales de alto nivel con ancho de banda
muy estrecho.
9.7.1. Dither
Con seales complejas de gran amplitud, hay poca correlacin entre la seal y el error, ya que
es aleatorio y suena similar al ruido blanco analgico. Con seales de bajo nivel, el carcter
del error cambia y llega a estar ms correlacionado con la seal. El resultado son distorsiones
pequeas pero medibles. Para eliminar esta correlacin, a menudo, se aade una seal de
ruido analgica a la seal original antes de que sea muestreada. Esto hace ms aleatorios los
efectos del error de cuantizacin. Esta seal, llamada dither, no slo enmascara el ruido de
cuantizacin sino que adems dota al sistema digital de la posibilidad de codificar amplitudes
de seal ms pequeas que el bit menos significativo, de una manera similar a como un
sistema analgico es capaz de retener seales por debajo de su ruido de fondo.
Un importante, a menudo mencionado, y frecuentemente no entendido, aspecto del audio
digital es el dither. Cada sistema de audio digital que dice ser lineal (es decir, libre de
distorsin) debe de utilizarlo. Pero que es el dither?.

U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 12

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

El audio digital es representado por una serie de palabras (muestras). Cada palabra representa
un nivel de amplitud de la forma de onda en un particular instante en el tiempo. Los niveles de
amplitud son representados en palabras mediante bits (dgitos binarios. Los sistemas de audio
se especifican (entre otras cosas) en trminos de longitud de palabra, lo cual es el nmero de
bits que representa cada palabra.
En el curso del procesado de la seal de audio digital, el nmero de bits puede incrementarse.
Por ejemplo, cuando dos seales son sumadas (como podra ocurrir cuando mezclamos dos
seales), dos seales de 16 bit llegan a ser una seal de 17 bit. Amplificar la seal una
cantidad fija y determinada tiene un similar efecto: una seal de 16 bit amplificada por un
factor de 4 se convierte en una seal de 18 bit. De hecho, en cada una de las manipulaciones a
la que es sometida la seal de audio digital se incrementa la longitud de la palabra.
Algunas veces, en este estado, despus que la longitud de palabra ha sido incrementada
durante el procesado de la seal, puede ser necesario reducirla a su tamao original. Reducir
la longitud de la palabra es tan simple como dividir los valores de la palabra por 2 a la
potencia del nmero de bits a reducir. As, para reducir una seal de 20 bits a 16 bits, hay que
dividir cada valor de palabra por 16 (2 a la potencia de 4 (20-16=4)). Esto reduce
sucesivamente el nmero de bits, sin embargo durante el proceso se pierde algo de resolucin
de seal.
Debido a que son utilizados valores ms pequeos para describir la misma seal, sta no es
descrita con la precisin adecuada. En audio digital, una prdida de precisin se traduce en
ruido, as el efecto producido ahora sobre la seal consiste en que se le ha aadido ruido. Si el
nivel de ruido es suficientemente bajo, esto no causar ninguna molestia. Si el nivel es tal que
el ruido es audible, el tipo de ruido determinar cunto de molesto es. El ruido que vara con
la seal (es decir, que tenga alguna correlacin con la seal) es con mucho el ms molesto.
Sera ideal que si existiese sonido, fuese completamente no correlativo con la seal. Este
requerimiento es alcanzado mediante el uso del dither.
Emplear el dither significa aadir ruido a la seal de audio. S, se aade ruido a propsito, y es
una cosa buena. Se aade ruido para realizar un intercambio, se intercambia un pequeo bajo
nivel de ruido (silbido) por una gran reduccin en la distorsin. Es un buen intercambio e
igual que el que realizan nuestros odos.
El problema resulta de algo que Nyquist no menciona acerca de la implementacin en el
mundo real: el defecto de utilizar un nmero fijo de bits (por ejemplo, 16) para representar
con precisin los puntos de la muestra. El trmino tcnico se traduce como efectos de
longitud de palabra finita.
En primera instancia, los 16 bits suenan bien con 96 dB de rango dinmico, y es una cosa
buena si se hace uso de l todo el tiempo. Por ejemplo no se puede escuchar las ondas
sonoras en toda la amplitud. Si se ajusta la grabacin para permitir picos que alcancen los 16
bits completamente, esto significar que mucho de la msica es grabada a ms bajo volumen
utilizando menos bits.
9.7..2. Efecto del Dither
Un sistema de digitalizacin bien diseado debe suprimir cualquier cualidad audible del error
de cuantizacin. Obviamente, el nmero de bits de la palabra de cuantizacin podra
aumentar, resultando en una disminucin del error de amplitud de 6 dB por bit adicional
(recordemos la frmula de la relacin Seal/Error). Esto no es muy econmico, y muchos bits
adicionales se deberan usar para reducir la audibilidad del error de cuantizacin
satisfactoriamente.

U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 13

ESCUELA DE CINE Y VIDEO

CICLO: SONIDO

MODULO: POSTPRODUCCION

Una alternativa es aadir una pequea cantidad de ruido blanco analgico, conocido como
"dither", a la seal de entrada. El dither ha sido empleado en los diseos desde que se empez
a usar en la tecnologa de vdeo all por los aos 1950, y ahora se usa en la tecnologa de
audio.
Con el dither, una pequea cantidad de ruido elimina los efectos indeseados ("artifacts") de la
seal; pero lo que es ms importante, no enmascara esos efectos, sino que los elimina. Los
resultados sern seales de pulsos que preservan la informacin de la seal original. La seal
cuantizada vara arriba y abajo conforme vara la seal con dither, siguiendo el valor medio de
la entrada. Esta informacin es codificada en la anchura variable de los pulsos de la seal
digital, y a este tipo de almacenamiento de informacin se le conoce como "modulacin por
anchura de pulsos" (PWM) y preserva con total exactitud la forma de onda de la seal de
entrada. El valor medio de la seal cuantizada puede moverse continuamente entre dos
intervalos de cuantizacin, aliviando de esta manera sus peligros. Audiblemente, el resultado
es la forma de onda original, con ruido aadido, pero sigue siendo mucho ms deseable que la
distorsin de la onda cuadrada.
Esta tcnica de promediado no es ninguna cosa rara, pues ilustra la forma en que el odo
responde en su percepcin de las seales acsticas. Nuestros odos son bastante exactos a la
hora de detectar seales de banda estrecha por debajo del ruido de fondo, debido a las
propiedades de promediado de la membrana basilar. El odo se comporta como un filtro de
1/3 de octava con anchos de banda muy estrechos, de modo que el error de cuantizacin, al
que se le ha dado el carcter de ruido blanco por el dither, es promediado por el odo,
oyndose la onda sinusoidal original de banda estrecha sin distorsin. En otras palabras, el
dither cambia la naturaleza digital del error de cuantizacin en ruido blanco y as, el odo,
puede distinguir seales con niveles por debajo de un incremento de cuantizacin.
Esta es una conclusin importante. Con el dither, la resolucin de un sistema de digitalizacin
est por debajo del bit menos significativo. Codificando la seal de audio con dither para
producir la modulacin de la seal cuantizada, podremos recuperar esa informacin aunque su
nivel sea ms pequea que el incremento mnimo del cuantizador. Adems el dither minimiza
la distorsin causada por la cuantizacin reduciendo aquellos efectos indeseables a ruido
blanco.
Aparte de los beneficios del dither, tambin contribuye al ruido en un sistema de
digitalizacin. Esto resulta en la degradacin de unos pocos dB en el ruido de fondo, pero es
un incremento mnimo comparado a la gran relacin Seal/Error inherente a un sistema
digital. El dither representa as un concepto nico e inverosmil. La idea de aadir ruido
analgico a un sistema digital parece un poco extrao, pero como se ha visto, el resultado es
una mayor resolucin y una distorsin ms baja.

U. D. 9: FUNDAMENTOS DEL SONIDO DIGITAL.

PAGINA 14

También podría gustarte