Está en la página 1de 15

10.

1 Comparación entre grabación analógica y digital


En la grabación analógica
se utiliza un micrófono para transformar las variaciones de presión sonora en variaciones de
voltaje.

Este voltaje variable se puede adaptar después a distintos medios:


* cambios del patrón de magnetización de la cinta
* alteraciones de las zonas claras y oscuras en una Banda sonora de cine
* desviaciones variables en el surco
* en el caso de un LP, etc.

La grabación analógica esta directamente relacionada con la onda sonora,


su reproducción es relativamente sencilla: las variaciones de la señal grabada se pueden
convertir directamente en variaciones de presión sonora,
con ayuda de los transductores y amplificadores.

El problema
el sistema de reproducción
es incapaz de distinguir entre señales deseadas y señales no deseadas

señales no deseadas
resultado de un proceso de grabación no del todo perfecto,
o consecuencia de distintas interferencias introducidas en la señal.
Por ejemplo: la aguja de un tocadiscos no puede distinguir si el movimiento que sufre es
debido a un arañazo en el disco
El arañazo genera una señal indeseada debida a un defecto en el soporte de la grabación que
se reproduce como un «clic».

Por otro lado,


la grabación digital transforma la onda generada por un micrófono en una serie de números,
cada uno de los cuales representa un instante concreto en el tiempo.
Estos números se graban en forma codificada,
lo que permite al sistema detectar si la señal reproducida es correcta o no.

Un reproductor de Disco Compacto (CD)


es capaz de distinguir entre las señales deseadas y las que no lo son,
y puede rechazar las indeseadas en la mayoría de los casos.

El audio digital
Es más tolerante con los canales de grabación defectuosos que el audio analógico,
y las distorsiones e imperfecciones durante el proceso de grabación
no afectan a la calidad del sonido, tanto en grabacion como en reproducción.
Cadena completa de la señal digital de audio

La figura 10.1 nos muestra la cadena completa de un sistema de grabación o de transmisión


digitales.
En 1er lugar
la señal analógica de audio (voltaje variando con el tiempo)
atraviesa un conversor analógico/digital (A/D),
donde las variaciones continuas de voltaje se transforman en series de «muestras»,
que son una especie de <fotografías> de la señal analógica,
tomadas varios miles de veces por segundo.
Cada muestra se representa por un número

Para que puedan ser grabadas o transmitidas correctamente,


las series de muestras deben ser previamente codificadas
mediante el proceso de codificacion de canal.

Al reproducir o recibir la señal, esta se descodifica y se somete a una corrección de errores.


Para eliminar cualquier daño que haya sufrido la señal desde que fue codificada.
Se corrigen tmb los errores de la base de tiempos o de nivel de las muestras,

Y el resultado se lleva al conversor digital/analógico (D/A),


que convierte los datos numéricos de nuevo en señal analógica con variaciones continuas en el
tiempo.

Principios básicos
Muestreo y análisis en el dominio del tiempo
El proceso que tiene lugar en un conversor A/D
conlleva la toma de niveles o «MUESTREO»
de la amplitud de la señal de audio a intervalos regulares en el tiempo

Definición de la
figura 10.2: el voltaje
eléctrico que
representa el sonido
puede ser tanto
positivo como
negativo a lo largo
del tiempo, y los pulsos de muestra representan la amplitud instantánea de la señal en cada
momento.

Las muestras pueden ser consideradas como <imágenes estáticas> de la señal de audio.
Cuando pasan una tras otra
dibujan una representación continua de la onda

Para poder representar la señal con detalle es necesario tomar una gran cantidad de mues-
tras por segundo.
EL TEOREMA DE MUESTREO, propuesto por Shannon,
indica que deben tomarse al menos dos muestras por cada periodo de la señal de audio si se
quiere tener una información suficiente de la misma.

figura 10.3: si se toman menos de dos muestras por ciclo, en la


reconstrucción puede resultar una señal completamente
diferente a la original; este fenómeno se conoce como
«ALIASING».
PROCESO DE MUESTREO EN EL
DOMINIO DE LA FRECUENCIA

PROCESO DE MUESTREO: Proceso de modulación

MODULACION DE AMPLITUD DE PULSOS (PAM)

COMO EVITAR ALIASING EN DOMINIO DE LA FRECUENCIA

DEFINICION DE ALIASING

Si en una grabación digital de audio no se evita el <aliasing>


algunas componentes del espectro de audio que no existían en un principio
se «desplazan» hacia atras a medida que aumenta la frecuencia de la señal original.

FRECUENCIA DE MUESTREO
La velocidad con la que se toman las muestras
está directamente relacionada con la respuesta en frecuencia del sistema
pq solo las frecuencias inferiores a la mitad de la frecuencia de muestreo pueden ser
procesadas sin «aliasing».

para poder tratar señales de audio de hasta 20 kHz (el límite de señales audibles)
es necesario utilizar una frecuencia de muestreo de mínimo 40 kHz.

En la mayoría de los conversores A/D se utiliza antes del muestreo: un filtro <antialiasing>
cuya función es eliminar
cualquier componente de
frecuencia que esté por
encima de la mitad de la
frecuencia de muestreo (o
frecuencia de Nyquist).

En la práctica
todos los sistemas de audio (como el Disco Compacto, CD)
utilizan una frecuencia de muestreo ligeramente superior a la mínima teórica, y se ha fijado
en 44'1 kHz.
Esto permite que los filtros no deban tener una pendiente de corte muy abrupta por encima
de la frecuencia de Nyquist,
lo que genera una mejor calidad de audio:
se evita que los filtros produzcan un efecto de «campanilleo»
y que afecten a las frecuencias altas.
En algunos sistemas profesionales
se ha fijado una frecuencia de muestreo mayor que la del CD: 48 kHz, por ejemplo

En algunos sistemas de radiodifusión y televisión


—como es el caso del NICAM 728 para transmision de sonido digital estereo de TV—
la frecuencia de muestreo es 32 kHz, lo que limita la respuesta del sistema a 15 kHz, aprox.

Cuantificación

CUANTIFICACION
Proceso en el que una vez muestreada la señal,
Se convierte en series de números,

El resultado del muestreo es un tren de pulsos de amplitud variable;


LA CUANTIFICACION consiste en asignar un valor numérico a cada uno de los pulsos,
de acuerdo con su amplitud.
El proceso de
cuantificación implica
asignar a cada
muestra un valor de
entre un conjunto de
escalones prefijados.

En la figura 10.5 se
ha empleado, a
modo de ejemplo,
una escala de 1 a 10,
tanto para valores
positivos
como para negativos.

Cada muestra debe quedar representada por uno de estos valores enteros.
No se permiten valores fraccionarios o intermedios, por lo que durante la cuantificación cada
muestra se redondea al entero más próximo.
El resultado es una secuencia de números como la que se indica en la figura.

Hay diferencias entre la amplitud original de la muestra


y su correspondiente representación numérica;
esta diferencia se conoce como ERROR DE CUANTIFICACIÓN.
el valor máximo del error de cuantificación
es más/menos la mitad del escalón de cuantificación
pq cuando la amplitud de la muestra supera medio escalón de cuantificación por encima de
uno determinado, se le asigna el valor correspondiente al intervalo inmediato siguiente.

Cuantas más cifras se utilicen en la escala


vertical menor será el posible error de
cuantificación, pq los escalones de
cuantificación serán también menores (ver
figura 10.6).

EN AUDIO DIGITAL
el sistema de numeración empleado es el
BINARIO, en lugar del decimal.
Esto ofrece muchas ventajas
Pq permite representar los números
utilizando tan solo dos estados
(encendido/apagado, alto/bajo,
verdadero/falso, con voltaje/sin voltaje, etc.),
puede grabarse una información de audio
como si se tratase de datos de ordenador.

En un sistema decimal
cada dígito representa una potencia de diez
En un sistema binario
cada digito representa una potencia de dos.
Como solamente se dispone de dos estados «cero» o «uno»
se necesitan muchos digitos para representar valores grandes mediante un sistema binario
(ver figura 10.7).

Cada digito binario se conoce como bit


<binary digit».
Mediante una palabra o número binario de 4
bits se pueden representar 24 = 16 valores
diferentes.
En la figura 10.8 se muestra un ejemplo de escala de
cuantificación que utiliza cifras de 4 bits, en lugar de valores
decimales.
En este caso se han elegido los números para que el cero
corresponda al nivel de tensión más negativo, sin embargo,
puede ser mas interesante asignar el valor binario «0000» a
0 voltios (según se explica en la Ficha Tematica 10.2).
Una cuantificación de tan solo 4 bits deja bastante que
desear
Pq sus 16 intervalos conllevan un error de cuantificación
grande.
produciría un sonido con mucha distorsión,
el nivel del error comparado con el de la señal de audio será
considerable.

EL ERROR QUE RESULTA DE LA CUANTIFICACIÓN


es una forma de distorsión
llega a modificar ligeramente la forma de la señal de audio (dependiendo de la magnitud del
error).
la señal de error resultante se denomina ERROR DE CUANTIFICACION O DISTORSION DE
CUANTIFICACION
la señal de audio cuantificada tiene un nivel bastante alto
puede considerarse semialeatoria (como la mayoría de las señales reales)
el error se manifiesta como un ruido de bajo nivel.
Para dar una naturaleza aleatoria al efecto que produce este error
se añade intencionadamente un ruido de nivel bajo a la señal de audio, antes de la conversión;
a este ruido se le conoce por «DITHER».

EL MARGEN DINÁMICO DE UN SISTEMA DE AUDIO DIGITAL


se ve limitado en su extremo superior por el máximo valor que puede alcanzar la escala del
conversor.
A partir de este punto la señal quedara recortada (ver figura 10.9) y sufrirá mucha distorsión.
Este punto se fija normalmente para un determinado voltaje de entrada,
que en algunos equipos es +24 dBu.
para niveles bajos de señal el margen dinámico queda limitado por el error de cuantificación.

El Disco Compacto emplea 16 bits por muestra,


lo que permite 2(Con exponente 16)= 65 536 intervalos de cuantificaci6n posibles,
que logran una representación bastante precisa de la señal original.

Algunos sistemas profesionales


han llegado incluso a 20 bits
fidelidad mayor.
El margen dinamico de un sistema PCM lineal se incrementa
aprox 6 dB por cada bit que se añade al cuantificador.

Entonces un sistema de 16 bits es capaz de ofrecer un margen dinámico de 96 dB.


Desgraciadamente muchos sistemas
son capaces de reproducir señales con nivel por debajo del límite teórico.
Esto se logra, en parte, gracias a una modulación de la señal «dither»
y al uso de conversores con sobremuestreo (ver Ficha Tematica 10.3)
que utilizan técnicas de conformación de ruido «noise shaping», y que no obedecen a las leyes
simples de un sistema PCM lineal.

muchos conversores denominados de 16 bits


NO son exactamente conversores lineales de 16 bits,
y el ruido de fondo que entregan puede ser mayor de lo que se prevé en teoría.

La salida cuantificada de un conversor a/d


se entrega normalmente mediante un conjunto de cables,
uno por cada bit de la palabra binaria que representa a la señal de audio;
según esto
un conversor de 16 bits tendría 16 salidas individuales simultaneas.
Cuando cada bit de datos se transmite por un cable independiente se dice que los datos
estan en formato paralelo.
Si, por el contrario, se transmiten por un único canal, un bit tras otro, se dice que los datos
estan en formato serie.

REPRESENTACIÓN DE
VALORES NEGATIVOS EN LAS
MUESTRAS

COMPLEMENTO A DOS Y LO
QUE REPRESENTA

BIT MAS SIGNIFICATIVO MSB


SOBREMUESTREO

ESPECTRO DE POTENCIA DEL RUIDO


DE CUANTIFICACION

CONVERSORES

CONFORMACION DE RUIDO (noise


shaping)

ALIASING
ANTIALIASING

CONVERSORES A/D D/A

Principios de la codificación de canal


Los datos binarios obtenidos en el proceso de cuantificación
NO son aptos para ser grabados directamente en cinta.

Para adaptar los datos a las características propias del sistema de grabación
se emplea un «código de canal»
que logra un buen aprovechamiento del espacio en grabación
hace que los datos puedan recuperarse después.
Existe una gran variedad de códigos de canal,
Su misión es transformar una sucesión de datos binarios en una serie de transiciones
que se envían hacia el medio de grabación o de transmisión.
Se trata de un tipo de modulación.

La mayoría de los códigos de canal


se diseñan para que tengan un bajo contenido de CC
(en otras palabras, los datos se codifican para que, por término medio, haya el mismo número
de ceros que de unos).
Este es el caso de las señales que deben ser acopladas mediante transformadores

En otros casos
conviene que los códigos tengan un ancho de banda determinado,
o que tengan limitado su contenido de altas frecuencias.

Existen, por otro lado,


códigos pensados específicamente para sistemas de grabacion de muy alta densidad,
con un bajo contenido de reloj
con la posibilidad de que haya periodos largos sin transiciones de un nivel lógico a otro.

LA CODIFICACION DE CANAL
significa estructurar los datos que van a ser grabados
incorporando al mismo tiempo una señal de reloj,
de manera que haya suficiente información de reloj
como para que al reproducir puedan recuperarse tanto los datos como el sincronismo.

Los codigos de canal


difieren entre sí en cuanto a su robusted y en la forma en que afectan a la distorsión, al ruido o
a los errores de sincronismo.

En la figura 10.10 se recogen algunos ejemplos de codigos de canal utilizados en sistemas de


audio.
El mas sencillo es el CODIGO FM, un ejemplo de modulacion de frecuencia por una señal
binaria.
Es uno de los codigos Manchester,
conocido tambien como marca bifase «biphase mark»;
es la modulacion empleada para el codigo de tiempo SMPTE/EBU

Los códigos MFM y Miller(con exponente 2) son mas eficientes que el FM en cuanto a
densidad de grabación.
MFM es más eficiente porque elimina las transiciones entre varios unos seguidos
conservando solamente las transiciones en el caso de varios ceros.

Miller (con exponente 2) elimina el contenido de CC presente en el código MFM


y lo logra suprimiendo la transición para el ultimo uno
cuando hay un número par de unos seguidos.

Los códigos de grupo,


como el que se emplea en el Disco Compacto y en R-DAT,
transforman los patrones de bits de los datos originales en nuevos códigos con mejores
prestaciones.
Usan una «tabla de transferencia» que recoge todas las posibles combinaciones de datos que
dan lugar a los nuevos datos codificados.

El CD utiliza la modulación 8/14,


en la cual cada palabra original de 16 bits se divide en dos palabras de 8 bits.
A continuación se emplea una tabla de transferencia
para generar una nueva palabra código de 14 bits por cada una de las 256 posibles
combinaciones de 8 bits.
Como se pueden formar muchas más palabras con 14 bits que con 8, podemos elegir
cuidadosamente cuales de las 16384 palabras son más apropiadas para las características que
se pretenden en la grabación del CD.
En este caso se eligen aquellas que tienen no más de once bits consecutivos iguales Y no
menos de tres.
Esto limita el ancho de banda de los datos grabados
y se adapta a las características del proceso de lectura óptica,
al mismo tiempo que conserva la necesaria información de reloj.

Corrección de errores

EXISTEN DOS ETAPAS FUNDAMENTALES DENTRO DEL PROCESO DE CORRECCIÓN ERRORES


EN AUDIO DIGITAL.

En primer lugar, el error debe ser detectado,


y a continuacion deber ser corregido;
si no puede corregirse deberá ocultarse.

Para que un error pueda ser detectado es necesario diseñar una serie de mecanismos de
proteccion.
EXISTEN DOS TIPOS PRINCIPALES DE ERROR: errores de ráfaga y errores aleatorios.

LOS ERRORES DE RAFAGA


producen la perdida de varias muestras sucesivas.
Se deben a veces a una ausencia temporal de la señal «drop-out»,
como la que puede ocurrir en una cinta;
otras veces son consecuencia de una interferencia producida por un pico de tensión,
o por la suciedad en la superficie de un CD, por ejemplo.
La capacidad de corrección de errores de ráfaga
se especifica normalmente como el número de muestras consecutivas que pueden llegar a
corregirse por completo.

LOS ERRORES ALEATORIOS


Producen la perdida de muestras aisladas
suelen ser consecuencia del ruido o de una baja calidad de la señal.
El Índice de errores aleatorios
se indica normalmente como una tasa media (1 por cada 106, por ejemplo).

Un sistema de correccion de errores


debe ser capaz de enfrentarse tanto a errores de rafaga como aleatorios,
que, ademas, pueden aparecer muy proximos entre Si.

Antes de la grabación,
los datos de audio se someten normalmente a un proceso de intercalado,

proceso de intercalado
se altera el orden de las muestras, según el principio que se explica en la figura 10.11.
Las muestras que en tiempo real eran adyacentes
se esparcen ahora a lo largo de la cinta.
Lo que se consigue con esto
es que un posible error de ráfaga que destruya una serie de muestras consecutivas,
se transforma, tras el desintercalado,
en una serie de errores aislados en medio de muestras <sanas>;
a partir de aqui, estos errores pueden ocultarse.

Un proceso común,
asociado al intercalado,
consiste en separar mediante un retardo las muestras pares e impares.

Cuanto mayor sea el retardo que introduce el intercalado,


MAYOR será también la ráfaga de error que admita el sistema.

Un ejemplo de este tipo de tratamiento contra errores


es el que se utiliza en el formato DASH (formato digital de grabación en cinta abierta):
las muestras impares están retardadas 2448 muestras con respecto a las pares,
al mismo tiempo que se reordenan entre si en grupos de muestras impares y pares.

Antes de la grabaci6n se añaden también una serie de datos redundantes.

LA REDUNDANCIA
implica grabar un mismo dato en más de un lugar o en formas diferentes.
Un ejemplo sencillo de su uso
En el caso del formato <twin-DASH>
donde todos los datos se graban por duplicado.
Sobre un segundo par de pistas (que contienen los datos duplicados) la secuencia de datos
impares/pares se transforma en pares/impares.

Con esto se consiguen dos objetivos:


1 supone una doble protección contra errores;
2 es capaz de corregirlos cuando se empalma la cinta
pq se producen dos ráfagas de error, una por cada conjunto de pistas;
como se dispone dos grupos de pistas,
de uno de ellos se pueden obtener los datos impares no dañados y del otro los datos pares,
con lo que se evita tener que interpolar
(ver Ficha Tematica 10.5).

LOS CÓDIGOS DE VERIFICACION


DE REDUNDANCIA CICLICA (CRC),
formados a partir de los datos
originales y grabados junto con
ellos,
se utilizan en muchos sistemas
para detectar en reproducción la
presencia de errores ,
así como su situación exacta.
Se logra corregir perfectamente,
hasta un cierto límite,
tanto errores de ráfaga como
errores aleatorios,
haciendo uso de complejos
procedimientos matemáticos para
formar las palabras código a partir
de los datos originales.

Otro sistema potente de


proteccion contra errores
es el código Reed-Solomon,
utilizado en varios sistemas
digitales;
se describen los distintos métodos de tratamiento de los errores en reproducción, una vez que
han sido detectados.

 CORRECCION COMPLETA
 INTERPOLACION
 RETENCION DE LA MUESTRA ANTERIOR
 ANULACIÓN DE LA SALIDA <MUTE>

Conversión D/A
El proceso de conversión D/A se representa esquemáticamente en la figura 10.12.

Las palabras que representan a las muestras de audio


se convierten de nuevo en una serie de niveles eléctricos en forma de escalera
cada uno de los cuales corresponde al valor de una muestra.

ESTO PUEDE LOGRARSE DE VARIAS FORMAS.

 En los conversores mas simples


se utilizan los estados de los bits para conectar o desconectar fuentes de corriente,
de forma que la amplitud del pulso final es el resultado de la combinación de las salidas de
cada una de esas fuentes.
En otros conversores
se emplea un contador binario para contar desde la cifra binaria que representa a la muestra
hasta cero;
durante ese mismo tiempo se esta generando una rampa de voltaje,
que vuelve a ser muestreada en unos determinados instantes.
Este muestreo reduce el ancho de los pulsos antes de que estos atraviesen un filtro paso bajo
de reconstrucción,
cuya frecuencia de corte es igual a la mitad de la frecuencia de muestreo.
Si no se hiciese este muestreo a la salida del conversor D/A,
el efecto de promediado del filtro paso bajo se convertiría en una reducción en la amplitud de
las frecuencias altas de audio
(debido al denominado «efecto apertura»).
Esto se evita limitando el ancho de los pulsos de este muestreo,
por ejemplo a 1/8 del periodo de muestreo original.
Para corregir el efecto apertura es necesaria una ecualizacion adicional.

Principios básicos de la grabación digital en cinta


Las altas tasas de datos necesarias para una grabación digital
obligan a utilizar anchos de banda del orden de varios megahercios
(un único canal de audio digital precisa una velocidad de datos de 0'75 megabits por segundo,
aprox).

Los magnetófonos existentes hasta la aparición del audio digital no admitían directamente
información digital —en lugar de la analógica—
puesto que los circuitos y las cabezas de grabación estaban diseñadas para trabajar con
frecuencias no superiores a los 50 kHz.

La grabación de video
necesita anchos de banda mucho mayores y grandes densidades de grabación
para poder representar imágenes con una buena calidad.
cuando comenzaron a desarrollarse las técnicas PCM para grabación de sonido,
se pens6 en los grabadores de video (VTR) como dispositivos de almacenamiento digital.

También podría gustarte