Está en la página 1de 14

AUDIO COMPANDING.

1. OBJETIVO.

 Realizar un programa en MATLAB que sea capaz de descomprimir un archivo de


audio (formato WAV), previamente comprimido de acuerdo a la ley de compresión
u.

2. MARCO TEÓRICO
En procesamiento de señales, audio analógico, telecomunicaciones y termodinámica,
la compansión o companding es un método aplicable a señales para mejorar la
transmisión de las mismas en canales limitados. Está formado por dos
procesos: compresión y expansión (compressing y expanding en inglés respectivamen
te).
La compresión es un procedimiento reversible que reduce el rango dinámico de la
señal, de forma que diferencias de niveles grandes en la entrada son representadas por
diferencias pequeñas en la salida. Un ejemplo sería un amplificador logarítmico que
enfatice las señales de baja amplitud más que las señales de alta amplitud. La siguiente
gráfica ilustra un compresor logarítmico (rango de señal entre -1 y 1; entrada en el eje
de abscisas y salida en el de ordenadas):

Los efectos de aplicar un compresor a una señal de amplitud variable se observan en las
siguientes figuras:
Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería

Señal original.

Señal comprimida.

Expansión
La expansión realiza el proceso inverso de la compresión: restaura el rango dinámico
original de la señal a partir de su versión comprimida.
La compresión se aplica antes de transmitir la señal por el canal o medio limitado y la
expansión se aplica en la salida una vez recibida la versión comprimida para restaurar
la señal original..
Característica de compansión
La característica de compansión vendrá dada por el tipo de señales a tratar. Por
ejemplo, para señales de voz es necesario un rendimiento SQR relativamente constante,
lo que significa que la distorsión debe ser proporcional a la amplitud de la señal para
cualquier nivel de señal de entrada. Esto requiere una razón de compresión logarítmica.
Existen dos métodos de compresión analógicos que se aproximan a una función
logarítmica, y son conocidos como Ley Mu y Ley A.
En audio digital, la cuantificación lineal multiplica los valores reales de
las muestras por un factor constante (frecuentemente una potencia de 2) y
después trunca los valores, para obtener pasos de cuantificación equidistantes. De esta
forma se obtiene mayor precisión en las señales de amplitud elevada que en las de
amplitud baja (debido a que sus dígitos significativos se encuentran en menor orden de
magnitud).
Para evitar el error de cuantificación en dichas señales, se puede comprimir la señal
amplificando las bajas amplitudes antes de cuantificar y expandirla a la salida del
sistema para recuperar la señal original.

LEY MU.
Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería

Comparación de la compansión (compresión-expansión) de los algoritmos Ley-μ (Ley


Mu) y Ley-A
El algoritmo Ley μ o Ley Mu es un sistema de cuantificación logarítmica de una señal
de audio. Es utilizado principalmente para audio de voz humana dado que explota las
características de ésta. El nombre de Ley μ proviene del término original inglés "µ-law",
que usa la letra griega µ (Mu). Su aplicación cubre el campo de comunicaciones
telefónicas. Este sistema de codificación es usado en Estados Unidos y Japón, mientras
que en Europa se utiliza un sistema muy parecido llamado ley A.

Características básicas de la Ley

 Es un algoritmo estandarizado, definido en el estándar ITU-T G.711


 Tiene una complejidad muy baja
 Utilizado en aplicaciones de voz humana
Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería
 No introduce prácticamente retardo algorítmico (dada su baja
complejidad)
 Es adecuado para sistemas de transmisión TDM
 No es adecuado para la transmisión por paquetes
 Factor de compresión aproximadamente de 2:1
Digitalmente, el algoritmo ley μ es un sistema de compresión con
pérdida en comparación con la codificación lineal normal. Esto significa
que al recuperar la señal, ésta no será exactamente igual a la original.

Funcionamiento
El algoritmo de Ley Mu basa su funcionamiento en un proceso de compresión y
expansión llamado compansión. Se aplica una compresión/expansión de las amplitudes
y posteriormente una cuantificación uniforme. Las amplitudes de la señal de audio
pequeñas son expandidas y las amplitudes más elevadas son comprimidas.
El funcionamiento se basa en que cuando una señal pasa a través de un compansor, el
intervalo de las amplitudes pequeñas de entrada es representado por un intervalo de
cuantificación más grande en la salida, y el intervalo de las amplitudes más elevadas
pasa a ser representado en un intervalo de cuantificación más pequeño en la salida, tal
como se muestra en la figura anexa:

Representación de intervalos de cuantificación con el algoritmo de Ley Mu

Esta figura muestra que los valores de entrada (línea horizontal) contenidos en el
intervalo [-0.2,+0.2] (amplitudes pequeñas) están representados en la salida (línea
vertical) en el intervalo [-0.6,0.6], por lo que se constata que hay una expansión digital.
Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería
Por otra parte, los valores de entrada contenidos en los intervalos [-1,-0,6] y [+0.6,+1]
son representados en la salida en los intervalos [-0.9,-1] y [+0.9,+1], lo que representa
una compresión digital.

LEY A
La ley A (A-Law) es un sistema de cuantificación logarítmica de señales de audio, usado
habitualmente para compresión en aplicaciones de voz humana. Está estandarizada
por la ITU-T en G.711 y es similar a la ley Mu.

Características básicas de la Ley A

 Es un algoritmo estandarizado, definido en el estándar ITU-T G.711


 Tiene una complejidad muy baja
 Utilizado en aplicaciones de voz humana
 No introduce prácticamente retardo algorítmico (dada su baja complejidad)
 Es adecuado para sistemas de transmisión TDM
 No es adecuado para la transmisión por paquetes
 Digitalmente, el factor de compresión aproximadamente de 2:1

Planteamiento del algoritmo

Este algoritmo se utiliza principalmente para la codificación de voz humana, ya que su


funcionamiento explota las características de ésta. Las señales de voz están formadas
en gran parte por amplitudes pequeñas, ya que son las más importantes para la
percepción del habla, por lo tanto éstas son muy probables. En cambio, las amplitudes
grandes no aparecen tanto.
En el caso de que una señal de audio tuviera una probabilidad de aparición de todos los
niveles de amplitud por igual, la cuantificación ideal sería la uniforme, pero en el caso
de la voz humana esto no ocurre, estadísticamente aparecen con mucha más frecuencia
niveles bajos de amplitud. El algoritmo Ley A explota el factor de que los altos niveles
de amplitud no necesitan tanta resolución como los bajos. Por lo tanto, si damos más
niveles de cuantificación a las bajas amplitudes y menos a las altas conseguiremos
másresolución, un error de cuantificación inferior y por lo tanto una relación SNR
superior que si efectuáramos directamente una cuantificación uniforme para todos los
niveles de la señal.
Esto provoca que si para un determinado SNR fijado necesitamos por ejemplo 16 bits
usando una cuantificación uniforme, para el mismo SNR usando la codificación Ley A
necesitemos 8 bits, dado que el error de cuantificación es menor y podemos
permitirnos usar menos bits para obtener el mismo SNR.
Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería
Funcionamiento

El algoritmo Ley A basa su funcionamiento en un proceso de compresión y expansión


llamado companding. Se aplica una compresión/expansión de las amplitudes y
posteriormente una cuantificación uniforme. Las amplitudes de la señal de audio
pequeñas son expandidas y las amplitudes más elevadas son comprimidas.
Esto se puede entender de la siguiente forma; cuando una señal pasa a través de un
compansor (compresor-expansor), el intervalo de las amplitudes pequeñas de entrada
es representado en un intervalo más largo en la salida, y el intervalo de las amplitudes
más elevadas pasa a ser representado en un intervalo más pequeño en la salida. En la
siguiente figura podemos verlo con claridad:

Ésta figura muestra que el rango de los valores de entrada (línea horizontal) contenidos
en el intervalo [-0.2,0.2] (amplitudes pequeñas) están representados en la salida (línea
vertical) en el intervalo [-0.7,0.7], aproximadamente. Podemos comprobar que hay una
expansión.
Por otra parte vemos que los valores de entrada contenidos en el intervalo [-1,-0,6] y
[0.6,1] son representados en la salida en los intervalos [-1, -0.9,] y [0.9,1]. Podemos
comprobar que se produce una compresión.
Digitalmente, todo este esquema es equivalente a aplicar una cuantificación no
uniforme (logarítmica) a la señal original, donde tendremos pequeños pasos de
cuantificación para los valores pequeños de amplitud y pasos de cuantificación grandes
para los valores grandes de amplitud. Para recuperar la señal en el destino tendremos
que aplicar la función inversa.
Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería

Por lo tanto, la implementación del sistema consiste en aplicar a la señal de entrada


una función logarítmica y una vez procesada realizar una cuantificación uniforme. Es lo
mismo que decir que el paso de cuantificación sigue una función del tipo logarítmico.
Para una entrada x dada, la ecuación Ley A de salida es:

3. ESPECIFICACIONES
3.1 FUNCIONAMIENTO
Un registro de audio (mono), ha sido comprimido usando la ley µ (con µ = 255). Comprmido ha
sido muestreado y tratado, según la norma ley µ y almacenado en un archivo de audio llamado
“audiolaw.wav”. su trabajo es recuperar la señal original de audio, para lo cual procederá de la
siguiente manera:
a) Escribimos un programa en MATLAB llamado proyecto_1.m

- Cargamos el archivo de audio comprimido “audioulaw.wav”. El audio en este archivo ha


sido comprimido, usando la ley µ (µ = 255). Usamos la función wavplay, para leer el
archivo WAV desde MATLAB.
Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería
- Reproducimos el audio, usando comando de MATLAB

-
- Usando los comandos de MATLAB, hicimos un grafico de audio en el dominio
del tiempo, tuvimos q considerar, que la grabación dura aproximadamente 9
segundos, por lo cual la escala de tiempos tuvimos que calibrar a 10 seg. La
amplitud esta calibrada a los valores máximos del archivo de audio (-1, +1). Los
ejes están correctamente etiquetados

b) Escribimos un programa (función) en MATLAB y lo nombramos “expansor”, que sea


capaz de expandir un archivo de audio, previamente comprimido con la ley µ.

Para llamar a este archivo lo llamamos

Expansor (x, mu);


Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería

- X es un vector que contiene los datos del archivo del audio digital comprimido y mu es el
valor de µ = 255 y lo usamos en el programa de expansión. El vector resultante debe tener
la información descomprimida. La función será invocada desde el programa principal
proyecto_2 para descomprimir el vector X.

- Para un vector de entrada x de audio sin comprimir, la ecuación para la ley µ de


codificación es:

𝒎(𝟏+µ|𝐱|)
𝑭(𝒙) = 𝒔𝒈𝒏(𝒙)
𝒎(𝟏+µ)

- Donde µ = 255 (8bits) para los estándares de Norte America y Japon. Es importante notar
que los valores del vector varian entre -1 y +1

- La ley de expansión µ, esta dada por la ecuación:

𝟏
𝑭−𝟏 (𝒚) = 𝒔𝒈𝒏(𝒚) ( ) ((1 + µ|y| − 1)
µ
Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería

En primera instancia programamos la formula para expandir, tal cual indica la ecuación:
- Escribimos una función en MATLAB, llamada: expansor (x, mu), que siendo llamada
desde el programa “proyecto_2m” sea capaz de expandir la señal comprimida. Para eso
utilizamos la formula indicada.

- Reproducimos el audio descomprimidos, comprobamos los resultados, comparando con el


audio original de la señal comprimida
- Hicimos un grafico, mostrando las señales de audio original y la descomprimida en dos
diagramas diferentes.
Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería
C) Utilice mallab para comprimir y descomprimir una señal de audio de máximo 10
segundos de duración (grabación propia con la identificación del grupo), usando la ley
de compresión A la grabación debe ser generada por el grupo
Inicio.

Compresión.
Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería

Descompresión
Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería
4. CUESTIONARIO
- Investigar las características de la cuantificación no lineal
explicando la necesidad de su uso a la cuantificación lineal.
La cuantificación logarítmica (cuantificación escalar) es un tipo de cuantificación digital
en el que se utiliza una tasa de datos constante, pero se diferencia de la cuantificación
uniforme en que como paso previo a la cuantificación se hace pasar la señal por
un compresor logarítmico.

Se hace pasar la señal por un compresor logarítmico antes de la cuantificación. Como


en la señal resultante la amplitud del voltaje sufre variaciones menos abruptas, la
posibilidad de que se produzca un ruido de cuantificación grande disminuye. Antes de
reproducir la señal digital, ésta tendrá que pasar por un expansor.

En esta cuantificación tendremos pequeños pasos de cuantificación para los valores


pequeños de amplitud y pasos de cuantificación grandes para los valores grandes de
amplitud, lo que proporciona mayor resolución en señales débiles al compararse con
una cuantificación uniforme de igual bit rate, pero menor resolución en señales de gran
amplitud.

A la salida del sistema, la señal digital ha de pasar por un expansor, que realiza la
función inversa al compresor logarítmico. El procedimiento conjunto de compresión y
expansión se denomina companding.

Los algoritmos Ley Mu y Ley A sirven como ejemplo de cuantificadores logarítmicos.

- Incluir las diferencias entre leyes de la cuantificación u y A


El algoritmo Ley Mu (μ-law o mu-law) es un sistema de cuantificación logarítmica de una
señal de audio. Es utilizado principalmente para audio de voz humana dado que explota
las características de ésta. El nombre de Ley Mu proviene de µ-law, que usa la letra griega
µ. Su aplicación cubre el campo de comunicaciones telefónicas. Este sistema de
codificación es usado en Estados Unidos y Japón. En Europa se utiliza un sistema muy
parecido llamado ley A.

Características principales de la ley Mu:

Es un algoritmo estandarizado, definido en el estándar ITU-T G.711

Tiene una complejidad baja

Utilizado en aplicaciones de voz humana

No introduce prácticamente retardo algorítmico (dada su baja complejidad)

Es adecuado para sistemas de transmisión TDM

No es adecuado para la transmisión por paquetes


Universidad Mayor de San Andrés
.-------ETN-1038---
Facultad de ingeniería
Factor de compresión aproximadamente de 2:1

Es una compresión con pérdidas


La ley A (A-Law) es un sistema de cuantificación logarítmica de señales de audio, usado
habitualmente con fines de compresión en aplicaciones de voz humana. Está
estandarizada por la ITU-T en G.711 y es similar a la ley Mu.

Caracteristicas principales de la ley A:

Es un algoritmo estandarizado, definido en el estándar ITU-T G.711

Tiene una complejidad baja

Utilizado en aplicaciones de voz humana

No introduce prácticamente retardo algorítmico (dada su baja complejidad)

Es adecuado para sistemas de transmisión TDM

No es adecuado para la transmisión por paquetes

Digitalmente, factor de compresión aproximadamente de 2:1

La ley Mu se utiliza en Estados Unido y japón porque alli las tramas que se utilizan son de
1,55 Mb/s mientras que en Europa se utilizan tramas de 2 Mb/s, asique se utiliza la ley A.

5. CONCLUSION
El companding se aplica en la reducción de ruidos: al almacenar señales de audio en
medios magnéticos se añade un nivel de ruido a la señal que puede resultar molesto al
reproducir pasajes de baja intensidad.
Con el objetivo de evitar esto, se comprime la señal de forma que se enfaticen las señales
de baja amplitud antes de grabar la señal y después se expande al reproducirla de forma
que se reduzca el nivel de las señales enfatizadas restaurándolas a sus valores
originales. Al aplicar esta reducción, el ruido que ha añadido la grabación magnética se
reducirá también.

Los procesos reales de reducción de ruidos, tales como la reducción de ruidos


Dolby o dbx son más complejos e intervienen más factores tales como distinta
enfatización en distintos rangos del espectro de frecuencias.

Concluimos que la señal de audio comprimida y descomprimida con los denominados


compansores logarítmicos ley A y ley MU se verifica que el compansor le la dey A es
inferior a la ley MU en términos de calidad para la descompresión

También podría gustarte