Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Codificadores Conceptuales
Codificadores Conceptuales
Para codificar las muestras en formato PCM (audio digital sin comprimir) se realiza
una transformada al dominio frecuencial y se cuantifican y codifican a partir de un
conjunto de datos obtenidos en un modelo psicoacústico. La implementación de este
modelo psicoacústico es lo que determina la calidad final y es donde se aprovecha
el enmascaramiento temporal o frecuencial, siendo el umbral de enmascaramiento el
que controla la cuantificación.
Las distintas versiones de MPEG-1, siendo MP3 (MPEG-1 layer3) la más conocida,
utilizan este método de codificación.
Codificadores paramétricos
Un ejemplo de este tipo de codificación es HVXC para voz y HILN para música, ambos
dentro del estándar MPEG-4
Usualmente los patrones repetitivos de señal son más evidentes en otro dominio
(temporal, frecuencial...), es por esto que la transformación de la señal en
función de estos patrones permitirá reducir o eliminar la redundancia.
Transformaciones en otro dominio donde los patrones repetitivos sean más evidentes.
Predicción.
Codificación entrópica: codificación de Huffman, codificación aritmética, Run
Length Coding (RLE).
Parámetros
Los códecs de audio se caracterizan por los siguientes parámetros:
Número de canales: depende del número de señales de audio simultáneos que contiene
el flujo de datos. Puede ser mono (1 canal), estéreo (2 canales) o multicanal como
5.1 (seis canales) o 7.1 (ocho canales).
Frecuencia de muestreo: determina la calidad percibida, por lo tanto cuanto más
alto sea mayor será la fidelidad del sonido obtenido respecto al original. Puesto
que el sistema auditivo humano no es capaz de percibir frecuencias superiores a
20kHz y que la frecuencia de muestreo debe cumplir el criterio de Nyquist, para
obtener calidad CD nunca se utiliza frecuencias de muestreo superiores a 44.1kHz,
puesto que no suponen ninguna ganancia de calidad.
Número de bits por muestra. Determina la precisión con la que se reproduce la señal
original y el rango dinámico de la misma. Se suelen utilizar 8 (para un rango
dinámico de hasta 45 dB), 16 (para un rango dinámico de hasta 90 dB como el formato
CD) o 24 bits por muestra (para 109 a 120 dB de rango dinámico). El más común es 16
bits.
Tipo de compresión: distingue entre compresión con pérdidas (lossy) y sin pérdidas
(lossless).
Tasa de bits: determina el número de bits de información necesarios por unidad de
tiempo. La tasa de bits no se puede deducir de los parámetros anteriores puesto que
la compresión puede ser con pérdidas o sin pérdidas. Además, puede ser constante
(CBR), variable (VBR) o en media (ABR). En audio se utiliza tasa de bits variable
(VBR), puesto que es más eficiente que CBR cuando hay silencios o segmentos donde
la complejidad es baja y se pueden almacenar con menos bits.
Aplicaciones
El objetivo principal de los códecs de audio es reducir la cantidad de datos
digitales necesarios para reproducir una señal auditiva. Resulta especialmente útil
comprimir los datos para que ocupen el mínimo tamaño posible a la hora de
almacenarlo y si se tiene que transmitir por la red se pueda enviar con la mayor
rapidez posible. Así, las aplicaciones principales son:
Compatibilidad
Los principales problemas con los los códecs de audio es el gran número existente.
Encontrar los códecs adecuados puede ser difícil a veces, ya que por lo general
vienen en paquetes. Como todos ellos son diseñados específicamente para trabajar
con un determinado tipo de archivo y el formato, por ejemplo, el códec "A" podría
funcionar con el reproductor de MP3, mientras que el codec "B" podría ofrecer
ningún sonido debido a problemas de compatibilidad.