Está en la página 1de 29

NORMAS DE NORMAS DE CODIFICACIN CODIFICACIN DE AUDIO DE AUDIO

OBJETIVOS

Conocer el estado del arte en codificacin de audio Presentar las principales normas usadas actualmente y sus aplicaciones Clasificar dichas normas atendiendo a diferentes criterios

CONTENIDO
Introduccin a la codificacin de audio Primeras normas Dcada de los 80 Dcada de los 90 Situacin actual Resumen y conclusiones

PARMETROS DE UN CODIFICADOR

CALIDAD OFRECIDA RELACIN DE COMPRESIN RETARDO REQUERIMIENTOS HARDWARE (COSTE): COMPLEJIDAD, MEMORIA.

INTRODUCCIN

ESTNDARES DE CALIDAD
CALIDAD CALIDAD TELEFNICA TELEFNICA RADIO AM RADIO AM REPORTING REPORTING RADIO FM RADIO FM COMPACT DISC COMPACT DISC PRODUCCIN PRODUCCIN BANDWIDTH BANDWIDTH 300-3400 Hz 300-3400 Hz 7 Khz 7 Khz 105 Khz 105 Khz 15 Khz 15 Khz 20 Khz 20 Khz 20 Khz 20 Khz Fmuestreo Fmuestreo 8 Khz 8 Khz 16 Khz 16 Khz 22,05 24 Khz 22,05 --24 Khz 32 Khz 32 Khz 44,1 Khz (*) 44,1 Khz (*) 48 Khz 48 Khz

INTRODUCCIN

PRIMERAS NORMAS
Transmisin telefnica digital Europa y USA siguen caminos diferentes Codificacin PCM CCITT Norma G.711 (1971) Aparicin de los ordenadores personales, desarrollo de Arpanet, satlites, fibra ptica A finales de los 70 aparece el compact disc
PRIMERAS NORMAS

G.711 (CD)
TRANSMISOR
Entrada Analgica

x(t)
Filtro Antisolapamiento

x(nTs)
Muestreo Cuantificacin Robusta Codificador Binario 64 Kbps

Cdigo

300 - 3.400 Hz 8 Khz

ndice

RECEPTOR
ndice Cdigo Decodificador Binario Cuantificador Inverso

xq(nTs)
Filtro Interpolador

xr(t)

PRIMERAS NORMAS

DCADA DE LOS 80

Proliferacin del uso del PC En 1984 aparece el primer DSP Normas de codificacin ms eficientes G.721, J.41 y J.42, NICAM y G.722

DECADA DE LOS 80

G.721
s[n] x[n]
G711- 1

+
xe[n]

e[n]

Q Adaptativo

i[n]

Codificador Binario 32 Kbps

c[n]

Q- 1 Adaptativo

Adaptacin Factor de Escala Predictor Adaptativo

eq [n]

Xr [n]
DECADA DE LOS 80

J.41 y J.42
J.42
Codificacin Codificacin Calidad Calidad Ancho de Banda Ancho de Banda Frec. muestreo Frec. muestreo Bits/muestra Bits/muestra Rgimen binario Rgimen binario Retardo Retardo Complejidad Complejidad Fecha aprobacin Fecha aprobacin PCM PCM Radio AM Radio AM 7 Khz 7 Khz 16 Khz 16 Khz 12 12 192 (3x64) Kbps 192 (3x64) Kbps Despreciable Despreciable Mnimo Mnimo Ao 1.984 Ao 1.984
DCADA DE LOS 80

J.41
PCM PCM Radio FM Radio FM 15 Khz 15 Khz 32 Khz 32 Khz 12 12 384 (6x64) Kbps 384 (6x64) Kbps Despreciable Despreciable Mnimo Mnimo Ao 1.984 Ao 1.984

NICAM
Codificacin Codificacin Calidad Calidad Ancho de Banda Ancho de Banda Frec. muestreo Frec. muestreo Bits/muestra Bits/muestra Rgimen binario Rgimen binario Retardo Retardo Complejidad Complejidad Fecha aprobacin Fecha aprobacin
DCADA DE LOS 80

PCM PCM Radio FM Radio FM 15 Khz 15 Khz 32 Khz 32 Khz 10 10 728 Kbps (estreo) 728 Kbps (estreo) 32 muestras (1 ms) 32 muestras (1 ms) Mnimo Mnimo Abril-87 Abril-87

G.722

16 Kbps
CODIFICADOR ADPCM BANDA SUPERIOR (4-8 Khz) CODIFICADOR ADPCM BANDA INFERIOR (0-4 Khz)

Fs = 16 Khz 14 bits/muestra

FILTROS QMF ANALISIS

MUX

64, 56 48 Kbps

48, 40 32 Kbps

DCADA DE LOS 80

G.722
CALIDAD DEL AUDIO EN FUNCIN DE LA VELOCIDAD DE TRANSMISIN USANDO LA NORMA G.722 (7 Khz) EXCELENTE 5 BUENA 4 VOZ MUSICA

ACEPTABLE 3 POBRE MALA 2 1

48

56 BIT RATE (Kbps)

64

DCADA DE LOS 80

DCADA DE LOS 90

Proliferacin de aplicaciones multimedia Aumento espectacular de las prestaciones HW Proliferacin de Internet Radio y televisin Digital Codificacin perceptual (calidad subjetiva) G.728, MPEG-1, MPEG-2, MPEG-2 AAC, MPEG-4

DCADA DE LOS 90

G.728
Entrada PCM 64 Kbps Ley A o Ley Conversin a PCM uniforme Buffer formacin vectores

Codebook del VQ para Excitacin

Filtro de Sntesis

- +

Filtro de peso perceptual

Adaptacin Backward de ganancia

Adaptacin Backward del predictor

Mnimo MSE

Salida 16 Kbps

ndice VQ
DCADA DE LOS 90

MPEG
Moving Picture Experts Group Vdeo, audio y sistema Considera transmisin y almacenamiento Define la trama y funcionamiento del decodificador Codificacin perceptual

DCADA DE LOS 90

MPEG-1
ISO/IEC 11172-3 Hasta dos canales de audio Varios modos (mono, dual, estreo y joint estreo) Tres niveles (capas) de codificacin: Capa 1: DCC Capa 2: DAB Capa 3: MP3 Tres frecuencias de muestreo (32, 441 y 48 Khz) Varios regmenes binarios de salida
DCADA DE LOS 90

MPEG-1
FM
Receptores fijos SNR 50 dB Saturacin del espectro Multitrayecto

DAB
Receptores Mviles Calidad CD Nuevas bandas COFDM (SF) Proteccin errores

DCADA DE LOS 90

MPEG-1
FPB 1 FPB 2 x(n) 32:1 32:1 32:1
Cuantificador 1 Cuantificador 2

ENTRAMADO Y PROTECCION CONTRA ERRORES

Trama AUDIO

FPB 32

Cuantificador 32

FFT 1024 PUNTOS

MODELO PSICOACSITCO

INFORMACION LATERAL

Datos (*) Auxiliares

DCADA DE LOS 90

MPEG-1
5 C A 4 L I 3 D A D 2 (MOS) 1

JointStereo Sin Cascada Cascada Cascada 3 veces 5 veces


2x180

128 192 2x128 2x120 Bit Rate en Kbit/s para una seal estreo

ISO/MPEG Capa 2 ISO/MPEG Capa 3

Caso Mejor Valor Medio Mejor Caso Peor

DCADA DE LOS 90

MPEG-2

ISO/IEC 13818-3 Orientado a televisin digital Ampliacin de MPEG-1: Hasta cinco canales de audio (L,R,C,Ls,Rs) Tres nuevas frecuencias de muestreo (16, 2205 y 24 Khz) Se mantienen las 3 capas de MPEG-1 Compatible con MPEG-1

DCADA DE LOS 90

MPEG-2 AAC

ISO/IEC 13818-7 Alta calidad a 64 Kbps Hasta 48 canales de audio 3 niveles de complejidad (estndar, baja complejidad y frecuencia de muestreo escalable) Frecuencias de muestreo desde 8 hasta 96 Khz Se rompe la compatibilidad con MPEG-1 y MPEG-2

DCADA DE LOS 90

MPEG-4
ISO/IEC 14496-3 Orientado a multimedia interactva Tres tipos de codificadores segn bit rate:

Paramtrico (2-4, 4-16 Kbps) CELP (6-24 Kbps) MPEG-2 AAC (16-64 Kbps)
Escalabilidad a varios niveles (bit rate, ancho de banda y complejidad) Trabaja con objetos media (MPEG-7)

DCADA DE LOS 90

MPEG-4: Versin 2
MPEG-4-versin 2 aade funciones a la versin 1: Mayor proteccin ante errores (reordenacin de las palabras cdigo de Huffman para AAC). Parametrizacin de las propiedades acsticas de una escena, permitiendo presentacin de sonido 3D mejorado, modelado acstico del recinto, etc. Codificacin de audio de bajo retardo para transmisin de audio en comunicaciones bidireccionales. Escalabilidad de bit rate en pasos pequeos (granular). Codificacin paramtrica, pudiendo modificar la escala temporal y el pitch durante la decodificacin.
SITUACIN ACTUAL

MPEG-7: Caractersticas
MPEG-7, denominado MCDI (Multimedia Content Description Interface), ofrece herramientas para describir contenidos multimedia. MPEG-7 est en proceso de definicin, y se espera que exista una versin definitiva para finales del 2003, que permita su posterior estandarizacin. Pretende manejar de forma rpida y eficiente informacin audiovisual (imgenes, grficos, modelos 3D, audio, voz, vdeo, escenarios, ...) para su acceso en internet, libreras digitales, etc. A diferencia de los estndares anteriores, orientados a la codificacin eficiente, MPEG-7 se dirige hacia la bsqueda de informacin audiovisual a partir de descripciones. Si MPEG-4 plantea un cierto nivel de abstraccin (codificacin de objetos), MPEG-7 va a nivel de abstraccin superior (codificacin del conocimiento).

SITUACIN ACTUAL

MPEG-7: Caractersticas
MPEG-7 fija los siguientes objetivos: Definicin de un conjunto de descriptores, esquemas de descripcin y sus relaciones para tratar informacin multimedia diversa. Definicin de un lenguaje especial, llamado DDL (Description Definition Language). Representacin codificada de las descripciones para, por ejemplo, almacenamiento eficiente o acceso rpido de informacin audiovisual. MPEG-7 estandariza la descripcin de informacin audiovisual, pero no su extraccin, permitiendo la incorporacin de nuevos algoritmos de extraccin de caractersticas. MPEG-7 usar los estndares anteriores (MPEG-1 -2 -4) mediante referencias a partes concretas de ellos.
SITUACIN ACTUAL

MPEG-7: Aplicaciones
Acceso a informacin audiovisual en libreras digitales (catlogos de imgenes, diccionarios musicales, ) Servicios de directorio multimedia (pginas amarillas) Seleccin de medios de difusin (canales de radio, TV, ) Edicin multimedia (servicio de noticias electrnicas) Servicios culturales (museos de historia, galeras de arte, etc) Bsqueda de informacin periodstica. Gestin de recursos naturales (remote sensing) y aplicaciones biomdicas Servicios de investigacin (reconocimiento de caractersticas humanas) Entretenimiento (bsqueda de un juego, karaoke) y compras. Archivos de radio, vdeo y cine.
SITUACIN ACTUAL

EVOLUCIN DE LAS NORMAS


2.000 MPEG-4 y MPEG-2 AAC 1998 G.728 (16 Kbps) 1992 G.722 (64, 56 48 Kbps) 1988 G.721 (32 Kbps) J.42 (192 Kbps) 1984 1984 MPEG-2 1994

1.990

MPEG-1 1992 NICAM (728 Kbps,estreo) 1987 J.41 (384 Kbps) 1984 CD (1,5 Mbps)

G.711 1.980 (64 Kbps) 1971 300-3.400 Hz (Telefnica) 7 Khz (AM) 105 Khz 15 Khz (Reporting) (FM)

1979 Ancho de Banda 20 Khz (CD y Prof.)

CONCLUSIONES

CLASIFICACIN DE LAS NORMAS


BSICA TELEF. AM REP. FM CD PROD. J.41 NICAM CD G.711 J.42 NO PERC. G.721 G.722 G.722 PERCEP. G.728 MPEG2 AAC MPEG2 MPEG2 AAC MPEG2 MPEG2 AAC MPEG1, MPEG2 MPEG2 AAC MPEG1, MPEG2 MPEG2 AAC MPEG1, MPEG2 MPEG2 AAC
CONCLUSIONES

OBJETOS MPEG4 MPEG4 MPEG4 MPEG4 MPEG4 MPEG4