Está en la página 1de 30

Curso 05 /06 Pg.

1
Tema 3 1
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tema 3: Codificacin de Contenidos Multimedia.
3.1 Introduccin.
Ventajas de la codificacin digital.
Alternativas y compromisos en la codificacin digital.
3.2 Tcnicas de codificacin de voz.
3.3 Tcnicas de codificacin de audio.
3.4 Tcnicas de codificacin de imgenes.
3.5 Tcnicas de codificacin de video.
ndice
Contenido
Tema 3 2
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Bibliografa Ref
Weinstein, Stephen. The Multimedia Internet", 2005, Springer.
Gibson, Jerry D. Multimedia Communications, 2001, Academic Press.

Bibliografa bsica
Curso 05 /06 Pg. 2
Tema 3 3
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Bibliografa en Internet
Otros documentos
Ref
[SpeechCVoIP] Speech Coders a VoIP perspective.
Roar Hagen
http://www.itu.int/itudoc/itu-t/workshop/converge/s6am-p4_pp7.ppt
Cuadro Resmen de Codificaodres de Voz.
http://www.voipforo.com/codec/codecs.php

Tema 3 4
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Introduccin.
La informacin multimedia es actualmente el principal impulsor del desarrollo y diseo
de las prximas generaciones de ordenadores y redes de telecomunicacin.
Todo lo que hay detrs del universo multimedia es un gran negocio que mueve al
ao cantidades incalculables en inversiones, investigacin, implantacin de redes,
generacin de contenidos, diseo de equipos, servicios y aplicaciones, etc
En este tema realizaremos un enfoque tcnico desde el mundo de las
telecomunicaciones a los contenidos multimedia, y ms concretamente a como se
codifica esa informacin para posteriormente poder ser transmitida.
3.1
Introduccin.
Curso 05 /06 Pg. 3
Tema 3 5
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Introduccin.
La informacin multimedia surge de la integracin de distintos tipos de formatos o
fuentes de informacin heterogneos, tales como la voz, audio, textos, imgenes,
videos.
3.1
Introduccin.
Los mtodos y tcnicas usados para la codificacin de cada uno de los tipos de fuentes
de informacin puede ser completamente distintos unos de otros, pero an as pueden
aunarse y formar un bloque de informacin ms completo y homogneo.
Se hace necesario el uso de la tecnologa digital.
Puede representar de manera
uniforme en un mismo medio
de transmisin todo tipo de
informacin.
Tema 3 6
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Introduccin. 3.1
Introduccin.
Ventajas de la codificacin digital.
Compresin: Gracias a la eliminacin de redundancias, as como a tcnicas de
enmascaramiento, los flujos de datos digitales pueden ser enviados con mucho menos
ancho de banda. Adems, a menores necesidades de almacenamiento, los dispositivos se
hacen ms econmicos.
Flexibilidad de reproduccin, adems de ajuste de velocidad de reproduccin, as
como el salto a cualquier punto deseado del flujo de informacin.
Copia sin prdida de calidad: Las copias son exactas a los originales.
Curso 05 /06 Pg. 4
Tema 3 7
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Introduccin. 3.1
Introduccin.
Ventajas de la codificacin digital.
Flexibilidad de manipulacin, incluyendo la facilidad del troceado de la informacin
y montaje sin prdida de calidad, fcil mejora de elementos grficos y sonoros, mezcla e
insercin sin bordes de imgenes infogrficas en entornos reales, etc.
Facilidad de bsqueda y recuperacin: Facilidad de incorporar informacin de
contenido y metadatos que puede ser obtenidos eficientemente y asociados a los objetos
multimedia. Posibilidad de buscar en los contenidos por aspectos tales como parecidos
entre objetos, patrones de colores, ritmos
Tema 3 8
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Introduccin. 3.1
Introduccin.
Ventajas de la codificacin digital.
Composiciones multimedia: Viabilidad sin deterioro de la calidad de integrar
cualquier tipo de medio junto con informacin textual, de control, etc., todo ello
perfectamente sincronizado en tiempo y espacio.
Facilidad de intercambio de piezas y composiciones multimedia a travs de medios
fsicos o redes de comunicaciones.
Curso 05 /06 Pg. 5
Tema 3 9
Servicios Multidestino
Dpto. de Ingeniera Electrnica, de Telecomunicacin y Automtica
rea de Ingeniera Telemtica
i
Universidad de Jan
E. P. S. de Linares
Introduccin. 3.1
Tipos de ficheros multimedia ms usuales.
MIDI audio synthesis format .mid
Joint PictureExperts Groups image compressive coding .jpg
Graphics Interchange Format (comprimido) .gif
Microsoft Bit map, sin compresin .bmp
Microsoft Audio Video Interleaved File .avi
Microsoft Avanced Streaming (o System) Format para video y audio comprimido .asf
Macintosh Audio Interchange Format (sin compresin) .aif
Avanced Audio Compression (Estndar MPEG) .aac
Descripcin Extensin
Tema 3 10
Servicios Multidestino
Dpto. de Ingeniera Electrnica, de Telecomunicacin y Automtica
rea de Ingeniera Telemtica
i
Universidad de Jan
E. P. S. de Linares
Introduccin. 3.1
Tipos de ficheros multimedia ms usuales.
Windows Media Audio y Video respectivamente (comprimidos) .wma, .wmv
Formato de audio sin compresin (en Microsoft Windows) .wav
Tagged Image File Format (sin compresin o comprimido sin prdidas) .tiff
Syncronized Multimedia Integration Language (marcado para lenguajes
mulitmedia)
.smil, .smi
Real Audio o Real Media auido y/o video comprimido .ra, .rm
MPEG compressive video coding .mpg, .mpeg
MPEG level 3 (Estndar de compresin de audio de MPEG) .mp3
Apple Quicktime movie (comprimido) .mov
Descripcin Extensin
Curso 05 /06 Pg. 6
Tema 3 11
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Introduccin. 3.1
Introduccin.
Alternativas y compromisos en la codificacin digital
La codificacin digital puede tener como entrada, tanto informacin analgica como
digital y en funcin a la prdida de calidad en el proceso puede ser:
Codificacin sin prdidas: No hay prdida de informacin. Se consigue una
compresin alrededor de la mitad del tamao original.
Codificacin con prdidas: Se pierde informacin en el proceso pero se consiguen
ratios de compresin mucho ms altos.(MPEG-1 comprime alrededor de 15 veces
el tamao).
Normalmente se usan conjuntamente, primero con prdidas y luego sin prdidas.
Tema 3 12
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Introduccin. 3.1
Introduccin.
Alternativas y compromisos en la codificacin digital
La codificacin digital se divide en dos procesos:
Codificacin de fuente: Convierte la informacin multimedia en un fichero o flujo de
bits comprimido.
Codificacin de canal: Convierte la informacin digital transmitir o almacenar a las
seales adecuadas al medio usado para la transmisin o almacenaje.
Es usual que ambas se implementen conjuntamente para mejorar el comportamiento
global.
Curso 05 /06 Pg. 7
Tema 3 13
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Introduccin. 3.1
Introduccin.
Alternativas y compromisos en la codificacin digital
Cuando se agrupa un codificador y un decodificador para proporcionar una
comunicacin a dos vas se denomina CODEC.
Existen gran cantidad de mtodos de compresin, ya sean paramtricos o basados en la
forma o informacin de la seal, ya sea en el dominio temporal, espacial o frecuencia.
Pero la codificacin digital est sujeta a gran nmero de compromisos, los cuales
dependen del valor o rango de diversos parmetros correspondientes a cada mtodo de
compresin concreto.
Tema 3 14
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Introduccin. 3.1
Introduccin.
Alternativas y compromisos en la codificacin digital
Eficiencia de codificacin: Es la relacin entre el nmero de bits necesario para cada
elemento multimedia antes y despus de la compresin.
Retardo de compresin. Es ms delicado en aplicaciones multimedia pero no para la
difusin.
Complejidad: El coste computacional en operaciones por segundo o tambin el
coste de la circuitera de codificacin.
Calidad de la informacin decodificada: Ya sea subjetiva, relativa a capacidades
perceptuales humanas u objetiva (SNR).
Curso 05 /06 Pg. 8
Tema 3 15
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Introduccin. 3.1
Introduccin.
Alternativas y compromisos en la codificacin digital
Bit rate constante o bit rate variable: Algunos medios o tipos de informacin
pueden conseguir una mayor eficiencia al utilizar para cada escena o fragmento el bit
rate necesario manteniendo la calidad perceptual.
Flexibilidad: Es la capacidad de un flujo de bits comprimidos de poder ser accedidos
y decodificados en cualquier punto.
Tema 3 16
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
Introduccin.
El increble crecimiento en las redes de comunicaciones y los considerables avances en
las tecnologas de integracin (VLSI), que han generado gran cantidad de nuevos
dispositivos y servicios, han llevado a gran nmero de gobiernos y empresas a renovar
su inters por la codificacin de voz (speech coding), dirigiendo sus esfuerzos hacia la
estandarizacin de sus desarrollos.
Tanto el ITU-T, el European Telecommunications Standards Institute (ETSI) y la ISO
han estado diseando las guas y patrones que deben seguir estos nuevos estndares.
Debido a lo anterior, en los ltimos aos se han dedicado muchos recursos y esfuerzos
al estudio e investigacin de tcnicas de codificacin de la voz.
Curso 05 /06 Pg. 9
Tema 3 17
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
Introduccin.
En la codificacin de voz se pueden destacar dos grandes lneas de desarrollo e
investigacin:
Modelos de seal basados en Codificacin por Prediccin Lineal (LPC)
Modelos de Anlisis-Sntesis en el dominio transformado.
La mayora de los algoritmos que se han estandarizado usan LPC, y en particular los
que usan la tcnica denominada prediccin lineal por anlisis/sntesis, los cuales han
sido integrados en gran cantidad de estndares de telefona mvil.
Tema 3 18
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
Introduccin.
Por supuesto el auge del Multimedia e Internet ha propiciado tambin el desarrollo de
algoritmos de codificacin de voz y audio, principalmente basados en caractersticas
psico-acsticas.
En los casos en los que se desean regmenes binarios muy bajos para la codificacin de
la voz se usan esquemas de anlisis-sntesis. En el proceso de anlisis se extraen una
serie de parmetros los cuales se codifican y se envan al receptor. En el proceso de
sntesis, se decodifican estos parmetros y se usan para generar la voz segn gran
variedad de mecanismos.
Generalmente todos los codificadores de voz son con prdidas, por lo que el bit rate de
la seal original no se mantiene.
Curso 05 /06 Pg. 10
Tema 3 19
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
Medidas de la Calidad
La calidad de un codificador se mide de diferentes formas: calidad de la voz,
complejidad del algoritmo, retardo y robustez frente al ruido de fondo.
Pero debido a que en un canal la voz debe comportarse razonablemente bien frente a
ruidos, seales de marcacin, msica, etcSe hacen necesarias medidas Subjetivas de
la calidad de la voz.
Algunas de estas medidas son:
Mean Opinion Score (MOS)
Diagnostic Rhyme Test (DRT)
Diagnostic Acceptability Measure (DAM)
Tema 3 20
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
Medidas de la Calidad.
Mean Opinion Score (MOS)
La MOS es muy comn en procesos de estandarizacin e implica la clasificacin de la
voz codificada en una escala de 1 a 5. Valores de 4.4.5 son para lneas de telefona
convencionales, 3.5-4 para telefona mvil y 2.5-3.5 para voz sinttica.
Clasificacin MOS Calidad Subjetiva
5 Excelente
4 Buena
3 Suficiente
2 Pobre
1 Mala
El codificador ms simple que
consigue calidad entre 4-4.5 es el
ITU G.711 PCM de 64 Kbits/s con
MOS 4.3. Otros como el ITU
G.729 lo consiguen con tan slo 8
Kbits/s
Curso 05 /06 Pg. 11
Tema 3 21
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
Anlisis-Sntesis de la Voz y Prediccin Lineal
Modelos de la Voz
La voz humana se genera por la interaccin del aire con el tracto bucal, la cuerdas
vocales y la glotis.
Los modelos de ingeniera asumen el tracto vocal como un filtro variante en el tiempo
excitado en funcin del tipo de sonido por:
seales quasi-peridicas cuando las voz es sonora (ejemplo las vocales /a/, /e/, )
o seales aleatorias para sonidos sordos (ejemplo la /s/,/f/, etc.)
El filtro del tracto bucal es estimado usando algoritmos de Prediccin Lineal
Tema 3 22
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
Codificadores usados por la norma H.323 y SIP para VoIP
ITU G.711 PCM de 64 Kbits/s con MOS 4.3 (8 KHz con 8 bit por muestra).
ITU G.726 y G.727 ADPCM
16 Kbit/s ITU G.728 Low Delay CELP
ITU G.729 y G.729A CS-ACELP
ITU G.723.1 MP-MLQ/ACELP
iLBC (internet Low Bitrate Codec)
Pero primero se ver una introduccin a los codificadores CELP ya que la mayora
siguen esta tcnica o variaciones de la misma.
Curso 05 /06 Pg. 12
Tema 3 23
Servicios Multidestino
Dpto. de Ingeniera Electrnica, de Telecomunicacin y Automtica
rea de Ingeniera Telemtica
i
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
FS-1016. Algoritmo Code Excited Linear Prediction (CELP)
CELP se basa en procedimientos de bsqueda de anlisis-por-sntesis, cuantizacin de
vectores con pesos (VQ) y prediccin lineal (LP).
Se usa un filtro LPC de dcimo orden para modelar las formantes de retardo corto de la
seal de voz. La periodicidad de retardo largo de la seal se modela con un diccionario
adaptativo VQ (tambin llamado pitch).
El error de la prediccin lineal de retardo corto y el pitch VQ se cuantifican usando un
libro de secuencias estocsticas (son muestras de ruido aleatorio blanco gaussiano).
Al receptor slo se le enva como excitacin el ndice del diccionario y la ganancia.
(1/8)
Tema 3 24
Servicios Multidestino
Dpto. de Ingeniera Electrnica, de Telecomunicacin y Automtica
rea de Ingeniera Telemtica
i
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
FS-1016. Algoritmo Code Excited Linear Prediction (CELP)
CODIFICADOR
En la figura 1 se muestra la etapa de anlisis de un transmisor CELP ( la figura 2 es la
figura 1 en detalle).
Este contiene una rplica del sintetizador del receptor (excepto el post-filtro).
A la seal de entrada, se le resta la salida del sintetizador CELP, esta diferencia se pasa
por un filtro perceptual. El error perceptual se utiliza despus para realizar la bsqueda
en el diccionario.
(2/8)
Curso 05 /06 Pg. 13
Tema 3 25
Servicios Multidestino
Dpto. de Ingeniera Electrnica, de Telecomunicacin y Automtica
rea de Ingeniera Telemtica
i
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
FS-1016. Algoritmo Code Excited Linear Prediction (CELP)
CODIFICADOR
El procedimiento de bsqueda encuentra las ganancias de los diccionarios estocsticos y
adaptativos que minimizan el error cuadrtico medio.
El filtro de prediccin lineal puede determinarse por tcnicas de anlisis de retardo corto
de la seal de entrada.
El objetivo del filtro perceptual es atenuar aquellas frecuencias en las que el odo
humano detecta menos los posibles errores y aumentarlas para aquellas en que el odo
es ms perceptivo. O sea, se lleva a cabo una comparacin dando ms importancia a
aquellas zonas donde el odo aprecia ms el ruido.
(3/8)
Tema 3 26
Servicios Multidestino
Dpto. de Ingeniera Electrnica, de Telecomunicacin y Automtica
rea de Ingeniera Telemtica
i
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
FS-1016. Algoritmo Code Excited Linear Prediction (CELP)
Figura 1
(4/8)
Sintetizador CELP
Sintetizador CELP
Entrada de
voz
Filtro basado en
pesos perceptuales
Filtro basado en
pesos perceptuales
Minimizado del
error
Minimizado del
error
s

e
-
Curso 05 /06 Pg. 14
Tema 3 27
Servicios Multidestino
Dpto. de Ingeniera Electrnica, de Telecomunicacin y Automtica
rea de Ingeniera Telemtica
i
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
FS-1016. Algoritmo Code Excited Linear Prediction (CELP)
Figura 2
(5/8)
Tema 3 28
Servicios Multidestino
Dpto. de Ingeniera Electrnica, de Telecomunicacin y Automtica
rea de Ingeniera Telemtica
i
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
FS-1016. Algoritmo Code Excited Linear Prediction (CELP)
DECODIFICADOR
El sintetizador CELP (figura 3) se basa en el principio del uso de un filtro de prediccin
lineal cuya ganancia se busca en una tabla.
La excitacin se genera usando, en paralelo, un diccionario estocstico (de valores
aleatorios) fijo y otro diccionario que no es fijo, sino adaptativo. Despus, se actualiza
el diccionario adaptativo con esta excitacin.
En el receptor, se puede mejorar la calidad de la voz sintetizada aadiendo una fase de
post-filtrado.
(6/8)
Curso 05 /06 Pg. 15
Tema 3 29
Servicios Multidestino
Dpto. de Ingeniera Electrnica, de Telecomunicacin y Automtica
rea de Ingeniera Telemtica
i
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
FS-1016. Algoritmo Code Excited Linear Prediction (CELP)
Figura 3
(7/8)
Tema 3 30
Servicios Multidestino
Dpto. de Ingeniera Electrnica, de Telecomunicacin y Automtica
rea de Ingeniera Telemtica
i
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
FS-1016. Algoritmo Code Excited Linear Prediction (CELP)
COMENTARIOS
Esta versin del CELP de 4,8 Kbit/s que es usado por el Departamento de Defensa de
los EE. UU. para usarlo en la tercera generacin de la unidad de telefona segura (STU-
III) y es la que se ha desarrollado junto con AT&T Bell Laboratories y est descrito en
el Federal Standard 1016.
(8/8)
Curso 05 /06 Pg. 16
Tema 3 31
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
ITU G.726 y G.727 ADPCM
Usa Codificacin por Modulacin de Pulsos Diferencial Adaptativa (ADPCM). Es uno
de los codificadores ms simples que usa Prediccin Lineal.
ADPCM codifica la diferencia entre la muestra actual de voz y la muestra predicha. Los
parmetros de la estimacin son obtenidos de una estimacin hacia atrs, es decir, usa la
informacin cuantificada usando un algoritmo de gradiente.
El rango de bit rates va desde los 16 Kbps a los 40 Kbps y el MOS del ADPCM de 32
Kbps es 4.1 y su complejidad 2 MIPS aproximadamente.
G.727 fue desarrollado para aplicaciones sobre redes de paquetes. Tiene cuantificadores
embebidos que permiten bajar el bit rate fcilmente tirando bits.
Tema 3 32
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
16 Kbit/s ITU G.728 Low Delay CELP
Uno de los problemas de las aplicaciones de voz sobre redes de comunicaciones es que
la ganancia de codificacin se incrementa a expensas del retardo de codificacin
(Retardo de una va: sin incluir retardos de canal ni codificacin de canal).
As, el ITU G.728 Low Delay CELP consigue su bajo retardo de una va gracias a:
tramas cortas, prediccin adaptativa hacia atrs y un conjunto pequeo de vectores de
excitacin (5 muestras).
El retardo conseguido es de 2 ms y la MOS va desde el 3.93 hasta un 4.1, y es
considerado equivalente o mejor que el G.726. La complejidad y uso de memoria son:
Codificador: 10.6 MIPS 12,4 KBytes
Decodificador: 8.06 MIPS y 13,8 KBytes.
Curso 05 /06 Pg. 17
Tema 3 33
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
ITU G.729 y G.729A CS-ACELP
Est basado en una estructura conjugada algebraica de CELP (CS-ACELP) con bajo
retardo de 8 Kbit/s.
Se ha diseado para aplicaciones de redes inalmbricas y multimedia.
CS-CELP es un codificador de bajo retardo con tamaos de trama de 10 ms, un look-
ahead de 5 ms y un retardo total del algoritmo de 15 ms
El algoritmo se basa en un esquema CELP de anlisis-sntesis con dos libros de
cdigos.
(1/2)
Tema 3 34
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
ITU G.729 y G.729A CS-ACELP
Existen dos versiones del algoritmo:
La G.729 original con un coste de 20 MIPS y MOS 4,0
Y la G.729 Anexo A, menos compleja, 11 MIPS y MOS 3,76.
La norma G.729 Anexo B define un algoritmo de compresin de silencios lo cual
permite tanto a al G.729 como a la G.729 A operar a bit rates menores.
Hay extensiones planeadas de la G.729 a 6,4 Kbit/s y 12 Kbit/s
(2/2)
Curso 05 /06 Pg. 18
Tema 3 35
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
ITU G.723.1 MP-MLQ/ACELP
El codificador G.723.1 es un codificador de voz dual-rate diseado para audio,
videoconferencia y telefona sobre redes pblicas.
El G.723.1 es parte de los estndares de conferencias de audio y video ITU H.323 y
H.324. Y es recomendado por el Voice over IP Forum como codificador por defecto.
El codificador es dual, funcionando a 6,3 y 5,3 Kbit/s y tiene una opcin de bit rate
variable usando un detector de actividad de voz (compresin de silencios)
En la versin de 6,3 Kbit/s obtiene una MOS de 3.98, una duracin de trama de 30 ms,
look-ahead de 7,5 ms y un retardo de una va de 37,5 ms.
Tema 3 36
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
iLBC (internet Low Bitrate Codec)
Voz muestreada a 8 kHz,
Usa un algoritmo de prediccin lineal (LPC) con independencia de bloques.
Ancho de banda de 13.867 kbps (52 bytes por cada 30 ms)
Tamao de trama de 30 ms (soportar 20 ms el la siguiente revisin)
Complejidad y requerimientos de memoria similares al ITU G.729A
Calidad bsica es igual o mejor que G.729. Pero la robustez frente a la prdida de
paquetes es significativamente mejor que G.729.
Ocultacin de las prdidas de paquetes.
[RFC 3951] Internet Low Bit Rate Codec (iLBC). Experimental. S. Andersen, A.
Duric, H. Astrom, R. Hagen, W. Kleijn y J. Linden. December 2004
Curso 05 /06 Pg. 19
Tema 3 37
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
iLBC (internet Low Bitrate Codec)
MOS Results
1.5
2.0
2.5
3.0
3.5
4.0
0 5 10 15
Packet Loss [%]
M
O
S
G.729A G.723.1 iLBC
Tema 3 38
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Voz. 3.2
iLBC (internet Low Bitrate Codec)
Los codificadores de bajo bit rate actuales: ITU G.729, G.723.1, GSM-EFR, y 3GPP-
AMR fueron desarrollados para redes conmutadas y telefona inalmbrica y estn todos
basados en el paradigma CELP (Code Excited Linear Prediction).
Los codificadores CELP guardan informacin de estado, es decir, tienen memoria,
por lo que existe la posibilidad de la propagacin de errores antes la prdida de
resultados.
iLBC trata cada paquete individualmente, hacindolo muy apropiado para las redes
de paquetes.
Curso 05 /06 Pg. 20
Tema 3 39
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Introduccin
Con la introduccin del CD se provoc una revolucin del audio digital que
rpidamente desplaz al audio analgico.
Sin embargo la muy significante cantidad de informacin sin comprimir que supone la
reproduccin de un CD (1,41 Mbits /s) imposibilita el envo por las redes de paquetes
convencionales, incluso hoy da.
As, numerosas tcnicas de compresin se han desarrollado, siendo algunos de los ms
conocidos el MP3 fruto de la investigacin de la ISO/MPEG (Moving Pictures Experts
Group)
Tema 3 40
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
El Moving Pictures Experts Group (MPEG) ha desarrollado dentro de la ISO una serie
de estndares de codificacin de audio tanto para almacenamiento como para
transmisin.
Los estndares ISO informan tan slo de la sintaxis de los flujos de bits, as como del
proceso de decodificacin, lo que deja una amplia libertad para la codificacin.
En esta seccin se har una breve revisin de los estndares MPEG-1 Capa I, II y III,
MPEG-2 BC y MPEG-2 AAC y MPEG 4.
Curso 05 /06 Pg. 21
Tema 3 41
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-1
El MPEG-1 consiste en tres capas de esquemas de codificacin de audio de complejidad
y comportamiento subjetivo creciente.
1 - 2
1 - 2
1 - 2
Canales
1.993 32-320 32,44.1 y 48 MPEG-1 Capa III
1.992 32-384 32,44.1 y 48 MPEG-1 Capa II
1.992 32-448 32,44.1 y 48 MPEG-1 Capa I
Aprobado Bit rate comprimido
(kbit/s)
Muestreo del
Audio (kHz)
Estndar
Tema 3 42
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-1
MPEG-1 opera en cada uno de los siguientes modos:
Mono.
Estreo
Dual
Joint Stereo (Estreo unido): Con esta tcnica se consigue an ms compresin
gracias al estudio de la correlacin entre los canales izquierdo y derecho y la
irrelevancia que supone el contemplar la diferencia de fase entre ellos.
Curso 05 /06 Pg. 22
Tema 3 43
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-1. Capas I y II
Se basan codificacin por sub-bandas de frecuencia.
El espectro de la seal de entrada se divide en 32 sub-bandas igualmente espaciadas y
se muestrea cada una con una Fs/32.
En cada sub-banda se agrupan 12 muestras formando un bloque, haciendo un total de
384 muestras. Todas esta muestras se normalizan para que tengan valores absolutos
menores que uno (esta normalizacin se realiza buscando la muestra con el valor
absoluto mayor y eligindolo con el ms prximo de una lista de 63 valores permitidos)
Tema 3 44
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-1. Capas I y II
Esquema de bloques del codificador.
Transformacin
estreo
Transformacin
estreo
Seal
de
audio Banco de
filtros de
Anlisis
Banco de
filtros de
Anlisis
Cuantificacin
y
Codificacin
Cuantificacin
y
Codificacin
Empaquetado
Empaquetado
Modelo psico-
acstico
Modelo psico-
acstico
bit allocation
bit allocation
Flujo de
bits de
salida
Curso 05 /06 Pg. 23
Tema 3 45
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-1. Capas I y II
Despus de la normalizacin se cuantifican y codifican siguiendo criterios psico-
acsticos.
Para el estudio psico-acstico detallado se usa la FFT en paralelo con la
descomposicin en sub-bandas, con 512 puntos para la Capa I y 1024 para la Capa II.
La unidad de alojamiento de bit (bit allocation) determina la resolucin del
cuantificador de acuerdo con el bit rate deseado y la informacin perceptual derivada
del modelo psico-acstico.
Tema 3 46
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-1. Capas I y II. Mejoras de la Capa II sobre la Capa I
La capa II consigue una reduccin en el bit rate por tres motivos:
Se reduce la redundancia e irrelevancia en los factores de escala de tres bloques de 12
muestras adyacentes.
Se mejora la precisin de la tabla de cuantificacin.
Las inherentes mejoras en el anlisis psico-acstico al usar una FFT con 1024 puntos
en vez de una con 512.
Curso 05 /06 Pg. 24
Tema 3 47
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-1. Capa III.
Es el ms conocido de todos ellos por su denominacin MP3.
Introduce diversas nuevas caractersticas sobre los anteriores
Un banco de filtros hbrido: Lo forman dos bancos de filtros en cascada.
Consigue mayor resolucin para cada sub-banda al usar una Transformada
Modificada del Coseno Discreta de 18 puntos.
Usa cuantificacin no lineal y bit rate variable para optimizar el bit rate resultante.
Usa un concepto nuevo: La reserva de bits, dejando sin usar bits cuando el audio a
comprimir no los necesita y usndolos cuando los fragmentos de audio son demasiado
complejos y necesitan ms bits.
Tema 3 48
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-2.
Difiere con respecto a MPEG-1 en que puede usar hasta 5.1 canales, incluyendo 5
canales con ancho de banda completo del 3/2 estreo ms un canal opcional de mejora
de baja frecuencia.
Adems se extienden por debajo las frecuencias de muestreo a 16, 22.05 y 24 kHz.
MPEG-2 comprende 2 estndares, MPEG-2 BC para la compatibilidad hacia atrs con
MPEG-1, y MPEG-2 AAC que no aporta compatibilidad alguna.
Curso 05 /06 Pg. 25
Tema 3 49
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-2 BC.
Las diferencias entre MPEG-1 y MPEG-2 BC son mnimas, salvo en el nuevo campo de
frecuencia de muestreo, un ndice de bit rate y un modelo psico-acstico usado en la
asignacin de tablas de bits.
Al aportar frecuencias de muestreo menores posibilita la compresin de audio de dos
canales a menos de 64 Kbps con buena calidad.
La compatibilidad hacia atrs se consigue haciendo que los codificadores MPEG-1
distribuyan dos de los canales MPEG-2 BC, el izquierdo y el derecho codificados en
MPEG-1 y la dems informacin como datos auxiliares de un flujo de bits MPEG-1.
Tema 3 50
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-2 AAC.
Permite una mayor calidad donde la compatibilidad hacia atrs no es una limitacin.
Mientras que MPEG-2 BC proporciona buena calidad a 640-896 Kbits/s para cinco
canales completos, AAC proporciona muy buena calidad a menos de la mitad de esos
ratios.
AAC utiliza una codificacin sub-banda usando un modelo perceptual, supresores de
redundancia inter trama (algunos aspectos se toman de MPEG- Layer III), y un
modelado del ruido en tiempo (TNS). De esta forma proporciona flexibilidad ante
diversos perfiles para ajustarse a compromisos de complejidad-calidad.
Curso 05 /06 Pg. 26
Tema 3 51
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-4.
El estndar MPEG-4 se termin en 1.994 e integra un amplio abanico de codificadores
de voz y audio de alta fidelidad.
El juego de herramientas de MPEG-2 AAC dentro de MPEG-4 soporta la compresin
de audio natural desde 2 Kbps a 64 Kbps.
MPEG-4 define tres tipos de codificacin:
Codificacin Paramtrica
Prediccin lineal excitada por cdigo (CELP)
Codificacin Tiempo/Frecuencia (T/F).
Tema 3 52
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Audio. 3.3
Estndares de Codificacin de Audio ISO/MPEG
MPEG-4.
Para las seales de voz muestreadas a 8 KHz se usa codificacin paramtrica para
conseguir bit rates de 2 Kbps a 6 Kbps.
Para seales de audio muestreadas de 8 KHz a 16 KHz, los codificadores CELP ofrecen
buena calidad a bit rates medios (6-24 Kbps).
La codificacin T/F se aplica tpicamente a partir de 16 Kbps para seales muestreadas
a ms de 8 KHz. T/F se desarrolla sobre MPEG-2 AAC con algunos aadidos.
Curso 05 /06 Pg. 27
Tema 3 53
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Imgenes Estticas. 3.4
Introduccin
Como ya se ha comentado, la compresin de contenidos multimedia es una de las
tecnologas que ha posibilitado la revolucin multimedia.
Si embargo, para que una tecnologa sea ampliamente usada es necesario cierto nivel de
estandarizacin, hecho que en el campo de las imgenes estticas se ha conseguido con
un gran xito por el modelo desarrollado por el Joint Photografic Experts Group
(JPEG).
El estndar JPEG son realmente dos, uno para codificacin con prdidas y otro para
codificacin sin prdidas de imgenes estticas. Existe un tercer estndar para la
compresin de imgenes binarias, el JBIG (Joint Bilevel Image Group), que completa el
conjunto de estndares.
Tema 3 54
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Imgenes Estticas. 3.4
Introduccin
Adems de los anteriores existen otros estndares de facto como el Graphics
Interchange Format (GIF) y el Portable Network Graphics (PNG) que incluyen
compresin de imgenes grficas.
Actualmente JPEG y JBIG son estndares internacionales, aunque existen trabajos
orientados a conseguir nuevos estndares, todos ellos pretenden dar cobertura a la
codificacin sin prdidas, con prdidas y binaria, A pesar de todo cada uno tienen un
objetivo principal.
JPEG LS (Sin prdidas): Tiene un modo binario y un modo casi sin prdidas
debido a restricciones en el nivel de distorsin de los pxeles.
JPEG2000 (Con prdidas): Incorpora bi-nivel y sin prdidas.
JBIG2 (Binaria): Permite la codificacin con prdidas en imgenes binarias
Curso 05 /06 Pg. 28
Tema 3 55
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Imgenes Estticas. 3.4
JPEG
JPEG es un estndar que aglutina una gran variedad de tcnicas de compresin.
Posee tanto modos de compresin con prdidas, como sin prdidas.
Adems, la codificacin de bit del JPEG puede ser Huffman o codificacin aritmtica
binaria.
JPEG tiene dos modos de funcionamiento, jerrquico y no jerrquico.
Tema 3 56
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Imgenes Estticas. 3.4
JPEG
JPEG no-jerrquico.
Dentro de este modo existen otros modos:
Sin prdidas.
Secuencial basado en DCT con prdidas: procesa la imagen de izquierda a derecha y
arriba a abajo de manera estricta.
Progresivo basado en DCT con prdidas: Permite varios procesos de refinado sobre la
misma imagen incrementando la calidad sucesivamente.
Curso 05 /06 Pg. 29
Tema 3 57
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Imgenes Estticas. 3.4
JPEG
JPEG jerrquico.
Permite la combinacin de los modos no-jerrquicos, codificacin progresiva con
incremento de la resolucin, codificacin de diferencia de imgenes y mltiples frames
por imgenes (los modos no-jerrquicos slo permiten un frame por imagen).
Tema 3 58
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Video. 3.5
Introduccin. Codificadores MPEG
Existen gran nmero de codificadores de video que han sido utilizados profusamente en
los ltimos aos. En temas posteriores se vern los estndares de sesiones multimedia.
En este apartado se mostrar brevemente aquellos descritos dentro de la norma MPEG.
El Motion Picture Experts Group es responsable de la estandarizacin del MPEG-1,
MEPG-2, MPEG-4, MPEG-7 y MPEG-21, enfocados al almacenamiento, recuperacin
de informacin de audio/video, difusin.
Cada uno de estos estndares estn encuadrados en un momento histrico y las
necesidades que abarcan son muy diferentes.
Curso 05 /06 Pg. 30
Tema 3 59
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Video. 3.5
Codificadores MPEG
MPEG-1 corresponde a la calidad VCR y est rondando los 1,5 Mbps, apropiado para
las pantallas de los ordenadores y dispositivos porttiles.
MPEG-2 aporta una calidad de consumo y aproximada a la televisin y necesita 4
Mbps en varios formatos bien definidos.
MPEG-4 proporciona una codificacin orientada a objetos de secuencias de imgenes
de baja calidad para entornos de pocos recursos o poco ancho de banda, llegando
incluso a los 10 Kbps. Recientemente, MPEG-4 Parte 10 (tambin conocido como
H.26L o H.264) ha demostrado una gran calidad de codificacin de video en un mplio
rango de anchos de banda.
Tema 3 60
Codificacin de Contenidos Multimedia
Dpto. de Ingeniera de Telecomunicacin
rea de Ingeniera Telemtica
Universidad de Jan
E. P. S. de Linares
Tcnicas de Codificacin de Video. 3.5
Codificadores MPEG
MPEG-7 es un estndar en desarrollo orientado a la obtencin de informacin en bases
de datos multimedia, buscando un Interfaz de Descripcin de Contenido Multimedia.
Las clasificaciones van desde colores, formas, texturas hasta escenas.
MPEG-21. Abunda mucho ms en la clasificacin incorporando incluso su distribucin
sobre redes, propiedad intelectual, preferencias de clientes, adaptacin a varias redes.
Los estndares MPEG han sido usados ampliamente, como en la televisin digital por
satlite y televisin por cable (MPEG-2), el video en pequeos dispositivos y cmaras
(MPEG-4) y la televisin de alta definicin (HDTV) basada extensamente en las
normas MPEG

También podría gustarte