Está en la página 1de 7

RADIODIFUSION. GOMEZ.

- ALGORITMO MPEG-4

ALGORITMO MPEG-4
Jonathan Alberto Gomez Becerra
jonathan.gomez@unmsm.edu.pe

RESUMEN: El estándar MPG-4, definido en ISO/IEC 14496-2, es


desarrollado para proveer a los usuarios un nuevo nivel de interacción MPG ha estado trabajando en este desarrollo desde 1993,
con los contenidos visuales. Provee tecnología para ver, acceder, y después de 6 años, un Estándar Internacional ha adoptado
manipular objetos más allá que píxeles, con una gran solidez ante finalmente la cobertura de la primera versión de MPEG-4. [4]
errores en tasas de bit elevadas. Los campos de aplicación varían
desde televisión digital, transmisión de video, hasta multimedia móvil
y juegos. Provee herramientas para codificación de forma, estimación
2 . VISTA GENERAL
de movimiento y compensación, codificación de texturas, resiliencia a
errores, codificación de sprites y escalabilidad. La codificación de 2.1 MOTIVACIÓN
forma se hace en modo binario, la forma de cada objeto es descrita
por una máscara binaria; la compensación de movimiento está basada El video digital está reemplazando al analógico en muchas
en bloques, con modificaciones para los límites del objeto; la de la aplicaciones existentes. Un ejemplo es la introducción de la
textura se basa en 8x8 DC, y así el resto. Los puntos de conformidad televisión digital, que empieza un amplio despliegue. Otro ejemplo
están definidos en el fue el reemplazo del antiguo VHS por el DVD para la visualización
Perfil Simple, el Perfil Núcleo, y el Perfil Principal de películas. MPEG-2 ha sido uno de las tecnologías clave que
permitió la aceptación de esos nuevos formatos. En estas
PALABRAS CLAVE: MPEG4, estándar, compresión, codificación, aplicaciones existentes, el video digital pareciera no diferir mucho
multimedia. en funcionalidad con el video análogo, pero hay obvios beneficios
como una mejora de calidad y confiabilidad, aunque el contenido
sea el mismo desde el punto de vista del usuario. Sin embargo,
1 . INTRODUCCIÓN una vez en contenido está en el dominio digital, nuevas
funcionalidades pueden ser añadidas fácilmente, que permitirá al
La multimedia está en la prioridad de la creciente atención de
usuario interactuar en nuevas formas con el contenido. MPEG-4
las telecomunicaciones, los usuarios finales, y la industria de
provee las tecnologías clave que
computadoras. En un amplio sentido, la multimedia es asumida como
permitirá tales funcionalidades
un marco de trabajo general para la interacción con información
disponible de diferentes fuentes, incluyendo video.
2.2 . ÁREAS DE APLICACIÓN
Un estándar multimedia debe proveer soporte para un gran
número de aplicaciones. Estas se trasladan en conjuntos específicos 2.2.1 TV DIGITAL
de requisitos los cuales pueden ser muy diferentes uno del otro. Un
tema común para la mayoría de aplicaciones es la necesidad de Con el crecimiento de la Internet, se aumentó la capacidad
soporte de interactividad con diferentes tipos de información. Las del usuario de controlar gráficos, audio, imágenes y texto, para un
aplicaciones relacionadas a información visual pueden ser agrupadas valor agregado de ciertos programas, o proveer información útil al
en la base de diferentes características: televidente, pero no necesariamente relacionado con el programa
que se está viendo. La capacidad de enlazar y sincronizar eventos
• Tipo de data (imagen fija, video, etc.) con video mejora la experiencia de usuario. La codificación y
• Tipo de fuente (imágenes naturales, imágenes por representación de no sólo tramas de video, sino objetos
computadora, etc.) individuales en pantalla, han abierto las puertas a formas
• Tipo de comunicación: desde punto a punto hasta totalmente nuevas de la programación
multipunto a multipunto en televisión
• Tipo de funcionalidades deseadas: manipulación de
objetos, edición en tiempo real, etc.) 2.2.2 MULTIMEDIA MÓVIL

Los estándares de video MPEG-1[1] y MPEG-2 [2], aunque La enorme popularidad de los smartphones nos da la idea del
perfectamente adecuados en ambientes para los cuales fueron interés en las comunicaciones móviles y computación. Usando
diseñados, no son necesariamente flexibles para manejar multimedia en estos dispositivos mejoraría la experiencia de
eficientemente los requisitos de las aplicaciones multimedia. Es aquí, usuario. Estrechos anchos de banda, capacidad computacional
donde MPEG (Moving Pictures Experts Group) se abocó al desarrollo limitada, y confiabilidad de la transmisión son limitaciones que van
del estándar MPEG-4, proveyendo una plataforma común para un siendo superadas a grandes pasos, ya que hablamos de un
amplio rango de aplicaciones multimedia [3]. estándar que tiene una mejor eficiencia de codificación y una gran
flexibilidad en la asignación de recursos computacionales.

1
RADIODIFUSION. GOMEZ. - ALGORITMO MPEG-4

MPEG-4 ser accesible sobre un amplio rango de


2.2.3 PRODUCCIÓN DE TV media, como redes móviles así como las cableadas.
En adición, la escalabilidad temporal y espacial
La creación de contenido ahora está volcada en técnicas de basada en el objeto permite al usuario decidir donde
producción virtuales como extensiones al ya conocido chroma keying. usar recursos, como pueden ser el ancho de banda
La escena y actores son grabados por un lado, y puede ser mezclado disponible.
con efectos computacionales adicionales y efectos especiales.
Codificando los objetos de videos en vez de cuadros de videos
rectangulares y lineales, y permitiendo acceso a los objetos de video,
la escena puede ser renderizada con mayor calidad y flexibilidad. La
televisión que consiste en objetos de videos compuestos, y audio y
gráficos adicionales, pueden ser transmitidos directamente al usuario.

2.2.4 JUEGOS

La popularidad de los juegos demanda mayor interacción del


usuario. Muchos juegos diseñados en 3D se vuelven más realistas
con la adición de objetos de video bajo técnicas de superposición. Es
posible personalizar, por tanto, los juegos mediante el uso de bases
de información de videos enlazados en tiempo real en el mismo.
Figura 1. Funcionalidades ofrecidas por el estándar visual MPEG-4
2.2.5 TRANSMISIÓN DE VIDEO
Para soportar algunas de estas funcionalidades, MPEG-4
El streaming de video en la Internet es más popular que nunca. debe proveer la capacidad de representar arbitrariamente
Actualizaciones de noticias, redes sociales, conciertos, etc. Aquí, el objetos de video con forma definida. Cada objeto puede ser
ancho de banda es limitado por el uso de módems, y la confiabilidad codificado con diferentes parámetros y a diferentes calidades.
dela transmisión es un problema, ya que pueden ocurrir pérdidas de La forma de un objeto de video puede ser representado en
paquetes. Con una mejorada resiliencia a errores y mejor eficiencia MPEG-4por un plano binario o a nivel de grises. La textura es
de codificación, MPEG-4 alivia tales problemas.
codificada aparte de su forma. Para aplicaciones de baja tasa
de bits, se puede usar la codificación basada en cuadro, como
2.3 CARACTERÍSTICAS en MPEG-1 y MPEG-2. Para aumentar la robustez a los
errores, son tomadas en cuenta previsiones especiales en el
El estándar MPEG-4 consiste en un conjunto de herramientas
nivel del flujo de bits para permitir una rápida re
que permiten aplicaciones al soportar muchas clases de
funcionalidades. Las más importantes cubiertas por este estándar sincronización, y una recuperación eficiente ante errores.
pueden ser agrupadas en 3 categorías, como se ve en la Figura 1, y
resumida como sigue: El estándar MPEG-4 ha sido explícitamente
optimizado para tres rangos de tasa de bits
1) Eficiencia de compresión: Este concepto ha sido la
premisa principal para MPEG-1 y MPEG-2, y ahora 1) Debajo de 64 kbit/s
en sí mismo ha permitido aplicaciones como TV 2) 64-384 kbit/s
Digital y DVD. La mejorada eficiencia de codificación 3) 348-4 Mbit/s
de flujos de datos concurrentes múltiples aumenta la
aceptación de aplicaciones basadas en el Para aplicaciones de alta calidad, altas tasas de bits son
estándar MPEG-4 también soportadas mientras se use el mismo set de
herramientas y la misma sintaxis de flujo de bits para los
2) Interactividad basada en contenido: Codificando y disponibles en las tasas de bits más bajas.
representando objetos de video en vez de cuadros,
permite aplicaciones basadas en contenidos. Es una
de las más importantes novedades que aporta el
MPEG-4 provee soporte para material entrelazado y
estándar. Basado en una representación eficiente de progresivo. El formato de crominancia que es soportado es
objetos, como su manipulación, edición en flujo de bits, y 4:2:0. En este formato el número muestras de Cb y Cr son
escalabilidad basada en objetos permite nuevos niveles la mitad del número de muestras de las de la luminancia
de interactividad de contenido. tanto en horizontal como en vertical. Cada componente
puede ser representada por un número de bits variante de
3) Acceso Universal: La robustez en entornos 4 a 12.
propensos a error permite al contenido codificado en

2
RADIODIFUSION. GOMEZ. - ALGORITMO MPEG-4

2.4 ESTRUCTURA Y SINTAXIS

El concepto central definido por el estándar MPEG4 es el objeto


audiovisual, el cual es el fundamento de la representación basada en
objeto. Tal representación está acondicionada para aplicaciones
interactivas y da acceso directo a los contenidos de le escena. Nos
limitaremos principalmente a objetos de video natural. Un objeto de
video puede consistir de una o más capas para soportar la
codificación escalable. Esta sintaxis escalable permite la
reconstrucción del video en forma de capas partiendo de una capa
base autónoma, y agregando una serie de capas de mejora. Esto
permite a las aplicaciones generar un único flujo de bits de video
MPEG-4 para una variedad de requisitos de ancho de banda y/o
computacionales. Un caso especial es donde un alto grado de
escalabilidad es requerida, y ocurre cuando una imagen estática es
mapeada en 2 o 3 objetos dimensionales. Para manejar esta
funcionalidad, el estándar provee un modo especial para codificar Figura 2. Ejemplo de una estructura lógica de flujo de bits de video
texturas estáticas usando una transformación ondícula. en MPEG-4

Una escena visual MPEG-4 puede consistir de uno o más


objetos de video, cada uno de ellos es caracterizado por información Hay 2 tipos de capas de objetos de video, la capa de objeto de
espacial y temporal en los aspectos de su forma, movimiento, y video que provee funcionalidad completa MPEG-4, y una capa de
textura. Para ciertas aplicaciones, los objetos de video pueden no ser funcionalidad reducida, la capa de objeto de video con cabeceras
deseables, debido a posible dificultad de generarlos. Para esas cortas. El último provee compatibilidad de flujo de bits con la línea
aplicaciones, el estándar permite las codificaciones de cuadros base H.263. [5]
rectangulares los cuales representan un caso degenerado de un
objeto formado arbitrariamente. Cada objeto de video es muestreado en tiempo, cada muestra
de tiempo de un objeto de video es un plano de objeto de video. Estos
Un flujo de bits visual en MPEG-4 provee una descripción puedes ser agrupador para formar un conjunto de planos de objetos:
jerárquica de una escena visual como se muestra en la Figura 2. Cada
nivel de la jerarquía puede ser accedido in el flujo de bits por códigos • Grupo de planos de objetos de video (GOV):
especiales llamados códigos de inicio. Los niveles jerárquicos que Proveen puntos en el flujo de bits donde los planos
describen la escena más directamente son: de objetos de video son codificados
independientemente de cada otro, y por tanto proveer
• Secuencia de objeto visual (VS): La escena puntos de acceso aleatorio dentro del flujo de bits.
completa MPEG-4 que puede contener cualquier Los GOV son opcionales.
objeto natural o sintético 2D o 3D y sus
correspondientes capas de mejora. • Plano de objeto de video (VOP): Es la muestra en
tiempo de un objeto de video.
• Objeto de video (VO): Un objeto de video Pueden ser codificados independientemente de cada
corresponde a un objeto 2D en particular en la otro, o dependiente de otro por el uso de
escena. En el caso más simple, esto puede ser un compensación de movimiento. Un cuadro de video
cuadro rectangular, o un objeto formado convencional puede ser representado por un VOP
arbitrariamente correspondiente a otro objeto o fondo con forma rectangular.
de la escena
Un plano de objeto de video puede ser usado en muchas
• Capa de objeto de video (VOL): Cada objeto de maneras. La más común es en la que el vop contiene la información
video puede ser codificado en forma escalable de video codificada de una muestra de tiempo de un objeto de video.
(multicapa), o no escalable (capa única), En ese caso contiene parámetros de movimientos, información de
dependiendo de la aplicación, representado por el forma e información sobre la textura. Puede también codificarse un
VOL. Provee soporte para codificación escalable. Un sprite. Un sprite es un objeto de video que es usualmente más grande
objeto de video puede ser codificado usando que el video mostrado, y persiste en el tiempo. Hay maneras de
escalabilidad temporal o espacial, yendo desde modificar ligeramente un sprite, cambiando su brillo o transformándolo
grandes a finas resoluciones. Dependiendo de en una deformación espacial. Es usado para representar, más o
parámetros como ancho de banda disponible, menos áreas estáticas, como fondos. Los sprites son codificados
potencia computacional, y preferencias de usuario, la usando macro bloques.
resolución deseada puede ser hecha
disponible para el decodificador

3
RADIODIFUSION. GOMEZ. - ALGORITMO MPEG-4

Un macro bloque contienen una sección de la componente de 3.1 CODIFICACIÓN DE FORMA BINARIA
luminancia y los componentes sub muestreados espacialmente de la
crominancia. En el estándar MPEG-4 hay soporte para sólo un La información de forma binaria es codificada por una técnica
formato de crominancia para un macro bloque, el formato 4:2:0. En de bloque compensado de movimiento permitiendo codificación con o
este formato, cada macro bloque contiene 4 bloques de luminancia y sin pérdidas de tal información. En MPEG-4, la forma de cada VOP
2 de crominancia. Cada bloque contiene 8x8 pixeles, y es codificado es codificada junto con sus otras propiedades (textura y movimiento).
usando la transformada DCT. Un macro bloque lleva la información Para este fin, la forma de un VOP es limitada por una ventana
de forma, movimiento y textura. rectangular con un tamaño de múltiplos de 16 píxeles en direcciones
vertical y horizontal. La posición del rectángulo limitante puede ser
La Figura 3 muestra el diagrama de bloques general de la elegida de tal manera que contenga en mínimo número de bloques de
codificación y decodificación de MPEG-4 basado en la noción de los 16x16 sin píxeles transparentes. Las muestras en la caja limitante son
objetos de video. Cada uno de estos es codificado separadamente. luego particionadas en bloque de 16x16 muestras y el proceso de
Por razones de eficiencia y retro compatibilidad, los objetos de video codificación/decodificación se realiza bloque por bloque.
son codificados por medio de sus correspondientes planos de objetos
de video en un esquema híbrido de alguna manera similar a los La matriz binaria representando la forma de un VOP es referido
anteriores estándares MPEG. La Figura 4 muestra un ejemplo de como una máscara binaria. Aquí, cada píxel perteneciente a la VOP
decodificación de un VOP. se establece a 255, y todos los otros píxeles a cero. Luego es
particionada en bloques alfa binarios (BAB) de 16x16. Cada BAB es
codificado separadamente. Empezando de cuadros rectangulares, es
común tener BABs con todos los píxeles del mismo valor, 0 (bloque
transparente) o 255 (bloque opaco). El algoritmo de compresión de
forma provee muchos modos para codificar un BAB. Las herramientas
básicas para codificar BABs son el algoritmo de Codificación
Aritmética basada en Contexto (CAE) [6], y compensación de
movimiento. InterCAE y IntraCAE son variantes del algoritmo CAE
usado con y sin compensación de movimiento, respectivamente.
Figura 3. Diagrama de bloques general de un video MPEG-4 Cada modo de codificación de forma soportada por el estándar es una
combinación de estas herramientas básicas. Los vectores de
movimiento pueden ser calculados buscando la mejor posición
concordante (dado por ea suma mínima de diferencias absolutas).
Los vectores de movimiento por sí mismos son codificados
diferencialmente. Cada BAB puede ser codificado en uno de los
siguientes modos:

1) El bloque es etiquetado como transparente. En este


caso, no es necesaria la codificación. La información
de textura tampoco es codificada para cada bloque.
2) El bloque es etiquetado como opaco. Una vez más,
Figura 4. Ejemplo de decodificación basada en VOP en la codificación de forma no es necesaria para tales
MPEG-4 bloques, pero la información de textura necesita ser
3 HERRAMIENTAS DE CODIFICACIÓN DE codificada (ya que ellos pertenecen al VOP)
3) El bloque es codificado usando IntraCAE sin uso de
FORMA información pasada.
4) La diferencia de vector de movimiento (MVD) es cero
En el estándar visual MPEG-4, 2 clases de información de pero el bloque no es actualizado.
forma son considerados como inherentes características de un objeto 5) MVD es cero y el bloque es actualizado. Inter CAE es
de video. Estos están referidos como la información de forma de usado para codificar la actualización del bloque.
escala de grises, y la binaria. Por esta última, se quiere decir de una 6) MVD no es cero, pero el bloque no es codificado.
información de etiqueta que define qué porciones (píxeles) del soporte
7) MVD no es cero, y el bloque está codificado.
del objeto pertenece al objeto de video en un tiempo determinado. La
información de forma binaria es mejor representada como una matriz
El algoritmo CAE es usado para codificar píxeles en BABs. El
con el mismo tamaño que la de la VOP. Cada elemento de la matriz
codificador aritmético es inicializado al comienzo del proceso. Cada
puede tomar uno de dos posibles valores dependiendo de si el píxel
pixel se codifica como sigue:
está dentro o fuera del objeto de video. La forma en escala de grises
es una generalización del concepto de forma binaria, proveyendo una
posibilidad de representar objetos transparentes, y reducir los efectos 1) Se calcula un número contexto de acuerdo a la
definición de la Figura 5.
de aliasing. Aquí, la información de forma es representada en 8 bits,
en vez de un valor binario. 2) Se indiza una tabla de probabilidad usando este
número de contexto.

4
RADIODIFUSION. GOMEZ. - ALGORITMO MPEG-4

3) Se usa la probabilidad obtenida para manejar el 3) Un VOP puede ser predicho en base a VOPs pasados
codificador aritmético para la asignación de palabra así como futuros. Tales son denominados VOPs
clave Interpolados
Bidireccionales (B-VOP). Estos pueden sólo ser
interpolados basados en I-VOP o PVOPs.

Obviamente, la estimación por movimiento es necesario sólo


para codificar P-VOPs y B-VOPs. La estimación es realizada solo para
macro bloques en la caja límite del VOP en cuestión. Si un macro
bloque yace enteramente en un VOP, la estimación es realizada en la
forma usual, basado en coincidencias de bloque de macro bloques
16x16, así como 8x8 bloques (en modo de predicción avanzada). Esto
Figura 5. Número contexto seleccionado para codificación de resulta en un vector de movimiento para el entero macro bloque, y uno
forma InterCAE (a) y Intra CAE (b). Para por cada uno de sus bloques. Los vectores de movimiento son
cada caso, el píxel a ser codificado está marcado por un círculo, y los calculados a precisión de media muestra.
píxeles contexto están marcados con
cruces. En el InterCAE, parte de los píxeles contexto son
tomados de los bloques alrededor en el cuadro anterior.

3.2 CODIFICACIÓN DE FORMA DE ESCALA DE


GRISES

La información de forma en escala de grises tiene una


estructura similar correspondiente a la de la forma binaria con la
diferencia que cada píxel (elemento de matriz) puede tomar un rango
de valores (0 a 255), transparente a oscuro. Valores intermedios
correspondes a intermedios grados de transparencia de ese píxel. Por
convención, una información de forma binaria corresponde a una Figura 6. Los 3 modos de codificación VOP. I-VOPs son codificados
información de forma de escala de grises con valores de 0 a 255. sin información de otros VOPs. P- y B-VOPs están predichos
basados en I- u otros P-VOPs.
La información de forma de escala de grises es codificada
usando un DCT compensado en movimiento basado en bloque, 5 HERRAMIENTAS DE CODIFICACIÓN DE
similar al de la codificación de textura, permitiendo sólo codificación TEXTURAS
con pérdidas. La codificación de forma de escala de grises también
hace uso de codificación de forma binaria para codificar su soporte.
La información de textura de un plano de objeto de video está
presente en la luminancia, Y, y 2 componentes de crominancia, Cb,
4 ESTIMACIÓN DE MOVIMIENTO Y Cr, de la señal de video. En el caso de un I-VOP, la información de
HERRAMIENTAS DE COMPENSACIÓN textura reside directamente en los componentes de luminancia y
crominancia. En el caso de VOPs compensados por movimiento, la
información de textura representa el error residual resultante después
La estimación del movimiento y compensación son
de la compensación. Para codificar la información de textura, el
comúnmente usadas para comprimir secuencias de video usando
estándar DCT basado en bloques 8x8 es usado. Para codificar un
redundancias temporales entre cuadros. Las aproximaciones para
VOP arbitrariamente formado, una malla de 8x8 es superpuesta en el
compensación por movimiento en MPEG-4 son similares a aquellos
VOP. Usando esta malla, los bloques 8x8 que son internos al VOP
usados en otros estándares. La principal diferencia es que las
son codificados sin modificaciones. Los bloques que se extienden en
técnicas basadas en bloques usadas en los otros estándares han sido
ambos lados del VOP son denominados bloques de frontera, y son
adaptadas para la estructura VOP usada en MPEG4. El estándar
tratados distintos de los bloques internos. Los bloques transformados
provee 3 nodos para codificar un VOP de entrada, como se muestra
son cuantizados, y una predicción de coeficiente individual puede ser
en la Figura 6, a nombrar:
usada desde los bloques vecinos para reducir más el valor de entropía
de los coeficientes. Esto es seguido por un scanning de los
1) Un VOP puede ser codificado independientemente de coeficientes para reducir la longitud de recorrido promedio hacia
cualquier otro VOP. En este caso, el VOP codificado coeficientes codificados. Luego, los coeficientes son codificados por
se denomina Intra VOP (I-VOP) codificación de longitud variable. Este proceso se muestra en
2) Un VOP puede ser predicho (por compensación de diagrama de bloques en la Figura
movimiento) basado en otro VOP decodificado 7:
previamente. Tales son los VOP Predichos (P-VOP)

5
RADIODIFUSION. GOMEZ. - ALGORITMO MPEG-4

Figura 7. Proceso de codificación de texturas VOP

6 RESILIENCIA A ERRORES
Figura 8. Herramientas de resiliencia de errores en
Esta funcionalidad es importante para acceso universal a través MPEG-4
de ambientes propensos a errores, como las comunicaciones móviles.

MPEG-4 provee varios mecanismos para permitir resiliencia a


errores con diferente grado de robustez y complejidad. Estos 7 CODIFICACIÓN DE SPRITE
mecanismos son ofrecidos por herramientas que proveen medios
para resincronización, detección de errores, recuperación de
Un sprite consiste de aquellas regiones de un VO que están
información y ocultación de errores. Hay 4 herramientas y son:
presentes en la escena, a lo largo del segmento de video.
Esencialmente es una imagen estática que puede ser trasmitida solo
• Resincronización Es la manera más frecuente de una vez, al inicio de la transmisión. Sprites han sido incluidos en
traer resiliencia a errores a un flujo de bits. Consiste MPEG-4 principalmente porque proveen alta eficiencia de compresión
en insertar marcadores únicos en el flujo de bits de en tales casos. La codificación basada en sprite es muy adecuada
modo que en caso de un error, el decodificador pueda para objetos sintéticos, aunque también puede ser usado para objetos
saltar los bits restantes hasta el siguiente marcador y en escenas naturales que van en movimiento rígido.
volver a decodificar desde ese punto en adelante.
Los sprites estáticos son generados, antes que empiece el
• Partición de información Este método separa los proceso de codificación, usando los originales VOPs. El decodificador
bits de codificación de información de movimiento y recibe cada sprite estático antes del resto del segmento del video, y
los de textura. En caso de error, un método más es codificado de tal manera que los reconstruidos VOPs pueden ser
eficiente de ocultamiento de error puede ser aplicado generados fácilmente.
cuando por ejemplo, el error ocurre en los bits de
textura.

• Código de extensión de cabecera Estos códigos 8 CONCLUSIONES


binario permiten una inclusión opcional de
información de cabecera redundante, vital para una MPEG-4 ha sido desarrollado para soportar un amplio rango de
correcta decodificación del video. De esta manera, aplicaciones multimedia. Los anteriores estándares principalmente se
las oportunidades de corrupción de la información de concentraron en compactar tanto video como audio, mientras que
cabecera y el completo salto de largas porciones del ahora MPEG-4 habilita funcionalidades que son requeridas por
flujo de bits será reducido muchas aplicaciones.

• VLCs reversibles Estos VLCs permiten reducir más El estándar visual MPEG-4 usa una representación basada en
la influencia de ocurrencia de errores en la objeto de la secuencia del video. Esto permite fácil acceso y
informaci{on decodificada. RVLCs son palabras manipulación de regiones arbitrarias en cuadros del video. La
código las cuales pueden ser decodificadas tanto estructura basada en Objetos de Video directamente soporta una
como hacia delante como por atrás. En caso de error funcionalidad altamente deseable: interactividad basada en objeto.
y salto de flujo de bits hasta el siguiente marcador de
resincronización, es posible aún decodificar Para permitir acceso universal, han sido consideradas también
porciones del flujo de bits corruptos en orden inverso en el estándar, funcionalidades orientadas a la transmisión.
para limitar el impacto del error. Funcionalidades para robustez ante errores y resiliencia en errores de
transmisión, y el control de la tasa adaptada al codificador
La Figura 8 resume la influencia de estas herramientas en la al disponible ancho de banda del canal. [7]
sintaxis del flujo de bits MPEG-4.

6
RADIODIFUSION. GOMEZ. - ALGORITMO MPEG-4

9 REFERENCIAS

[1] MPEG-1 Video Group, "Information Technology -


Coding of Moving Pictures and Associated Audio for Digital
Storage Media up to about 1.5 Mbit/s: Part 2 - Video," ISO/IEC
11172-2, International Standard, 1993.
[2] MPEG-2 Video Group, "Information Technology - Generic Coding
of Moving Pictures and Associated Audio: Part 2 - Video,"
ISO/IEC 13818-2, International
Standard, 1995.
[3] L. Chariglione, “MPEG and Multimedia Communications”, IEEE
Transactions on Circuits and Systems for Video Technology, Vol.
7, No. 1, pp. 5 18, Feb. 1997.
[4] MPEG-4 Video Group, “Generic Coding of Audio-Visual Objects:
Part 2 - Visual,” ISO/IEC JTC1/SC29/WG11 N1902, FDIS of
ISO/IEC 14496-2, Atlantic City, nov.1998
[5] ITU-T Experts Group on Very Bitrate Visual Telephony, “ITU-T
Recommendation H.263: Video Coding for Low Bitrate
Communication,” Dec. 1995.
[6] F. Bossen, T. Ebrahimi, "A simple and efficient binary shape coding
technique based
on bitmap representation" in Proc. of the International Conference
on Acoustics, Speech, and Signal
Processing (ICASSP'97), vol. 4, pp. 3129
3132, Munich, Germany, April 20-24, 1997.
[7] E. Touradj and H. Caspar**, "MPEG-4 Natural Video Coding - An
overview”

También podría gustarte