Está en la página 1de 7

FIEE – UNMSM. Mego.

Radiodifusión – Algoritmo MPEG-4


.

ALGORITMO MPEG-4
Diego Joseph Mego Guerrero
diegomegoguerrero@gmail.com

aplicaciones multimedia. Es aquí, donde MPEG (Moving


RESUMEN: El estándar MPEG-4, definido en Pictures Experts Group) se abocó al desarrollo del
ISO/IEC 14496-2, es desarrollado para proveer a los estándar MPEG-4, proveyendo una plataforma común
usuarios un nuevo nivel de interacción con los contenidos para un amplio rango de aplicaciones multimedia [3].
visuales. Provee tecnología para ver, acceder, y MPEG ha estado trabajando en este desarrollo desde
manipular objetos más allá que píxeles, con una gran 1993, después de 6 años, un Estándar Internacional ha
solidez ante errores en tasas de bit elevadas. Los campos adoptado finalmente la cobertura de la primera versión de
de aplicación varían desde televisión digital, transmisión MPEG-4. [4]
de video, hasta multimedia móvil y juegos. Provee
herramientas para codificación de forma, estimación de 2 VISTA GENERAL
movimiento y compensación, codificación de texturas,
resiliencia a errores, codificación de sprites y
escalabilidad. La codificación de forma se hace en modo 2.1 MOTIVACIÓN
binario, la forma de cada objeto es descrita por una
máscara binaria; la compensación de movimiento está El video digital está reemplazando al analógico en
basada en bloques, con modificaciones para los límites muchas aplicaciones existentes. Un ejemplo es la
del objeto; la de la textura se basa en 8x8 DC, y así el introducción de la televisión digital, que empieza un
resto. Los puntos de conformidad están definidos en el amplio despliegue. Otro ejemplo fue el reemplazo del
Perfil Simple, el Perfil Núcleo, y el Perfil Principal antiguo VHS por el DVD para la visualización de películas.
MPEG-2 ha sido uno de las tecnologías clave que
PALABRAS CLAVE: MPEG4, estándar, compresión, permitió la aceptación de esos nuevos formatos. En estas
codificación, multimedia. aplicaciones existentes, el video digital pareciera no diferir
mucho en funcionalidad con el video análogo, pero hay
obvios beneficios como una mejora de calidad y
1 INTRODUCCIÓN confiabilidad, aunque el contenido sea el mismo desde el
punto de vista del usuario. Sin embargo una vez en
contenido está en el dominio digital, nuevas
La multimedia está en la prioridad de la creciente
funcionalidades pueden ser añadidas fácilmente, que
atención de las telecomunicaciones, los usuarios finales,
permitirá al usuario interactuar en nuevas formas con el
y la industria de computadoras. En un amplio sentido, la
contenido. MPEG-4 provee las tecnologías clave que
multimedia es asumida como un marco de trabajo general
permitirá tales funcionalidades
para la interacción con información disponible de
diferentes fuentes, incluyendo video.
2.2 . ÁREAS DE APLICACIÓN
Un estándar multimedia debe proveer soporte para
un gran número de aplicaciones. Estas se trasladan en 2.2.1 TV DIGITAL
conjuntos específicos de requisitos los cuales pueden ser
muy diferentes uno del otro. Un tema común para la Con el crecimiento de la Internet, se aumentó la
mayoría de aplicaciones es la necesidad de soporte de capacidad del usuario de controlar gráficos, audio,
interactividad con diferentes tipos de información. Las imágenes y texto, para un valor agregado de ciertos
aplicaciones relacionadas a información visual pueden programas, o proveer información útil al televidente pero
ser agrupadas en la base de diferentes características: no necesariamente relacionado con el programa que se
está viendo. La capacidad de enlazar y sincronizar
 Tipo de data (imagen fija, video, etc.) eventos con video mejora la experiencia de usuario. La
 Tipo de fuente (imágenes naturales, codificación y representación de no sólo tramas de video,
imágenes por computadora, etc.) sino objetos individuales en pantalla, han abierto las
 Tipo de comunicación: desde punto a punto puertas a formas totalmente nuevas de la programación
hasta multipunto a multipunto en televisión
 Tipo de funcionalidades deseadas:
manipulación de objetos, edición en tiempo 2.2.2 MULTIMEDIA MÓVIL
real, etc.)
La enorme popularidad de los smartphones nos dan
Los estándares de video MPEG-1[1] y MPEG-2 [2], la idea del interés en las comunicaciones móviles y
aunque perfectamente adecuados en ambientes para los computación. Usando multimedia en estos dispositivos
cuales fueron diseñados, no son necesariamente flexibles mejoraría la experiencia de usuario. Estrechos anchos de
para manejar eficientemente los requisitos de las banda, capacidad computacional limitada, y confiabilidad

1
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.

de la transmisión son limitaciones que van siendo de las más importantes novedades que
superadas a grandes pasos, ya que hablamos de un aporta el estándar. Basado en una
estándar que tiene una mejor eficiencia de codificación y representación eficiente de objetos, como
una gran flexibilidad en la asignación de recursos su manipulación, edición en flujo de bits, y
computacionales. escalabilidad basada en objetos permite
nuevos niveles de interactividad de
2.2.3 PRODUCCIÓN DE TV contenido.

La creación de contenido ahora está volcada en 3) Acceso Universal: La robustez en entornos


técnicas de producción virtuales como extensiones al ya propensos a error permite al contenido
conocido chroma keying. La escena y actores son codificado en MPEG-4 ser accesible sobre
grabados por un lado, y puede ser mezclado con efectos un amplio rango de media, como redes
computacionales adicionales y efectos especiales. móviles así como las cableadas. En adición,
Codificando los objetos de videos en vez de cuadros de la escalabilidad temporal y espacial basada
videos rectangulares y lineales, y permitiendo acceso a en el objeto permite al usuario decidir donde
los objetos de video, la escena puede ser renderizada con usar recursos, como pueden ser el ancho de
mayor calidad y flexibilidad. La televisión que consiste en banda disponible.
objetos de videos compuestos, y audio y gráficos
adicionales, pueden ser transmitidos directamente al
usuario.

2.2.4 JUEGOS

La popularidad de los juegos demanda mayor


interacción del usuario. Muchos juegos diseñados en 3D
se vuelven más realistas con la adición de objetos de
video bajo técnicas de superposición. Es posible
personalizar, por tanto, los juegos mediante el uso de
bases de información de videos enlazados en tiempo real
en el mismo.
Figura 1. Funcionalidades ofrecidas por el estándar
2.2.5 TRANSMISIÓN DE VIDEO visual MPEG-4

El streaming de video en la Internet es más popular Para soportar algunas de estas


que nunca. Actualizaciones de noticias, redes sociales, funcionalidades, MPEG-4 debe proveer la
conciertos, etc. Aquí, el ancho de banda es limitado por el capacidad de representar arbitrariamente
uso de módems, y la confiabilidad dela transmisión es un objetos de video con forma definida. Cada
problema, ya que pueden ocurrir pérdidas de paquetes. objeto puede ser codificado con diferentes
Con una mejorada resiliencia a errores y mejor eficiencia
de codificación, MPEG-4 alivia tales problemas.
parámetros y a diferentes calidades. La forma
de un objeto de video puede ser representado
2.3 CARACTERÍSTICAS en MPEG-4por un plano binario o a nivel de
grises. La textura es codificada aparte de su
El estándar MPEG-4 consiste en un conjunto de forma. Para aplicaciones de baja tasa de bits,
herramientas que permiten aplicaciones al soportar se puede usar la codificación basada en cuadro,
muchas clases de funcionalidades. Las más importantes como en MPEG-1 y MPEG-2. Para aumentar la
cubiertas por este estándar pueden ser agrupadas en 3 robustez a los errores, son tomadas en cuenta
categorías, como se ve en la Figura 1, y resumida como previsiones especiales en el nivel del flujo de
sigue: bits para permitir una rápida re sincronización, y
una recuperación eficiente ante errores.
1) Eficiencia de compresión: Este concepto ha
sido la premisa principal para MPEG-1 y
MPEG-2, y ahora en sí mismo ha permitido El estándar MPEG-4 ha sido explícitamente
aplicaciones como TV Digital y DVD. La optimizado para tres rangos de tasa de bits
mejorada eficiencia de codificación de flujos
de datos concurrentes múltiples aumenta la 1) Debajo de 64 kbit/s
aceptación de aplicaciones basadas en el 2) 64-384 kbit/s
estándar MPEG-4 3) 348-4 Mbit/s

2) Interactividad basada en contenido: Para aplicaciones de alta calidad, altas tasas de


Codificando y representando objetos de bits son también soportadas mientras se use el
video en vez de cuadros, permite mismo set de herramientas y la misma sintaxis
aplicaciones basadas en contenidos. Es una

2
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.

de flujo de bits para los disponibles en las tasas correspondiente a otro objeto o fondo de la
de bits más bajas. escena

MPEG-4 provee soporte para material  Capa de objeto de video (VOL): Cada
objeto de video puede ser codificado en
entrelazado y progresivo. El formato de
forma escalable (multicapa), o no escalable
crominancia que es soportado es 4:2:0. En este (capa única), dependiendo de la aplicación,
formato el número muestras de Cb y Cr son la representado por el VOL. Provee soporte
mitad del número de muestras de las de la para codificación escalable. Un objeto de
luminancia tanto en horizontal como en vertical. video puede ser codificado usando
Cada componente puede ser representada por escalabilidad temporal o espacial, yendo
un número de bits variante de 4 a 12. desde grandes a finas resoluciones.
Dependiendo de parámetros como ancho de
banda disponible, potencia computacional, y
2.4 ESTRUCTURA Y SINTAXIS
preferencias de usuario, la resolución
deseada puede ser hecha disponible para el
El concepto central definido por el estándar MPEG-
decodificador
4 es el objeto audiovisual, el cual es el fundamento de la
representación basada en objeto. Tal representación está
acondicionada para aplicaciones interactivas y da acceso
directo a los contenidos de le escena. Nos limitaremos
principalmente a objetos de video natural. Un objeto de
video puede consistir de una o más capas para soportar
la codificación escalable. Esta sintaxis escalable permite
la reconstrucción del video en forma de capas partiendo
de una capa base autónoma, y agregando una serie de
capas de mejora. Esto permite a las aplicaciones generar
un único flujo de bits de video MPEG-4 para una variedad
de requisitos de ancho de banda y/o computacionales. Un
caso especial es donde un alto grado de escalabilidad es
requerida, y ocurre cuando una imagen estática es
mapeada en 2 o 3 objetos dimensionales. Para manejar
esta funcionalidad, el estándar provee un modo especial
para codificar texturas estáticas usando una
transformación ondícula. Figura 2. Ejemplo de una estructura lógica de flujo de
bits de video en MPEG-4
Una escena visual MPEG-4 puede consistir de uno
o más objetos de video, cada uno de ellos es
caracterizado por información espacial y temporal en los Hay 2 tipos de capas de objetos de video, la capa de
aspectos de su forma, movimiento, y textura. Para ciertas objeto de video que provee funcionalidad completa
aplicaciones, los objetos de video pueden no ser MPEG-4, y una capa de funcionalidad reducida, la capa
deseables, debido a posible dificultad de generarlos. Para de objeto de video con cabeceras cortas. El último provee
esas aplicaciones, el estándar permite las codificaciones compatibilidad de flujo de bits con la línea base H.263. [5]
de cuadros rectangulares los cuales representan un caso
degenerado de un objeto formado arbitrariamente. Cada objeto de video es muestreado en tiempo,
cada muestra de tiempo de un objeto de video es un plano
Un flujo de bits visual en MPEG-4 provee una de objeto de video. Estos puedes ser agrupador para
descripción jerárquica de una escena visual como se formar un conjunto de planos de objetos:
muestra en la Figura 2. Cada nivel de la jerarquía puede
ser accedido in el flujo de bits por códigos especiales
 Grupo de planos de objetos de video
llamados códigos de inicio. Los niveles jerárquicos que
(GOV): Proveen puntos en el flujo de bits
describen la escena más directamente son:
donde los planos de objetos de video son
codificados independientemente de cada
 Secuencia de objeto visual (VS): La otro, y por tanto proveer puntos de acceso
escena completa MPEG-4 que puede aleatorio dentro del flujo de bits. Los GOV
contener cualquier objeto natural o sintético son opcionales.
2D o 3D y sus correspondientes capas de
mejora.  Plano de objeto de video (VOP): Es la
muestra en tiempo de un objeto de video.
 Objeto de video (VO): Un objeto de video Pueden ser codificados
corresponde a un objeto 2D en particular en independientemente de cada otro, o
la escena. En el caso más simple, esto dependiente de otro por el uso de
puede ser un cuadro rectangular, o un compensación de movimiento. Un cuadro
objeto formado arbitrariamente

3
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.

de video convencional puede ser 3 HERRAMIENTAS DE CODIFICACIÓN


representado por un VOP con forma
rectangular. DE FORMA

Un plano de objeto de video puede ser usado en En el estándar visual MPEG-4, 2 clases de
muchas maneras. La más común es en la que el vop información de forma son considerados como inherentes
contiene la información de video codificada de una características de un objeto de video. Estos están
muestra de tiempo de un objeto de video. En ese caso referidos como la información de forma de escala de
contiene parámetros de movimientos, información de grises, y la binaria. Por esta última, se quiere decir de una
forma e información sobre la textura. Puede también información de etiqueta que define qué porciones
codificarse un sprite. Un sprite es un objeto de video que (píxeles) del soporte del objeto pertenece al objeto de
es usualmente más grande que el video mostrado, y video en un tiempo determinado. La información de forma
persiste en el tiempo. Hay maneras de modificar binaria es mejor representada como una matriz con el
ligeramente un sprite, cambiando su brillo o mismo tamaño que la de la VOP. Cada elemento de la
transformándolo en una deformación espacial. Es usado matriz puede tomar uno de dos posibles valores
para representar, más o menos áreas estáticas, como dependiendo de si el píxel está dentro o fuera del objeto
fondos. Los sprites son codificados usando macro de video. La forma en escala de grises es una
bloques. generalización del concepto de forma binaria, proveyendo
una posibilidad de representar objetos transparentes, y
Un macro bloque contienen una sección de la reducir los efectos de aliasing. Aquí, la información de
componente de luminancia y los componentes sub forma es representada en 8 bits, en vez de un valor
muestreados espacialmente de la crominancia. En el binario.
estándar MPEG-4 hay soporte para sólo un formato de
crominancia para un macro bloque, el formato 4:2:0. En 3.1 CODIFICACIÓN DE FORMA BINARIA
este formato, cada macro bloque contiene 4 bloques de
luminancia y 2 de crominancia. Cada bloque contiene 8x8
La información de forma binaria es codificada por
pixeles, y es codificado usando la transformada DCT. Un
una técnica de bloque compensado de movimiento
macro bloque lleva la información de forma, movimiento y
permitiendo codificación con o sin pérdidas de tal
textura.
información. En MPEG-4, la forma de cada VOP es
codificada junto con sus otras propiedades (textura y
La Figura 3 muestra el diagrama de bloques general movimiento). Para este fin, la forma de un VOP es limitada
de la codificación y decodificación de MPEG-4 basado en por una ventana rectangular con un tamaño de múltiplos
la noción de los objetos de video. Cada uno de estos es de 16 píxeles en direcciones vertical y horizontal. La
codificado separadamente. Por razones de eficiencia y posición del rectángulo limitante puede ser elegida de tal
retro compatibilidad, los objetos de video son codificados manera que contenga en mínimo número de bloques de
por medio de sus correspondientes planos de objetos de 16x16 sin píxeles transparentes. Las muestras en la caja
video en un esquema híbrido de alguna manera similar a limitante son luego particionadas en bloque de 16x16
los anteriores estándares MPEG. La Figura 4 muestra un muestras y el proceso de codificación/decodificación se
ejemplo de decodificación de un VOP. realiza bloque por bloque.

La matriz binaria representando la forma de un VOP


es referido como una máscara binaria. Aquí, cada píxel
perteneciente a la VOP se establece a 255, y todos los
otros píxeles a cero. Luego es particionada en bloques
alfa binarios (BAB) de 16x16. Cada BAB es codificado
separadamente. Empezando de cuadros rectangulares,
es común tener BABs con todos los píxeles del mismo
valor, 0 (bloque transparente) o 255 (bloque opaco). El
Figura 3. Diagrama de bloques general de un video algoritmo de compresión de forma provee muchos modos
MPEG-4 para codificar un BAB. Las herramientas básicas para
codificar BABs son el algoritmo de Codificación Aritmética
basada en Contexto (CAE) [6], y compensación de
movimiento. InterCAE y IntraCAE son variantes del
algoritmo CAE usado con y sin compensación de
movimiento, respectivamente. Cada modo de codificación
de forma soportada por el estándar es una combinación
de estas herramientas básicas. Los vectores de
movimiento pueden ser calculados buscando la mejor
posición concordante (dado por ea suma mínima de
diferencias absolutas). Los vectores de movimiento por sí
mismos son codificados diferencialmente. Cada BAB
Figura 4. Ejemplo de decodificación basada en VOP en puede ser codificado en uno de los siguientes modos:
MPEG-4

4
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.

1) El bloque es etiquetado como transparente. basado en bloque, similar al de la codificación de textura,


En este caso, no es necesaria la permitiendo sólo codificación con pérdidas. La
codificación. La información de textura codificación de forma de escala de grises también hace
tampoco es codificada para cada bloque. uso de codificación de forma binaria para codificar su
2) El bloque es etiquetado como opaco. Una soporte.
vez más, la codificación de forma no es
necesaria para tales bloques, pero la 4 ESTIMACIÓN DE MOVIMIENTO Y
información de textura necesita ser
codificada (ya que ellos pertenecen al VOP) HERRAMIENTAS DE
3) El bloque es codificado usando IntraCAE sin COMPENSACIÓN
uso de información pasada.
4) La diferencia de vector de movimiento La estimación del movimiento y compensación son
(MVD) es cero pero el bloque no es comúnmente usadas para comprimir secuencias de video
actualizado. usando redundancias temporales entre cuadros. Las
5) MVD es cero y el bloque es actualizado. aproximaciones para compensación por movimiento en
Inter CAE es usado para codificar la MPEG-4 son similares a aquellos usados en otros
actualización del bloque. estándares. La principal diferencia es que las técnicas
6) MVD no es cero, pero el bloque no es basadas en bloques usadas en los otros estándares han
codificado. sido adaptadas para la estructura VOP usada en MPEG-
7) MVD no es cero, y el bloque está codificado. 4. El estándar provee 3 nodos para codificar un VOP de
entrada, como se muestra en la Figura 6, a nombrar:
El algoritmo CAE es usado para codificar píxeles en
BABs. El codificador aritmético es inicializado al comienzo 1) Un VOP puede ser codificado
del proceso. Cada pixel se codifica como sigue: independientemente de cualquier otro VOP.
En este caso, el VOP codificado se
1) Se calcula un número contexto de acuerdo denomina Intra VOP (I-VOP)
a la definición de la Figura 5. 2) Un VOP puede ser predicho (por
2) Se indiza una tabla de probabilidad usando compensación de movimiento) basado en
este número de contexto. otro VOP decodificado previamente. Tales
3) Se usa la probabilidad obtenida para son los VOP Predichos (P-VOP)
manejar el codificador aritmético para la 3) Un VOP puede ser predicho en base a
asignación de palabra clave VOPs pasados así como futuros. Tales son
denominados VOPs Interpolados
Bidireccionales (B-VOP). Estos pueden sólo
ser interpolados basados en I-VOP o P-
VOPs.

Obviamente, la estimación por movimiento es


necesario sólo para codificar P-VOPs y B-VOPs. La
estimación es realizada solo para macro bloques en la
caja límite del VOP en cuestión. Si un macro bloque yace
Figura 5. Número contexto seleccionado para enteramente en un VOP, la estimación es realizada en la
codificación de forma InterCAE (a) y Intra CAE (b). Para forma usual, basado en coincidencias de bloque de macro
cada caso, el píxel a ser codificado está marcado por un bloques 16x16, así como 8x8 bloques (en modo de
círculo, y los píxeles contexto están marcados con predicción avanzada). Esto resulta en un vector de
cruces. En el InterCAE, parte de los píxeles contexto son movimiento para el entero macro bloque, y uno por cada
tomados de los bloques alrededor en el cuadro anterior. uno de sus bloques. Los vectores de movimiento son
calculados a precisión de media muestra.
3.2 CODIFICACIÓN DE FORMA DE ESCALA
DE GRISES
La información de forma en escala de grises tiene
una estructura similar correspondiente a la de la forma
binaria con la diferencia que cada píxel (elemento de
matriz) puede tomar un rango de valores (0 a 255),
transparente a oscuro. Valores intermedios correspondes
a intermedios grados de transparencia de ese píxel. Por
convención, una información de forma binaria
corresponde a una información de forma de escala de
grises con valores de 0 a 255.
Figura 6. Los 3 modos de codificación VOP. I-VOPs son
La información de forma de escala de grises es codificados sin información de otros VOPs. P- y B-VOPs
codificada usando un DCT compensado en movimiento están predichos basados en I- u otros P-VOPs.

5
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.

5 HERRAMIENTAS DE CODIFICACIÓN  Partición de información Este método


separa los bits de codificación de
DE TEXTURAS información de movimiento y los de textura.
En caso de error, un método más eficiente
La información de textura de un plano de objeto de de ocultamiento de error puede ser aplicado
video está presente en la luminancia, Y, y 2 componentes cuando por ejemplo, el error ocurre en los
de crominancia, Cb, Cr, de la señal de video. En el caso bits de textura.
de un I-VOP, la información de textura reside
directamente en los componentes de luminancia y  Código de extensión de cabecera Estos
crominancia. En el caso de VOPs compensados por códigos binario permiten una inclusión
movimiento, la información de textura representa el error opcional de información de cabecera
residual resultante después de la compensación. Para redundante, vital para una correcta
codificar la información de textura, el estándar DCT decodificación del video. De esta manera,
basado en bloques 8x8 es usado. Para codificar un VOP las oportunidades de corrupción de la
arbitrariamente formado, una malla de 8x8 es información de cabecera y el completo salto
superpuesta en el VOP. Usando esta malla, los bloques de largas porciones del flujo de bits será
8x8 que son internos al VOP son codificados sin reducido
modificaciones. Los bloques que se extienden en ambos
lados del VOP son denominados bloques de frontera, y  VLCs reversibles Estos VLCs permiten
son tratados distintos de los bloques internos. Los reducir más la influencia de ocurrencia de
bloques transformados son cuantizados, y una predicción errores en la informaci{on decodificada.
de coeficiente individual puede ser usada desde los RVLCs son palabras código las cuales
bloques vecinos para reducir más el valor de entropía de pueden ser decodificadas tanto como hacia
los coeficientes. Esto es seguido por un scanning de los delante como por atrás. En caso de error y
coeficientes para reducir la longitud de recorrido promedio salto de flujo de bits hasta el siguiente
hacia coeficientes codificados. Luego, los coeficientes marcador de resincronización, es posible
son codificados por codificación de longitud variable. Este aún decodificar porciones del flujo de bits
proceso se muestra en diagrama de bloques en la Figura corruptos en orden inverso para limitar el
7: impacto del error.

La Figura 8 resume la influencia de estas


herramientas en la sintaxis del flujo de bits MPEG-4.

Figura 7. Proceso de codificación de texturas VOP

6 RESILIENCIA A ERRORES
Esta funcionalidad es importante para acceso
universal a través de ambientes propensos a errores,
Figura 8. Herramientas de resiliencia de errores en
como las comunicaciones móviles.
MPEG-4
MPEG-4 provee varios mecanismos para permitir
resiliencia a errores con diferente grado de robustez y
complejidad. Estos mecanismos son ofrecidos por
herramientas que proveen medios para resincronización, 7 CODIFICACIÓN DE SPRITE
detección de errores, recuperación de información y
ocultación de errores. Hay 4 herramientas y son: Un sprite consiste de aquellas regiones de un VO
que están presentes en la escena, a lo largo del segmento
 Resincronización Es la manera más de video. Esencialmente es una imagen estática que
frecuente de traer resiliencia a errores a un puede ser trasmitida solo una vez, al inicio de la
flujo de bits. Consiste en insertar transmisión. Sprites han sido incluidos en MPEG-4
marcadores únicos en el flujo de bits de principalmente porque proveen alta eficiencia de
modo que en caso de un error, el compresión en tales casos. La codificación basada en
decodificador pueda saltar los bits restantes sprite es muy adecuada para objetos sintéticos, aunque
hasta el siguiente marcador y volver a también puede ser usado para objetos en escenas
decodificar desde ese punto en adelante. naturales que van en movimiento rígido.

6
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.

Los sprites estáticos son generados, antes que


empiece el proceso de codificación, usando los originales
VOPs. El decodificador recibe cada sprite estático antes
del resto del segmento del video, y es codificado de tal
manera que los reconstruidos VOPs pueden ser
generados fácilmente.

8 CONCLUSIONES
MPEG-4 ha sido desarrollado para soportar un
amplio rango de aplicaciones multimedia. Los anteriores
estándares principalmente se concentraron en compactar
tanto video como audio, mientras que ahora MPEG-4
habilita funcionalidades que son requeridas por muchas
aplicaciones.

El estándar visual MPEG-4 usa una representación


basada en objeto de la secuencia del video. Esto permite
fácil acceso y manipulación de regiones arbitrarias en
cuadros del video. La estructura basada en Objetos de
Video directamente soporta una funcionalidad altamente
deseable: interactividad basada en objeto.

Para permitir acceso universal, han sido


consideradas también en el estándar, funcionalidades
orientadas a la transmisión. Funcionalidades para
robustez ante errores y resiliencia en errores de
transmisión, y el control de la tasa adaptada al codificador
al disponible ancho de banda del canal. [7]

9 REFERENCIAS

[1] MPEG-1 Video Group, "Information Technology -


Coding of Moving Pictures and
Associated Audio for Digital Storage Media up to
about 1.5 Mbit/s: Part 2 - Video," ISO/IEC 11172-2,
International Standard, 1993.
[2] MPEG-2 Video Group, "Information Technology -
Generic Coding of Moving Pictures and Associated
Audio: Part 2 - Video," ISO/IEC 13818-2, International
Standard, 1995.
[3] L. Chariglione, “MPEG and Multimedia
Communications”, IEEE Transactions on Circuits and
Systems for Video Technology, Vol. 7, No. 1, pp. 5
18, Feb. 1997.
[4] MPEG-4 Video Group, “Generic Coding of Audio-
Visual Objects: Part 2 - Visual,”
ISO/IEC JTC1/SC29/WG11 N1902, FDIS of ISO/IEC
14496-2, Atlantic City, Nov.1998
[5] ITU-T Experts Group on Very Bitrate Visual
Telephony, “ITU-T Recommendation
H.263: Video Coding for Low Bitrate Communication,”
Dec. 1995.
[6] F. Bossen, T. Ebrahimi, "A simple and efficient binary
shape coding technique based
on bitmap representation" in Proc. of the International
Conference on Acoustics, Speech, and Signal
Processing (ICASSP'97), vol. 4, pp. 3129-
3132, Munich, Germany, April 20-24, 1997.
[7] E. Touradj and H. Caspar**, "MPEG-4 Natural Video
Coding - An overview”

También podría gustarte