Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MPG4 MEGO Word
MPG4 MEGO Word
ALGORITMO MPEG-4
Diego Joseph Mego Guerrero
diegomegoguerrero@gmail.com
1
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.
de la transmisión son limitaciones que van siendo de las más importantes novedades que
superadas a grandes pasos, ya que hablamos de un aporta el estándar. Basado en una
estándar que tiene una mejor eficiencia de codificación y representación eficiente de objetos, como
una gran flexibilidad en la asignación de recursos su manipulación, edición en flujo de bits, y
computacionales. escalabilidad basada en objetos permite
nuevos niveles de interactividad de
2.2.3 PRODUCCIÓN DE TV contenido.
2.2.4 JUEGOS
2
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.
de flujo de bits para los disponibles en las tasas correspondiente a otro objeto o fondo de la
de bits más bajas. escena
MPEG-4 provee soporte para material Capa de objeto de video (VOL): Cada
objeto de video puede ser codificado en
entrelazado y progresivo. El formato de
forma escalable (multicapa), o no escalable
crominancia que es soportado es 4:2:0. En este (capa única), dependiendo de la aplicación,
formato el número muestras de Cb y Cr son la representado por el VOL. Provee soporte
mitad del número de muestras de las de la para codificación escalable. Un objeto de
luminancia tanto en horizontal como en vertical. video puede ser codificado usando
Cada componente puede ser representada por escalabilidad temporal o espacial, yendo
un número de bits variante de 4 a 12. desde grandes a finas resoluciones.
Dependiendo de parámetros como ancho de
banda disponible, potencia computacional, y
2.4 ESTRUCTURA Y SINTAXIS
preferencias de usuario, la resolución
deseada puede ser hecha disponible para el
El concepto central definido por el estándar MPEG-
decodificador
4 es el objeto audiovisual, el cual es el fundamento de la
representación basada en objeto. Tal representación está
acondicionada para aplicaciones interactivas y da acceso
directo a los contenidos de le escena. Nos limitaremos
principalmente a objetos de video natural. Un objeto de
video puede consistir de una o más capas para soportar
la codificación escalable. Esta sintaxis escalable permite
la reconstrucción del video en forma de capas partiendo
de una capa base autónoma, y agregando una serie de
capas de mejora. Esto permite a las aplicaciones generar
un único flujo de bits de video MPEG-4 para una variedad
de requisitos de ancho de banda y/o computacionales. Un
caso especial es donde un alto grado de escalabilidad es
requerida, y ocurre cuando una imagen estática es
mapeada en 2 o 3 objetos dimensionales. Para manejar
esta funcionalidad, el estándar provee un modo especial
para codificar texturas estáticas usando una
transformación ondícula. Figura 2. Ejemplo de una estructura lógica de flujo de
bits de video en MPEG-4
Una escena visual MPEG-4 puede consistir de uno
o más objetos de video, cada uno de ellos es
caracterizado por información espacial y temporal en los Hay 2 tipos de capas de objetos de video, la capa de
aspectos de su forma, movimiento, y textura. Para ciertas objeto de video que provee funcionalidad completa
aplicaciones, los objetos de video pueden no ser MPEG-4, y una capa de funcionalidad reducida, la capa
deseables, debido a posible dificultad de generarlos. Para de objeto de video con cabeceras cortas. El último provee
esas aplicaciones, el estándar permite las codificaciones compatibilidad de flujo de bits con la línea base H.263. [5]
de cuadros rectangulares los cuales representan un caso
degenerado de un objeto formado arbitrariamente. Cada objeto de video es muestreado en tiempo,
cada muestra de tiempo de un objeto de video es un plano
Un flujo de bits visual en MPEG-4 provee una de objeto de video. Estos puedes ser agrupador para
descripción jerárquica de una escena visual como se formar un conjunto de planos de objetos:
muestra en la Figura 2. Cada nivel de la jerarquía puede
ser accedido in el flujo de bits por códigos especiales
Grupo de planos de objetos de video
llamados códigos de inicio. Los niveles jerárquicos que
(GOV): Proveen puntos en el flujo de bits
describen la escena más directamente son:
donde los planos de objetos de video son
codificados independientemente de cada
Secuencia de objeto visual (VS): La otro, y por tanto proveer puntos de acceso
escena completa MPEG-4 que puede aleatorio dentro del flujo de bits. Los GOV
contener cualquier objeto natural o sintético son opcionales.
2D o 3D y sus correspondientes capas de
mejora. Plano de objeto de video (VOP): Es la
muestra en tiempo de un objeto de video.
Objeto de video (VO): Un objeto de video Pueden ser codificados
corresponde a un objeto 2D en particular en independientemente de cada otro, o
la escena. En el caso más simple, esto dependiente de otro por el uso de
puede ser un cuadro rectangular, o un compensación de movimiento. Un cuadro
objeto formado arbitrariamente
3
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.
Un plano de objeto de video puede ser usado en En el estándar visual MPEG-4, 2 clases de
muchas maneras. La más común es en la que el vop información de forma son considerados como inherentes
contiene la información de video codificada de una características de un objeto de video. Estos están
muestra de tiempo de un objeto de video. En ese caso referidos como la información de forma de escala de
contiene parámetros de movimientos, información de grises, y la binaria. Por esta última, se quiere decir de una
forma e información sobre la textura. Puede también información de etiqueta que define qué porciones
codificarse un sprite. Un sprite es un objeto de video que (píxeles) del soporte del objeto pertenece al objeto de
es usualmente más grande que el video mostrado, y video en un tiempo determinado. La información de forma
persiste en el tiempo. Hay maneras de modificar binaria es mejor representada como una matriz con el
ligeramente un sprite, cambiando su brillo o mismo tamaño que la de la VOP. Cada elemento de la
transformándolo en una deformación espacial. Es usado matriz puede tomar uno de dos posibles valores
para representar, más o menos áreas estáticas, como dependiendo de si el píxel está dentro o fuera del objeto
fondos. Los sprites son codificados usando macro de video. La forma en escala de grises es una
bloques. generalización del concepto de forma binaria, proveyendo
una posibilidad de representar objetos transparentes, y
Un macro bloque contienen una sección de la reducir los efectos de aliasing. Aquí, la información de
componente de luminancia y los componentes sub forma es representada en 8 bits, en vez de un valor
muestreados espacialmente de la crominancia. En el binario.
estándar MPEG-4 hay soporte para sólo un formato de
crominancia para un macro bloque, el formato 4:2:0. En 3.1 CODIFICACIÓN DE FORMA BINARIA
este formato, cada macro bloque contiene 4 bloques de
luminancia y 2 de crominancia. Cada bloque contiene 8x8
La información de forma binaria es codificada por
pixeles, y es codificado usando la transformada DCT. Un
una técnica de bloque compensado de movimiento
macro bloque lleva la información de forma, movimiento y
permitiendo codificación con o sin pérdidas de tal
textura.
información. En MPEG-4, la forma de cada VOP es
codificada junto con sus otras propiedades (textura y
La Figura 3 muestra el diagrama de bloques general movimiento). Para este fin, la forma de un VOP es limitada
de la codificación y decodificación de MPEG-4 basado en por una ventana rectangular con un tamaño de múltiplos
la noción de los objetos de video. Cada uno de estos es de 16 píxeles en direcciones vertical y horizontal. La
codificado separadamente. Por razones de eficiencia y posición del rectángulo limitante puede ser elegida de tal
retro compatibilidad, los objetos de video son codificados manera que contenga en mínimo número de bloques de
por medio de sus correspondientes planos de objetos de 16x16 sin píxeles transparentes. Las muestras en la caja
video en un esquema híbrido de alguna manera similar a limitante son luego particionadas en bloque de 16x16
los anteriores estándares MPEG. La Figura 4 muestra un muestras y el proceso de codificación/decodificación se
ejemplo de decodificación de un VOP. realiza bloque por bloque.
4
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.
5
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.
6 RESILIENCIA A ERRORES
Esta funcionalidad es importante para acceso
universal a través de ambientes propensos a errores,
Figura 8. Herramientas de resiliencia de errores en
como las comunicaciones móviles.
MPEG-4
MPEG-4 provee varios mecanismos para permitir
resiliencia a errores con diferente grado de robustez y
complejidad. Estos mecanismos son ofrecidos por
herramientas que proveen medios para resincronización, 7 CODIFICACIÓN DE SPRITE
detección de errores, recuperación de información y
ocultación de errores. Hay 4 herramientas y son: Un sprite consiste de aquellas regiones de un VO
que están presentes en la escena, a lo largo del segmento
Resincronización Es la manera más de video. Esencialmente es una imagen estática que
frecuente de traer resiliencia a errores a un puede ser trasmitida solo una vez, al inicio de la
flujo de bits. Consiste en insertar transmisión. Sprites han sido incluidos en MPEG-4
marcadores únicos en el flujo de bits de principalmente porque proveen alta eficiencia de
modo que en caso de un error, el compresión en tales casos. La codificación basada en
decodificador pueda saltar los bits restantes sprite es muy adecuada para objetos sintéticos, aunque
hasta el siguiente marcador y volver a también puede ser usado para objetos en escenas
decodificar desde ese punto en adelante. naturales que van en movimiento rígido.
6
FIEE – UNMSM. Mego. Radiodifusión – Algoritmo MPEG-4
.
8 CONCLUSIONES
MPEG-4 ha sido desarrollado para soportar un
amplio rango de aplicaciones multimedia. Los anteriores
estándares principalmente se concentraron en compactar
tanto video como audio, mientras que ahora MPEG-4
habilita funcionalidades que son requeridas por muchas
aplicaciones.
9 REFERENCIAS