Está en la página 1de 10

Libro blanco

Estndar de compresin de vdeo H.264.


Nuevas ventajas para la videovigilancia.

ndice
1. Introduccin

2. Desarrollo de H.264

3. Cmo funciona la compresin de vdeo

4. Perfiles y niveles de H.264

5. En qu consisten los fotogramas

6. Mtodos bsicos de reduccin de datos

7. Eficiencia de H.264

8. Conclusiones

1.

Introduccin
Se espera que el ms reciente estndar de compresin de vdeo, H.264 (tambin denominado MPEG-4
Parte 10/AVC para Codificacin de Vdeo Avanzada) se convierta en el estndar de vdeo a elegir en los
prximos aos.
H.264 es un estndar abierto con licencia que es compatible con las tcnicas ms eficientes de compresin
de vdeo hoy disponibles. Sin comprometer la calidad de la imagen, un codificador H.264 puede reducir
el tamao de un archivo de vdeo digital en ms de un 80% si se compara con Motion JPEG, y hasta un
50% comparado con el estndar MPEG-4 Parte 2. Esto significa que se requiere menos ancho de banda
y espacio de almacenamiento para los archivos de vdeo. O, visto de otra manera, se puede lograr mayor
calidad de imagen de vdeo para una frecuencia de bits determinada.
H.264 es un estndar definido de manera conjunta por organizaciones de normalizacin de los sectores
de telecomunicaciones e industrias de TI, y se espera que su aceptacin sea ms generalizada que en el
caso de estndares anteriores.
H.264 ya se ha utilizado en nuevos aparatos electrnicos como telfonos mviles y reproductores de
vdeo digital, y ha sido aceptado rpidamente por los usuarios. Los proveedores de servicios como las
empresas de almacenamiento de vdeo en lnea o las empresas de telecomunicaciones tambin estn
empezando a adoptar H.264.
En el sector de la videovigilancia, H.264 encontrar su mayor utilidad en aplicaciones donde se necesiten
velocidades y resoluciones altas, como en la vigilancia de autopistas, aeropuertos y casinos, lugares donde
por regla general se usa una velocidad de 30/25 (NTSC/PAL) imgenes por segundo. Es aqu donde las
ventajas econmicas de un ancho de banda y un almacenamiento reducidos se harn sentir de forma ms
clara.
Se espera que H.264 acelere tambin la adopcin de cmaras megapxel, ya que con esta eficiente
tecnologa de compresin se pueden reducir los archivos de gran tamao y las frecuencias de bits sin que
la calidad de la imagen se vea afectada. En cualquier caso, tiene sus exigencias: aunque H.264 permite
ahorrar en costes de ancho de banda y almacenamiento, tambin necesita cmaras de red y estaciones
de control de mejor rendimiento.

2.

Desarrollo de H.264
H.264 es el resultado de un proyecto conjunto entre el grupo de expertos de codificacin de vdeo de
ITU-T y el grupo de expertos de imgenes en movimiento de ISO/IEC (MPEG). ITU-T es el sector que coordina
los estndares de telecomunicaciones en nombre de la Unin Internacional de Telecomunicaciones. ISO son
las siglas de International Organization for Standardization (Organizacin Internacional de Normalizacin),
mientras que IEC son las de International Electrotechnical Commission (Comisin Electrotcnica
Internacional), que supervisa los estndares de todas las tecnologas elctricas, electrnicas y afines. H.264
es el nombre usado por ITU-T, mientras que ISO/IEC utiliza el nombre MPEG-4 Parte 10/AVC, ya que lo
presenta como parte de su suite MPEG-4. La suite MPEG-4 incluye, por ejemplo, MPEG-4 Parte 2, que es
un estndar que ya ha sido usado por codificadores de vdeo basados en IP y cmaras de red.
Diseado para solucionar una serie de debilidades de estndares de compresin de vdeo anteriores, H.264
satisface con xito su objetivo de admitir:
>

>
>
>
>

Implementaciones que ofrezcan una reduccin de la frecuencia de bits del 50%, a partir de una
calidad de vdeo fija y comparada con otros estndares de vdeo
Robustez frente a errores, de forma que se toleren los errores de transmisin a travs de varias redes
Capacidades de baja latencia y mejor calidad para latencias mayores
Specificacin de sintaxis directa que simplifique las implementaciones
Descodificacin de coincidencia exacta, que define exactamente cuntos clculos numricos debe
realizar un codificador y un decodificador para evitar que se acumulen errores

H.264 tiene tambin la flexibilidad suficiente como para admitir una amplia gama de aplicaciones con
diferentes requisitos de frecuencia de bits. Por ejemplo, en aplicaciones de vdeo de entretenimiento lo
que incluye retransmisiones, satlite, cable y DVD H.264 podr ofrecer un rendimiento de entre 1 y 10
Mbit/s con una alta latencia, mientras que en servicios de telecomunicaciones puede ofrecer frecuencias
de bits inferiores a 1 Mbit/s con baja latencia.

3.

Cmo funciona la compresin de vdeo


La compresin de vdeo implica reducir y eliminar datos redundantes del vdeo para que el archivo de
vdeo digital pueda enviarse y almacenarse de manera eficiente.
En este proceso se aplica un algoritmo al vdeo original para crear un archivo comprimido y ya listo para
ser transmitido o guardado. Para reproducir el archivo comprimido, se aplica el algoritmo inverso y se
crea un vdeo que incluye prcticamente el mismo contenido que el vdeo original. El tiempo que se tarda
en comprimir, enviar, descomprimir y mostrar un archivo es lo que se denomina latencia. Cuanto ms
avanzado es el algoritmo de compresin, mayor es la latencia a igual potencia de procesamiento.
El par de algoritmos que funcionan conjuntamente se denomina cdec de vdeo (codificador/decodificador).
Los cdecs de vdeo que hacen uso de estndares diferentes no suelen ser compatibles entre s, es decir,
el contenido de vdeo comprimido con un estndar no se puede descomprimir con otro estndar diferente.
Por ejemplo, un decodificador MPEG-4 Parte 2 no funcionar con un codificador H.264. Esto ocurre
simplemente porque un algoritmo no puede descodificar correctamente los datos de salida del otro
algoritmo, pero es posible usar muchos algoritmos diferentes en el mismo software o hardware, con
objeto de poder comprimir varios formatos.
Los diferentes estndares de compresin de vdeo utilizan mtodos diferentes para reducir los datos y,
en consecuencia, los resultados en cuanto a frecuencia de bits y latencia son diferentes.
Los resultados de los codificadores que utilizan el mismo estndar de compresin pueden variar tambin
debido a que el diseador de un codificador haya decidido usar diferentes conjuntos de las herramientas
definidas por un estndar. Siempre que los datos de salida de un codificador se ajusten al formato de un
estndar, se pueden realizar implementaciones diferentes. Esto es una ventaja, ya que cada implementacin
puede tener sus propios objetivos y presupuestos. Los codificadores profesionales que no funcionan en
tiempo real y que se utilizan para el control de medios pticos deberan tener la opcin de poder ofrecer
un mejor vdeo codificado que un codificador de hardware en tiempo real para videoconferencias
integrado en un dispositivo porttil. Un estndar determinado, en consecuencia, no puede garantizar la
frecuencia de bits o la calidad. Adems, el rendimiento de un estndar no se puede comparar
adecuadamente con otros estndares, ni incluso con otras implementaciones del mismo estndar, sin
definir primero cmo se implementa.
Un decodificador, a diferencia de un codificador, debe implementar todas las partes necesarias de un
estndar para descodificar una transmisin de bits compatible. Esto se debe a que un estndar especifica
exactamente la forma en la que el algoritmo de descompresin debe restaurar cada bit de un archivo
comprimido.
El grfico siguiente compara la frecuencia de bits, partiendo de la misma calidad de imagen, entre los
siguientes estndares de vdeo: Motion JPEG, MPEG-4 Parte 2 (sin compensacin de movimiento),
MPEG-4 Parte 2 (con compensacin de movimiento) y H.264 (perfil de base).

Escena de una
puerta de entrada
H.264 (perfil base)
MPEG-4 parte 2, (sin compensacin de movimiento)
MPEG-4 parte 2, (sin compensacin de movimiento)

Frecuencia de bits (kbit/s)

7,000

Motion JPEG

6,000

5,000

4,000

3,000

2,000

1,000

50

100
Tiempo(s)

Figura 1.

4.

Un codificador H.264 cre hasta un 50% menos bits por segundo para una secuencia de vdeo de muestra que un codificador
MPEG-4 con compensacin de movimiento. El codificador H.264 fue al menos tres veces ms eficiente que un codificador MPEG-4
sin compensacin de movimiento y al menos seis veces ms eficiente que Motion JPEG.

Perfiles y niveles de H.264


El grupo implicado en la definicin de H.264 se centr en la creacin de una solucin sencilla y elegante,
limitando al mnimo las opciones y funciones. Un aspecto importante de este estndar es que, al igual
que otros estndares de vdeo, proporciona sus capacidades en forma de perfiles (conjuntos de
caractersticas algortmicas) y niveles (clases de rendimiento) que admiten producciones populares y
formatos comunes.
H.264 tiene siete perfiles, cada uno de los cuales va destinado a una clase concreta de aplicaciones.
Cada perfil define qu conjunto de caractersticas puede usar el codificador y limita la complejidad de
implementacin del decodificador.
Lo ms probable es que las cmaras de red y los codificadores de vdeo usen un perfil denominado base,
que est destinado, sobre todo, a aplicaciones con recursos informticos limitados. El perfil base es el
ms adecuado dado el rendimiento disponible para un codificador en tiempo real que est integrado en
un producto de vdeo de red. Asimismo, el perfil permite una baja latencia, algo importante en la
videovigilancia y especialmente importante para permitir el control de movimiento horizontal/vertical/
zoom (PTZ) en tiempo real en cmaras de estas caractersticas.
H.264 tiene 11 niveles o grados de capacidad para limitar los requisitos de rendimiento, ancho de banda
y memoria. Cada nivel define la frecuencia de bits y la frecuencia de codificacin en macrobloques por
segundo para resoluciones que van de QCIF a HDTV y ms all. Cuanto mayor es la resolucin, mayor es
el nivel requerido.

5.

En qu consisten los fotogramas


Segn cual sea el perfil de H.264, el codificador puede utilizar diferentes tipos de fotogramas (imgenes
estticas): fotogramas I, fotogramas P y fotogramas B.
Un fotograma I, o intrafotograma, es una imagen autnoma que se puede codificar de forma independiente
sin hacer referencia a otras imgenes. La primera imagen de una secuencia de vdeo es siempre un
fotograma I. Los fotogramas I sirven como puntos de inicio en nuevas visualizaciones o como puntos de
resincronizacin si la transmisin de bits resulta daada. Los fotogramas I se pueden utilizar para
implementar funciones de avance o retroceso rpido o de acceso aleatorio. Un codificador insertar
automticamente fotogramas I a intervalos regulares o a peticin de nuevos clientes que puedan
incorporarse a la visualizacin de una transmisin. La desventaja de este tipo de fotogramas es que
consumen muchos ms bits, pero por otro lado no generan demasiados artefactos (defectos).

Un fotograma P (de interfotograma Predictivo), hace referencia a partes de fotogramas I o P anteriores


para codificar el fotograma. Los fotogramas P suelen requerir menos bits que los fotogramas I, pero con
la desventaja de ser muy sensibles a la transmisin de errores, debido a la compleja dependencia con
fotogramas P o I anteriores.
Un fotograma B, o interfotograma Bipredictivo, es un fotograma que hace referencia tanto a fotogramas
anteriores como posteriores.

Figura 2.

Secuencia tpica con fotogramas I-, B y P. Un fotograma P slo puede hacer referencia a fotogramas I o P anteriores, mientras que
un fotograma B puede hacerlo a fotogramas I o P anteriores o posteriores.

Cuando un decodificador de vdeo restaura un vdeo descodificando la transmisin de bits fotograma a


fotograma, la descodificacin debe comenzar siempre por un fotograma I. Los fotogramas P y B, en caso
de usarse, deben descodificarse junto a los fotogramas de referencia.
En el perfil base de H.264 slo se utilizan fotogramas I y P. Este perfil es el ideal para cmaras de red y
codificadores de vdeo, ya que la latencia se reduce gracias a la ausencia de fotogramas B.

6.

Mtodos bsicos de reduccin de datos


Existe toda una variedad de mtodos que pueden utilizarse para reducir los datos de vdeo, tanto dentro
de un fotograma de imagen como entre una serie de fotogramas.
Dentro del fotograma de la imagen, los datos pueden reducirse, simplemente, eliminando la informacin
que no es necesaria y que afecta a la resolucin de la imagen.
En una serie de fotogramas, los datos de vdeo se pueden reducir con mtodos como la codificacin
diferencial, utilizada en la mayora de estndares de compresin de vdeo, H.264 incluido. En la
codificacin diferencial, un fotograma se compara con otro fotograma de referencia (como un fotograma
I o P anterior) y slo se codifican los pxeles que han cambiado respecto al fotograma de referencia. De
esta forma, se reduce el nmero de valores de pxeles que hay que codificar y enviar.

Figura 3.

Con el formato Motion JPEG, se codifican y envan las tres imgenes de la secuencia de arriba como imgenes separadas y nicas,
(fotogramas I), sin dependencias entre s.

Transmitido

Figura 4.

No transmitido

Con la codificacin diferencial, (la utilizada en la mayor parte de estndares de compresin de vdeo, H.264 incluido), slo se
codifica entera la primera imagen (fotograma I). En las dos imgenes siguientes (fotogramas P), existen referencias a la primera
imagen en lo que se refiere a elementos estticos, como la casa, mientras que slo se codifican las partes mviles, como el hombre
que corre, usando vectores de movimiento y reduciendo as la cantidad de informacin que se enva y almacena.

El grado de codificacin se puede reducir an ms si la codificacin y descodificacin de las diferencias


se basa en bloques de pxeles (macrobloques) en vez de en pxeles individuales. La consecuencia es que
se comparan reas ms grandes y slo se codifican los bloques que son significativamente distintos.
Asimismo, se reduce la sobrecarga asociada a la localizacin de las reas a cambiar.
La codificacin diferencial, de cualquier manera, no reducir los datos de forma significativa si hay
mucho movimiento en el vdeo. En este caso, pueden utilizarse tcnicas como la compensacin de
movimiento basada en bloques. La compensacin de movimiento basada en bloques tiene en cuenta que
gran parte de un fotograma nuevo est ya incluido en el fotograma anterior, aunque quizs en un lugar
diferente del mismo. Esta tcnica divide un fotograma en una serie de macrobloques. Se puede componer
o predecir un nuevo fotograma (por ejemplo, un fotograma P) bloque a bloque, buscando un bloque que
coincida en un fotograma de referencia. Si se encuentra una coincidencia, el codificador simplemente
codifica la posicin en la que se ha encontrado el bloque que coincide del fotograma de referencia. La
codificacin del vector de movimiento, como se denomina, precisa de menos bits que si hubiera de
codificarse el contenido real de un bloque.
Ventana de bsqueda

Vector de movimiento

Fotograma de
eferencia anterior
Figura 5.

7.

Bloque coincidente

Bloque de destino

Fotograma P

Ilustracin de la compensacin de movimiento basada en bloques

Eficiencia de H.264
H.264 lleva la tecnologa de compresin de vdeo a un nuevo nivel. Con H.264 se introduce un nuevo y
avanzado esquema de prediccin interna para codificar fotogramas I. Este esquema reduce en gran medida
el tamao en bits de un fotograma I y conserva una gran calidad, permitiendo la prediccin sucesiva de
bloques de pxeles ms pequeos dentro de un macrobloque de un fotograma. Esto se realiza buscando
los pxeles coincidentes entre los pxeles anteriormente codificados que rodean a un nuevo bloque de 4x4

pxeles que se va a codificar internamente. Mediante la reutilizacin de los valores de pxel que ya han sido
codificados, se puede reducir drsticamente el tamao en bits. Esta nueva prediccin interna es una parte
fundamental de la tecnologa H.264 y ha demostrado ser muy eficiente. A modo de comparacin, si se
utilizaran exclusivamente fotogramas I en una transmisin H.264, el tamao del archivo sera mucho
menor que si se utilizara una transmisin Motion JPEG, que slo utiliza fotogramas I.
En este modo, los cuatro pxeles inferiores del bloque de arriba se copian
verticalmente en parte de un macrobloque codificado internamente.

Figura 6.

Figura 7.

En este modo, los cuatro pxeles de la


derecha del bloque de la izquierda se
copian horizontalmente en parte un
macrobloque codificado internamente.

En este modo, los ocho pxeles inferiores de los bloques de arriba se copian
diagonalmente en parte de un macrobloque codificado internamente.

Ilustraciones de algunos de los modos de prediccin interna que pueden tener lugar en la codificacin de 4x4 pxeles dentro de uno
de los 16 bloques que forman un macrobloque. Cada uno de los 16 bloques de un macrobloque se pueden codificar usando mtodos
distintos.

Imagen original

Imagen resultante de la prediccin interna

Imagen residual

Imagen de salida

Las imgenes de arriba ilustran la eficiencia del esquema de prediccin interna de H.264, mediante el cual la imagen resultante de
la prediccin interna puede enviarse gratis. Slo es necesario codificar el contenido residual y los modos de prediccin interna
para crear la imagen de salida.

La compensacin de movimiento basada en bloques (usada para codificar los fotogramas P y B) tambin
ha sido mejorada en el estndar H.264. Un codificador puede elegir entre buscar bloques coincidentes
(con una precisin inferior a un pxel) en unas pocas o en muchas reas de uno o varios fotogramas de
referencia. El tamao y la forma del bloque tambin se puede ajustar para mejorar las coincidencias
encontradas. En reas donde no se encuentran bloques coincidentes en un fotograma de referencia, se
utilizan macrobloques codificados internamente. El alto grado de flexibilidad de la compensacin de
movimiento basada en bloques es til en la vigilancia de escenas abigarradas, manteniendo la calidad en
aplicaciones exigentes. La compensacin de movimiento es el aspecto ms exigente de un codificador de
vdeo, y las diferentes formas y grados en el que puede implementarlo el codificador H.264 puede afectar
a la eficiencia de la compresin del vdeo.
Con H.264, los tpicos defectos pixelados (que pueden verse en vdeo muy comprimido usando los
estndares Motion JPEG y MPEG en vez de H.264) se pueden reducir usando un filtro de eliminacin de
bloques en bucle. Este filtro suaviza los bordes de los bloques con intensidad adaptativa para ofrecer un
vdeo descomprimido casi perfecto.

Figura 8.

8.

Los artefactos (defectos) pixelados en la imagen muy comprimida de la izquierda se reducen al aplicar un filtro de eliminacin de
bloques, como se muestra en la imagen de la derecha.

Conclusiones
H.264 es un gran paso adelante en la tecnologa de compresin de vdeo, ofrece tcnicas ms eficientes en
la compresin gracias a sus mejores capacidades de prediccin y a su capacidad de recuperacin ante
errores. Este estndar ofrece nuevas posibilidades a la hora de crear mejores codificadores de vdeo que
permiten transmisiones de vdeo de mayor calidad y a mayores resoluciones manteniendo las mismas
frecuencias de bits (en comparacin a estndares anteriores), o, a la inversa, la misma calidad e vdeo con
frecuencias de bits inferiores. H.264 es el primer proyecto conjunto entre ITU, ISO y IEC para lograr un
estndar de compresin de vdeo comn e internacional. Gracias a su flexibilidad, H.264 ya ha sido aplicado
en distintas reas como el DVD de alta definicin (como Blu-ray), la difusin de vdeo digital, incluyendo la
TV de alta definicin, el almacenamiento de vdeo en lnea (como YouTube), la telefona mvil de tercera
generacin y en software como QuickTime, Flash y el sistema operativo de los ordenadores Apple , MacOS
X, as como en consolas de videojuegos como PlayStation 3. Con el apoyo de tantas industrias y aplicaciones
para consumidores y profesionales, se espera que H.264 sustituya al resto de estndares y mtodos de
compresin utilizados en la actualidad.
A medida que el formato H.264 sea cada vez ms usado en cmaras de red, codificadores de vdeo y
software de gestin de vdeo, los diseadores e integradores de sistemas debern asegurarse de que los
productos y proveedores que elijan usen este nuevo estndar abierto. Y hasta el momento, los productos de
vdeo en red compatibles con H.264 y Motion JPEG son los ideales para lograr la mayor flexibilidad e
integracin posibles.

31805/ES/R1/0804

www.axis.com

Acerca de Axis Communications


Axis es una compaa de TI que ofrece soluciones de
vdeo IP dirigidas al mercado profesional. La compaa es
lder del mercado del vdeo IP, conduciendo el cambio de
la vdeo vigilancia analgica hacia las soluciones digitales. Los productos y soluciones de Axis estn diseados
para los sectores de la vigilancia, la seguridad y la monitorizacin remota, y estn basados en la innovacin y en
los estndares abiertos.
Axis es una compaa sueca que tiene oficinas en 18
paises, y que coopera con socios comerciales en ms de
70 pases de todo el mundo. Fundada en 1984, Axis
Communications cotiza en la Bolsa de Suecia (OMX
Exchange). Si desea ms informacin acerca de Axis
Communications, por favor visite www.axis.com

2008 Axis Communications AB. AXIS COMMUNICATIONS, AXIS, ETRAX, ARTPEC y VAPIX son marcas comerciales registradas o solicitudes de registro de
marca comercial de Axis AB en diferentes jurisdicciones. Todos los dems nombres de empresas, productos y denominaciones sociales son marcas comerciales
registradas de su respectivo titular. Nos reservamos el derecho de introducir modificaciones sin previo aviso.

También podría gustarte