Está en la página 1de 28

CONSIDERACIONES INICIALES

En primer lugar, SIEMPRE es preferible mantener la calidad del original. Si se está


pensando copiar un video de más de 120 minutos, ojalá utilizar DVDs de doble capa o
dos DVDs.

En segundo lugar, el formato MPEG-2 (usado en SVCDs y DVDs) SIEMPRE es


preferible a cualquier otro. Por asuntos de compatibilidad y calidad, lo más
recomendable es utilizar este formato en la medida de lo posible.

Finalmente, el CD posee SIEMPRE peor calidad que el DVD, incluso en formatos


MPEG-4 ASP. Debe utilizarse sólo en casos que no se posea grabador de DVD.

CONCEPTOS IMPORTANTES

BITRATE: es la relación entre bits que se leen y el tiempo en segundos en que ocurre
dicha lectura. La unidad de medición aquí utilizada será el kilobit por segundo (kbps),
equivalente a 1.000 bits por segundo. El bitrate determina la calidad de un flujo de
video: a mayor bitrate, mayor calidad y viceversa.

CODEC: archivo que contiene la información de codificacion y/o decodificación de un


formato específico.

CODIFICADOR: aplicacion o codec que realiza el proceso de codificación de un flujo.

CUADRO: cualquiera de las imágenes que conforman un flujo de video.

FLUJO DE AUDIO: cualquier elemento de audio de un archivo de película.

FLUJO DE VIDEO: cualquier elemento de video de un archivo de película.

FRAME RATE: es la relación entre cuadros que se muestran y el tiempo en segundos.


La unidad de medición aquí utilizda serán los cuadros por segundo (fps). El frame rate
depende del estándar: NTSC = 29,97 (23,976 para NTSC FILM), PAL = 25)

MPEG-1: es el estándar de video utilizado en VCD. Su intención inicial fue


proporcionar buena calidad de imagen a través de la compresión de video. La
compresión de video constaba de la exclusión de toda la información que el ojo humano
no es capaz de notar, lo cual hace que el formato sea conocido como "con pérdidas". De
esta forma se logra una mejor eficiencia, sin pérdidas significativas de calidad.

MPEG-2: es el estándar de video utilizado en SVCD y VCD (destinado a reemplazar a


MPEG-1), el cual entrega un nivel de calidad de imagen bastante adecuado a bitrates
bajos respecto de cuadros no comprimidos.

MPEG-4 ASP: es un estándar de video, destinado originalmente a su uso en redes,


utilizado ampliamente hoy en día. Introduce mejoras en la compresión de video
mediante nuevas técnicas (como el Q-Pel y el GMC) y algoritmos. Entre los codecs más
conocidos están DivX, XviD y Sorenson.
RESOLUCIÓN: es la cantidad de pixeles de un flujo de video, expresado a través del
ancho por el alto de la imagen. A mayor resolución, mejor calidad de imagen y más
necesidad de bitrate. Los formatos de televisión estándar (SDTV) permiten un máximo
de 720x480 pixeles en NTSC y 720x576 en PAL.

FORMATOS

Los formatos de video aquí analizados (MPEG-1, MPEG-2 y MPEG-4 ASP) poseen
todos análisis de imagen similares. Lo que los codificadores de video hacen es tomar la
imagen y dividirla en bloques de 16x16 pixeles. A cada bloque se le asigna un número
que se determina internamente (por el propio codificador, cuando quien codifica
especifica el bitrate) o externamente (por quien codifica, el cual digita un número para
todos los cuadros). Esta es la razón por la cual la resolución debe expresarse en
múltiplos de 16. De no ser así, los pixeles que el codificador no encuentre los asumirá
negros y podrían producirse inconsistencias en los bordes de la imagen. Además,
cuando se especifican bajos bitrates o bitrates constantes (sobre todo en MPEG-2)
tienden a aparecer "bloques" (blocking) en la imagen. Estos bloques son precisamente
de 16x16 pixeles y se deben a que el codificador no calcula con precisión os valores a
cada bloque, lo cual hace que se noten durante la reproducción.

MPEG-2 está diseñado para su uso a altos bitrates. Se estima que a 9.800 kbps (a
máxima resolución, según estándar), el ojo humano no es capaz de distinguir entre el
original y el codificado, en cualquier tipo de flujo. Bitrates menores tendrán
necesariamente calidad menor al original.

MPEG-4 ASP funciona a menores bitrates que MPEG-2, por lo tanto su calidad es
mejor a MPEG-2 al mismo bitrate. El uso de Q-Pel mejora la calidad del análisis,
mientras que GMC mejora su compresión a cambio de bajas en calidad.

Para ambos formatos, la mejor calidad de codificación se obtiene mediante dos pasadas
(2-pass encoding): en la primera se analiza el flujo y en la segunda se adapta al bitrate
especificado por quien codifica. Basándonos en esto, se establecerá un indicador de
calidad basado en los cuadros de un flujo de video.

CALIDAD DE CUADRO

Se definirá la CALIDAD DE CUADRO (QF) como la relación entre los bits de un


segundo de video y los pixeles totales de un segundo de video:

QF = bitrate / (ancho * alto * frame rate)

El indicador determina cuantos bits se le asignan a cada pixel en promedio en un flujo


de video. Despejando el bitrate obtenemos una fórmula para determinarlo.

BITRATE = QF * ancho * alto * frame rate

Para cada codec el QF es distinto, lo cual permite clasificarlos según su eficiencia.

Según mis propias estimaciones, XviD posee una calidad bastante alta para QFs de 0,25
en adelante, mientras que las peores se logran con QFs menores a 0,15 (con Q-Pel
activado y GMC desactivado en ambos casos).

La existencia del QF permite también cambiar los parámetros manteniendo la calidad lo


más constante posible. En los TV convencionales (de tubo) la diferencia de imagen
suele ser imperceptible cuando se reduce la resolución horizontal de 720 hasta 480
(SVCD). Por lo tanto, podemos determinar el bitrate con un QF que sea equivalente al
de un SVCD (0,364948 -> SVCD, con 2520 kbps CBR) con la resolución horizontal
que queramos (siempre que sea múltiplo de 16). En caso que necesitemos más espacio,
podría ser necesario reducir también la resolución vertical.

Para terminar, es obvio que la calidad de un video no mejora si buscamos agrandar su


resolución. Sólo se incurre en un gasto de espacio. Los buenos supersampleadores sólo
se adquieren profesionalmente.

H.264: ¿La muerte de DivX?


No hay duda que DivX (y eventualmente XviD) se ha convertido en el rey de la
compresión de video en el último tiempo. En el internet es muy común encontrar
archivos de videomúsica, deportes, noticias y otros en este formato. Por otro lado, los
reproductores de DVD lo han incluido dentro de sus múltiples formatos, junto con
JPEG, VCD y SVCD, y se ha hecho vastamente popular a través de todo el mundo.

Sin embargo, una nueva amenaza, como alguna vez lo fueron Sorenson de Quicktime y
Windows Media Video, aparece en el horizonte con el fin de arrebatarle la supremacía
dentro de los formatos de video. El vertiginoso desarrollo de los formatos basados en
MPEG-4 AVC/H.264 están dejando cada vez más atrás a DivX (y XviD). Tanto que en
la comparación realizada por compression.ru
(http://www.compression.ru/video/code...4_2005_en.html) acerca de la calidad de los
diferentes codecs del nuevo estándar, DivX, usado como punto de comparación, salió
último en la mayoría de las pruebas realizadas.

¿De qué se trata este nuevo estándar? Es el desarrollo de la parte 10 del estándar
MPEG-4, y se conoce como AVC (Advanced Video Coding) o H.264 (en virtud de la
norma que le da su nombre, según la International Telecommunication Union, ITU),
definida en Mayo de 2003. A grandes rasgos, amplía la norma anterior (la parte 2,
conocida como Advanced Simple Profile, ASP), de la cual forma parte DivX, XviD,
ffmpeg y Quicktime entre otros, y le da mayor funcionalidad, agregando nuevas
técnicas de compresión y otras cualidades que, a diferencia de especificaciones
anteriores que se aplicaban durante la decodificación de los flujos de video, se aplican
durante la codificación misma, haciendo más fácil la decodificación. Entre las más
importantes están el filtro de deblocking, los cuadros de referencia multiple y el mayor
uso de herramientas de compensación de movimientos (motion compensation) a través
de macrobloques de 16x16 y hasta 4x4.

La mayor amenaza para DVD es que H.264 se ha transformado en la especificación


obligatoria para el nuevo formato HD-DVD y Blu-ray Disc, ambos competidores
directos del DVD, así como también las transmisiones digitales para Europa, Estados
Unidos, Corea y Japón. Así mismo se está desarrollando su uso en apliaciones 3GPP
para telefonía móvil.
El software existente para la codificación y decodificación en formato H.264 está
conformado por Nero Digital (en colaboración con Ateme), Quicktime 7, Sorenson
AVC, Main Concept, Lead Technologies, Pixeltools Expert, W&W Communications y
BT, todos con venta bajo licencia. Dentro de los proyectos abiertos están el
decodificador de libavcodec a través de ffdshow
(http://ffdshow.sourceforge.net/tikiw...w_articles.php) y el codificador x264
(http://developers.videolan.org/x264.html), el cual puede utilizarse en archivos avi con
excelentes resultados a bitrates bajos.

La apuesta está hecha. Sólo Windows Media Video podría tener algo que decir en esta
batalla, debido a que también es parte de la especificación de HD-DVD y Blu-ray Disc,
a pesar que su formato, aunque es de libre uso, esté bajo el desarrollo exclusivo de
Microsoft. Pero eso sólo el tiempo lo dirá.

By ALEX-KID

Acerca de entrelazar y desentrelazar


Este es un artículo que explica qué es entrelazar y desentrelazar, cómo funciona y
para qué sirve. Muchos de los términos usados se mantendrán en inglés para una mejor
comprensión de estos en páginas web especializadas.

El entrelazado o (interlace en inglés) es una técnica visual que se basa en mostrar la


imagen alternando entre líneas horizontales impares y pares de cada cuadro. Estos 2
grupos de líneas se conocen como campos (fields en inglés) y conforman entonces cada
cuadro de imagen de video.

El movimiento continuo y suave requiere entre 24 y 30 cuadros por segundo (fps en


inglés) y el utilizar más sería un gasto de ancho de banda de transmisión. En los inicios
de la TV, en 1920, la imagen era proyectada de forma progresiva (un cuadro completo
tras otro, sin entrelazar) de izquierda a derecha (no de arriba hacia abajo, como en la
actualidad). Sin embargo, esto provocaba un notorio parpadeo (flickering en inglés) lo
cual producía cansancio visual. Esto podía remediarse con al menos 50 fps, pero la
tecnología de ese tiempo no permitía tan alta tasa de refresco. Entonces se pensó en
mostrar una línea por medio primero y después las líneas de entre medio que llenaran
por completo la imagen. De esta forma se eliminó el flickering y las líneas alcanzaban a
recuperarse para mostrar el siguiente cuadro, por lo que la tasa de refresco de cada field
era de 25 fps, pero la de la imagen por completo era de 50 fps. Este proceso se conoce
actualmente como entrelazado.

Gráficamente el entrelazado puede apreciarse de la siguiente manera:


donde se pueden apreciar dos imágenes superpuestas con un efecto "peineta".

Una muy buena pregunta es si es mejor el video entrelazado o el video progresivo.


Obviamente, el video progresivo entrega una mayor claridad en las imágenes, ya que
son cuadros completos los que se muestran. Esto podemos apreciarlo en nuestros
computadores, donde la imagen es precisamente progresiva, donde la tasa de refresco en
Hz del monitor entrega el fps (ej.: 60 Hz = 60 fps). Así también, las pantallas de LCD y
plasma también entregan señales progresivas de video, con un proceso de
desentrelazado intermedio cuando se recibe una señal análoga de televisión. Sin
embargo, los televisores con tubo de cátodos aún utilizan la señal entrelazada para
mostrar imágenes, razón por la cual aún es importante entender el entrelazado.

Entendiendo que progresivo es mejor que entrelazado, examinaré algunas técnicas de


desentrelazado para procesar video, por ejemplo, de los DVDs que son codificados con
video entrelazado. Volviendo a la imagen anterior, veremos que está formada por dos
imágenes:
¿Cómo llegar a esta separación? Existen básicamente 3 procedimientos, los cuales serán
analizados con los filtros de Virtualdub como herramienta de referencia.

1. Blend: consiste en "borrar" las líneas de entrelazado fusionando los campos.


Aunque es un método muy limpio de desentrelazado (no queda ninguna línea),
produce un efecto "fantasmal" (ghosting) en la imagen que puede ser indeseable.
Sin embargo es uno de los más rápidos de hacer y no es molesto visualmente.

2. Descartar y duplicar campos: la primera reduce la resolución vertical del


video, y puede ser útil en caso que queramos crear un VCD a partir de un DVD
(pasaría de 480 a 240 la resolución vertical), porque de otro modo habría que
redefinir el tamaño (resize) perdiendo detalle en el video. La segunda reemplaza
un campo por otro, de forma que queda la imagen formada sólo por un campo.
Esto puede producir pixelación, sobre todo cuando las líneas oblicuas o
diagonales tienen mucha presencia.
3. Motion compensation: es una técnica predictiva que se basa en estimar el
movimiento de los pixeles (con vectores) para dibujar el nuevo cuadro. Es la
más indicada para desentrelazar, pero también la más compleja. En el mercado
se utiliza mucho profesionalmente, siendo una de las mejores aplicaciones
HiCon32 de Fraunhofer Institute (puedes bajar el demo desde aquí)

Uno de los buenos filtros de desentrelazado para Virtualdub es el "smart deinterlace",


que utiliza motion compensation simple.

Mención aparte merece la técnica de 2:3 pulldown o telecine (también conocido como
3:2 pulldown), que consiste en entrelazar una imagen progresiva de tipo fílmico (23,976
fps) para obtener una imagen de tipo video NTSC (29,97 fps). Esto se hace repitiendo
cuadros y campos de la siguiente forma:

CUATRO CUADROS DE FILM: A B C D

CINCO CUADROS DE VIDEO: A1A2 B1B2 B1C2 C1D2 D1D2

donde las letras son los cuadros y los números los campos. De esta forma se crea un
nuevo cuadro repitiendo los cuadros de film 2-3-2-3 veces (AA-BBB-CC-DDD),
quedando entonces con una tasa de refresco de 29,97 fps entrelazado (59,94 fps). Al
crear un DVD de tipo fílmico se le habilita un "switch" para indicarle al reproductor que
realice el telecine, de forma que pueda verse en la TV. Si se cuenta con un DVD con
"progressive scan" podrá verse el video a los 23,976 fps originales (sólo si se cuenta con
una salida progresiva, como las pantallas de plasma y lcd). Si el DVD está grabado con
2:3 pulldown, basta con utilizar el "inverse telecine" del Virtualdub, que se encuentra en
el menú "Video -> Frame Rate" en su modalidad "adaptive". De esa forma se obtendrá
un video de 23,976 fps, con un desentrelazado limpio, a la vez que se ahorra espacio.

#2: Optimizar la relación resolución/bitrate en video.


Este documento es muy útil para lo relativo al ripeo digital-digital (DVD a VCD, DV
a DVD, etc) y análogo-digital (TV a DVD, VHS a DVD, etc). Entrega sugerencias y
explicaciones acerca de la mejor forma de hacer estos traspasos sin malgastar espacio en
disco ni ancho de banda.

Conceptos preliminares:

Resolución: nivel de detalle de un video en pixeles horizontales por pixeles verticales.


Mientras mayor el nivel de detalle, mejor se ve. Es análogo a los megapixeles de las
cámaras fotográficas.

Bitrate: nivel de "calidad" de un video. Indica la tasa de transferencia de información


en bits por segundo. A mayor tasa de transferencia, mejor calidad.
Ahora bien, las transmisiones de TV en Chile utilizan la norma estadounidense,
conocida como NTSC y corresponden a 525 líneas horizontales entrelazadas, de las
cuales se visualizan 480 en nuestras TVs. El detalle horizontal, por otra parte, la parte
visible de una de estas líneas horizontales, corresponde a 440 puntos o pixeles.

Las videograbadoras reducen la resolución de las transmisiones de TV, de manera que


con una resolución de 260 líneas horizontales basta para obtener la misma calidad. En
puntos horizontales bastan 330 puntos. En el caso de videograbadoras formato S-VHS
la resolución mejora a 360 líneas horizontales y 400 puntos. Las filmadoras con cintas
análogas entregan una resolución similar a los VHS.

Los formatos digitales son los que mejor responden a los altos niveles de imagen. Tanto
DVDs como filmadoras DV entregan 480 líneas horizontales y 720 puntos.

Volviendo al inicio del tema, la idea es no malgastar ancho de banda y espacio en disco
duro al momento de realizar el traspaso a formato digital.
De esta forma se sugieren las siguientes especificaciones, las cuales incluyen resolución
y formato MPEG-2 para video:

Captura directa TV:


- 480x480 a 5000 kbps (max)

Ripeo VHS:
- 384x288 a 3200 kbps (max)

Ripeo SVHS:
- 480x480 a 5000 kbps (max)

Ripeo a DVD o DV:


- 720x480 a 9800 kbps (max)

Así se ahorra espacio en disco y no se mal utiliza, ya que una mayor resolución no
mejorará la imagen.

Se responderán dudas acerca de esto.

Saludos

By ALEX-KID

Alta definición y guía de uso codificador x264.


El concepto de alta definición está acaparando cada vez más atención.
Recientemente, el Mundial de Fútbol de Alemania fue el último suceso transmitido en
este formato, pero en EE.UU., Reino Unido y Francia, estas transmisiones han ido en
aumento desde el 2005, principalmente para eventos deportivos.

Y no es para menos. La alta definición consiste en una mayor densidad de la pantalla de


TV, lo cual permite que las imágenes sean más nítidas (hasta cinco veces). Y tomando
en cuenta que va necesariamente de la mano con la TV digital, los resultados mejoran
aún más. Esto, debido a que la digitalización permite un uso eficiente del ancho de
banda, lo cual favorece la entrega de contenidos adicionales a las típicas señales de
video y audio, como transmisión de datos, interactividad, contenido para teléfonos
móviles, internet, etc.

Si la definición estándar consiste en 525 líneas horizontales para NTSC (625 para PAL),
de las cuales sólo son visibles 480 (576 para PAL), para la TV de alta definición, en
adelante HDTV, esa resolución aumenta en ambos casos: a 720 líneas, con barrido
progresivo (1280x720 = 720p), y hasta 1080 líneas con barrido progresivo o entrelazado
(1920x1080 = 1080p ó 1080i). En caso de señal entrelazada, se utilizan frecuencias de
refresco de 60Hz (60 cuadros por segundo, NTSC) y 50Hz (50 cuadros por
segundo, PAL), similares a la TV convencional. Para ambos casos (720 y 1080 líneas)
la relación de aspecto es de 16:9 (pantalla ancha).

La diferencia entre HDTV con la TV convencional puede apreciarse en el siguiente


gráfico:

En él se compara lo que abarca cada formato.

Aquí hay una captura de pantalla de una transmisión a 720p (tamaño real, grande):

Spoiler:
y aquí la misma a 1080p (tamaño real, más grande todavía):
Spoiler:

Como formato digital, la HDTV, requiere de codecs que compriman las señales. Se
estableció que podría elegirse entre MPEG-2 (el mismo de los DVD), H.264 y VC-1
(WMV-HD). Estos mismos codecs se utilizarían en la fabricación de los nuevos
reproductores de video de alta definición HD-DVD y Bluray Disc, que buscan
reemplazar al formato DVD.

En Chile, el CNTV está preocupado por comenzar de una buena vez el proceso de
migración hacia esta tecnología. Tomando en cuenta que aún falta definir las
especificaciones y lineamientos que adoptará el formato aunque todo parece indicar que
se adoptará el formato norteamericano), parece ser que Chile se está quedando atrás en
HDTV. Hay que considerar que EE.UU. y el bloque europeo ya ha comenzado su
proceso de transición: desde 1998 que comenzaron la migración hacia HDTV y varios
países europeos piensan finalizar sus procesos en 2012, mientras que EE.UU. pretende
hacerlo en 2009 e Italia a fines de este año. Latinoamérica en general está fuera de este
tema, salvo México (2021) y Brasil (2013-2018).

Dada la progresiva popularidad del formato H.264, y su futura implementación en


HDTV, he preparado una guía de uso del único codec abierto de este tipo capaz de
competir con los que se desarrollan en forma comercial: x264.

El codec x264 viene en dos interfaces: VfW y CLI. En esta sección se analizarán los
dos, sus pro y sus contras y el uso de cada interfaz.

La versión más conocida de x264 es la de Video for Windows (VfW) y es la más usada
debido a su interfaz gráfica y su integración con el contenedor estándar de Microsoft
(AVI), el cual es posible encontrar en casi cualquier software de edición de video. Sin
embargo, esta versión presenta limitaciones debido a la antigüedad del estándar de
Microsoft en cuanto a aplicación de la nueva tecnología. La versión "adecuada" es la
versión Command Line Interface (CLI), ya que por defecto almacena la película en
MP4, el contenedor definido en la especificación H.264, y cuenta con todas las mejoras
incluidas en el codec. Por lo tanto, la sugerencia para grabar películas en x264 es
utilizar el CLI para codificarlas y así hacer un uso eficiente del espacio en disco.

Conceptos relevantes

Bitrate: tasa de transferencia de datos en unidad de tiempo. Se usará la denominación


kbps ue indica kilobits por segundo (1.000 bits por segundo).
Cuadros: cualquier imagen de una secuencia de video. Estos pueden ser:

• I: son imágenes completas (intra), suelen utilizarse en los cambios de escena.


• P: se llaman predictivas y almacenan sólo los cambios que se dan a partir de un
cuadro I y otros cuadros P anteriores.
• B: se llaman bidireccionales, y son similares a los cuadros P, pero también hacen
referencia a cuadros I y P futuros, dando más precisión a la codificación.
Línea de comandos: interfaz computacional en el cual el PC recibe instrucciones a
través de comandos tipeados por el usuario. En Windows XP, se puede ingresar a este
modo haciendo clic en Inicio -> Ejecutar y tipeando cmd.
Video real: no es la definición más adecuada, pero se refiere a contenido de video en
que se muestra la vida tal como es (películas filmadas, no dibujadas).

Video for Windows (VfW)

Ésta es la primera pestaña de la ventana de configuración del codec. En ella se puede


especificar la forma de codificación:

• Single Pass - Bitrate: codificación de una pasada, sólo se especifica el bitrate


promedio del video, similar a XviD.
• Single Pass - Quantizer: igual que el anterior, pero se especifica el cuantizador
para cada bloque de la imagen (más info sobre cuantizador y bloques aquí),
similar a XviD, pero con escala logarítmica en vez de lineal. Se considera que
15/40 dan la mejor/peor calidad, mientras que 20/30 es buena/mala.
• Multipass - First Pass: se procesa el video para obtener el flujo de datos, de
forma que en posteriores pasadas, se utilice para codificar con mayor precisión
(en VirtualDub conviene hacer uso de la opción File -> Run video analysis pass
en vez de Save as). Similar a XviD.
• Multipass - First Pass (fast): igual que el anterior, pero con modo Turbo
activado.
• Multipass - Nth pass: codifica el video utilizando lo datos recabados por la
anterior pasada (puede recoger nuevos datos para una pasada posterior si Update
Statsfile está activado).
• Update Statsfile: se utiliza junto con opciones Multipass para
almacenar/actualizar los datos de video.
• Statsfile name: nombre y ruta del archivo de datos de video.

En esta sección se especifican las opciones del control de datos de video.

• Keyframe Boost (%): cuánto se aumenta la calidad de la imagen de los cuadros


I respecto de los cuadros P. Similar al indicador de compresión en archivos JPG.
Por defecto 40.
• B-frames reduction (%): cuánto se reduce la calidad de los cuadros B respecto
de los cuadros P. Más efectivo en secuencias de anime donde los cambios de
cuadro no requieren movimiento tan uniforme. Por
defecto 30; en anime, hasta 60.
• Bitrate variability (%): cuánto se puede desviar el bitrate a partir del promedio
que se especificó. Por defecto 60.
• Min QP: mínima calidad alcanzable. Por defecto 10.
• Max QP: máxima calidad alcanzable. Por defecto 51.
• Max QP Step: máxima tasa de cambio de una calidad a otra. Por defecto 4.
• Scene Cut Threshold: nivel de agresividad en la detección de un cambio de
escena para introducir un nuevo cuadro I. Por defecto 40.
• Min IDR-frame interval: mínimo número de cuadros para introducir un nuevo
cuadro I. Se recomienda fijarlo al frame rate del video, o sea cada 1 segundo (30
fps NTSC, 25 fps PAL). Por defecto 25.
• Max IDR-frame interval: máximo número de cuadros para introducir un nuevo
cuadro I. Se recomienda fijarlo a 10 veces el frame rate (cada 10 segundos). Por
defecto 250.
Aquí se decide el análisis de los cuadros.

• Partitions: las diferentes opciones se refieren a la forma en que se dividirán


(particionarán) los cuadros para su análisis. Como regla general, a mayores
particiones, mejor calidad y mayor compresión. Por lo tanto se recomienda dejar
todos los cuadros chequeados.
• Max consecutive: cantidad máxima de cuadros B consecutivos. Favorece la
compresión, pero perjudica la calidad cuando el número es muy alto. Se
recomienda dejarlo en 3. Por defecto 2.
• Bias: cuánto desviarse del valor especificado anteriormente. Ej: 100, utilizaría
siempre el indicado en Max consecutive, mientras que -100 utilizaría siempre 0.
Requiere que Adaptive esté desactivado. Por defecto 0.
• Use as references: permite al codec utilizar también cuadros B como referencia
de otros cuadros B (no sólo cuadros P), lo cual mejora la calidad. Por defecto
desactivado.
• Bidirectional ME: permite predecir cuadros B mediante estimación de
movimiento (motion estimation), aumentando así la calidad. Por defecto
desactivado.
• Adaptive: deja a criterio del codec cuándo utilizar cuadros B. Por defecto
activado.
• Weighted prediction: permite la predicción de cuadros B a partir de más de un
cuadro P, lo cual los hace más precisos. Por defecto, activado.
• Direct mode: activa el uso de vectores de predicción de movimiento en cuadros
B. Se recomienda Spatial para anime y Temporal para video real.
La última pestaña hace referencia a la estimación de movimiento y otras opciones
misceláneas.

• Partition decision: las opciones se refieren a la mejor decisión respecto de la


estimación de movimiento. Están ordenadas de menor a mayor calidad. Se
recomienda usar la última opción (RDO on B-frames), pero en favor del tiempo
que pudiera tomar codificar con ella, se sugiere no bajar de la quinta, a menos
que se cuente con un procesador rápido y mucho tiempo disponible.
• Method: decide el método de estimación de movimiento a utilizar. En general,
se sugiere utilizar la opción Uneven Multi-Hexagon, pero si se cuenta con poco
procesador y poco tiempo, Hexagonal Search será suficiente. Exhaustive search,
utiliza la búsqueda pixel por pixel, lo cual aumenta inútilmente el tiempo de
codificación y entrega resultados poco satisfactorios.
• Range: máximo rango empleado para los vectores en la estimación de
movimiento. Se recomiendan valores entre 16 y 32. Por defecto, 16.
• Chroma ME: activa el análisis de la información cromática (colores) en la
estimación de movimiento. Favorece la calidad, sobre todo en animaciones. Por
defecto activado.
• Max Ref. frames: activa la codificación mediante referencias a cuadros
previamente codificados, lo cual mejora la compresión. Se recomienda para
video real un valor de 3-5, y para animación, 8-10. Por defecto 1.
• Mixed Refs: otorga mayor libertad al codec para hacer referencias en
particiones de los macrobloques. Se recomienda activar si el valor de la opción
anterior es mayor a 2.
• Sample AR: relación de aspecto. Se recomienda dejarlo en 1:1, a menos que se
sepa lo que se hace. Por defecto 1:1.
• Threads: reduce el tiempo en procesadores con múltiples núcleos (Intel HT/Duo
Core, AMD 64 X2/HT, etc.). Por defecto 1.
• CABAC: algoritmo de compresión que aumenta la eficiencia sin pérdidas en
calidad, pero que requiere de mayor complejidad en la decodificación, sobre
todo a bitrates altos. Se recomienda activarlo. Por defecto activado.
• Trellis: aumenta la calidad visual de la codificación, decidiendo qué datos
quedarán finalmente. Se recomienda desactivarlo en modo Single pass -
Quantizer y activarlo en los modos Multipass en PCs rápidos.
• Noise reduction: nivel de ruido a reducir, tiende eliminar detalles. Por defecto
0.
• Deblocking filter: activa el filtro de deblocking que busca eliminar los bloques
en el video. Se recomienda dejarlo activado a menos que el video tenga ciertas
características, como ruido, lo cual podría suavizar demasiado la imagen,
causando pérdidas de detalle.
o Strength: agresividad con que será eliminado el blocking. Por defecto 0.
o Threshold: sensibilidad de detección de blocking. Por defecto 0.
• Log level: registra información de la codificación. Por defecto Error.
• FourCC: indica el tipo de video que el archivo AVI registrará internamente. Por
defecto H264.

Command Line Interface (CLI)

La versión CLI de x264 es mucho más flexible, no obstante se ejecuta desde la línea de
comandos. Como se trata de un interfaz más simple, su compilación como ejecutable
también lo es, lo cual hace que los desarrolladores creen algunas variantes, de entre las
que destaca la que proporciona cuantización adaptativa (AQ). Además considera
muchas más opciones que VfW, ya que los archivos de salida se basan en el contenedor
MP4.

Debido a la poca cercanía del público general con la línea de comandos, se utilizará en
esta guía la aplicación MeGUI, la cual estaba incluida dentro del instalador del codec
hasta mayo de este año, y que consiste en un interfaz gráfico intérprete de la línea de
comandos, o sea, traduce a gráficas lo que debe tipearse en la línea de comandos. Otra
aplicación similar apoyada por el codec es StaxRip.
MeGUI es una aplicación destinada a utilizar la mayoría de las opciones de los CLI de
los codecs XviD, x264, Snow (ffdshow libavcodec) y LMP4 (ffdshow libavcodec).
Como funciona con los CLI, requiere de otras aplicaciones para lograr resultados
completos. Éstas son mencoder, mp4box, mkvmerge, avimux_gui, divxmux,
avc2avi, x264, xvid_encraw, DGIndex, oggenc2, faac, NeroAacEnc, lame,
enc_AudX_CLI, enc_aacPlus, ffmpeg y AVISynth, todas descargables desde el
mismo MeGUI.

En la pestaña Input se muestra la información de Video y Audio necesaria para la


codificación. Nótese que pide scripts de AVISynth como archivos de entrada de video,
pero pueden introducirse archivos AVI en general. Para los archivos que no sean
aceptados será necesario crear un script. En el caso del audio, es posible introducir 2
flujos en un mismo archivo. Los perfiles de video y audio (profiles) son configuraciones
preestablecidas que pueden encontrarse en el Internet para su descarga.
En la pestaña principal están las opciones referentes a bitrate, deblocking y de estructura
de archivos MPEG-4 AVC.

• Mode: modo de bitrate en la codificación. Cuenta con más opciones que VfW,
de las que podemos destacar las de 3 pasadas (3 pass), pasadas múltiples
automatizadas y calidad constante (const. quality).
• Turbo: se utiliza para apurar la primera pasada de análisis en los modos de 2 y 3
pasadas. Por defecto desactivado.
• Bitrate/Quantizer/Quality: especifica el valor asignado en modos de bitrate
(ABR, X pass)/quantizer/quality. Por defecto ABR (Average Bitrate = Single
Pass).
• Lossless: activa la codificación sin pérdidas de calidad, la cual utiliza enormes
cantidades de espacio en disco. Sólo disponible cuando se activa High Profile en
AVC Profiles. Por defecto desactivado.
• Logfile: ubicación del archivo de estadísticas de video en codificación de más
de una pasada.
• Enable PSNR calculation: habilita el cálculo de calidad de video (en caso que
se quiera analizar), el cual no influye en la codificación, pero resta velocidad. Se
recomienda desactivarlo.
• Number of Threads: reduce el tiempo en procesadores con múltiples núcleos
(Intel HT/Duo Core, AMD 64 X2/HT, etc.). Por defecto 1.
• Enable Deblocking: activa el filtro de deblocking. Por defecto desactivado.
• Deblocking Strength: agresividad con que será eliminado el blocking. Por
defecto 0.
• Deblocking Threshold: sensibilidad de detección de blocking. Por defecto 0.
• AVC Profiles: especifica el perfil del archivo AVC. Se recomienda High
Profile. Por defecto Main Profile.
• AVC Level: especifica el nivel del archivo AVC. Se recomienda su valor por
defecto Unrestricted.
• FourCC: indica el tipo de video que el archivo MP4 registrará internamente. Se
recomienda utilizar H264 para asegurar compatibilidad con los reproductores.
Por defecto VSSH.
La pestaña Zones indica las zonas de excepción del video que tendrán un bitrate distinto
al del resto de la película (ej: los créditos no requieren tanto bitrate).

• Start frame: cuadro que iniciará una zona de excepción.


• End frame: cuadro que dará fin a la zona de excepción.
• Quantizer/Bitrate: indica la calidad/bitrate (en % del promedio) de la zona de
excepción. En créditos, puede utilizarse hasta un 20% del bitrate promedio.
• Mode: modo de codificación utilizado en la zona de excepción. Puede ser
Quantizer si se especifica en términos de calidad, o Weighted como ponderado
del bitrate promedio.
• Custom Commandline Options: permite introducir otras opciones no listadas
en las pestañas o de otras compilaciones de x264 mediante la línea de comandos.
Por ejemplo, la compilación de ChronoCross introduce la cuantización
adaptativa AQ (Adaptive Quantization), que no está presente en MeGUI, pero
que puede incluirse utilizando la sintaxis correcta (ej: --aq-strength 0.6 --aq-
sensitivity 16.0).
La pestaña RC and ME se refiere al control de la tasa de bitrate y la estimación de
movimiento.

• VBV Buffer Size: tamaño del búfer VBV (verificador del búfer de video), que
especifica el máximo de memoria que utilizará el decodificador para comenzar
la reproducción del video. Se recomienda el valor por defecto 0 (automático).
• VBV Maximum Bitrate: máximo bitrate que se puede almacenar en el búfer
VBV. Por defecto 0.
• VBV Initial Buffer: nivel de memoria inicial del búfer VBV para dar comienzo
a la reproducción. Se recomienda su valor por defecto 0,9.
Bitrate Variance: cuánto se puede desviar el bitrate a partir del promedio que se
especificó. Por defecto 0,6.
• Quantizer Compression: cuánto se puede desviar la calidad a partir del
promedio especificado en el bitrate. Se recomienda su valor por defecto 0,6 para
uso general (video con poco y mucho movimiento).
• Temp. Blur of est. Frame complexity: cuánto reducir las fluctuaciones en la
calidad utilizada antes de la curva de compresión. Se recomienda su valor por
defecto 20.
• Temp. Blur of Quant after CC: cuánto reducir las fluctuaciones en la calidad
utilizada después de la curva de compresión. Se recomienda su valor por defecto
0,5.
• Chroma ME:activa el análisis de la información cromática (colores) en la
estimación de movimiento. Por defecto activado.
• M.E. Range: máximo rango empleado para los vectores en la estimación de
movimiento. Se recomiendan valores entre 16 y 32. Por defecto, 16.
• Scene Change Sensitivity: nivel de agresividad en la detección de un cambio de
escena para introducir un nuevo cuadro I. Por defecto 40.
• M.E. Algorithm: decide el método de estimación de movimiento a utilizar. En
general, se sugiere utilizar la opción Uneven Multi-Hexagon, pero si se cuenta
con poco procesador y poco tiempo, Hexagonal Search será suficiente.
Exhaustive search utiliza la búsqueda pixel por pixel, lo cual aumenta
inútilmente el tiempo de codificación y entrega resultados poco satisfactorios.
• Subpixel Refinement: las opciones se refieren a la mejor decisión respecto de la
estimación de movimiento. Están ordenadas de menor a mayor calidad. Se
recomienda usar la sexta opción (RDO) o séptima (RDO level 2, sólo si está
disponible en la compilación), pero en favor del tiempo que pudiera tomar
codificar con ella, se sugiere no bajar de la quinta, a menos que se cuente con un
procesador rápido y mucho tiempo disponible.
• Keyframe interval: máximo número de cuadros para introducir un nuevo
cuadro I. Se recomienda fijarlo a 10 veces el frame rate (cada 10 segundos). Por
defecto 250.
• Min GOP Size: mínimo número de cuadros para introducir un nuevo cuadro I.
Se recomienda fijarlo al frame rate del video, o sea cada 1 segundo (30 fps
NTSC, 25 fps PAL). Por defecto 25.
• Noise Reduction: nivel de ruido a reducir, tiende eliminar detalles. Por defecto
0.
La última pestaña hace referencia a parámetros más avanzados.

• Minimum Quantizer: mínima calidad alcanzable. Por defecto 10.


• Maximum Quantizer: máxima calidad alcanzable. Por defecto 51.
• Maximum Quantizer Delta: máxima tasa de cambio de una calidad a otra. Por
defecto 4.
• Credits Quantizer: calidad utilizada en zonas de introducción y créditos para
mejorar la compresión. Por defecto 40.
• Factor between I and P frame Quants: cuánto se aumenta la calidad de la
imagen de los cuadros I. Similar al indicador de compresión en archivos JPG.
Por defecto 1,4.
• Factor between P and B frame Quants: cuánto se aumenta la calidad de los
cuadros P respecto de los cuadros B. Más efectivo en secuencias de animación
donde los cambios de cuadro no requieren movimiento tan uniforme. Por
defecto 1,3; En anime, hasta 60.
• Chroma QP Offset: ajuste de compensación de calidad entre color y
luminosidad. Se recomienda su valor por defecto 0.
• Trellis: aumenta la calidad visual de la codificación, decidiendo qué datos
quedarán finalmente. Se recomienda desactivarlo en modo Single pass -
Quantizer y activarlo en los modos Multipass en PCs rápidos.
• Number of Reference Frames: activa la codificación mediante referencias a
cuadros previamente codificados, lo cual mejora la compresión. Se recomienda
para video real un valor de 3-5, y para
animación, 8-10. Por defecto 1.
• Mixed: otorga mayor libertad al codec para hacer referencias en particiones de
los macrobloques. Se recomienda activar si el valor de la opción anterior es
mayor a 2.
• CABAC: algoritmo de compresión que aumenta la eficiencia sin pérdidas en
calidad, pero que requiere de mayor complejidad en la decodificación, sobre
todo a bitrates altos. Se recomienda activarlo. Por
defecto activado.
• No Dct Decimation: evita ignorar cuadros en que la diferencia con cuadros
anteriores es mínima en cuadros P. Se recomienda su valor por defecto
desactivado.
• No Fast P-Skip: da mayor precisión al método Trellis para decidir sobre
macrobloques, evitando la detección rápida de saltos. Se recomienda activarlo.
Por defecto desactivado.
• Quantization matrix: permite elegir distintas matrices de cuantización
(calidad). En general, se recomienda la que viene por defecto None.
• Quantizer Matrix File: permite elegir entre matrices predefinidas en un archivo
CFG, cuando en la opción anterior se especifica Custom.
• Macroblock Options: las diferentes opciones se refieren a la forma en que se
dividirán (particionarán) los cuadros para su análisis. Como regla general, a
mayores particiones, mejor calidad y mayor compresión. Por lo tanto se
recomienda dejar todos los cuadros chequeados, lo cual se logra eligiendo High
Profile como perfil AVC (primera pestaña).
• Number of B-frames: cantidad máxima de cuadros B consecutivos. Favorece la
compresión, pero perjudica la calidad cuando el número es muy alto. Se
recomienda dejarlo en 3. Por defecto 2.
• Adaptive B-frames: deja a criterio del codec cuándo utilizar cuadros B. Por
defecto activado.
• B-Pyramid: permite al codec utilizar también cuadros B como referencia de
otros cuadros B (no sólo cuadros P), lo cual mejora la calidad. Por defecto,
desactivado.
• RDO for B-frames: implica mejoras en la estimación de movimiento que se
aplicará a las B-Frames, lo cual mejora la calidad de las mismas.
• Weighted B-Prediction: permite que cuadros B tengan en cuenta los datos de
"brillo" del vídeo, como los desvanecimientos y las degradaciones, lo cual
mejora la calidad visual.
• Bidirectional M.E.: permite predecir cuadros B mediante estimación de
movimiento (motion estimation), aumentando así la calidad. Por defecto
desactivado.
• B-frame mode: activa el uso de vectores de predicción de movimiento en
cuadros B. Se recomienda Spatial para anime y Temporal para video real.
• B-frame bias: cuánto desviarse del valor especificado en Number of B-frames.
Ej: 100, utilizaría siempre el indicado en la opción anterior, mientras que -100
utilizaría siempre 0. Requiere que
Adaptive esté desactivado. Por defecto 0.

Una vez configurado el video, se configura el audio: recomiendo codificar en ND-AAC


(Nero Digital), ya que es el que mejor calidad ofrece hasta el momento, a los menores
bitrates (48 KHz/80 kbps es un valor bastante adecuado). Posteriormente se mandan
ambos a la lista de procesos pendientes (Enqueue) se elige que se multiplexen o muxen
en un solo archivo MP4 y, finalmente, en la pestaña Queue seleccionamos Start para
que comience la codificación.

Una vez terminada la codificación los archivos pueden ser vistos con el codec ffdshow
(configurado para ver H.264) o con Nero Showtime.

Eso sería. Saludos.

By ALEX-KID

Estándares Audiovisuales: ¿cómo andan las cosas?


Para que todos sepamos el "estado del arte" en lo que se refiere a estándares
audiovisuales. Hay sorpresas (cosas que no saben).

Pero partamos desde el comienzo: la televisión análoga.

TELEVISIÓN ANÁLOGA

La televisión análoga es lo que hoy en día vemos cuando prendemos la TV que recibe la
señal por la antena. La tecnología de este aparato es cercana a 1920 y se han ido
agregando otras funciones con el tiempo. Al principio, las transmisiones eran en blanco
y negro entrelazado y en monofónico. Se agregaron:

• En los '40-'50 pudo agregársele color a la imagen de manera que una transmisión
a color podía verse perfectamente en una TV en B&N sin afectar el brillo o el
contraste. En B&N sólo se tiene una señal lumínica (denotada como Y),
mientras que en colores se agregan las señales cromáticas (denotadas por U y
V). Respecto de RGB,
Y = 0,299R + 0,587G + 0,114B
U = 0,436(B - Y) / (1 - 0,114)
V = 0,615(R - Y) / (1 - 0,299)
• En los '70 se introdujo el Teletexto: señal de información de texto en pantalla
que muestra noticias, programación y closed caption entre otros.
• En los '80 se desarrollaron canales de audio adicionales: éstereo y SAP
(secondary audio program).

TELEVISIÓN DE ALTA DEFINICIÓN (HDTV)


La novedad del momento, HDTV es un tipo de transmisión no masificada en Chile,
debido a que el CNTV no ha definido aún el estándar. Se basa en el formato digital y
permite interactividad con el receptor. Los aparatos vendidos en Chile no traen
incorporado un receptor digital, por lo tanto no sirven para recibir transmisiones
digitales. Entre sus características están:

• Imagen de tipo panorámica (widescreen, 16:9). Los programas grabados en 4:3


serán adaptados mediante pillarbox (bandas negras a la derecha y a la izquierda).
• Sonido surround 5.1 (codec AC3).
• Mayor nitidez de la imagen y mejor calidad de los colores.
• Disponibilidad de 3 codecs de video: MPEG-2, H.264 y VC1 (WMV-9).
• Ancho de banda de entre 6 y 25 mbps
• Barrido progresivo a 720 y 1080 líneas y entrelazado a 1080 líneas
(aproximadamente equivalente a 0,9MP y 2MP respectivamente).

Si comparáramos entre TV análoga y HDTV se vería algo así:

VIDEO DE ULTRA ALTA DEFINICIÓN (UHDV)

La última "chupada del mate" en video la están desarrollando los japoneses. Por el
momento, la empresa NHK busca mejorar 16 veces la HDTV, mediante UHDV. La
próxima generación de video propone 4320 líneas horizontales (33MP), formato
panorámico (16:9), 60 cuadros por segundo, sonido surround 22.2 (9 arriba, 10 centro, 3
abajo, 2 baja frecuencia) y entre 0,5 y 6,6 gbps.

Una imagen adaptada para TV análoga, HDTV y UHDV se vería así:


Según New York Times, las reacciones de los primeros testers fue de náuseas y mareos
debido a la cercanía de la imagen con la realidad. Se esperaría que los medios de
registro para esta tecnología se basen en el Video Disco Holográfico (HVD), cuya
capacidad de almacenamiento podría llegar a 3,9TB, o en el Disco de Baño Proteico
(PCD), que podría almacenar hasta 50TB, haciendo innecesaria la compresión de datos.

Eso sería. Saludos

By ALEX-KID

¿Qué es un codec?

Un codec no es más que un programa que incluye un conjunto de algoritmos e


instrucciones para codificar y decodificar vídeo o audio digital, de forma que se reduzca
el tamaño que ocupan. De hecho, codec son las iniciales de COdificador /
DECodificador. El vídeo o audio sin compresión ocuparían muchísimo, de ahí que sea
necesario algo que reduzca su tamaño. Normalmente los algoritmos de compresión
empleados conllevan una perdida de calidad, por lo que siempre interesará utilizar los
codecs que más compresión logren y menos calidad pierdan.
Quizá el codec más famoso sea el MP3, que nos sirve de ejemplo. Una canción que en
MP3 nos ocupa unos 3 ó 4 MB con muy buena calidad, sin compresión podría ocupar
10 veces más. La función del codec es precisamente ayudar a disminuir el tamaño del
archivo sin tener una pérdida apreciable de calidad. Igualmente, para poder reproducir
un vídeo o audio necesitamos el codec con el que fue comprimido, no nos vale otro.
Esto es porque cada codec tiene su forma de comprimir y descomprimir, sus propios
algoritmos, distintos en cada caso. De ahí la gran cantidad de codecs que existen: unos
mejoran calidad, otros mejoran la compresión...

Solucionar problemas frecuentes en la reproducción de los vídeos

En ocasiones nos encontramos con que en nuestro ordenador la mayoría de los vídeos se
reproducen mal. Los problemas más frecuentes son los saltitos en la imagen, los colores
que no se corresponden con la realidad, una excesiva pixelación de la película, o
directamente que no se reproduce nada. Si tenemos un pack de codecs instalado, hay
muchísimas posibilidades de que ésa sea la causa del problema.

Si estamos en uno de estos casos, podemos intentar solucionar el problema siguiendo


estos pasos:

• En primer lugar, ir al Agregar o quitar programas del Panel de Control de


Windows, y desinstalar todos los packs de codecs, codecs sueltos y filtros
ffdshow que tengamos instalados.
• Acto seguido, reiniciar el ordenador.
• Una vez se haya reiniciado, conviene utilizar un programa para limpiar el
registro de Windows. Recomendado por su eficacia y por dar cero problemas el
CCleaner (hacerlo en la pestaña Registro o Registry, y usar la configuración
que trae por defecto tras la instalación).
• Después instalaremos todos los codecs indispensables que podemos ver en la
página de codecs de vídeo y audio.
• Si sigue el problema, entonces nos instalaremos adicionalmente los filtros
ffdshow, activando los decodificadores que necesitemos durante la instalación.
• Un último consejo sería utilizar un buen reproductor. Olvidemos el Windows
Media Player, hay alternativas mucho mejores, como el Media Player Classic.

Trabajando con los codecs

En esta sección hay una serie de manuales para aprender a trabajar con los codecs sin
sufrir ningún problema. Abarca tanto la descarga de los codecs que podemos necesitar
como la forma de averiguar qué codecs utiliza un archivo. Es una sección muy
importante ya que del buen funcionamiento de los codecs dependen muchos programas
de edición y compresión de vídeo.

Averiguar los codecs que utiliza un archivo

Algunos de los programas más populares que nos permitirán saber qué codecs utilizan
los principales tipos de archivos de vídeo son GSpot y MediaInfo. Estos programas
soportan archivos AVI y MPG, entre otros formatos, y nos darán muchísima
información sobre ellos. De esta forma, cuando no podamos reproducir un archivo por
falta de un codec, GSpot y MediaInfo nos ayudarán a averiguar cuál debemos instalar.
En general, recomendamos usar GSpot para archivos AVI, MPG y VOB, y MediaInfo
para otros tipos.

• Manual de GSpot

• Manual de MediaInfo

Descargas de codecs

En MundoDivX hemos reunido en una sola página todos los codecs que se pueden
necesitar para reproducir la gran mayoría de vídeos y convertirlos de formato o
recomprimirlos. En esta sección se encuentra una lista con los indispensables que
cualquiera debería tener instalados, así como una serie de codecs y filtros de uso menos
frecuente.

• Codecs de vídeo y audio

Configuración de los codecs

Para poder comprimir vídeos usando un codec como DivX, XviD o x264 necesitaremos
conocer cómo configurarlos. En los siguientes manuales se explicará exclusivamente la
configuración de estos codecs para hacer compresiones a una o dos pasadas utilizando
otro programa, de manera que nos servirán como referencia para los manuales de
conversión de DVD a AVI/OGM, subtitular AVI, etc. Hay que mencionar que los codec
XviD y DivX son los más usados para la distribución de películas y los que los
reproductores compatibles con MPEG-4 soportan. El codec x264 da muy buena calidad
pero su uso es mucho más reducido por ser menos compatible.

• Configuración del codec XviD

• Configuración del codec DivX

• Configuración del codec x264

¿Qué es un contenedor? ¿Qué es un codec?

Descripción ¿Es lo mismo un codec que un contenedor? ¿Qué relación hay entre
ellos? ¿Cuáles son los codecs y los contenedores más habituales? Pongamos un poco de
orden entre AVI, DivX, XviD, MPG, OGG, OGM, MOV, AC3, MP3...

Contenedor

Un contenedor no es más que un archivo que permite almacenar simultáneamente datos


de distinto tipo. Cualquier archivo comprimido, por ejemplo los de extensión ZIP, es un
contenedor.

En el caso del vídeo digital, un contenedor es un archivo que incluye vídeo y audio (a
veces también subtítulos) sin importar el formato en que estén codificados o
comprimidos estos datos. Las extensiones de archivo de los contenedores más
conocidos son AVI, MPG, OGM, MP4, MKV y MKA (Matroska) y MOV.

Codec

Los codecs son los programas que permiten codificar y decodificar tanto el vídeo como
el audio que está dentro del contenedor, es decir, el formato en que se van a guardar o se
han guardado esos datos. Los codecs de vídeo más conocidos son DivX y XviD (ambos
dentro del estándar MPEG-4), MPEG-1 (VCD) y MPEG-2 (SVCD y DVD). Los codecs
de mayor uso de audio son MP3, OGG y AC3.

Los codecs se emplean porque permiten comprimir los archivos: el ejemplo clásico es
una canción en formato WAV que ocupa 10 veces más que la misma canción en MP3.
Pero lo que no se va en lágrimas, se va en suspiros: para conseguir disminuir el tamaño
del archivo todos los codecs citados "pierden" información. Por eso siempre que se
recodifica un archivo, disminuye su calidad.

Por tanto...

Resumiendo, para reproducir un archivo de vídeo AVI en el ordenador, se necesitan 3


cosas:

• Un reproductor de vídeo capaz de interpretar el contenedor AVI.


• El codec de vídeo con que se codificó la imagen (en una mayoría de las veces
DivX o XviD).
• El codec de audio con que se codificó el sonido (en una mayoría MP3, aunque
cada vez se ve más AC3).

También podría gustarte