Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Video Digital
Video Digital
CONCEPTOS IMPORTANTES
BITRATE: es la relación entre bits que se leen y el tiempo en segundos en que ocurre
dicha lectura. La unidad de medición aquí utilizada será el kilobit por segundo (kbps),
equivalente a 1.000 bits por segundo. El bitrate determina la calidad de un flujo de
video: a mayor bitrate, mayor calidad y viceversa.
FORMATOS
Los formatos de video aquí analizados (MPEG-1, MPEG-2 y MPEG-4 ASP) poseen
todos análisis de imagen similares. Lo que los codificadores de video hacen es tomar la
imagen y dividirla en bloques de 16x16 pixeles. A cada bloque se le asigna un número
que se determina internamente (por el propio codificador, cuando quien codifica
especifica el bitrate) o externamente (por quien codifica, el cual digita un número para
todos los cuadros). Esta es la razón por la cual la resolución debe expresarse en
múltiplos de 16. De no ser así, los pixeles que el codificador no encuentre los asumirá
negros y podrían producirse inconsistencias en los bordes de la imagen. Además,
cuando se especifican bajos bitrates o bitrates constantes (sobre todo en MPEG-2)
tienden a aparecer "bloques" (blocking) en la imagen. Estos bloques son precisamente
de 16x16 pixeles y se deben a que el codificador no calcula con precisión os valores a
cada bloque, lo cual hace que se noten durante la reproducción.
MPEG-2 está diseñado para su uso a altos bitrates. Se estima que a 9.800 kbps (a
máxima resolución, según estándar), el ojo humano no es capaz de distinguir entre el
original y el codificado, en cualquier tipo de flujo. Bitrates menores tendrán
necesariamente calidad menor al original.
MPEG-4 ASP funciona a menores bitrates que MPEG-2, por lo tanto su calidad es
mejor a MPEG-2 al mismo bitrate. El uso de Q-Pel mejora la calidad del análisis,
mientras que GMC mejora su compresión a cambio de bajas en calidad.
Para ambos formatos, la mejor calidad de codificación se obtiene mediante dos pasadas
(2-pass encoding): en la primera se analiza el flujo y en la segunda se adapta al bitrate
especificado por quien codifica. Basándonos en esto, se establecerá un indicador de
calidad basado en los cuadros de un flujo de video.
CALIDAD DE CUADRO
Según mis propias estimaciones, XviD posee una calidad bastante alta para QFs de 0,25
en adelante, mientras que las peores se logran con QFs menores a 0,15 (con Q-Pel
activado y GMC desactivado en ambos casos).
Sin embargo, una nueva amenaza, como alguna vez lo fueron Sorenson de Quicktime y
Windows Media Video, aparece en el horizonte con el fin de arrebatarle la supremacía
dentro de los formatos de video. El vertiginoso desarrollo de los formatos basados en
MPEG-4 AVC/H.264 están dejando cada vez más atrás a DivX (y XviD). Tanto que en
la comparación realizada por compression.ru
(http://www.compression.ru/video/code...4_2005_en.html) acerca de la calidad de los
diferentes codecs del nuevo estándar, DivX, usado como punto de comparación, salió
último en la mayoría de las pruebas realizadas.
¿De qué se trata este nuevo estándar? Es el desarrollo de la parte 10 del estándar
MPEG-4, y se conoce como AVC (Advanced Video Coding) o H.264 (en virtud de la
norma que le da su nombre, según la International Telecommunication Union, ITU),
definida en Mayo de 2003. A grandes rasgos, amplía la norma anterior (la parte 2,
conocida como Advanced Simple Profile, ASP), de la cual forma parte DivX, XviD,
ffmpeg y Quicktime entre otros, y le da mayor funcionalidad, agregando nuevas
técnicas de compresión y otras cualidades que, a diferencia de especificaciones
anteriores que se aplicaban durante la decodificación de los flujos de video, se aplican
durante la codificación misma, haciendo más fácil la decodificación. Entre las más
importantes están el filtro de deblocking, los cuadros de referencia multiple y el mayor
uso de herramientas de compensación de movimientos (motion compensation) a través
de macrobloques de 16x16 y hasta 4x4.
La apuesta está hecha. Sólo Windows Media Video podría tener algo que decir en esta
batalla, debido a que también es parte de la especificación de HD-DVD y Blu-ray Disc,
a pesar que su formato, aunque es de libre uso, esté bajo el desarrollo exclusivo de
Microsoft. Pero eso sólo el tiempo lo dirá.
By ALEX-KID
Mención aparte merece la técnica de 2:3 pulldown o telecine (también conocido como
3:2 pulldown), que consiste en entrelazar una imagen progresiva de tipo fílmico (23,976
fps) para obtener una imagen de tipo video NTSC (29,97 fps). Esto se hace repitiendo
cuadros y campos de la siguiente forma:
donde las letras son los cuadros y los números los campos. De esta forma se crea un
nuevo cuadro repitiendo los cuadros de film 2-3-2-3 veces (AA-BBB-CC-DDD),
quedando entonces con una tasa de refresco de 29,97 fps entrelazado (59,94 fps). Al
crear un DVD de tipo fílmico se le habilita un "switch" para indicarle al reproductor que
realice el telecine, de forma que pueda verse en la TV. Si se cuenta con un DVD con
"progressive scan" podrá verse el video a los 23,976 fps originales (sólo si se cuenta con
una salida progresiva, como las pantallas de plasma y lcd). Si el DVD está grabado con
2:3 pulldown, basta con utilizar el "inverse telecine" del Virtualdub, que se encuentra en
el menú "Video -> Frame Rate" en su modalidad "adaptive". De esa forma se obtendrá
un video de 23,976 fps, con un desentrelazado limpio, a la vez que se ahorra espacio.
Conceptos preliminares:
Los formatos digitales son los que mejor responden a los altos niveles de imagen. Tanto
DVDs como filmadoras DV entregan 480 líneas horizontales y 720 puntos.
Volviendo al inicio del tema, la idea es no malgastar ancho de banda y espacio en disco
duro al momento de realizar el traspaso a formato digital.
De esta forma se sugieren las siguientes especificaciones, las cuales incluyen resolución
y formato MPEG-2 para video:
Ripeo VHS:
- 384x288 a 3200 kbps (max)
Ripeo SVHS:
- 480x480 a 5000 kbps (max)
Así se ahorra espacio en disco y no se mal utiliza, ya que una mayor resolución no
mejorará la imagen.
Saludos
By ALEX-KID
Si la definición estándar consiste en 525 líneas horizontales para NTSC (625 para PAL),
de las cuales sólo son visibles 480 (576 para PAL), para la TV de alta definición, en
adelante HDTV, esa resolución aumenta en ambos casos: a 720 líneas, con barrido
progresivo (1280x720 = 720p), y hasta 1080 líneas con barrido progresivo o entrelazado
(1920x1080 = 1080p ó 1080i). En caso de señal entrelazada, se utilizan frecuencias de
refresco de 60Hz (60 cuadros por segundo, NTSC) y 50Hz (50 cuadros por
segundo, PAL), similares a la TV convencional. Para ambos casos (720 y 1080 líneas)
la relación de aspecto es de 16:9 (pantalla ancha).
Aquí hay una captura de pantalla de una transmisión a 720p (tamaño real, grande):
Spoiler:
y aquí la misma a 1080p (tamaño real, más grande todavía):
Spoiler:
Como formato digital, la HDTV, requiere de codecs que compriman las señales. Se
estableció que podría elegirse entre MPEG-2 (el mismo de los DVD), H.264 y VC-1
(WMV-HD). Estos mismos codecs se utilizarían en la fabricación de los nuevos
reproductores de video de alta definición HD-DVD y Bluray Disc, que buscan
reemplazar al formato DVD.
En Chile, el CNTV está preocupado por comenzar de una buena vez el proceso de
migración hacia esta tecnología. Tomando en cuenta que aún falta definir las
especificaciones y lineamientos que adoptará el formato aunque todo parece indicar que
se adoptará el formato norteamericano), parece ser que Chile se está quedando atrás en
HDTV. Hay que considerar que EE.UU. y el bloque europeo ya ha comenzado su
proceso de transición: desde 1998 que comenzaron la migración hacia HDTV y varios
países europeos piensan finalizar sus procesos en 2012, mientras que EE.UU. pretende
hacerlo en 2009 e Italia a fines de este año. Latinoamérica en general está fuera de este
tema, salvo México (2021) y Brasil (2013-2018).
El codec x264 viene en dos interfaces: VfW y CLI. En esta sección se analizarán los
dos, sus pro y sus contras y el uso de cada interfaz.
La versión más conocida de x264 es la de Video for Windows (VfW) y es la más usada
debido a su interfaz gráfica y su integración con el contenedor estándar de Microsoft
(AVI), el cual es posible encontrar en casi cualquier software de edición de video. Sin
embargo, esta versión presenta limitaciones debido a la antigüedad del estándar de
Microsoft en cuanto a aplicación de la nueva tecnología. La versión "adecuada" es la
versión Command Line Interface (CLI), ya que por defecto almacena la película en
MP4, el contenedor definido en la especificación H.264, y cuenta con todas las mejoras
incluidas en el codec. Por lo tanto, la sugerencia para grabar películas en x264 es
utilizar el CLI para codificarlas y así hacer un uso eficiente del espacio en disco.
Conceptos relevantes
La versión CLI de x264 es mucho más flexible, no obstante se ejecuta desde la línea de
comandos. Como se trata de un interfaz más simple, su compilación como ejecutable
también lo es, lo cual hace que los desarrolladores creen algunas variantes, de entre las
que destaca la que proporciona cuantización adaptativa (AQ). Además considera
muchas más opciones que VfW, ya que los archivos de salida se basan en el contenedor
MP4.
Debido a la poca cercanía del público general con la línea de comandos, se utilizará en
esta guía la aplicación MeGUI, la cual estaba incluida dentro del instalador del codec
hasta mayo de este año, y que consiste en un interfaz gráfico intérprete de la línea de
comandos, o sea, traduce a gráficas lo que debe tipearse en la línea de comandos. Otra
aplicación similar apoyada por el codec es StaxRip.
MeGUI es una aplicación destinada a utilizar la mayoría de las opciones de los CLI de
los codecs XviD, x264, Snow (ffdshow libavcodec) y LMP4 (ffdshow libavcodec).
Como funciona con los CLI, requiere de otras aplicaciones para lograr resultados
completos. Éstas son mencoder, mp4box, mkvmerge, avimux_gui, divxmux,
avc2avi, x264, xvid_encraw, DGIndex, oggenc2, faac, NeroAacEnc, lame,
enc_AudX_CLI, enc_aacPlus, ffmpeg y AVISynth, todas descargables desde el
mismo MeGUI.
• Mode: modo de bitrate en la codificación. Cuenta con más opciones que VfW,
de las que podemos destacar las de 3 pasadas (3 pass), pasadas múltiples
automatizadas y calidad constante (const. quality).
• Turbo: se utiliza para apurar la primera pasada de análisis en los modos de 2 y 3
pasadas. Por defecto desactivado.
• Bitrate/Quantizer/Quality: especifica el valor asignado en modos de bitrate
(ABR, X pass)/quantizer/quality. Por defecto ABR (Average Bitrate = Single
Pass).
• Lossless: activa la codificación sin pérdidas de calidad, la cual utiliza enormes
cantidades de espacio en disco. Sólo disponible cuando se activa High Profile en
AVC Profiles. Por defecto desactivado.
• Logfile: ubicación del archivo de estadísticas de video en codificación de más
de una pasada.
• Enable PSNR calculation: habilita el cálculo de calidad de video (en caso que
se quiera analizar), el cual no influye en la codificación, pero resta velocidad. Se
recomienda desactivarlo.
• Number of Threads: reduce el tiempo en procesadores con múltiples núcleos
(Intel HT/Duo Core, AMD 64 X2/HT, etc.). Por defecto 1.
• Enable Deblocking: activa el filtro de deblocking. Por defecto desactivado.
• Deblocking Strength: agresividad con que será eliminado el blocking. Por
defecto 0.
• Deblocking Threshold: sensibilidad de detección de blocking. Por defecto 0.
• AVC Profiles: especifica el perfil del archivo AVC. Se recomienda High
Profile. Por defecto Main Profile.
• AVC Level: especifica el nivel del archivo AVC. Se recomienda su valor por
defecto Unrestricted.
• FourCC: indica el tipo de video que el archivo MP4 registrará internamente. Se
recomienda utilizar H264 para asegurar compatibilidad con los reproductores.
Por defecto VSSH.
La pestaña Zones indica las zonas de excepción del video que tendrán un bitrate distinto
al del resto de la película (ej: los créditos no requieren tanto bitrate).
• VBV Buffer Size: tamaño del búfer VBV (verificador del búfer de video), que
especifica el máximo de memoria que utilizará el decodificador para comenzar
la reproducción del video. Se recomienda el valor por defecto 0 (automático).
• VBV Maximum Bitrate: máximo bitrate que se puede almacenar en el búfer
VBV. Por defecto 0.
• VBV Initial Buffer: nivel de memoria inicial del búfer VBV para dar comienzo
a la reproducción. Se recomienda su valor por defecto 0,9.
Bitrate Variance: cuánto se puede desviar el bitrate a partir del promedio que se
especificó. Por defecto 0,6.
• Quantizer Compression: cuánto se puede desviar la calidad a partir del
promedio especificado en el bitrate. Se recomienda su valor por defecto 0,6 para
uso general (video con poco y mucho movimiento).
• Temp. Blur of est. Frame complexity: cuánto reducir las fluctuaciones en la
calidad utilizada antes de la curva de compresión. Se recomienda su valor por
defecto 20.
• Temp. Blur of Quant after CC: cuánto reducir las fluctuaciones en la calidad
utilizada después de la curva de compresión. Se recomienda su valor por defecto
0,5.
• Chroma ME:activa el análisis de la información cromática (colores) en la
estimación de movimiento. Por defecto activado.
• M.E. Range: máximo rango empleado para los vectores en la estimación de
movimiento. Se recomiendan valores entre 16 y 32. Por defecto, 16.
• Scene Change Sensitivity: nivel de agresividad en la detección de un cambio de
escena para introducir un nuevo cuadro I. Por defecto 40.
• M.E. Algorithm: decide el método de estimación de movimiento a utilizar. En
general, se sugiere utilizar la opción Uneven Multi-Hexagon, pero si se cuenta
con poco procesador y poco tiempo, Hexagonal Search será suficiente.
Exhaustive search utiliza la búsqueda pixel por pixel, lo cual aumenta
inútilmente el tiempo de codificación y entrega resultados poco satisfactorios.
• Subpixel Refinement: las opciones se refieren a la mejor decisión respecto de la
estimación de movimiento. Están ordenadas de menor a mayor calidad. Se
recomienda usar la sexta opción (RDO) o séptima (RDO level 2, sólo si está
disponible en la compilación), pero en favor del tiempo que pudiera tomar
codificar con ella, se sugiere no bajar de la quinta, a menos que se cuente con un
procesador rápido y mucho tiempo disponible.
• Keyframe interval: máximo número de cuadros para introducir un nuevo
cuadro I. Se recomienda fijarlo a 10 veces el frame rate (cada 10 segundos). Por
defecto 250.
• Min GOP Size: mínimo número de cuadros para introducir un nuevo cuadro I.
Se recomienda fijarlo al frame rate del video, o sea cada 1 segundo (30 fps
NTSC, 25 fps PAL). Por defecto 25.
• Noise Reduction: nivel de ruido a reducir, tiende eliminar detalles. Por defecto
0.
La última pestaña hace referencia a parámetros más avanzados.
Una vez terminada la codificación los archivos pueden ser vistos con el codec ffdshow
(configurado para ver H.264) o con Nero Showtime.
By ALEX-KID
TELEVISIÓN ANÁLOGA
La televisión análoga es lo que hoy en día vemos cuando prendemos la TV que recibe la
señal por la antena. La tecnología de este aparato es cercana a 1920 y se han ido
agregando otras funciones con el tiempo. Al principio, las transmisiones eran en blanco
y negro entrelazado y en monofónico. Se agregaron:
• En los '40-'50 pudo agregársele color a la imagen de manera que una transmisión
a color podía verse perfectamente en una TV en B&N sin afectar el brillo o el
contraste. En B&N sólo se tiene una señal lumínica (denotada como Y),
mientras que en colores se agregan las señales cromáticas (denotadas por U y
V). Respecto de RGB,
Y = 0,299R + 0,587G + 0,114B
U = 0,436(B - Y) / (1 - 0,114)
V = 0,615(R - Y) / (1 - 0,299)
• En los '70 se introdujo el Teletexto: señal de información de texto en pantalla
que muestra noticias, programación y closed caption entre otros.
• En los '80 se desarrollaron canales de audio adicionales: éstereo y SAP
(secondary audio program).
La última "chupada del mate" en video la están desarrollando los japoneses. Por el
momento, la empresa NHK busca mejorar 16 veces la HDTV, mediante UHDV. La
próxima generación de video propone 4320 líneas horizontales (33MP), formato
panorámico (16:9), 60 cuadros por segundo, sonido surround 22.2 (9 arriba, 10 centro, 3
abajo, 2 baja frecuencia) y entre 0,5 y 6,6 gbps.
By ALEX-KID
¿Qué es un codec?
En ocasiones nos encontramos con que en nuestro ordenador la mayoría de los vídeos se
reproducen mal. Los problemas más frecuentes son los saltitos en la imagen, los colores
que no se corresponden con la realidad, una excesiva pixelación de la película, o
directamente que no se reproduce nada. Si tenemos un pack de codecs instalado, hay
muchísimas posibilidades de que ésa sea la causa del problema.
En esta sección hay una serie de manuales para aprender a trabajar con los codecs sin
sufrir ningún problema. Abarca tanto la descarga de los codecs que podemos necesitar
como la forma de averiguar qué codecs utiliza un archivo. Es una sección muy
importante ya que del buen funcionamiento de los codecs dependen muchos programas
de edición y compresión de vídeo.
Algunos de los programas más populares que nos permitirán saber qué codecs utilizan
los principales tipos de archivos de vídeo son GSpot y MediaInfo. Estos programas
soportan archivos AVI y MPG, entre otros formatos, y nos darán muchísima
información sobre ellos. De esta forma, cuando no podamos reproducir un archivo por
falta de un codec, GSpot y MediaInfo nos ayudarán a averiguar cuál debemos instalar.
En general, recomendamos usar GSpot para archivos AVI, MPG y VOB, y MediaInfo
para otros tipos.
• Manual de GSpot
• Manual de MediaInfo
Descargas de codecs
En MundoDivX hemos reunido en una sola página todos los codecs que se pueden
necesitar para reproducir la gran mayoría de vídeos y convertirlos de formato o
recomprimirlos. En esta sección se encuentra una lista con los indispensables que
cualquiera debería tener instalados, así como una serie de codecs y filtros de uso menos
frecuente.
Para poder comprimir vídeos usando un codec como DivX, XviD o x264 necesitaremos
conocer cómo configurarlos. En los siguientes manuales se explicará exclusivamente la
configuración de estos codecs para hacer compresiones a una o dos pasadas utilizando
otro programa, de manera que nos servirán como referencia para los manuales de
conversión de DVD a AVI/OGM, subtitular AVI, etc. Hay que mencionar que los codec
XviD y DivX son los más usados para la distribución de películas y los que los
reproductores compatibles con MPEG-4 soportan. El codec x264 da muy buena calidad
pero su uso es mucho más reducido por ser menos compatible.
Descripción ¿Es lo mismo un codec que un contenedor? ¿Qué relación hay entre
ellos? ¿Cuáles son los codecs y los contenedores más habituales? Pongamos un poco de
orden entre AVI, DivX, XviD, MPG, OGG, OGM, MOV, AC3, MP3...
Contenedor
En el caso del vídeo digital, un contenedor es un archivo que incluye vídeo y audio (a
veces también subtítulos) sin importar el formato en que estén codificados o
comprimidos estos datos. Las extensiones de archivo de los contenedores más
conocidos son AVI, MPG, OGM, MP4, MKV y MKA (Matroska) y MOV.
Codec
Los codecs son los programas que permiten codificar y decodificar tanto el vídeo como
el audio que está dentro del contenedor, es decir, el formato en que se van a guardar o se
han guardado esos datos. Los codecs de vídeo más conocidos son DivX y XviD (ambos
dentro del estándar MPEG-4), MPEG-1 (VCD) y MPEG-2 (SVCD y DVD). Los codecs
de mayor uso de audio son MP3, OGG y AC3.
Los codecs se emplean porque permiten comprimir los archivos: el ejemplo clásico es
una canción en formato WAV que ocupa 10 veces más que la misma canción en MP3.
Pero lo que no se va en lágrimas, se va en suspiros: para conseguir disminuir el tamaño
del archivo todos los codecs citados "pierden" información. Por eso siempre que se
recodifica un archivo, disminuye su calidad.
Por tanto...