Está en la página 1de 13

CAVP 1

cine y vídeo digital [058]

I. la tecnología del vídeo digital

introducción
El vídeo y la televisión digitales se basan en los desarrollos realizados en las décadas de los setenta y los ochenta sobre los
sistemas analógicos NTSC, PAL y SECAM. Sobre dicha base comenzó el diseño de una nueva generación de sistemas que
supliera las deficiencias de los anteriores e introdujera importantes mejoras en la calidad de la imagen, el sonido y de la
recepción.
La investigación derivó en dos grandes familias de proyectos: sistemas avanzados de TV digital -SDTV y EDTV- y sistemas de
TV de alta definición -HDTV-. Los desarrollos abandonaron pronto el campo analógico y se orientaron hacia el entorno
digital, lo que ha producido una lenta pero imparable transformación del sector productivo. Ambas áreas de desarrollo han
terminado confluyendo y, en la actualidad, se está iniciando la migración hacia la alta definición.

fundamento tecnológico
El vídeo digital aplica los mismos principios tecnológicos que se emplean en el ámbito de la TV y el vídeo analógicos:
Existencia de un mosaico rectangular de imagen.
Exploración secuencial del mosaico.
Reconstrucción de la información mediante señales eléctricas.
El mantenimiento de estos principios garantiza la compatibilidad entre el entorno análogo previo y el nuevo entorno digital, y
constituye un mecanismo eficaz de representar imágenes secuenciales (en movimiento). La principal innovación, aparte de la
propia digitalización, es el abandono de la señal de vídeo compuesto y el uso exclusivo de señales en componentes. Las
señales en componentes comenzaron a usarse, bajo forma analógica, a principios de los años ochenta en el entorno de
producción.
vídeo digital en componentes
Las señales en componentes permiten importantes mejoras de calidad y facilitan unas posibilidades de control y manipulación
de las mismas imposibles en forma compuesta. El vídeo digital de formato compuesto sólo se empleó en las primeras etapas
del proceso de migración y ha quedado relegado al uso en materiales de archivo antiguo, grabados originalmente en formatos
análogos compuestos.
La base de los sistemas de vídeo y TV digitales actuales se encuentra en la norma ITU-R BT.601, desarrollada en los años
ochenta por el Comité Consultivo Internacional de Radiocomunicaciones como núcleo para el posterior desarrollo de
sistemas de televisión digital. La ITU 601(o Recomendación 601del citado y extinto CCIR) es la piedra angular de la aparición
de otros desarrollos, como el DV y DVD, cualquier forma o estándar de TV digital, la alta definición o las normas de
compresión MPEG.
La obtención de las señales en componentes empleadas habitualmente en vídeo (analógico o digital) se basa en un proceso de
transcodificación, esto es, de paso de las señales primarias que suelen generar los sistemas de cámara a la expresión en
función de la luminancia y la crominancia.
Las señales primarias RGB digitalizadas pasan a través de una matriz de operación que las combina generando una salida de
luminancia basada en la ecuación de la 4ª ley de Grassmann:
Y=0,30R+0,59G+0,11B
La señal obtenida se hace pasar por otras dos matrices que calculan la diferencia de las primarias R y B con la luminancia:
Cb=B-(0,30R+0,59G+0,11B)=(1-0,11)B-0,30R-0,59G=0,89B-0,30R-0,59G
Cr=R-(0,30R+0,59G+0,11B)=(1-0,30)R-0,59G-0,11B=0,70R-0,59G-0,11B

1
Las dos señales de diferencia obtenidas se adjuntan a la luminancia y forman una terna de señales en componentes que
pueden emplearse en sustitución de las primarias, pudiendo recuperarse éstas sin pérdida alguna mediante matrices inversas.

R matriz de
G crominancia Cr
Cr
mosaico B matriz de
de imagen luminancia Y
matriz de
crominancia Cb
Cb
mecanismo de transcodificación de componentes primarias a componentes perceptivas

vídeo digital compuesto


El vídeo digital compuesto debe seguir iguales requerimientos a los de cualquier otra digitalización, cumpliendo estrictamente
el teorema del muestreo:
Debe emplearse una frecuencia de muestreo 2 veces superior a la máxima alcanzada por el ancho de banda de la señal
compuesta a digitalizar.
Además, la complejidad de la propia señal compuesta (formada por tres señales superpuestas), conlleva una condición añadida
a la planteada por el teorema:
La frecuencia de muestreo debe, además, ser 4 veces superior a la de la subportadora de color empleada por el sistema
análogo (4fsc).
Así, para digitalizar una señal compuesta PAL, de 5,5 MHz de ancho de banda, la frecuencia de muestra debe ser, al menos,
11 MHz según la condición general del teorema, que se eleva hasta los 17,72 MHz al incluir la condición sobre la
subportadora (4x4,43 MHz), lo que supone un 60% más de muestras.
El problema de la digitalización de vídeo compuesto tiene su origen en la complejidad del espectro de la señal compuesta: la señal
de crominancia se introduce en la parte de alta frecuencia de la luminancia, al ser modulada con la subportadora de color.
Sc Fmáx

luminancia crominancia

espectro de la señal de vídeo compuesto

De no haber modulación ni superposición de señales, la frecuencia de muestreo debería ser al menos del doble de la máxima
del ancho de banda total (Fmáx). Esta solución produciría un “batido” con la frecuencia de la subportadora (Sc), relativamente
cercana al límite superior del ancho de banda, y la aparición de un seudo-aliasing similar al moiré que se presenta,
ocasionalmente, al explorar imágenes con mucho detalle y un patrón de repetición geométrico, como el que presentan
algunos tejidos. La única posibilidad de evitarlo es elevar la frecuencia de muestra y que sea múltiplo par de la subportadora, al
tiempo que observa el teorema (más del doble de Fmáx): el múltiplo más bajo que cumple ambas condiciones es el 4.

estructuras de muestreo
El vídeo digital en componentes debe construirse cumpliendo, únicamente, el teorema del muestreo. Ahora bien, al trabajar
con señales separadas, deben digitalizarse tres flujos de datos simultáneos en lugar de uno. Las fórmulas de señales en
componentes digitales son iguales a las analógicas:
Componentes digitales primarias R’G’B’ (en adelante RGB)
Componentes digitales perceptivas Y’Pb’Pr’ (en adelante YCbCr)
Las YCbCr pueden obtenerse de las primarias, permiten la compatibilidad con la reproducción monocroma y ofrecen una
calidad comparable a la de aquéllas con menor flujo de datos, casi una necesidad por la altísima tasa binaria alcanzada. Al
digitalizar tres señales simultáneas, debe establecerse un patrón que relacione la disposición espacial y temporal de las
muestras: la estructura de muestreo.
Cuando se trabaja en componentes RGB, sólo es posible emplear una estructura de muestreo simétrica, que utiliza la misma
frecuencia de muestras para las tres componentes y asigna una muestra de cada una a cada píxel del mosaico. Ello supone
triplicar el número total de muestras y el volumen de datos. Este tipo de estructura de muestreo se denomina 4:4:4,
indicando mediante los números que hay igual cantidad de muestras de las tres componentes RGB.

cine y vídeo digital [058] 2


Si se emplean componentes del tipo YCbCr, puede optarse por una estructura simétrica, como en RGB, o emplearse una de
tipo asimétrico, en la que la frecuencia de muestreo de las componentes Cb y Cr es menor que la de Y.
La reducción es posible porque el poder resolutivo del ojo es considerablemente menor ante el color que para variaciones de
brillo. Así, pueden submuestrearse las componentes Cb y Cr sin que se perciba aliasing en la imagen final, utilizando una
frecuencia de muestras de la mitad que en Y y una estructura 4:2:2.
Cuando la estructura de muestreo no es simétrica, como en la 4:2:2, el distinto número de muestras de cada componente
supone una alteración en el patrón de asignación a los píxeles y en su repetición temporal.
Al determinar la distribución espacial de las muestras, se plantean tres opciones:
Alternar las muestras de Cb y Cr, de modo que cada píxel tenga asociadas dos muestras, una de Y y otra de Cb o de Cr.
Asignar tres muestras, Y, Cb y Cr a la mitad de los píxeles de cada línea y sólo una muestra, de la señal Y, a la otra mitad
alternándolos entre sí; entre líneas consecutivas, los píxeles “completos” de una línea serían “incompletos” en la siguiente
y viceversa. Este tipo de estructura asimétrica se denomina quincunx.
Utilizar un mecanismo similar al anterior, pero sin alternar entre píxeles con tres muestras y con una entre líneas
consecutivas, según un patrón llamado ortogonal.
Las posibilidades que ofrecen las diferentes frecuencias de muestra para las señales Y y Cb o Cr implica la capacidad de elegir
entre diferentes fórmulas de distribución de las muestras, tanto más numerosas y complejas cuanta mayor diferencia haya
entre las frecuencias de muestreo de las señales en componentes empleadas.
Atendiendo a criterios de simplicidad, se han estandarizado una serie reducida de estructuras de muestra (o exploración), que
son empleadas en todas las aplicaciones del vídeo digital:
RGB 4:4:4 YCbCr 4:4:4 YCbCr 4:2:2 YCbCr 4:2:2 YCbCr 4:2:2 YCbCr 4:2:2
(simétrico) (simétrico) alterno ortogonal alterno quincunx ortogonal quincunx

muestra de G
 
muestra de Y muestra de B / Cb muestra de R / Cr

ejemplos de estructuras de muestreo en componentes

Los muestreos simétricos o los asimétricos de tipo ortogonal son más simples, pues hay cambios en la disposición de
muestras entre líneas y permiten diseñar estructuras de muestra predecibles, en las que la identificación de la componente de
cada muestra viene dada por el propio patrón.
Pueden submuestrearse de forma más severa las componentes Cb y Cr según patrones 4:1:1 o 4:2:0/4:0:2 (con alternancia
de componente muestreada entre líneas) de forma que se reduce aún más el flujo de datos pero se pierde fidelidad en la
reproducción del color.
En el ámbito de producción, se emplean estructuras de muestreo simétricas de tipo 4:4:4, normalmente en forma RGB, o
asimétricas ortogonales 4:2:2, si se emplean componentes YCbCr. En entornos en los que la exigencia de calidad no es tan
alta, como ocurre en la difusión de televisión digital o las aplicaciones y formatos domésticos, se recurre a mayores
submuestreos de Cb y Cr:
El formato doméstico DV emplea una estructura 4:1:1o 4:2:0/4:0:2, en función de la norma analógica de referencia.
En el DVD se utiliza una estructura de muestra 4:2:0 (normalmente se obvia el segundo término de esta estructura, que
se da por supuesto).
La TV digital también recurre a estructuras de tipo 4:2:0 tanto en su versión convencional como en alta definición, como
asimismo hacen el HDV, el AVCHD o el BluRay.

cuantificación de muestras
La cuantificación de muestras consiste en la asignación de un valor concreto de señal, de una escala predefinida, para el voltaje
de cada muestra. A mayor número de niveles, mejor será el ajuste entre el valor real de señal y el permitido y menor el error
de cuantificación al forzar el ajuste a la escala. La cuantificación de señales de vídeo se realiza normalmente con 8 ó 10 bits, y
es necesario que, de ser varias, todas tengan igual profundidad de cuantificación. Con 8 bits por muestra hay 256 niveles
posibles de señal que, combinando las tres componentes, dan un total de 16777216 niveles o posibles colores. Con 10 bits

3 I: la tecnología del vídeo digital


se alcanzan 1073741824 niveles. La amplitud máxima es igual en ambos casos, siendo mayor la precisión a 10 bits (cuatro
niveles por cada uno de 8 bits).
Al cuantificar componentes, se emplea la misma escala en el caso de las RGB y dos escalas diferentes en las YCbCr, una para
la Y, igual a la empleada en RGB, y otra específica para las Cb y Cr.
un problema de volumen
La relación entre profundidad de cuantificación (longitud binaria de cada muestra) y la calidad de la información es directa: a
mayor profundidad, menor error de cuantificación y, por tanto, menos distorsión en la conversión A/D (mayor fidelidad y
calidad).
También existe una relación directamente proporcional entre el valor de los factores técnicos de la digitalización (frecuencia de
muestra y profundidad de cuantificación) y la tasa binaria; puede establecerse un símil gráfico entre la tasa de una imagen y el
volumen de una caja rectangular:
El largo y el alto en número de elementos de imagen son variables asociadas al muestreo (poder resolutivo): a mayor
número de elementos, más definición y superficie de la “caja”.
La profundidad binaria se asimila al fondo de la “caja”: a mayor número de bits por muestra o elemento de imagen,
mayor paleta de niveles y mayor profundidad de la hipotética “caja”.
Si se tiene en cuenta, además, la posible secuencialidad de la imagen, la tasa obtenida con los factores expuestos deberá
multiplicarse por la frecuencia de imágenes para obtener el flujo final.

H'

L' N'
L N

LxHxN L' x H' x N'


ejemplificación de la relación entre tamaño del mosaico, profundidad de cuantificación
y volumen o tasa binaria de la información

la norma ITU-R BT.601


La tecnología del vídeo y la televisión digitales tiene como estándar de referencia la norma ITU-R BT.601de la Unión
Internacional de Telecomunicaciones (ITU/UIT) publicada por el antiguo CCIR (Comité Consultivo Internacional de
Radiocomunicaciones) en 1982 como Recomendación CCIR-601.
La ITU-R BT.601 se desarrolló como norma universal de vídeo en componentes digitales y establece los parámetros básicos
de construcción de las señales de vídeo digital, sustituyendo a los sistemas de componentes analógicas como estándar de
máxima calidad en los ámbitos del broadcasting y la postproducción. Está diseñada para coexistir con los sistemas de vídeo y
televisión analógicos y garantizar la máxima compatibilidad con ellos. La norma cuenta con adaptaciones para las dos grandes
familias de sistemas analógicos: 525 líneas y 60 campos y 625 líneas con 50 campos, aunque gran parte de los parámetros de
trabajo son comunes a ambas variantes.
En aras de la compatibilidad, las señales empleadas y sus características generales coinciden con las de las normas en
componentes analógicas:
Vídeo en componentes de tipo YCbCr
Estructura y frecuencia de muestreo asimétricas: 13,5 MHz para Y y 6,75 MHz para Cb y Cr, con muestreo ortogonal
4:2:2
Actualmente, una cuantificación de 8 o 10 bits por muestra
Codificación de señales código PCM (Pulse Code Modulation), que permite emplear un único canal de datos con
multiplexado por muestras.
Como en el vídeo analógico, la base de la construcción de las señales es la línea, que presenta duraciones casi idénticas a sus
equivalentes analógicas. Al igual que en éstas, hay un período inactivo y otro activo, abarcando éste ultimo un total de 720
muestras de Y y 360 de cada crominancia (Cb y Cr) por línea.
Las muestras de Cb, Cr e Y se alternan siguiendo un patrón por línea como el que se indica: CbYCrYCbYCrYCbYCrY…

cine y vídeo digital [058] 4


Cada palabra ó símbolo de 8 ó 10 bits se asocia con una muestra, siendo el orden de la misma el que determina su
correspondencia a Y, Cb o Cr. Las muestras impares corresponden a crominancias y los píxeles impares cuentan con tres
muestras (Cb, Y y Cr), mientras que los pares sólo tienen una (Y).
Considerando las frecuencias de muestra y las profundidades de cuantificación establecidas, se considera una velocidad binaria
promedio la de 210 Mbps, que puede aumentar hasta los 270 Mbps si se incluyen sincronismos, señales test códigos de
tiempo y audio digital embebido.
La comunicación entre equipos ITU-601 puede hacerse mediante interfaces digitales en serie o en paralelo, siendo el SDI
(Serial Digital Interface, ITU-R BT.656) el más usual, con capacidad de transporte hasta 360 Mbps.
estructura de señales
Los períodos inactivos van identificados por un marcador que indica el inicio del tramo corto y el final del largo y que se
compone de cuatro octetos (bytes) con la siguiente expresión hexadecimal: FF-00-00-XY, siendo fijos los tres primeros y
variable el cuarto, cuyos 8 bitios portan información sobre la pertenencia de la línea a campo par o impar, al período de
borrado de campo o la parte activa de éste y la identificación de marcador de entrada o salida del borrado de línea, más 4
bitios extra de paridad (detección de errores).
De igual forma, los comienzos y finales del período activo a nivel de campo van identificados con secuencias específicas de
octetos que no se emplean para expresar valores de imagen activa y que se conocen, respectivamente como SAV y EAV
(Start of Active Video y End of Active Video).
La estructura de campos es ligeramente diferente a la de los sistemas analógicos: al ser par el número de líneas activas, éstas
se dividen por igual entre ambos campos, quedando un número impar de líneas inactivas para borrado vertical (49 en la
variante de 625 líneas), que se reparte en dos bloques de líneas enteras (no existen las medias líneas analógicas) teniendo el
borrado del segundo campo una línea más que el del primero. Cada período de borrado tiene dos líneas en el campo saliente
y el resto en el entrante, reservándose las tres últimas para datos auxiliares.
Para identificar cada bitio individual de los que componen las muestras, la frecuencia de reloj del sistema debe ser 8 ó 10
veces superior a la del muestra, pues cada muestra se cuantificará a 8 ó 10 bitios. Así, sobre la frecuencia estándar de 13,5
MHz, el reloj debe ser capaz de distinguir 8 ó 10 subciclos por muestra, lo que equivale a un reloj funcionando a frecuencias
de 108 ó 135 MHz.
Las señales de componentes de la ITU-R BT.601 se codifican bajo forma PCM (Pulse Code Modulation), lo que plantea la
ventaja de mantener sólo dos estados o niveles fundamentales de señal, equivalentes a los valores de 0 y 1 que éstas pueden
adoptar.
Una codificación tan simple plantea dos cuestiones cuya resolución es fundamental:
La perfecta identificación de cada muestra, así como de los comienzos y finales de campo y línea, y de las marcar o
impulsos de sincronización.
La necesidad de un reloj de sistema capaz de registrar no sólo el total de muestras, si no cada uno de los bitios que las
forman.
Para realizar una equivalencia entre la estructura de una línea de vídeo analógico y la digital de la ITU 601, se consideran unos
períodos de línea de 64 y 63,55 µs para las variantes de 625 y 525 líneas, respectivamente.
Cada línea se divide, de forma respectiva, en 864 y 858 períodos de muestra iguales y en ambos casos se establece un
intervalo activo equivalente a 720 muestras, lo que deja un total de 144 y 138 muestras inactivas en las variantes de la norma
en 625 y 525 líneas.
Los períodos inactivos se dividen, a su vez, en dos tramos: al comienzo de la línea digital hay un tramo largo de 132 o 122
muestras no activas, en función de la variante (625 o 525 líneas) y al final, uno corto de 12 ó 16 muestras inactivas. En
conjunto, estos períodos son ligeramente menores que en vídeo analógico pues no llegan a los 11 µs y durante los mismos
no se toman muestras, contabilizándose éstas únicamente como ciclos de reloj.
la cuantificación en la ITU 601
La cuantificación a 8 bits prevista en la formulación original de la ITU-601 permite un total de 256 niveles posibles de señal (de
0 a 255), pero como en vídeo digital sólo es posible emplear palabras binarias para expresar los mensajes, informaciones
como los sincronismos o los identificadores de principio y fin de períodos activos deben emplear parte del abanico de
combinaciones binarias fruto de la cuantificación.
Así, de los 256 niveles totales se emplean sólo 220 para cuantificar la luminancia, con un mínimo de valor 16 (00010000)
equivalente al nivel de negro y un máximo de 235 (11101011) como nivel de blanco; en Cb y Cr se emplean 225 niveles,
con mínimos situados en 16 y máximos en 240 (11110000), con referencia intermedia (crominancia nula) en el nivel 128
(10000000).

5 I: la tecnología del vídeo digital


255 255

235 240

220 niveles

225 niveles
128

16 16
luminancia Y crominancia Cb crominancia Cr
0 0
niveles de cuantificación a 8 bits de la ITU-R BT.601

Una revisión posterior de la norma introdujo la cuantificación a 10 bitios para mejorar la respuesta en ciertas operaciones de
postproducción. En dicha cuantificación a 10 bits, que posibilita 1024 niveles, se opta por aumentar la precisión antes que
aumentar el límite superior de la escala. De este modo, los escalones a 10 bits tienen una cuarta parte de la altura de los de 8,
siendo equivalentes a niveles fraccionarios de éstos.
mejoras y revisiones
La ITU-R BT.601 original contemplaba, únicamente, la cuantificación a 8 bits. Aún cuando esta profundidad de cuantificación
es suficiente en la mayor parte de situaciones de producción, en ocasiones es necesaria mayor precisión, como en ciertas
operaciones de postproducción compleja. Por ello, como se ha indicado previamente, se estableció una cuantificación mucho
más precisa, de 10 bits por muestra, que es normalmente empleada en los formatos o equipos de alta gama y en el trabajo
con materiales destinados a postproducción.
Una segunda mejora de la ITU original fue la imagen panorámica, pues la norma original planteaba una imagen con relación de
aspecto fija de 4:3. La quinta revisión de la norma plantea la posibilidad de trabajar con formatos de imagen de 16:9, con un
total de 960 muestras activas de Y por línea y 480 de cada crominancia, manteniendo la cuantificación pero elevando las
frecuencias de muestra a 18 MHz para Y y a 9 Mhz para Cb y Cr.
La adopción de un nuevo estándar de imagen con una relación de aspecto más panorámica que el tradicional 4:3 (1,33:1) de
los primeros sistemas de vídeo y TV y el cine primitivo, constituía una necesidad para adaptar la imagen de TV a los formatos
cinematográficos aparecidos desde 1950.
Las razones para la elección de la relación de aspecto 16:9 (1,78:1) como nuevo formato de imagen son múltiples, y
responden a tres criterios complementarios:
Criterio numérico: la extensión horizontal de la imagen es de un 1/3 (33%), con lo que sigue manteniéndose una
relación numérica sencilla con el 4:3. Así, una imagen de 16:9 se puede descomponer en una de 4:3 de igual altura más
otras tres de altura 1/3, o en un mosaico de 12 imágenes de 4:3 de 1/3 de altura, 4 a lo largo y 3 a lo alto,
Criterio de compatibilidad con el cine: la relación 16:9 es intermedia entre las ratios de imagen más usuales del cine
actual, 1,66:1 europea (15:9) y 1,85:1 (17:9) del americano Academia, así como un promedio entre los formatos
extremos de 1,33:1 y 2,35:1 (CinemaScope).
Criterio estético: la relación 1,78:1 es muy similar a la sección áurea de 1,61:1, por lo que el cuadro de imagen de 16:9
resulta muy armonioso y proporcionado.

4:3 16:9
1,33:1 1,78:1

relación entre las ratios de 4:3 y la de 16:9

la compresión de datos
La compresión es una técnica de reducción de la tasa binaria de una información digital, aunque también son factibles
soluciones similares en el ámbito analógico. Hay que diferenciar entre la reducción del flujo de datos al crear la información
digital de la verdadera compresión, aplicada a una información ya existente. La reducción del flujo de datos desde el origen
suele dar mayores problemas de calidad que la compresión, y consiste en aplicar técnicas de submuestreo o de baja
cuantificación. La compresión es, en esencia, la simplificación o la eliminación de un tipo de información existente en todo
mensaje: la redundante.

cine y vídeo digital [058] 6


En cualquier mensaje hay que diferenciar entre informaciones entrópica y redundante: la entrópica es la mínima esencial para
la decodificación del mensaje sin error ni ambigüedad; la redundante es aquella que no varía la esencia de dicho mensaje.
La cuantía de la reducción del flujo binario que compone el mensaje suele expresarse en forma de relación numérica llamada
tasa o ratio de compresión: por ejemplo, una tasa de compresión de 5:1 supone una reducción del 80%...
Las técnicas de compresión pueden clasificarse, de forma genérica, atendiendo a distintos criterios, en ocasiones no
excluyentes:
Compresión perceptiva, basada en modelos de percepción psicoacústico y/o psicovisual, y estadística, sustentada en la
estructura interna de la información.
Compresión simétrica, cuando la compresión y la descompresión son similares y asimétrica, cuando la fase de
compresión es más compleja.
Compresión sin pérdida (lossless) si la compresión/descompresión es totalmente reversible (los mensajes original y
descomprimido son idénticos bit a bit), o con pérdida (lossy) si hay diferencias, aún ínfimas, entre ambos.
La compresión sin pérdida no suele alcanzar ratios superiores a 2:1, siendo necesario recurrir a la compresión con pérdida si
se desea una reducción mayor.
La mayoría de las técnicas actuales de vídeo digital contemplan la posibilidad de uso de compresiones de tipo perceptivo con
pérdida de datos. Asimismo, la compresión de imágenes o vídeo suele aplicar técnicas complementarias para lograr una gran
disminución de datos con bajos sacrificios de calidad:
Es común trabajar sobre imágenes de componentes en formato YCbCr, que permiten una reducción de la tasa binaria
del 33% sobre las de tipo RGB.
Las técnicas de compresión suelen ser perceptivas y usan algoritmos llamados transformadas, como la DCT (Discrete
Cosine Transform).
Tras la transformada suele aplicarse una compresión estadística que permite reducir aún más la tasa binaria, compactando
los datos.
La compresión mediante algoritmos de transformada se basa en la búsqueda y reducción de la redundancia espacial de la
información en la imagen, o dicho de forma más directa, en encontrar y eliminar repeticiones o grandes similitudes en los
valores de señal de los elementos de la imagen.
Las técnicas de compresión basadas en este principio reciben los apelativos de intratrama o espacial, pues se aplican dentro de
cada imagen integrada en una trama o secuencia de vídeo.
La principal limitación de esta compresión es su relativa baja eficacia cuando se aplica a una cadena de imágenes secuenciales,
como el vídeo, porque la técnica, aunque aprovecha la redundancia presente en cada imagen, trata a cada una de forma
independiente y sin posibilidad de relación entre sí, desdeñando la existencia de una enorme cantidad de redundancia de
datos entre imágenes sucesivas o cercanas en el tiempo.
la transformada discreta del coseno
La DCT o transformada discreta del coseno es la más usual de las transformadas para compresión de imagen, fija o en
movimiento, y puede ser lossless o lossy si se aplica un perfil de cuantificación prefijado. La DCT de compresión tiene reflejo
en una DCT inversa empleada al descomprimir.
La DCT se aplica de modo intratrama, esto es, buscando redundancias de información de tipo espacial (igualdad o similitud
entre los valores de píxeles contiguos) y dividiendo cada imagen en bloques de 8x8 píxeles para Y y de 16x16 para las señales
Cb y Cr. La división en bloques tan pequeños garantiza que la diferencia de información entre los píxeles de cada bloque sea,
normalmente, poco importante. La compresión de las informaciones de luminancia Y y de las crominancias Cb y Cr se realiza
por separado.
Preferentemente, las imágenes han de tener una anchura y altura en píxeles que sea múltiplo de 8 ya que la división de las
mismas se realizará en bloques de dichas dimensiones, aunque existe la posibilidad de truncar las matrices DCT para
adaptarlas a mosaicos de tamaño no estándar.
La aplicación de la transformada equivale a expresar la información de cada píxel como una suma de señales senoidales
prefijadas, con la aplicación recurrente del siguiente algoritmo:
N-1 N-1 (2m+1)kπ (2n+1)lπ
v[k,l] = a(k) a(l) ∑ ∑ u[m,n] cos cos
m=0 n=0 2N 2N

Desde un punto de vista gráfico, la aplicación del algoritmo DCT supone la expresión de la información de cada píxel como
combinación de la suma o superposición de diferentes señales simples de frecuencia prefijada y con diferente coeficiente de

7 I: la tecnología del vídeo digital


presencia o intensidad. El conjunto de componentes simples es un muestrario de un total de 63 señales de frecuencia de
cambio creciente en sentido horizontal, vertical y diagonal que forman una matriz de análisis DCT.

bloque de imagen matriz DCT bloque de coeficientes patrón de truncamiento bloque comprimido lectura en zigzag
112 121 110 111 117 127 123 124 3.46 -0.18 0.04 -0.01 -0.04 -0.02 0.01 --0.02 1 1 1 1 1 1 0 0 3.46 --0.18 0.04 --0.01 --0.04 --0.02 0.00 0.00 3.46 -0.18 0.04 -0.01 -0.04 -0.02 0.00 0.00

109 114 117 111 118 119 121 124 0.46 0.11 0.00 0.03 0.04 -0.04 -0.02 0.00 1 1 1 1 1 0 0 0 0.46 0.11 0.00 0.03 0.04 0.00 0.00 0.00 0.46 0.11 0.00 0.03 0.04 0.00 0.00 0.00

113 112 106 105 115 124 130 135 0.39 -0.29 0.05 0.00 0.00 0.00 -0.01 0.01 1 1 1 1 0 0 0 0 0.39 --0.29 0.05 0.00 0.00 0.00 0.00 0.00 0.39 -0.29 0.05 0.00 0.00 0.00 0.00 0.00

108 111 113 115 114 108 110 100 -0.45 0.19 -0.02 -0.02 0.02 -0.05 0.01 0.00 1 1 1 0 0 0 0 0 --0.45 0.19 --0.02 0.00 0.00 0.00 0.00 0.00 -0.45 0.19 -0.02 0.00 0.00 0.00 0.00 0.00

97 100 95 91 86 82 95 91
algoritmo 0.07 -0.03 0.01 0.02 -0.04 0.04 -0.01 -0.01 1 1 0 0 0 0 0 0 0.07 --0.03 0.00 0.00 0.00 0.00 0.00 0.00 0.07 -0.03 0.00 0.00 0.00 0.00 0.00 0.00

64 64 71 60 53 55 53 39 0.11 0.06 -0.03 -0.02 0.02 -0.02 0.01 -0.02 1 0 0 0 0 0 0 0 0.11 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.11 0.00 0.00 0.00 0.00 0.00 0.00 0.00

66 71 73 66 73 66 64 68 -0.05 -0.05 0.01 0.01 0.03 -0.01 --0.01 0.00 0 0 0 0 0 0 0 0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

74 82 91 95 84 97 104 99 -0.01 -0.02 0.02 0.01 0.00 -0.02 0.03 -0.01 0 0 0 0 0 0 0 0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

ejemplo de aplicación de la DCT a un bloque de imagen de luminancia de 8x8 píxeles

Al aplicarse la transformada se cambia el dominio en el que se expresa la información del ámbito espacial al de la frecuencia.
Como dichas frecuencias están limitadas en su valor máximo por el tamaño del bloque y la matriz DCT, es común que las
componentes de mayor frecuencia (esquina inferior derecha de la matriz) tengan valores de coeficiente muy pequeños o
nulos, que pueden ser truncados o eliminados.
la compresión temporal
Las limitaciones que, en lo relativo a ratio de compresión, presentan los algoritmos de transformada obliga a utilizar tasas de
compresión elevadas, con truncamientos de datos, compresión de umbral o algoritmos de transformada simplificados o
rápidos que incrementan las pérdidas y degradan la calidad.
La opción que mejor aprovecha la redundancia natural que presenta la imagen secuencial es la compresión intertrama o
temporal, capaz de conseguir ratios muy elevadas con una baja aparición de artefactos o defectos producidos por el propio
proceso de reducción.
La compresión temporal se basa en el cálculo de diferencias entre imágenes sucesivas de la secuencia. Como en la
compresión espacial, se usan subdivisiones o bloques, de mayor tamaño que los de las técnicas intratrama, que se comparan
entre imágenes sucesivas, codificándose la diferencia entre ellos bajo forma de incrementos. Dada la redundancia temporal
natural, existe gran cantidad de datos comunes entre imágenes sucesivas.
la compresión intertrama MPEG
Una de las técnicas de compresión espacial, también llamada intertrama, pues se basa en la comparación entre imágenes de la
trama o secuencia de vídeo, es la familia de compresores MPEG (Motion Picture Expert Group) desarrollada la pasada década
a instancias de la ISO (International Standard Organization) y con entidad de normas de estandarización internacional.
La versión denominada MPEG-2 (ISO-IEC CD 13818) es la más utilizada hasta la fecha y se aplica en los ámbitos de la
producción profesional, la difusión de contenidos y la creación por usuarios domésticos, sirviendo de ejemplo de
funcionamiento de este tipo de técnicas de compresión. El MPEG-2 incluye apartados de compresión de vídeo y de audio,
con la finalidad de construir una trama de transporte de datos MPEG-2 TS (Transport Stream) conjunta más otros posibles
datos.
Existen diferentes versiones de MPEG-2 estructuradas en perfiles y niveles, refiriéndose los primeros a la complejidad (y
capacidad de reducción) de las técnicas de compresión empleadas y los segundos al tamaño de la imagen sobre la que se
aplican. En total, existen cinco perfiles: simple (SP), principal (MP), de jerarquía S/R (SRP), de jerarquía espacial (SHP) y alto
(HP) y cuatro niveles: bajo (LL), principal (ML) alto 1440 (H14L) y alto (HL) con 11 combinaciones de ambos desarrolladas y
diferente capacidad de compresión y flujo binario máximo, entre 4 y 100 Mbps. La versión más usual del MPEG-2, usada en
la TV digital, el DVD y otros formatos de grabación, es la llamada MPEG-2 MP@ML (perfil principal en nivel principal) que
llega hasta los 15 Mbps.
El MPEG-2, de forma general, divide una trama de vídeo en grupos de imágenes llamados GOPs (Group of Pictures) cuya
longitud puede ajustarse, aunque resulta tanto más eficaz cuanto mayor número de imágenes lo integran. Las imágenes
integrantes de un GOP se dividen en tres categorías:
Imágenes de ancla o índice (I): abren el GOP y actúan como referencia de comparación para todas las demás. Sólo hay
una por grupo de imágenes.

cine y vídeo digital [058] 8


Imágenes predictivas (P): Son imágenes de diferencia calculadas a partir de una imagen I o P previa. Puede haber varias en
un GOP.
Imágenes bidireccionales (B): Son imágenes reconstruidas, en su práctica totalidad, a partir de otras imágenes de tipo I ó
P, anteriores y también posteriores a ellas. Puede haber varias por grupo y son las principales responsables de las
drásticas reducciones que logra el MPEG.

I P1 B1 P2 B2 P3 B3 P4
posible estructura de un GOP y categorías de imágenes del mismo

I P1 B1 P2 B2 P3 B3 P4

eliminación de las imágenes bidireccionales de un GOP

Cada imagen I o P del GOP se subdivide en macrobloques (bloques de 16x16 ó 32x32 píxeles, 4 veces más grandes que los
de la DCT) que forman líneas de bloques (slices) explorados de forma secuencial (de izquierda a derecha y arriba abajo, como
las líneas convencionales).

división de una imagen en bloques y macrobloques (izquierda) y slices (derecha)

Los macrobloques de una imagen I o P se buscan en las sucesivas, en un área de búsqueda centrada en su posición inicial y de
32x32 ó 64x64 píxeles. Se pueden detectar desplazamientos, cambios de escala, rotaciones e incluso distorsiones del
macrobloque, que de hallarse, permiten no volver a codificarlo en imágenes sucesivas, expresando en éstas su ubicación en la
imagen inicial (con un marcador) y el cambio que debe aplicársele.

área de búsqueda de un macrobloque en imágenes sucesivas

El hallazgo de redundancias permite hacer una reconstrucción predictiva de las imágenes P del GOP basada en la información
de las imágenes previas.

I P1 B1 P2 B2 P3 B3 P4
reconstrucción predictiva de imágenes P

Las imágenes de tipo B sufren un tratamiento más radical: su información original es eliminada y es sustituida, en una posterior
reconstrucción predictiva, por la de las imágenes P, y para que esta reconstrucción sea posible, es necesario reordenar la
estructura de lectura del GOP.

I P1 B1 P2 B2 P3 B3 P4

I P1 P2 P3 P4 B1 B2 B3

reconstrucción bidireccional de las imágenes B (arriba)


y transposición del orden de lectura de imágenes en un GOP (abajo)

9 I: la tecnología del vídeo digital


formatos de grabación
La grabación magnética sigue siendo el principal método de registro de imágenes videográficas y de televisión. A partir de los
formatos en componentes analógicas aparecidos en década de los ’80, se han desarrollado una pléyade de formatos digitales
de grabación aplicables a los entornos profesionales y domésticos.
Por primera vez se han superado las limitaciones de la definición estándar (SD) y se ha alcanzado el territorio de la llamada alta
definición, acercando un poco más la imagen electrónica al nivel de calidad logrados por los medios fotoquímicos.
Los formatos de grabación digital de vídeo SD han evolucionado en tres grandes oleadas de tecnologías que, a partir del
seguimiento estricto de la norma ITU-R BT.601, han desarrollado múltiples variantes que permiten una mayor flexibilidad y
optimización de costes en la producción audiovisual. El desarrollo tecnológico de los últimos años ha propiciado la aparición
de nuevos soportes de grabación cuya principal característica es sustituir la cinta por mecanismos de acceso no lineal.
formatos de primera generación
La primera oleada de formatos la componen formatos sin compresión, en componentes o compuestos, sobre cintas de ¾ y
½ pulgada. La segunda incluye formatos profesionales y domésticos que recurren a la compresión de datos intratrama sobre
cintas de 3/4, 1/2 ó 1/4 de pulgada. La tercera y última oleada cuenta con soportes alternativos a la cinta, como los discos,
compresión intertrama y grabación bajo forma de ficheros de datos.
El formato D1 de componentes digitales fue el primero en ser desarrollado. Sigue la norma ITU R-601 de modo estricto y
garantiza la máxima calidad de imagen y sonido digitales. Al usar cinta de 3/4 de pulgada de ancho, el D1 se diseñó como
formato de estudio, no desarrollándose camascopios.
El formato D2 fue compañero de viaje del D1 y usaba cintas de igual ancho que éste, pero al ser de vídeo compuesto
presentaba menor flujo de datos y mayor tiempo de grabación. Se trataba de un formato ideado para archivo de imagen.
audio analógico audio analógico
vídeo audio digital

¾” audio digital ¾” vídeo

vídeo audio digital


pista de control pista de control
código de tiempo código de tiempo

D1

D1 D2
cinta de 3/4” (19 mm) cinta de 3/4” (19 mm)
vídeo digital YCbCr 4:2:2 a 8/10 bits vídeo digital compuesto 4fs a 8 bits
4 canales audio PCM a 48khz/16 bits 4 canales audio PCM a 48khz/16 bits
1 pista audio analógico 1 pista audio analógico
1 pista longitudinal CTL 1 pista longitudinal CTL
1 pista longitudinal LTC 1 pista longitudinal LTC

El formato D5 es análogo al D1 pero sobre cinta de 1/2”. Para conseguir la misma capacidad de flujo binario con pistas más
cortas emplea técnicas de grabación acimutal y de alta densidad. Como en el D1, se incluyen 4 pistas de audio digital de 48
kHz y 16 bits, así como la posibilidad de conexión SDI (Serial Digital Interface).
Lo que el D5 es al D1, el D3 lo es al D2. Es un formato digital compuesto de 1/2” con grabación acimutal de alta densidad. La
balística de cabezales y pistas es similar al D5, lo que permitió diseñar equipos de este último con capacidad de reproducción
de señal D3. Fue el primer formato en contar con camascopio, cuyas grabaciones podían postproducirse sobre máquinas D5.
audio analógico audio analógico
vídeo audio digital

½” audio digital
½” vídeo
vídeo audio digital
pista de control pista de control
código de tiempo código de tiempo

D5 D3
cinta de 1/2” (12,5 mm) cinta de 1/2” (12,5 mm)
vídeo digital YCbCr 4:2:2 a 10 bits vídeo digital compuesto 4fs a 8 bits
4 canales audio a 48khz/16 bits 4 canales audio a 48khz/16 bits
1 pista audio analógico 1 pista audio analógico
1 pista longitudinal CTL 1 pista longitudinal CTL
1 pista longitudinal LTC 1 pista longitudinal LTC

cine y vídeo digital [058] 10


la segunda generación de formatos
Los formatos a partir del D5 aplicaron diferentes innovaciones conducentes a reducir los costes de adquisición y explotación y
al diseño de sistema de grabación integral que permitiesen utilizar un único formato para la operación de cámaras y la
postproducción posterior. El desarrollo técnico que facilitó ambos objetivos fue el uso de técnicas de compresión aplicadas al
flujo de datos de vídeo antes de su grabación, lo que ha originado una enorme diversificación de formatos.
El formato DCT (Digital Cassette Technology) era un formato de estudio de 3/4” desarrollado por Ampex que usaba
componentes digitales. Fue, junto con el Betacam Digital, el primero en usar compresión: DCT con ratio de 2:1.
El Betacam Digital es la evolución del formato analógico Betacam SP. Es el primero de una generación de formatos de 1/2”
que usan compresión. La de éste se llama BRR y se basa en una DCT sin pérdidas de ratio 1,7:1. Cuenta con una gama de
equipos que abarca de camascopios a grabadores de estudio.
El D9, o Digital S, es la evolución del formato SuperVHS de JVC. Emplea cintas de 1/2”. Emplea una compresión DCT con
pérdidas de 3,3:1, que permite cierto grado de postproducción y lo hace una interesante opción de formato profesional
completo de bajo coste.
audio analógico audio analógico audio analógico
vídeo vídeo código de tiempo
tono piloto vídeo
¾” audio digital
½” audio digital
tono piloto ½” audio digital
vídeo vídeo subcódigo
pista de control pista de control vídeo
código de tiempo código de tiempo pista de control

Digital
Digital

DCT Betacam Digital D9/Digital-S


cinta de 3/4” (19 mm) cinta de 1/2” (12,5 mm) cinta de 1/2” (12,5 mm)
vídeo digital YCbCr 4:2:2 8/10 bits vídeo digital YCbCr 4:2:2 a 10 bits vídeo digital YCbCr 4:2:2 a 8 bits
compresión DCT 2:1 compresión BRR 2:1 compresión DCT 3,3:1
4 canales audio a 48khz/16 bits 4 canales audio a 48khz/16 bits 4 canales audio a 48khz/16 bits
1 pista audio analógico 1 pista audio analógico 1 pista audio analógico
1 pista longitudinal CTL 1 pista longitudinal CTL 1 pista longitudinal CTL
1 pista longitudinal LTC 1 pista longitudinal LTC 1 pista longitudinal LTC

La familia DV / miniDV son formatos domésticos desarrollados para sustituir a los analógicos anteriores y que, por la alta
calidad de las componentes digitales, han generado formatos profesionales. Usan cintas de 1/4”, muestreos 4:2:0 ó 4:1:1 y
compresión DV con pérdidas 5:1. Pueden grabar dos canales de audio digital a 48 kHz o cuatro a 32 kHz.
El formato DVCPro o DVCPro25 es una variante del formato DV estándar orientada al mercado televisivo de informativos.
Emplea cintas de 1/4” y muestreo 4:1:1 con compresión DV de 5:1. Graba pistas más anchas que el DV convencional una
mayor estabilidad de la señal. Tiene compatibilidad de lectura y grabación con materiales DV y, en algunos casos, de
reproducción de cintas DVCam.
La variante DVCPro 50 es una mejora del formato DVCPro con un muestreo completo ITU 601 y similares características al
D9 de JVC. Usa cintas de 1/4”, muestreo 4:2:2 y compresión DV 3,3:1, con 50 Mbps de tasa binaria. Al igual que su formato
hermano, en la actualidad existe la posibilidad de emplear un soporte de grabación en tarjetas como alternativa a la cinta.
El formato DVCam es la versión de Sony del formato DVCPro. Emplea cintas de 1/4” y muestreos 4:2:0, para normas de 625
líneas, y 4:1:1, para las de 525, con compresión DV 5:1. Es compatible en reproducción con DV y DVCPro.
El formato Professional DV es la versión de JVC de formatos como el DVCPro o DVCam. Emplea cintas de 1/4” de tamaño
miniDV con muestreo 4:2:0 y compresión de tipo DV 5:1. Es compatible en grabación y reproducción con los soportes de
formato DV/miniDV, aunque no con DVCPro o DVCam.
auxiliar auxiliar auxiliar auxiliar auxiliar
datos datos datos datos datos
audio audio audio audio audio
¼” vídeo ¼” vídeo ¼” vídeo ¼” vídeo ¼” vídeo
subcódigo subcódigo subcódigo subcódigo subcódigo
pista de control pista de control pista de control pista de control pista de control

Panasonic

124 92L ME
66

DV/miniDV DVCPro DVCPro 50 DVCam Professional DV


cinta de 1/4” (6,35 mm) cinta de 1/4” (6,35 mm) cinta de 1/4” (6,35 mm) cinta de 1/4” (6,35 mm) cinta de 1/4” (6,35 mm)
vídeo digital YCbCr 4:2:0 a 8 bits vídeo digital YCbCr 4:1:1 a 8 bits vídeo digital YCbCr 4:2:2 a 8 bits vídeo digital YCbCr 4:2:0 a 8 bits vídeo digital YCbCr 4:2:0 a 8 bits
compresión DV 5:1 compresión DV 5:1 compresión DV 3,3:1 compresión DV 5:1 compresión DV 5:1
2 canales audio a 48khz/16 bits 2 canales audio a 48khz/16 bits 4 canales audio a 48khz/16 bits 2 canales audio a 48khz/16 bits 2 canales audio a 48kHz/16 bits
1 pista audio analógico 1 pista audio analógico 1 pista audio analógico 1 pista audio analógico 1 pista audio analógico
1 pista longitudinal CTL 1 pista longitudinal CTL 1 pista longitudinal CTL 1 pista longitudinal CTL 1 pista longitudinal CTL
1 pista LTC (subcódigo) 1 pista LTC (subcódigo) 1 pista LTC (subcódigo) 1 pista LTC (subcódigo) 1 pista LTC (subcódigo)

11 I: la tecnología del vídeo digital


Betacam SX es un formato en componentes de 1/2”. Emplea una compresión MPEG-2 profesional llamada 4:2:2P@ML a 18
Mbps que trabaja con un muestreo de tipo ITU 601 y logra mayor calidad de imagen que otros formatos que alcanzan ratios
comparables de compresión DCT o DV.
El MPEG IMX es el último formato SD sobre cinta de Sony. Como el SX, usa compresión intertrama MPEG-2 4:2:2P@ML
con flujo binario de 50 Mbps y una calidad comparable al Betacam Digital, aunque el bitrate sea casi la mitad que en éste. Es
compatible con otros formatos de ½”, de Betacam a Betacam Digital y puede trabajar con 4 canales de audio a 48 kHz y 24
bits o bien 8 canales a 16 bits.
auxiliar auxiliar
vídeo vídeo
datos datos
audio audio
½” datos ½” datos
vídeo vídeo
código de tiempo código de tiempo
pista de control pista de control

MPEG
MPEG
IMX

Betacam SX MPEG IMX


cinta de 1/2” (12,5 mm) cinta de 1/2” (12,5 mm)
vídeo digital YCbCr 4:2:2 a 8 bits vídeo digital YCbCr 4:2:2 a 8 bits
compresión 4:2:2P@ML 10:1 compresión 4:2:2P@ML 3,3:1
4 canales audio a 48kHz/24 bits 8 canales audio a 48kHz/16 bits
1 pista audio analógico (auxiliar) 1 pista auxiliar
1 pista longitudinal CTL 1 pista longitudinal CTL
1 pista longitudinal LTC 1 pista longitudinal LTC

nuevos soportes y formatos


Entre los adelantos introducidos en la tecnología de grabación de vídeo digital se cuentan los nuevos formatos de grabación
que recurren a diferentes soluciones de soporte físico que garantizan un acceso no secuencial a la información grabada,
técnicas muy eficientes de compresión y al almacenamiento de datos bajo una estructura de archivos.
Editcam es el pionero entre los formatos de vídeo no lineales. Desarrollado por Ikegami, utiliza discos duros FieldPak de hasta
120 GB ó cartuchos RAMPak de 16 GB. Puede grabar distintos formatos bajo la forma de archivos de datos.
El XDCam es el primer formato de Sony sobre disco óptico. Emplea láser azul y discos Professional Disc con capacidad de
23,3 o 50 GB y puede grabar en formatos DVCam ó MPEG IMX con acceso no lineal e instantáneo a los datos.
La tecnología P2 de Panasonic permite grabar los formatos DVCPro25, 50 y HD en cartuchos de memoria de tipo CardBus
(PC Card) que integran 4 tarjetas SD, con una capacidad de hasta 32 GB. Al carecer de partes móviles, soportes y equipos
aumentan su vida útil y se reducen las posibles averías.
Infinity es una nueva serie de soportes desarrollada por Grass Valley sobre discos REV de Iomega, que pueden almacenar
hasta 35 GB de datos, o tarjetas de tipo CompactFlash Pro, con capacidades hasta 8 GB, en distintos formatos.

Editcam
disco duro IDE o cartucho XDCam
de memoria RAM flash disco óptico monocapa
vídeo digital YCbCr vídeo digital YCbCr
muestreo adaptable muestreo 4:2:2/4:2:0
cuantificación a 8/10 bits cuantificación a 8 bits
compresión variable compresión MPEG-2/DV
capacidad: hasta 120 GB capacidad: 23,3 GB

P2 Infinity
tarjeta de tipo CardBus (SD) disco REV o tarjeta CF Pro
vídeo digital YCbCr vídeo digital YCbCr
muestreo 4:2:2/4:1:1 muestreo adaptable
cuantificación a 8 bits cuantificación a 8/10 bits
compresión DCT/DV compresión variable
capacidad: hasta 32 GB capacidad: hasta 35 GB

la grabación doméstica
En el ámbito de la grabación doméstica existen diferentes soluciones en cuanto a soportes, aunque en el momento actual, el
principal formato sigue siendo el ya mencionado DV sobre soporte de cinta. El Digital8 de Sony es una adaptación del mismo
para cinta de 8 mm y similares características a aquél. Otra opción son los formatos domésticos sobre disco óptico, que no
han logrado gran aceptación debido a los costes de las videocámaras, mayores que en las de cinta, a las limitaciones del
soporte DVD de 8 cm empleado, los problemas de edición de secuencias comprimidas en MPEG y la compatibilidad entre
grabaciones.

cine y vídeo digital [058] 12


Las cámaras equipadas con disco duro pretenden ser una alternativa atractiva al eliminar el gasto en material fungible, pero las
altas tasas de compresión de las señales (MPEG-2 o MPEG-4) y los problemas de compatibilidad de las mismas con ciertas
aplicaciones de edición doméstica limitan sus posibilidades de uso.
Los nuevos códecs de compresión, como el AVC, posibilitan el uso de medios de grabación baratos, como las tarjetas de
memoria SD, para aplicaciones de tipo doméstico, tanto en el entorno de la definición estándar como en HD.

miniDV/Digital8
cinta de 1/4” / 8 mm DVD-R
vídeo YCbCr 4:2:0 a 8 bits disco óptico monocapa
Digital Recording
8 mm Videocassette

compresión DV 5:1 vídeo digital YCbCr


Digital 8
2 canales audio 48kHz/16 bits muestreo 4:2:0
1 pista audio analógico cuantificación a 8 bits
60
ME

1 pista longitudinal CTL compresión MPEG-2


1 pista LTC (subcódigo) capacidad: 1,5 GB

HDD SDHC
disco duro interno tarjeta SDHC
vídeo digital YCbCr vídeo digital YCbCr
muestreo 4:2:0 muestreo 4:2:0
cuantificación a 8 bits cuantificación a 8 bits
compresión DV/MPEG-2 compresión DV/MPEG-2
capacidad: hasta 32 GB capacidad: hasta 16 GB

bibliografía
De Boeck, W., Televisión digital. UD 122, IORTV, Madrid, 1990.
Delgado, M., Sistemas de radio y televisión. Paraninfo/Thomson, Madrid, 2004.
Félix, E., Sistemas de radio y televisión. McGraw Hill, Madrid, 2006.
Pank, B. (Ed.), The digital factbook ed. 20th Anniversary. Quantel Limited, 2008.*/**
Weise, M. y Weynand, D., How Video Works. Focal Press, Oxford, 2007.
En Internet:
http://www.sony.es/biz/view/ShowProductCategory.action?site=biz_es_ES&category=BC
http://panasonic-broadcast.es/index.cfm
http://www.ikegami.com/
http://www.thomsongrassvalley.com/
http://pro.jvc.com/prof/main.jsp

* Recurso disponible en el campus Virtual de la asignatura


**http://www.quantel.com/repository/files/library_DigitalFactBook_20th.pdf

13 I: la tecnología del vídeo digital

También podría gustarte