Está en la página 1de 65

Tema 6.- Vdeo.

Tema 6.Vdeo.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 1/65

Tema 6.- Vdeo.

ndice
NDICE........................................................................................................................................................................ 2
VDEO. ........................................................................................................................................................................ 3
6.1. INTRODUCCIN. ............................................................................................................................................. 3
6.2. BREVE HISTORIA DEL VDEO DOMSTICO ....................................................................................................... 3
6.3. VDEO ANALGICO. ....................................................................................................................................... 4
6.3.1.
Seal de vdeo analgico. ..................................................................................................................... 4
6.3.2.
Estndares de Vdeo Analgico. ........................................................................................................... 8
6.4. VDEO DIGITAL.............................................................................................................................................. 9
6.4.1.
Seal de vdeo digital. ......................................................................................................................... 10
6.4.2.
Estndares de vdeo digital................................................................................................................. 10
6.5. FORMATOS ESTNDARES DE VIDEO DIGITAL ................................................................................................ 11
6.5.1.
Vdeo CD............................................................................................................................................. 11
6.5.2.
Super Vdeo CD .................................................................................................................................. 13
6.5.3.
DVD .................................................................................................................................................... 14
6.5.4.
DV ....................................................................................................................................................... 22
6.6. COMPRESIN DE VDEO................................................................................................................................ 23
6.6.1.
Estndares para compresin de vdeo. ............................................................................................... 24
6.6.1.1.
MJPEG............................................................................................................................................ 24
6.6.1.2.
H.261............................................................................................................................................... 24
6.6.1.3.
MPEG. ............................................................................................................................................ 25
6.6.1.3.1. MPEG-4. ......................................................................................................................................... 28
6.6.1.4.
Cinepak ........................................................................................................................................... 29
6.6.1.5.
Sorenson Video ............................................................................................................................... 29
6.6.1.6.
Indeo ............................................................................................................................................... 30
6.6.1.7.
QuickTime ....................................................................................................................................... 30
6.6.1.8.
Animation ........................................................................................................................................ 30
6.6.2.
Nuevos formatos de compresin de vdeo ........................................................................................... 30
6.6.2.1.
DIVX/XVID ..................................................................................................................................... 30
6.6.2.2.
xVCD............................................................................................................................................... 33
6.6.3.
Contenedores de vdeo ........................................................................................................................ 34
6.6.3.1.
AVI .................................................................................................................................................. 34
6.6.3.2.
OGM ............................................................................................................................................... 37
6.6.3.3.
Matroska ......................................................................................................................................... 37
6.7. HARDWARE PARA EDITAR VDEO ................................................................................................................. 41
6.7.1.
Tarjetas firewire.................................................................................................................................. 43
6.7.2.
Videocmaras digitales....................................................................................................................... 45
6.8. PROCESO DE CREACIN DE VDEO EN MULTIMEDIA ...................................................................................... 54
6.8.1.
Diseo (guin)..................................................................................................................................... 54
6.8.2.
Filmacin/obtencin de los cortes de vdeo y audio ........................................................................... 55
6.8.3.
Revisin y digitalizacin ..................................................................................................................... 55
6.8.4.
Edicin/montaje .................................................................................................................................. 55
6.8.5.
Integracin.......................................................................................................................................... 55
6.9. EDICIN DE VDEO ....................................................................................................................................... 56
6.9.1.
Edicin lineal y no lineal .................................................................................................................... 56
6.9.2.
Efecto croma ....................................................................................................................................... 56
6.10.
VDEO EN INTERNET ................................................................................................................................ 56
6.10.1. Soporte de vdeo para Web ................................................................................................................. 57
6.10.2. Insertar clips en pginas Web............................................................................................................. 58
6.10.3. Vdeo Conferencia en Web.................................................................................................................. 58
6.10.4. Real Audio & Vdeo ............................................................................................................................ 60
6.10.5. Vdeo Streaming.................................................................................................................................. 60
6.11.
HERRAMIENTAS PARA EL TRATAMIENTO DE VDEO .................................................................................. 63

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 2/65

Tema 6.- Vdeo.

Vdeo.
6.1. Introduccin.
Una imagen se puede ver como una distribucin espacial de intensidad que es constante con
respecto al tiempo. Si consideramos que una imagen puede mostrar una variacin con este parmetro,
se estar haciendo mencin a un vdeo o secuencia de imgenes, en la que esa variacin temporal se
expresa en forma de una secuencia de imgenes. As se habla de seal de vdeo para formalizar el hecho
de referirse a una representacin analgica o digital que vara en el tiempo y en la que la informacin
espaciotemporal se ordena de acuerdo a una convencin predefinida de muestreo (scanning).
Podemos considerar la animacin como una secuencia de imgenes caracterizadas por su
resolucin, nmero de colores y, un factor distintivo con respecto a la imagen esttica que es el nmero
de imgenes que se muestra por unidad de tiempo (FRAME RATE), de forma que la impresin
obtenida es que existe movimiento. Para dar una sensacin de movimiento continuo, el valor del frame
rate debe estar alrededor de las 25 imgenes por segundo.
Como es obvio, nos encontramos nuevamente con el problema de las altas necesidades de espacio
de almacenamiento necesarias para poder tratar adecuadamente este medio. Sin embargo, existen
tcnicas de compresin basadas en los cambios que se producen entre imgenes consecutivas que
pueden reducir considerablemente el tamao final del fichero generado (Ej: Persona hablando con el
mismo fondo y la cmara fija).
Es til que la secuencia de imgenes incluya informacin de sonido en el mismo conjunto. Para
obtener la correcta sincronizacin entre sonidos e imgenes, se suelen mezclar dichas informaciones y a
este fenmeno se le llama interleaving: una pequea cantidad de imgenes se alterna con la informacin de
audio asociada, despus de la cual se dispone otra pieza de vdeo con su correspondiente informacin de sonido,
etc..
Veamos la terminologa que se emplea en este campo a partir de la representacin analgica que
es la forma tradicional de abordar este tema, para pasar despus a la representacin digital de la misma.
Video or motion video arrives originally through some type of camera,
which records what it sees as a sequence of images.

6.2. Breve historia del vdeo domstico


La historia del vdeo domstico es ms larga de lo que parece:

En 1927, John Logie Baird invent la "fonovisin", para grabar imgenes de televisin en
discos de fongrafo. La calidad era horrible, pero para empezar...
En 1951, Bing Crosby Enterprises construy el primer magnetoscopio en b/n, grabador
de cinta de vdeo magntica. Al ao siguiente RCA desarroll un prototipo en color.
En los sesenta se intentaron cientos de formatos y tipos distintos (Sony, Panasonic,
Philips, General Electric...), fundamentalmente para grabacin y redifusin de programas
de TV. La cinta era bastante ancha, de dos pulgadas.
En los setenta empezaron a aparecer aparatos domsticos (CBS, Philips...) reduciendo el
ancho de la cinta (a 3/4 de pulgada, sistema U-matic).
En 1975 apareci el sistema Betamax de media pulgada, diseado por Sony.
En 1977 JVC comercializ el VHS.
En 1979 Philips y Grundig sacaron el Vdeo 2000.
La poltica de VHS, mucho ms abierta que la de Sony, junto a la mayor duracin de las
cintas, provocaron que el mercado se inclinara significativamente por el VHS que, como
sabemos, es el sistema que finalmente se ha impuesto en el mercado domstico.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 3/65

Tema 6.- Vdeo.

En los noventa est surgiendo la siguiente generacin de vdeo: el digital, DV. Y con l el
DVD. El vdeo digital de consumo es de calidad similar al vdeo de estudio, con 500
lneas de resolucin.

La grabacin de las seales de vdeo primero se intent de modo longitudinal en la cinta (como
en audio), lo que obligaba a una gran velocidad de arrastre y una enorme longitud de cinta.
Para evitar esto se buscaron otros sistemas (helicoidal, transversal...) con ms fotogramas por
metro de cinta, y moviendo las cabezas de l/e adems de la cinta, lo que solucionaba en gran medida
los problemas anteriores.
Adems de estos formatos mentados hay muchos otros que han ido existiendo a lo largo de estos
aos. Los ms utilizados pueden ser los siguientes:
En vdeo domstico, VHS y Super-VHS
En cmaras de vdeo domsticas, 8mm (Vdeo-8) y Hi-8
En vdeo profesional, Betacam, U-Matic, D1/D2
En radiodifusin de vdeo: tipo B, tipo C

6.3. Vdeo analgico.


Es el que nos encontramos en televisin: transmitido a travs del aire despus de haber sido
codificado (por algn esquema de modulacin tpicamente) o almacenado en una cinta magntica. Y en
la proyeccin de pelculas en formato analgico y reproducidas a partir de medios magnticos
(cinematografa) o con medios pticos (laser disc).

6.3.1. Seal de vdeo analgico.


La seal de vdeo analgica es una seal elctrica que vara con el tiempo y que se obtiene a partir
de muestrear, de forma peridica, la informacin que llega a una cmara: un patrn de distribucin
espacial de intensidad luminosa cambiante con el tiempo. Este proceso se conoce como barrido
scanning). De esta forma se recoge la informacin acerca de la distribucin luminosa a travs de unas
lneas predefinidas de muestreo, as como la informacin de control (sincronismos) acerca de la posicin
horizontal y vertical del punto de barrido en cada momento. El punto de reconocimiento de la imagen
va trazando lneas casi horizontales de izquierda a derecha, volviendo a la izquierda y as
sucesivamente hasta completar la pantalla.
Los mtodos de barrido ms comnmente usados son: el progresivo y el entrelazado. El modo
progresivo recorre (obtiene) una imagen, que se denomina un cuadro o frame cada T segundos. En el
campo de los computadores este valor es de 1/72 para monitores de alta resolucin. Por otro lado, en el
campo de la televisin, se utiliza un modo entrelazado de 2:1 donde se dibujan primero las lneas pares
y despus las impares, por esto se distingue entre el campo (field) par e impar de una imagen. De forma
esquemtica se muestra este proceso en la Figura 1. En la misma se puede observar que ha de existir
una indicacin para el final de cada lnea, denominado sincronismo horizontal. Tambin existir una
marca de final de campo o sincronismo vertical. Durante el tiempo en que el punto de barrido se
desplaza de una lnea a la siguiente es necesario apagar el rayo de electrones (blanking intervals) y se
denomina horizontal blanking. As tambin se define un vertical blanking como el que se produce desde
que se termina de barrer la ltima lnea hasta que el punto de barrido vuelve a la primera. Esto se
muestra en la Figura 2.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 4/65

Tema 6.- Vdeo.

Figura 1. Esquema de barrido de un monitor.

Figura 2. Formato de raster.

A partir de este recorrido se obtiene una seal, que para el caso monocromtico, toma la forma
que indica la Figura 3 donde se puede observar la parte correspondiente al recorrido sobre una de las
lneas comentadas.

Figura 3. Seal de vdeo analgica B/N.

A la relacin entre la anchura de la imagen respecto a su altura se la denomina relacin de


aspecto (Aspect ratio) que en la televisin convencional es de 4:3 y que en la de alta definicin es de 16:9.
En el cine se suelen utilizar relaciones del orden de 1,85:1 y 2,35:1. Por este motivo existen diferentes
configuraciones en los diferentes estndares de vdeo, como se muestra en la Figura 4.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 5/65

Tema 6.- Vdeo.

Figura 4. Tamao de formatos de vdeo.

Por tanto, los parmetros a contemplar en la seal de vdeo analgico son los siguientes:
Intervalo en blanco horizontal:
Durante la vuelta al principio de la lnea hay un pequeo espacio de tiempo en que el sensor se
apaga y se enva un nivel en blanco (cero), con lo que la seal completa de un fotograma es una serie de
lneas de seal separadas por intervalos de espacio horizontal (horizontal blanking intervals).
Relacin de aspecto (aspect ratio):
Un parmetro importante del proceso de captacin de la imagen es la relacin entre la distancia
horizontal y la vertical de recorrido del punto de rastreo, la relacin horizontal/vertical de la imagen.
La televisin se estandariz desde el principio en 4:3 y las pelculas de cine se acercan ms a 2:1 (el
compromiso de tv de calidad actual es 16:9).
Sincronizacin:
Si el haz de luz que en el tubo de imagen de la TV se modula con la seal de vdeo obtenida de
esta forma, la imagen original se podr reproducir. Pero para ello tiene que haber una perfecta
sincronizacin con el barrido horizontal y vertical de la toma inicial. Para ello se enva una seal
adicional a la propia de vdeo, la seal de sincronizacin (sync information) que no es ms que una marca
de temporizacin horizontal y vertical.
Resolucin horizontal:
Segn se recorre la imagen, la seal elctrica que produce el sensor cambia de forma contnua de
acuerdo al nivel de luz y color que se ve. La resolucin horizontal de la imagen corresponde al rea que
el sensor es capaz de detectar, que es fcil de comprobar situando lneas verticales en la filmacin. Si
estn demasiado prximas de acuerdo a la resolucin del sensor, no se apreciar su separacin o las
propias lneas en la reproduccin. La resolucin horizontal est limitada por el ancho de banda de la
seal, ya que la variacin de la seal elctrica tiene que ser capaz de variar con la suficiente velocidad
para reflejar los cambios que se encuentran en cada uno de los puntos sucesivos de la lnea horizontal.
Resolucin vertical:
Tambin en vertical el nmero de lneas determinan la resolucin de la imagen. Un pequeo
nmero de lneas de cada fotograma se dejan blancas para retornar de nuevo a la lnea inicial, marcando
el intervalo de separacin vertical (vertical blanking interval). Originalmente los intervalos horizontal y
vertical daban tiempo a que el recorrido se reiniciara en los sistemas antiguos. Actualmente ese espacio
en blanco es el que suele usarse para transmitir otra informacin mezclada con la seal de vdeo, como
el teletexto o subttulos.
Velocidad de cuadro y entrelazado:
Para que el ojo humano no perciba que hay parpadeo en una serie de imgenes mostradas de
forma consecutiva sta debe refrescarse al menos 50 veces por segundo. Para no necesitar actualizar la
imagen completa tan rpido, se suele usar un truco que es refrescar en ese perodo slo la mitad de la
imagen, de modo que la imagen completa se refresca 25 veces (60 / 30 en otros sistemas). Si se hiciera
con mitades completas de pantalla el ojo humano notara el parpadeo (flicker), pero si se hace con lneas

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 6/65

Tema 6.- Vdeo.

consecutivas es imperceptible en objetos tan limitados en altura, por lo que se suele emplear
entrelazado de lneas (en un rastreo se muestran las lneas impares y en el siguiente las pares, y as
sucesivamente).
B/N y Color:
La seal en blanco y negro puede representarse elctricamente slo como un valor lineal de brillo.
Para el color se necesitan tres seales independientes que representen el brillo de cada punto filtrado
con un color primario: RGB, igual (lgicamente) que en el proceso de imagen fija. Debido a la
complejidad de distribuir tres seales en sincronismo perfecto, la mayora de los sistemas de vdeo no
gestionan RGB (tres cables), sino que las tres seales se codifican en un formato compuesto que puede
ser distribuido en un nico cable (o transmitido por radiodifusin). Hay distintos tipos de composicin,
que son los distintos sistemas que conocemos estandarizados en el mundo: PAL, NTSC, SECAM...
Para el caso de una seal de color, se puede obtener mediante una superposicin de las
distribuciones correspondientes a las componentes de las bases de un cierto espacio de representacin
de color. Existen diferentes estndares de seal de vdeo que difieren en los parmetros de la imagen
(como la resolucin espacial y temporal) y en la forma en que describen el color. Lo que hace posible
clasificarlos en:
Composite video o Vdeo Compuesto: mezcla la informacin de color y luminosidad en
una sla seal, lo que hace que se puedan comenter pequeas imprecisiones a la hora de
extraer la informacin de la misma.
S-Video: que es un compromiso entre el estndar de componente analgica y el de vdeo
compuesto. Utiliza dos lneas: una para la informacin de luminosidad y en la otra de
forma combinada la de crominancia (Y/C).
Component analog video: a cada componente se le asigna una seal. Estas componentes
pueden ser las del espacio RGB o una transformacin del estilo luminancia y crominancia
(como por ejemplo YIQ, YUV, YCrCb, ...).
En el estndar de componentes de vdeo, las tres componentes que representan el color son
tratadas de forma individual. Esta descripcin del color puede reducirse en base a la relativamente baja
precisin de discriminacin del color de la visin humana, manteniendo toda la informacin relativa a
la luminosidad. Para ello se utiliza una tcnica que se conoce como codificacin de las diferencias de
color. En sta, se obtienen dos seales que son la diferencia entre la componente de azul y la de
luminosidad (Cb), as como con la componente de rojo y la de luminosidad (Cr). Esta transformacin se
puede llevar a cabo mediante una operacin de multiplicacin de matrices entre los valores de RGB y
los coeficientes de la matriz de transformacin.
En esta nueva representacin del color es posible reducir los valores que representan la
informacin de color, manteniendo la de luminosidad. As es posible encontrar que se utilizan
diferentes esquemas de reduccin de informacin o subsampling, en funcin de la calidad de la seal que
se quiere obtener y que se muestra en la Figura 5.

Figura 4. Seal de vdeo analgica color.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 7/65

Tema 6.- Vdeo.

Figura 5. Muestreo de la cromaticidad.

6.3.2. Estndares de Vdeo Analgico.


Bajo este epgrafe se realiza un breve repaso de los estndares ms difundidos en el campo de la
difusin televisiva y que pertenecen al grupo de estndares de vdeo que se han denominado de Vdeo
Compuesto y que han inspirado los trabajos sobre estndares digitales que se abordan en el punto
siguiente. Estos estndares son:
NTSC: National Television Systems Commitee definido en el 1952 se utiliza principalmente
en Norte Amrica y Japn.
PAL: Phase Alternation Line se desarroll en 1960 y se utiliza mayormente en Europa.
SECAM: Systeme Electronique Color Avec Memoire, utilizado en Francia y Rusia.
HDTV:High-definition television se define como dos veces mayor en resolucin que la
televisin convencional, con una relacin 16:9 de aspecto, una frecuencia de barrido de
cuadro de 24 Hz. O mayor y, por lo menos, dos canales de audio de calidad CD.
Es usual encontrar los sistemas anteriores descritos como combinacin de sus caractersticas de
lneas, frecuencia y modo de barrido, como:

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 8/65

Tema 6.- Vdeo.

Figura 6. Comparacin de estndares de vdeo analgico.

Para terminar este punto sealar que existen otros estndares, quizs tan conocidos (o incluso
ms para el gran pblico y que son:
Componente de vdeo: RGB, YCrCb, YUC, YIQ, ...
S-Vdeo: SVHS y Hi8mm.
Tambin hay diferencia a la hora de elegir el cableado. As:
El cable de vdeo compuesto (por ejemplo, conector RCA) transmite nicamente una
seal compuesta.
El cable de S-vdeo (super-vdeo) separa la luminancia de la crominancia.
El cable de RGB (como el euroconector) transmite las 3 seales de color original
independientes.

6.4. Vdeo Digital.


La revolucin digital de las ltimas dos dcadas ha impulsado la tecnologa existente hasta el
punto de que es posible realizar sonido e imagen de alta calidad en computadores personales, hasta el
punto de que se puede considerar el vdeo (digital) como una forma ms de informacin (datos) que es
capaz de manejar el computador.
Tomando la idea del vdeo analgico, lo nico que tiene que aadir el digital es la conversin de
la seal elctrica a bits, mediante el proceso de digitalizacin o muestreo, que consiste en discretizar
primero el tiempo (sampling) y despus representar la amplitud con un valor discreto (quantizing), en lo
que se denomina conversin analgico-digital (A/D).
Esto produce una aproximacin a la seal original, pero a partir de ah (si la digitalizacin tiene la
precisin suficiente) se puede simplemente copiar cuantas veces sea necesario los valores originales sin
perder calidad (cosa que ocurre con cada copia analgica). Para ello es necesario que la frecuencia de
muestreo sea al menos el doble que la mayor frecuencia posible que la onda original (teorema de
Nyquist), y que el nmero de bits utilizado para cada valor sea suficiente para la calidad deseada.
Las ventajas de realizar el tratamiento en formato digital son:
Robustez de la seal, es menos sensible a interferencias y errores en la transmisin.
Tambin admite procesos de comprobacin de la integridad de la seal.
Es posible el acceso aleatorio a los contenidos de la secuencia, facilitando la edicin y/o
impresin de imgenes individuales de la secuencia grabada.
Es posible realizar la captura (grabacin) al tiempo que otros procesos de tratamiento de
la imagen.
No hay necesidad de pulsos de sincronismo y apagado del haz en los mismos, puesto que
se conoce la longitud de cada lnea y dnde empieza y termina.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 9/65

Tema 6.- Vdeo.

6.4.1. Seal de vdeo digital.


Casi todos los sistemas de vdeo digital se ajustan al estndar de componentes de vdeo para
representar la seal de color (o niveles de gris). La mayora de cmaras de vdeo proporcionan salidas
RGB que se digitalizan de forma individual. En los casos en que se necesita transmitir la seal a cierta
distancia de su origen esta se realiza en modo de vdeo compuesto, como es el caso de los equipos de
reproduccin de vdeo y cmaras analgicas. En estos casos, se convierte primero la seal de vdeo
compuesto a componentes de vdeo que despus de digitalizan de forma individual.
Las reas de ajuste horizontal y vertical de la seal de vdeo analgico desaparecen y ahora nos
referiremos al nmero de pixels por lnea y el nmero de lneas por cuadro. La prdida de resolucin
espacial en el caso analgico comporta un efecto de desenfoque o emborronamiento en el sentido que se
produzca esa prdida de resolucin. En el caso digital el efecto que se produce es el de aliasing. Este
consiste en que se hace visible la naturaleza "pixelada" de una imagen, fundamentalmente en los bordes
de los objetos: en lugar de verlos de forma continua, se aprecia un efecto de escalera. En funcin de las
caractersticas del monitor y la distancia del usuario este efecto se aprecia en mayor o menor medida.
La calidad de color deseable se alcanzara con 24 bits de color (8 bits de cada canal RGB), aunque
a menudo se usa una solucin de compromiso para disminuir los requisitos de tamao de 16 bits (5 bits
R, 6 bits G, 5 bits B, ya que el ojo humano parece ser ms receptivo al verde), o bien se define el color
mediante paleta.
El cuadro de trabajo de vdeo digital en PAL es de 768 x 576. El hecho de que sea tan habitual
trabajar en 320 x 240 o 160 x 120 es que son divisores directos de 640 x 480, que es la resolucin NTSC.
El problema con el vdeo digital es el requerimiento de memoria que impone al sistema, tanto
para su almacenamiento como para su transmisin. Por esto, la viabilidad del vdeo digital est en
funcin del uso de los mtodos de compresin. En lo que sigue se va a describir una serie de estndares
de formato de vdeo digital y de estndares de tcnicas de compresin utilizadas en este campo.

6.4.2. Estndares de vdeo digital.


CCIR Estndares para Vdeo Digital, hace referencia a los siguientes estndares:

CCIR 601 (ITU R. 601) que utiliza un barrido entrelazado.


CIF (Common Intermediate Format) que es aproximadamente de la calidad de un VHS, pero
con un barrido progresivo.
QCIF (Quarter-CIF).

Figura 7. Comparacin de estndares de vdeo digital.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 10/65

Tema 6.- Vdeo.

ATSC Digital Television Standard es lanzado en Noviembre de 1995 y cubre el estndar de HDTV.
Soporta diferentes formatos de barrido, que se listan a continuacin:

Figura 8. Formatos de barrido soportados por ATSC.

Donde I significa modo de barrido entrelazado y P modo progresivo.


Aunque la calidad de imagen es alta en estos sistemas, no pueden competir con la de la pelcula
de 35 mm. por lo que respecta a resolucin espacial. En este sentido existen desarrollos encaminados a
realizar un estndar denominado superhigh-definition (SHD), que permita mostrar imgenes en tiempo
real de 2000 x 2000 pixels con una frecuencia de cuadro de 60 Hz. Para llevarlo a la prctica se requiere
de nuevas tcnicas de compresin.

6.5. Formatos estndares de video digital


6.5.1.

Vdeo CD

La especificacin del Vdeo CD, anunciada por JVC, Philips, SONY y Matsushita en Julio 1993, es una
implementacin especial de CD-ROM/XA diseada para almacenar vdeo MPEG-1. MPEG significa
Motion Picture Experts Group, que es un comit de la International Standards Organization (ISO) y la
International Electrochemical Commission (IEC). Esta especificacin define un disco Mode 2 Form 2 que
puede contener hasta 74 minutos de calidad VHS a pantalla completa. Hay dos problemas importantes al
almacenar datos de vdeo en CD: demasiados datos y bajo ratio de salida. Un segundo de vdeo en
calidad VHS sin comprimir requiere 5 megabytes de espacio. Un CD de 680 MB contendra 2 minutos de
vdeo. Obviamente, se puede comprimir los datos a almacenar, descomprimiendo en tiempo real. MPEG1 usa varias tcnicas para comprimir vdeo con un factor de compresin de 200:1. Al ser MPEG un
estndar internacional, cualquier fabricante puede hacer hardware capaz de grabar, comprimir y
reproducir vdeo MPEG. Adems, al no estar limitado a una plataforma, se puede grabar y reproducir
CDs que sigan las especificaciones de los libros rojo y amarillo. Las tasas de compresin de audio y vdeo
pueden variar segn la aplicacin. Sin embargo, VideoCD extiende la utilidad de MPEG codificando el
vdeo de bitrates estndares en un formato que elimina la informacin de vdeo redundante y aade una
aplicacin en tiempo de ejecucin CDi para ser usada en reproductores CDi, DVD o VideoCD.
El libro blanco, desde su concepcin original como versin 1.1, ha sido aumentada a travs de los
aos con VideoCD 2.0 (1995), VCD-ROM (1997), VCD-Internet (1997) y SuperVCD (1998). VideoCD 2.0 es
para video interactivo PAL y NTSC, incluyendo capacidades de pausado de alta resolucin y rebobinar y
pasar hacia delante. VCD-ROM permite crea discos CD-ROM y VideoCD hbridos. VCD-Internet es una
manera estandarizada de enlazar video y pginas web contenidas en el disco u online. SuperVCD es un
MPEG1 de alto bitrate o MPEG2 de bitrate variable.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 11/65

Tema 6.- Vdeo.

Caractersticas principales del VideoCD

Parmetro

Valor

Tiempo
de
74 minutos
reproduccin
Video:
MPEG-1
Resolucin:
352 x 240 a 30 fps (NTSC) o 352 x 280 a 25 fps (PAL/SECAM)
Audio:
MPEG-1 stereo y pistas de audio opcionales
Imgenes:
MPEG-1 de hasta 720 x 480/576 (uso para mens)
Interaccin:
Mens para seleccionar. Listas de reproduccin para secuencias predeterminadas de
audio/vdeo/imgenes. Movimiento hacia adelanta y hacia atrs.
Subttulos
S
Puntos
de
Hasta 98 por pista (500 en total por disco)
entrada

Los Video CD se caracterizan por el uso de mltiples pistas. La pista 1 contiene el programa CD-i, la
informacin para Karaoke o videos musicales (opcional), las direcciones de puntos de entrada, las listas
de reproduccin y las imgenes MPEG. Las siguientes pistas se usan para el vdeo MPEG (opcionalmente
seguidas por pistas de audio). Pueden contener informacin adicional. Un Video CD debe tener al menos
2 pistas. Los archivos de vdeo MPEGS estn en Mode 2 Form 2. Se pueden aadir pistas adicionales de
audio CD tras la ltima pista MPEG.

La mayor parte de los archivos en un disco Video CD tienen nombres predefinidos y se localizan en
directorios especficos, tal y como mostramos a continuacin.
Directorio

Archivos

VCD

INFO.VCD
ENTRIES.VCD
PSD.VCD
LOT.VCD
MPEGAV AVSEQnn.DAT
CDDA
AUDIOnn.DAT
SEGMENT ITEMnnn.DAT
KARAOKE KARINFO.xxx
EXT
PSD_X.VCD

Comentarios

Identificacin
de
lbum
y
disco
Lista de puntos de entrada (mx 500)
Descriptor de secuencia de reproduccin
Archivo de desplazamiento de lista de IDs
Archivos MPEG (uno por pista)
Archivos CD Audio files (uno por pista)
Items de reproduccin (uno por segmento)
Archivos opcionales de informacin para karaoke

Versin opcional extendida de PSD.VCD


Versin opcional extendida de LOT.VCD
Lista opcional de direcciones de
I-frame
SCANDATA.DAT
Datos opcionales (uno por pista)
LOT_X.VCD

CDI

CAPTnn.DAT
(undefined)

Archivos de datos y programa CD-i

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 12/65

Tema 6.- Vdeo.

Especificaciones tcnicas de VideoCD 2.0

Caractersticas

Descripcin

Resolucin Vdeo

SIF (352 x 288 PAL, 352x240 NTSC)

Compresin Vdeo

MPEG-1

Bitrate Vdeo

Hasta 1151 kbps (CBR)

Compresin Audio

MPEG-1 layer 2

Bitrate Audio

224kbps

Sonido Surround

Dolby ProLogic (analgico)

Flujos
audio

mximos

de

1 estreo o 2 mono

Otras caractersticas

Mens, control de reproduccin


reproduccin de segmentos MPEG

Resolucin
imgenes

480 x 480, 480 x 576, 704x480 or 704x576

6.5.2.

de

tems

de

Super Vdeo CD

Super Video CD es un estndar de 1998 construido sobre el estndar VCD. Ofrece calidad de vdeo
entre el VCD y el DVD, usando una mejor resolucin de vdeo, codificacin con bitrate variable y el
estndar MPEG-2 para compresin de audio y vdeo. MPEG-2 introduce varias ventajas con respecto a
MPEG-1 como son un incremento de resolucin, vdeo entrelazado y mejor resolucin en componente
DC. Permite un bitrate variable en flujos audio y video, lo que permite que el codificador pueda mantener
una calidad ms constante al reducir el nmero de bits asignados para secciones de menor detalle e
incrementar el nmero de bits asignados a las secciones de mayor detalle. Tambin se puede doblar el
bitate con respecto al ofrecido por VCD. Se puede incluir un segundo flujo de audio MPEG, por lo que se
puede aadir un segundo idioma. La codificacin de audio MPEG-2.5.1 permite aadir sonido digital
surround a las pelculas.
Parmetro

Video CD v 2.0

SVCD

Tiempo de reproduccin: 74 minutos


150 kBps
Ratio datos:
MPEG-1
Vdeo:
1.15 Mbps CBR
352
x
240
(NTSC)
Resolucin:
352 x 280 (PAL/SECAM)
MPEG-1
stereo
CBR
Audio:
pistas CD audio opcionales
MPEG-1
Imgenes:
Mens, Lista de reproduccin,
Interaccin:
FF/FR
Leyendas
Subttulos:
Hasta
98
por
pista
Puntos de entrada:
(500 por disco).

35 a 70 mins+
300 kBps
MPEG-2
2.6 Mbps VBR medio
480
x
480
(NTSC)
480 x 576 (PAL/SECAM)
2 flujos MPEG-1 stereo VBR
canal 5.1 opcional
MPEG-2
Mayor interactividad
Grficos superponibles

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 13/65

Tema 6.- Vdeo.

Especificaciones tcnicas de Super Video CD 1.0


Caracterstica

Descripcin

Resolucin
Vdeo

2/3 D1 (480x576 PAL, 480x480 NTSC)

Compresin
Vdeo

MPEG-2

Bitrate video

Variable hasta 2600 kbps

Compresin
Audio

MPEG-1 layer 2

Bitrate Audio

Variable entre 32 kbps y 384 kbps

Sonido
Surround

MPEG-2 5+1 (digital) o Dolby ProLogic (analgico)

Mximo
audio

flujos

2 stereo o 4 mono

Otras
caractersticas

Overlay grfico para OSD, 4 flujos de subttulos o letras,


interactividad extendida con instrucciones variables y
condicionales

Imgenes

480 x 480, 480 x 576, 704x480, 704x576

6.5.3.

DVD

DVD-Video fue diseado originalmente para ajustarse a las necesidades de la industria cinematogrfica,
especialmente para contener una pelcula completa en un CD. Se ha demostrado que el uso de la
compresin de vdeo MPEG-2 ofrece mejores resultados que VHS y Laserdisc. DVD-Video tambin ofrece
sonido surround, subttulos, eleccin de formatos de visualizacin e interaccin con el usuario para
aplicaciones de vdeo no lineales. La especificacin DVD-Video fue escrita y ahora mantenida por el
grupo de trabajo WG1 del DVD Forum. El DVD-Video est reemplazando al VHS como formato base
para la distribucin de contenidos en vdeo.
Requerimientos para el formato DVD-Video:

133 minutos en una cara de un disco (99% de las pelculas) de vdeo comprimido MPEG-2 con
audio multicanal surround.
Mejor resolucin de vdeo que el Laserdisc.
Sonido surround calidad CD (calidad home cinema)
Audio hasta en 8 idiomas
Subttulos hasta en 32 idiomas
Formatos Pan-scan, letterbox y panormico
Control de contenidos
Proteccin de copia
Compatibilidad con CDs
Divisin y acceso por captulos
Hasta 9 ngulos de cmara para dar mayores posibilidades al usuario

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 14/65

Tema 6.- Vdeo.

La mayora de DVD-Video incluye extras que no pueden ser incluidos en un VHS, tales como biografas,
comentarios del director, el making of de la pelcula, etc. La especificacin DVD-Video est basada en
un DVD-ROM con el sistema de ficheros UDF Bridge. Dependiendo del tiempo de reproduccin
requerido y de otros factores, un DVD-Video puede ser DVD-5, DVD-10, DVD-9. Para reproducciones
mayores de 133 minutos (incluyendo contenido adicional), la capa dual DVD-9 es una solucin. Un DVD10 es ms til para versiones panormicas y pan & scan en el mismo disco. No se recomienda el uso del
formato DVD-10 para reproducciones de mayor duracin pues necesitaremos cambiar el disco de cara.
Tiempos de reproduccin
Los tiempos de reproduccin del DVD-Video no son fijos pero dependen del bitrate de vdeo, del formato
de disco y de otros factores.

Un DVD-5 (cara simple) puede contener 133 minutos de vdeo codificado con MPEG-2, 3
canales de audio surround y 4 canales de subttulos (sin compresin de vdeo un DVD-5 podra
tener alrededor de 3 minutos de vdeo).
En un DVD-9 (capa dual) tenemos hasta 240 minutos de vdeo.
En un DVD-10 (doble cara) tenemos 133 minutos por cara, pero hay que darle la vuelta al disco.
Un DVD-18 (capa dual, doble cara) puede tener 240 minutos por cara, necesitando cambiar de
cara.

A diferencia de los Audio CD, el tiempo de reproduccin no es fijo, sino que puede variar. Mayores
tiempos de reproduccin implica menores bitrates y menor calidad de vdeo y viceversa. El uso de
MPEG-1 en vez de MPEG-2 permite mayor tiempo de reproduccin a costa de menor calidad. Tener ms
o menos canales de audio o bitrates de audio diferentes tambin afecta el bitrate de vdeo y el tiempo de
reproduccin. El bitrate mximo es 98 Mb/s para vdeo, audio e imgenes (1008 incluyendo la
informacin de control). Para 133 minutos, el bitrate medio es 47 Mb/s. El bitrate medio de vdeo
disponible depende del nmero de flujos de audio y la codificacin usada y debera ser al menos 4 Mb/s
para obtener resultados de alta calidad. El grfico que mostramos a continuacin muestra el bitrate de
vdeo para varios tiempos de reproduccin. Se asume que el vdeo se acompaa de 3 flujos de audio
Dolby Digital a 448 kbps y 4 de subimgenes a 10 kbps. Para un DVD-5 el bitrate de vdeo es una media
de 31 Mbps, 240 minutos en un DVD-9 permite el mismo bitrate, pero los DVD-9 se usan para tiempos de
reproduccin ms cortos para conseguir mayor bitrate y mayor calidad. Para reproducir 133 minutos en
un DVD-5, el bitrate medio de vdeo ha de ser 31 Mbps. Si reducimos el nmero de canales de audio
podremos aumentarlo. Debemos tener en cuenta que el bitrate de vdeo mximo para este ejemplo es 84
Mbps, quedando el restante 14 Mbps para audio e imgenes.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 15/65

Tema 6.- Vdeo.

Tiempos de reproduccin de audio


Se puede usar un DVD-Video como audio exclusivamente, pero la calidad no ser como la de un DVDAudio usando los 6 canales. A continuacin mostramos ejemplos de tiempos aproximados:

Ejemplo

Codificacin

Audio calidad CD stereo


LPCM
Audio Stereo (@192kb/s) DolbyDigital
5.1 (@448kb/s)
DolbyDigital
5.1 (@1.536Mb/s)
DTS
5.1 (@768kb/s)
DTS
5.1 (48kHz/16b)
LPCM

Tiempo de reproduccin (hrs)


DVD-5

DVD-9

7.4
54
23.3
6.8
13.6
2.2

13.4
98
42.3
12.3
24.7
4.1

Estructura de archivos DVD-Video


Un DVD-Video contiene video, audio y otros datos usando una estructura de disco y archivos especfica,
donde los datos se organizan como flujos de datos. Los ttulos DVD-Video poseen una estructura
jerrquica como se muestra en la ilustracin. Est dividido en Video Title Sets o ttulos. Como mnimo
debe haber un VideoManager (VMG) y un VTS. Un disco que contenga una pelcula ms el making of
probablemente se divida en dos ttulos. Un disco conteniendo 6 episodios de un programa debera estar
dividido en 6 ttulos, aunque sera posible tener slo un ttulo.

Cada Video Title Set Information (VTSI) contiene datos de control y objetos de vdeo (VOBs) para mens
(si los hay) y ttulos (imgenes y vdeo). Cada VOB incluye vdeo, audio, imgenes y datos de
navegacin. Al reproducir un VOB, el reproductor no slo muestra el vdeo secuencialmente sino que
obedece las instrucciones de navegacin para mostrar mens, obtener decisiones del usuario, etc. Cada
VOB contiene celdas individuales enlazadas con Program Chains (PGCs), que proporcionan la
interactividad necesaria usando un simple lenguaje de programacin creado para DVD-Video. Existen 3
tipos de PGC: reproduccin secuencial, aleatoria con celdas repetidas y aleatoria sin celdas repetidas. Los
VOBs y otros datos se encuentran en archivos en el directorio VIDEO_TS. La tabla inferior muestra un
ejemplo de estos ficheros para un disco de un nico ttulo. El audio, vdeo e imgenes para la pelcula
estn contenidas en 9 VOBs, donde cada fichero ocupa menos de 1 GB. Para en DVD-5 no podr haber
ms de 5 VOBs, y 9 para un DVD-9.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 16/65

Tema 6.- Vdeo.

Archivo

Descripcin

VIDEO_TS.IFO
VIDEO_TS.VOB
VIDEO_TS.BUP
VTS_01_0.IFO
VTS_01_0.VOB
VTS_01_0.BUP

Archivo VMGI (Video Manager Information)


Archivo
VOB
para
Men
VMG
Copia Seguridad VMGI
Archivo VTSI (VTS Manager Information)
Video Object Set para Men VTS
Copia Seguridad VTSI

VTS_01_1.VOB Primer Title Video Object Set


VTS_01_2.VOB Segundo Title Video Object Set
. . . . . . ......
VTS_01_n.VOB ltimo Title Video Object Set (n <=9)
Los archivos VTS*.* pueden ser repetidos para cada VTS y llamarse VTS_02*.*, VTS_03*.* etc. Cada VTS
tendr un .IFO y un .BUP ms uno o varios .VOB files.
Flujos de datos DVD-Video

Tipo de
dato

Video

Flujos

Max
datos
rate

Codificacin

9.8 Mb/s Vdeo MPEG-1 o


MPEG-2
Audio
Hasta 8
6.144 Varios formatos de
Mb/s
audio en stereo y
surround
Imgenes
Hasta 32
3.36
2 bits/pixel RLE
Mb/s
Navegacin
PGC para obtener
1
interactividad

Proteccin anticopia DVD-Vdeo


Se hace uso del Content Scrambling System (CSS) para proteger los datos audio/vdeo en un DVD-Vdeo.
Cada VTS puede ser codificado con una clave nica. Cada ttulo nico puede tener asociado una clave de
disco y hasta 99 clave s de ttulo, que se almacenan de manera encriptada. En el decodificador, las claves
originales se obtienen por desencriptacin. Slo se encriptan los datos de vdeo. En unidades DVD-ROM,
el decodificador MPEG-2 recibe las llaves necesarias para la desencriptacin, lo cual asegura que slo el
hardware/software aprobado puede ser usado.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 17/65

Tema 6.- Vdeo.

A continuacin describiremos algunos mtodos de proteccin de sistemas de vdeo.


Analogue Copy Protection (ACP)
Es un sistema de proteccin de copias desarrollado y patentado por Macrovision y se compone de dos
elementos: Control de ganancia automtica (AGC) y Colorstripe. ACP es soportado por la mayora de
reproductores DVD y produce copias distorsionadas.

Se implementa como 2 bits de control en el flujo MPEG-2 durante el proceso de authoring. Aadir ACP al
disco DVD-Video requiere que el propietario obtenga una licencia de Macrovision. ACP proporciona los
siguientes beneficios:

nico sistema de proteccin analgico que distorsiona completamente el contenido en copias.


Los propietarios de los derechos pueden especificar facilidades de authoring si se activan los bits
de proteccin.
Ha sido probado como el medio ms efectivo de evitar copias no autorizadas.

Copia de DVD
Copiando un DVD podemos obtener un clon exacto. Podemos usar CSS y ACP para prevenir estas
copias:

Un grabador de DVD-Video puede detectar la presencia de la marca ACP y no hacer la copia.


Si se usa CSS para proteger digitalmente el contenido, los reproductores DVD deberan mostrar
datos CGMS (sistema de gestin de generacin de copias) y no hacer una copia del disco. CSS
tambin prevendra la copia de DVD a travs de un PC.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 18/65

Tema 6.- Vdeo.

Codificacin por regiones


Los discos DVD-Video protegidos mediante CSS pueden tambin estar codificados por regiones para
prevenir que un disco para los EEUU se reproduzca en Europa y viceversa, lo que permite la distribucin
independiente en varias zonas del mundo. Existen un total de 6 regiones:
Regin

1
2
3
4
5
6
7
8

Pases

USA, Canad
Europa, Oriente Medio, Surfrica, Japn
Sureste Asia, Taiwan
Centroamrica, Suramrica, Mxico, Australia, Nueva Zelanda
Federacin Rusa, (parte de) Africa, India, Pakistn
China
Sin definir
Para uso en aerolneas

Codificacin de Vdeo
DVD-Video es un estndar flexible que usa MPEG y que proporciona una excelente calidad de imagen
para NTSC o PAL/SECAM y largos tiempos de reproduccin para cualquier pelcula. El vdeo puede ser
codificado en MPEG-2 o en MPEG-1, con la siguiente tabla resumen:

Parmetro

MPEG-2

Resolucin
NTSC
(horizontal x vertical)
Resolucin PAL/SECAM
(horizontal x vertical)
VBR o CBR
PAL/SECAM frame rate
NTSC frame rate (en disco)

MPEG-1

720/704 x 480 352 x 480


352 x 480/240 351 x 240
720/704 x 576 352 x 576
352 x 576/288 352 x 288
VBR o CBR
CBR
25 fps
24 o 29.97 fps

El VBR permite obtener una mayor calidad de imagen con un mejor bitrate usando ms datos para
codificar las partes ms complejas de una secuencia de vdeo. Con CBR, el bitrate debe ser
suficientemente alto como para codificar todo el vdeo bien., es adecuado cuando no tenemos problemas
de espacio. La codificacin MPEG-2 fue diseado para codificar la seal digital CCIR 601 a resolucin
completa (720x480 NTSC; 720x576 PAL/SECAM) proporcionando VBR y entrelazamiento, con una
compresin de hasta 40:1. MPEG-1 permite mayor tiempo de reproduccin a menor calidad. No permite
visualizacin entrelazada y la resolucin de imagen se reduce a 352x240 (NTSC) o 352x288
(PAL/SECAM), as como usa CBR.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 19/65

Tema 6.- Vdeo.

Calidad de Imagen

Propiedad

Formato de codificacin
CBR/VBR
Pxels
Lneas
Bitrate
Calidad
Canales audio
Idiomas
Tiempo
reproduccin

de

Laserdisc

Video CD

SVCD

DVD-Video

Composicin
analgica
-

MPEG-1

MPEG-2

MPEG-2

CBR
352
240/288
1.15 Mb/s
Aceptable
2
1
74 mins
max

VBR
480
480/576
2.6 Mb/s
Buena
4
2 st/4 mono
37 mins bitrate
max

VBR
720
480/576
3.5 Mb/s
Muy buena
5.1
Hasta 8
~133 mins por
capa

Buena
2 a 5.1
1
60 mins

Formatos de pantalla
El aspect ratio de la TV tradicional es 4:3 (horizontal:vertical) mientras que las pelculas tienen por lo
general un aspect ratio 2.35:1. Existe un formato intermedio 16:9 para TV panormica. En un DVD-Video
podemos usar 3 formatos de pantalla:
Widescreen, 16:9 a pantalla completa.
Letterbox, donde una pelcula widescreen se muestra dejando barras arriba y abajo.
Pan & Scan, donde una pelcula widescreen se muestra como 4:3 pero ms estrecha que la original.

ngulos de cmara
Un disco DVD-Video ofrece la posibilidad de incluir hasta 9 ngulos de cmara diferentes. Estas
secuencias son entrepuestas en el disco para permitir un rpido acceso a las mismas, por lo que se reduce
el bitrate general para permitir ese tiempo de bsqueda. A continuacin mostramos un ejemplo de 3
ngulos entremezclados en el flujo de vdeo.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 20/65

Tema 6.- Vdeo.

Codificacin del Audio


Los discos DVD-Video pueden contener hasta 8 flujos de audio usando varios formatos comprimidos y
no comprimidos. Cada flujo de datos puede contener entre 2 (stereo) y 6 canales (sonido surround)
dependiendo del material disponible, existiendo pequeas diferencias entre la codificacin para PAL y
para NTSC. La posibilidad de mltiples flujos permite incluir varios idiomas en un disco. Veamos a
continuacin los formatos de audio disponibles para un DVD-Video:

Dolby Digital: (Dolby AC-3) proporciona sonido surround 5.1 y se usa actualmente en
reproductores de Laserdisc y DVD-Video. Es un formato con prdidas que tiene bitrates que van
desde 64 kbps (mono) a 448 kbps. El sonido surround 5.1 requiere de un mnimo de 384 kbps,
pero Dolby recomienda usar el mximo de 448 kbps. El audio stereo suele requerir 192kbps. Los
reproductores de DVD-Video convierten la salida Dolby Digital 5.1 en Dolby Surround
(ProLogic) usando las salidas analgicas stereo cuando no se dispone de decodificador Dolby
Digital.

MPEG: Tambin es un formato con prdida. MPEG-2 proporciona sonido surround 5.1/7.1 con
CBR (32-912 kbps, 384 kbps de media) o VBR. La tasa de muestreo se fija a 48 kHz. La opcin 7.1
aade los altavoces centro-izquierda y centro derecha. MPEG-1 layer II se usa como para Video
CD.

LPCM: Formato de audio sin comprimir, similar al Audio CD, pero con mayor frecuencia de
muestreo y cuantizacin. LPCM ofrece hasta 8 canales de 48/96 kHz de frecuencia de muestreo y
16/20/24 bits por muestra, pero no todos al mismo tiempo. El bitrate mximo es 6144 Mbps,
superior al de Dolby Digital o MPEG-2, ofrece una calidad similar al DVD-Audio, pero deja poco
ancho de banda para el vdeo.

DTS (Digital Theater Systems): Es un formato de audio 5.1 con prdida, frecuencia de muestreo
de 48 kHz y usa hasta 20 bits por muestra. La tasa de datos vara de 64 kbps a 1536 Mbps.

La especificacin DVD-Video define el uso de diferentes mtodos de codificacin audio para


PAL/SECAM y NTSC, como apreciamos en la siguiente tabla:

Disco

Obligatorio

Opcional

NTSC

LPCM Dolby Digital

LPCM, Dolby Digital, MPEG u otros

PAL/SECAM Linear PCM or MPEG-1 or MPEG-2 or Dolby Linear PCM, Dolby Digital, MPEG or
others
Digital

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 21/65

Tema 6.- Vdeo.

6.5.4.

DV

DV es un estndar internacional creado por un consorcio de 10 compaas para obtener un formato de


vdeo digital para el consumidor. Las compaas implicadas son Matsushita Electric Industrial Corp
(Panasonic), Sony Corp, Victor Corporation of Japan (JVC), Philips Electronics, N.V., Sanyo Electric Co.
Ltd, Hitachi, Ltd., Sharp Corporation, Thomson Multimedia, Mitsubishi Electric Corporation, y Toshiba
Corporation. Desde entonces se han unido ms compaas, sobrepasando las 60 en el consorcio DV. DV,
originalmente DVC (Digital Video Cassette), usa una cinta de de pulgada (6.35 mm) para grabar vdeo
digital de muy alta calidad. Se muestrea el vdeo con el mismo ratio que D-1, D-5 o el vdeo digital
Betacam (720 pxels por lnea de escaneo). El vdeo muestreado se comprime usando la DCT tal y como
sucede en M-JPEG, aunque aqu se permite una mayor optimizacin local de tablas de cuantizacin que
la realizada por compresores JPEG, superando el factor de compresin nominal 5:1 de un frame JPEG. DV
usa compresin intraframe: cada frame comprimida depende completamente de s misma y no de datos
provenientes de otras frames. Sin embargo, tambin usa compresin adaptativa entre frames; si el
compresor encuentra poca diferencia entre los campos entrelazados de un frame, los comprimir juntos.
La informacin de vdeo DV se introduce en un flujo de datos de 25 Mbps que, aadiendo el audio y la
correccin de errores se forma un flujo total de 36 Mbps.
Los formatos DV estn reconocidos como de mayor calidad de imagen que Betacam SP y MII, estando
por debajo de otros formatos como Digital-S y DVCPRO50. En una escala de 1(mnimo) a 10 (mximo),
obtendramos la siguiente calificacin de formatos:
D-5 (10-bit uncompressed digital) 10
D-1 (8-bit uncompressed digital) 9.9
Digital Betacam, Ampex DCT 9.7
D-9 (Digital-S), DVCPRO50 9.6
DV, DVCAM, D-7 (DVCPRO) 9
MII, Betacam SP 8.9
1" Type C 8.7
3/4" SP 6.5
3/4", Hi8, SVHS 5
Video 8, Betamax 4
VHS 3
EIAJ Type 1, Fisher-Price Pixelvision 1

Transferencia del vdeo digital al ordenador


IEEE-1394 es un protocolo de comunicaciones estndar para transferencias de datos de alta calidad y
pequea distancia, desarrollado originalmente por Apple Computer (Firewire). Sony llama i.LINK a su
implementacin del 1394. En ocasiones se asocia la aparicin del 1394 al desarrollo del DV. Los datos
almacenados en una cinta DV reflejan la estructura de paquetes enviados a travs de un interfaz 1394.
1394 es actualmente la mejor opcin para hacer transferencias de datos de vdeo digital a un ordenador.
Existen otras alternativas, como puede ser la transferencia digital en serie SMPTE 259M SDI, pero VTR
con SDI es muy caro, mientras que 1394 lo llevan ya incorporado muchas cmaras y el cable de conexin
tiene un precio asequible. La transferencia via IEEE1394 es una copia digital de datos ya que no existe ni
compresin ni descompresin en la transmisin, mientras que la transmisin sobre SDI est sujeta a
degradacin debido a la decompresin y recompresin. A continuacin presentamos una calificacin de
diversos mtodos de transferencia atendiendo a la calidad de la copia:

IEEE-1394 10
SDI 9.8
Analog Component (Y, R-Y, B-Y) 9
Y/C ("S-video") 8

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 22/65

Tema 6.- Vdeo.

Analog Composite 5

Especificaciones tcnicas de DV Cassette

Caractersticas

Descripcin

Resolucin de Vdeo

D1 (720x576 PAL, 720x480 NTSC)

Compresin de Video

DV

Bitrare Video

25 Mbps (CBR)

Audio

2 canales stereo a 32 kHz 12-bit PCM no lineal


1 canal stereo a(48/44.1/32) kHz 16-bit PCM lineal

Bitrate Audio

1000 kbps a 1500 kbps

6.6. Compresin de vdeo.


La aproximacin bsica a la compresin de vdeo es emplear cualquiera de los mtodos vistos
para compresin de imgenes aplicado a cada uno de los cuadros o frames que se denominan intraframe.
Sin embargo los niveles de compresin que se pueden alcanzar de esta forma son limitados por el
tratamiento intrnsecamente diferenciado de cada cuadro. Los mtodos de compresin interframe por su
parte, tratan de aprovechar las caractersticas de redundancia temporal debda a la similaridad entre
cuadros vecinos o contiguos, junto a redundancias espaciales, espectrales y psicovisuales para
obtener unos porcentajes de compresin mayores. Sin embargo hay que hacer notar que algunas
aplicaciones pueden tener requerimientos especficos (como por ejemplo, acceso aleatorio a todos los
cuadros) que dicten el uso de tcnicas intraframe en lugar de interframe.
De forma general, se pueden clasificar los mtodos de compresin de vdeo en cuatro clases:
Basadas en formas de ondas (Waveform). Si se considera el eje temporal como una
tercera dimensin, es posible generalizar las tcnicas de formas de ondas utilizadas en
compresin de imgenes para el caso de seales de vdeo. La idea de estos mtodos es
estimar los contenidos de un cuadro (o campo) en la siguiente instancia a partir de la
informacin en un punto de la secuencia; esto se lleva a cabo mediante tcnicas de motion
estimation.

Basadas en objetos (Object based). Son la generalizacin de aquellas empleadas para


compresin de imgenes en las que se descompona la informacin visual en funcin de
una serie de primitivas (como por ejemplo contornos y texturas) que en este caso
incluirn como parmetro el movimiento asociado a las mismas.
Basadas en modelos (Model based). Hace referencia a la bsqueda de modelos que
representen la informacin en la escena. Pero que, a diferencia de los casos anteriores, los
modelos son objetos en 2D, o en 3D, predefinidos cuya proyeccin o composicin
caracteriza la informacin que se quiere codificar. Esta idea se incluye en el estndar
MPEG-4 que incluir modelos de caras y cuerpos.
Basadas en fractales (fractal coding). Como generalizacin de las vistas para imgenes
estticas.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 23/65

Tema 6.- Vdeo.

6.6.1. Estndares para compresin de vdeo.


En este punto se desarrolla el apartado dedicado a estndares de compresin de vdeo digital
para facilitar la manipulacin y almacenamiento de seales de vdeo como una forma ms de
informacin tratable en un computador y su transmisin sobre redes de computadores existentes y
futuras y otros canales de difusin terrestres.
Se har un repaso de los estndares realizados por comisiones internaciones hasta llegar a
formatos propietarios de codificacin de vdeo. As, se aborda un repaso que empezando por MJPEG
como representante de los denominados mtodos de compresin intraframe; continuar con el H.261
(desarrollado para videoconferencia que admite tanto el mtodo intraframe como interframe) y que
termina con un repaso a MPEG que estn encaminados a mtodos interframe. A continuacin haremos
mencin, de forma muy breve, a los formatos QuickTime, Video for Windows y otros como ejemplos de
sistemas propietarios.
6.6.1.1. MJPEG.
Bsicamente el estndar Motion-JPEG trata cada campo ( cada cuadro) de una secuencia de vdeo
de forma diferente y le aplica un proceso de compresin totalmente independiente del resto.
Por supuesto que este enfoque tiene sus ventajas e inconvenientes que se resumen a continuacin:

Beneficios:
o Al almacenar de forma separada cada cuadro se pueden realizar modificaciones ms
precisas en un editor de vdeo.
o Es posible empezar a reproducir en cualquier cuadro, puesto que la informacin est
completa para todos.
o Es un formato til como medio de almacenamiento por la cantidad de informacin
(detalle) que contiene.

Inconvenientes:
o Puesto que no se utiliza la redundancia Inter-Frame (temporal), la compresin da
como resultado un fichero relativamente largo (tpicamente es tres veces ms grande
que el que creara el estndar MPEG).
o Debdo a la carga computacional que supone el proceso JPEG es necesario disponer
de hardware que lo realice para obtener buena calidad.

Al igual que en JPEG, se obtienen una reduccin de 20:1 en el vdeo MPEG.


Hay dos variantes usuales de MJPEG, MJPEG A y MJPEG B, la primera para gestionar ficheros
ms pequeos y la segunda de ms calidad.
6.6.1.2. H.261.
Es el estndar internacional de compresin de vdeo utilizado en videoconferencia. Describe los
mtodos de codificacin y decodificacin para imgenes en movimiento como parte de un servicio
audiovisual en mltiplos de p*64 kbps (donde p est en el rango de 1 a 30). Se desarroll con miras a ser
utilizado en redes de computadores.
Fu desarrollado por el ITU (anteriormente CCITT) y aceptado como estndar para vdeotelefona en 1987. Existen implementaciones tanto software como hardware. Opera sobre imgenes no
entrelazadas que codifica en modo YCbCr y soporta como resoluciones de los fomatos CIF y QCIF como
muestra la figura siguiente.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 24/65

Tema 6.- Vdeo.

Figura 9. Formatos de entrada para el estndar H.261.

El principio bsico de funcionamiento se basa en que las redundancias espaciales se reducen


mediante el empleo de la transfomacin basada en DCT y la correlacin temporal mediante una
codificacin predictiva del movimiento. Permite la utilizacin de mtodos de compresin Intraframe,
donde se codifican bloques de 8x8 pixels de cada imagen con ellos mismos. O tambin puede funcionar
en modo Interframe donde se codifican los cuadros con respecto a uno de referencia.
Adems de servir de base a posteriores estndares de compresin de video (como MPEG-1 y
MPEG-2), este estndar muestra dos caractersticas importantes:
i.
Determina el retraso mximo (150 milisegundos) para que las comunicaciones
bidireccionales de vdeo ofrezcan, de forma efectiva, realimentacin visual directa.
ii.
Es posible realizar implementaciones hardware de bajo coste. Que es un aspecto
importante para comercializar aplicaciones de videoconferencia.
De cara a las futuras aplicaciones de comunicacin visual para el gran pblico, se requerir de
velocidades de transmisin del orden de los 96 Kb/s. Para este propsito se han desarrollados nuevas
recomendaciones dentro de esta tendencia con el nombre de H.263 y H.263+.
6.6.1.3. MPEG.
El Moving Picture Experts Group de ISO/IEC ha dado nombre a una familia de estndares que se
aplica a la codificacin de seales de vdeo y en la cual se puede distinguir entre diferentes estndares
con rangos de actuacin distintos.
El estndar MPEG-1 es capaz de realizar su trabajo sobre medios de almacenamiento como el CDROM, as como canales de comunicacin del estilo de las RDSI, LANs y WANs. El principio bsico del
algoritmo de compresin que utiliza consiste en codificar Macrobloques (de tamao 16x16) hasta en tres
diferentes modos para cada cuadro en la secuencia. Estos bloques, se codifican de forma parecida a
como lo hace el estndar JPEG en alguno de los cuadros (intramode), como una especie de intraframe.
Los cuadros de los macrobloques se codifican en relacin a con los cuadros consecutivos mediante
tcnicas de compensacin del movimiento desde un cuadro anterior (predictive mode) o hacia un
prximo cuadro (bidirectional mode). A intervalos regulares, se fuerza a codificar todos los macrobloques
en modo intracode frame para evitar la propagacin de errores y permitir un rpido acceso a cualquier
cuadro decodificado en una secuencia de imgenes.
La forma de funcionamiento de MPEG-1 es similar al del estndar H.261 con algunas
caractersticas adicionales. La calidad del vdeo (tanto para compresin como descompresin) para un
tamao CIF, constituye un valor similar (sino superior) al estndar VHS de vdeo analgico. Fue
aceptado como estndar internacional en 1992.
MPEG-1 considera nicamente vdeo en formato de barrido progresivo. Y para alcanzar los 15
Mbps de velocidad de generacin de informacin codificada, usualmente se recorre a convertir la seal
de vdeo de entrada al fomato SIF (Standard Input Format). El espacio de representacin de color es el
YCrCb de la recomendacin 601 del CCIR.
MPEG-1 es un estndar genrico que define la sintaxis 8 para la representacin al nivel de bits
de la informacin codificada, as como un mtodo de decodificacin. A diferencia del estndar JPEG, no
Tecnologas para los Sistemas Multimedia Curso 2004/05 - 25/65

Tema 6.- Vdeo.

define algoritmos especficos, lo que proporciona gran flexibilidad a la hora del diseo del codificador.
De forma similar a como sucede con el estndar H.261, se adjuntan con la informacin codificada los
parmetros que definen los algoritmos utilizados de estimacin del movimiento y el criterio de
seleccin del modo de compresin.
Las caractersticas distintivas del estndar MPEG-1, respecto a sus predecesores, son:
i.

Acceso aleatorio: cualquiera de los cuadros puede ser decodificado en un tiempo


mximo conocido. Esto lo hace til para aplicaciones de almacenamiento de vdeo. Y se
consigue mediante la inclusin de puntos de acceso independientes (I-frames) en la
secuencia codificada.

ii.

Permite operaciones de bsqueda rpida hacia delante/atrs: es posible recorrer la


secuencia codificada y visualizar slo los cuadros seleccionados mediante esa operacin
de avance/retroceso rpido. Tambin se permite la reproduccin en sentido inverso al de
codificacin, lo cual es interesante en aplicaciones interactivas.

iii.

Retraso razonable en el proceso de codificacin/decodificacin de aproximadamente 1


segundo para dar la impresin de interactividad en acceso unidireccional de vdeo.

Respecto a cmo se organiza la codificacin en el estndar MPEG-1, hay que decir que de forma
similar a como ocurre como el estndar H.261 se sigue una estructura de datos jerrquica, de forma que
se posibilita que el proceso decodificador, por su parte, lleve a cabo la interpretacin correcta sin
ambigedades. Esta estructuracin consiste en secuencias de encabezamiento (que define de forma
unvoca la informacin que precede) y datos, para cada uno de los seis niveles siguientes que se
muestran en las figuras 10 y 11:
i.
ii.
iii.
iv.
v.
vi.

Secuencias (sequences) formadas por grupos de imgenes (pictures).


Grupos de imgenes (group of pictures, GOP) compuestas por imgenes.
Imgenes compuestas por trozos (slices). Existen diferentes tipos de imgenes o cuadros:
I, P y B que indican diferentes grados de compresin.
Los trozos estn hechos de macrobloques.
Los macrobloques estn comopuestos por un nmero de bloques.
Los bloques, que son vectores de 8x8 pixels. Estas son las nidades ms pequeas debdo
a la operacin de transformacin basada en DCT.

Los cuatro tipos de cuadros o slices de MPEG son:

Intra-coded (I), son los de referencia que vienen completos, al menos hay uno cada 10 o
15 frames. Estn comprimidos con un algoritmo al estilo de JPEG de forma intra-frame
con DCT. Se utilizan como puntos de acceso aleatorio en la secuencia. Tambin se llaman
cuadros clave (key frames).

Predictive-coded (P), se codifican con respecto al frame anterior (I o P a su vez), usando


la tcnica de prediccin compensada de movimiento, con lo que todas las coincidencias
no sern indicadas, comprimindose potencialmente ms que un I. Este tipo de cuadros
cuadros hacen uso de codificaciones inter-frame, en las cuales se realiza una estimacin
del movimiento y se codifican mediante DCT las diferencias obtenidas.

Bidirectional predictive-coded (B), la prediccin puede ser hacia delante, hacia atrs o
bidireccional y relativa a otras de tipo I P. No se pueden usar nunca como referencias
de otros frames.

DC-coded (D), se codifica slo con sus propios datos como las I, y se usa slo para
compresin sin prdida y en ese caso slo hay frames D (o no los hay en absoluto).

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 26/65

Tema 6.- Vdeo.

Olvidando los DC, se forman grupos de cuadros consecutivos que siempre comienzan en un
cuadro I, y que contienen I, P y B entremezclados, de modo que los P siempre se refieren al I o P
anterior y los B al I o P anterior y siguiente, aunque no sean consecutivos.
El estndar MPEG no especifica cuntos frames P o B debe haber, depende del codificador, que
podra incluso no determinar fotogramas B en absoluto. Por lo general, la compresin es tanto mejor
cuanto ms cuadros B haya.

Figura 10. Secuencias, GOP, macrobloques y bloques en MPEG.

Figura 11. Tipos de slices o cuadros en MPEG.

En la tabla siguiente podemos ver un resumen de las diferencias bsicas entre el estndar H.261
que hemos visto anteriormente y el MPEG-1.

Figura 12. Diferencias entre los estndares H.261 y MPEG-1.

Otra clase de algoritmos (aprobados en 1994): MPEG-2; se han propuesto para mtodos de
compresin de vdeo de alta calidad y diferentes velocidades de transmisin. El principio bsico es el
mismo que el MPEG-1, al que se han aadido caractersticas especiales que permiten el paso de
codificacin dentro de un cuadro o campo en secuencias entrelazadas. As como la introduccin de una
codificacin escalable que permite la decodificacin de una seal de vdeo con menor resolucin
(temporal espacial) calidad que aquella con la que se cre. Las velocidades de trabajo estn en el
orden de 15 a 35 Mb/s y proporciona mayor calidad de la seal de vdeo a costa de un proceso ms
complejo que el estndar MPEG-1.
El MPEG-4 introduce como caracterstica ms notable sobre los anteriores la facilidad de
interaccin con objetos visuales. El algoritmo est basado en tcnicas de representacin de basadas en
objetos. En esta representacin, los pixels de un objeto se consideran inseparables en la misma forma que
lo son las molculas en un objeto del mundo real debido a efecto de un campo de fuerza. Ese efecto est

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 27/65

Tema 6.- Vdeo.

en funcin de una representacin que acompaa la descripcin de un objeto. En este estndar, la seal
de vdeo se descompone en diferentes objetos, cada uno de los cuales tiene su respectiva informacin de
forma, textura y movimiento. Estas entidades se codifican de forma independiente para permitir el
acceso directo y la manipulacin (es decir operaciones de cortar, pegar, deformar, etc.).
El estndar MPEG-7 pasa por un cambio fundamental en la forma de representacin de la
informacin: la llamada representacin semntica.

Figura 13. Pirmide de estndares MPEG.

6.6.1.3.1. MPEG-4.
MPEG-4 trata ms de agrupar los estndares ya existentes que de crear nuevos formatos (formato
de formatos). Se trata de una especie de meta-formato que engloba tanto la posibilidad de almacenar
imgenes y sonidos comprimidos, como la de aadir objetos sintticos, interpretar (decodificar y
renderizar) y representar una composicin de escena a partir de mltiples objetos.
Adems, describe la forma en que debe transmitirse y sincronizarse el envo de los datos, bien sea
a travs de una red o bien en un soporte fsico local.
Tambin se encarga de la posible interaccin del usuario con las escenas descritas.
Dispone de un conjunto de tecnologas para satisfacer las necesidades de los autores de
productos multimedia, los proveedores de servicios de red y los usuarios finales:
AUTORES DE PRODUCTOS MULTIMEDIA:
o Les permite combinar varias tecnologas en una sola con mayor flexibilidad.
o Les otorga una mayor reutilizacin de sus creaciones al trabajar con objetos

PROVEEDORES DE SERVICIOS DE RED:


o Controlarn mejor el trfico, puesto que el estndar contempla el envo de
seales de control.
o Define unos niveles mnimos de calidad de servicio (QoS) para que cada
operador garantice un servicio de calidad segn los requerimientos del cliente y
del canal a utilizar.
o Se puede optimizar el flujo de datos en funcin de su tipo y relevancia.

USUARIO FINAL:
o Le ofrece televisin digital, aplicaciones grficas y multimedia interactivas,
comunicacin en tiempo real, vigilancia a distancia, etc.

Las escenas audiovisuales MPEG-4 estn compuestas por multitud de objetos multimedia de
forma jerrquica. Estandariza el nmero de objetos multimedia primitivos que pueden ser de dos o tres
dimensiones. Por ejemplo: si pensamos en una persona hablando en una clase y queremos transmitir esta
informacin de forma audiovisual, podemos descomponer la escena en varios objetos diferentes, como: imgenes
Tecnologas para los Sistemas Multimedia Curso 2004/05 - 28/65

Tema 6.- Vdeo.

estticas (pizarra, fondo, etc), objetos de vdeo (la animacin de la persona hablando), objetos audio (la voz de esa
persona), etc.
Las escenas son agrupaciones de objetos multimedia. Los objetos que componen la escena se
agrupan en rboles y subrboles. Esta idea se basa en el concepto de escena empleado en el lenguaje
VRML (Virtual Reality Modeling Language o Lenguaje de Modelado de Realidad Virtual).
La idea bsica es que los objetos multimedia primitivos se agrupan para formar objetos
multimedia ms complejos de forma jerrquica. De esta manera, el autor puede construir escenas tan
complejas como sea necesario y el usuario puede interactuar con un grupo de objetos como si de uno
slo se tratara.
Debido a la presencia de varios objetos es un solo bloque, es necesario tener en cuenta las
necesidades de ancho de banda de cada objeto para no tener que esperar al ms lento. Esto se consigue
mediante una capa de sincronizacin (capa de sincronizacin de flujos) que se dedica exclusivamente a
la gestin y control de los objetos que se necesitan representar.
Los objetos multimedia se transmiten en los que llamaremos flujos de datos. Los flujos de datos
se componen de flujos elementales de datos (elementary stream, ES). As pues, los objetos multimedia
pueden necesitar varios flujos de datos, que pueden ser de diferente naturaleza y que son transportados
en uno o mas flujos elementales. Un objeto descriptor identificar los flujos asociados a un objeto
multimedia. Los descriptores pueden llevar indicaciones del nivel de calidad (QoS) apropiado que se
requiere para la transmisin (p.e., la mxima tasa de bit, la tasa de bit de error, la prioridad, etc). La
capa de sincronizacin se encarga de sincronizar los flujos elementales. La sintaxis de esta capa de
sincronizacin es configurable en multitud de modos por lo que se puede usar en distintos tipos de
sistemas.
Generalmente, el usuario final ver la escena tal cual el autor la ha creado, aunque este pueda
permitir cierto grado de interaccin con la escena si la disea de este modo. Entre otras cosas, el usuario
podr:
Cambiar los puntos de vista o audicin (navegar por la escena).
Mover objetos de la escena a distintas posiciones.
Arrancar y detener el flujo de eventos (ej: iniciar y detener el vdeo).
Elegir el lenguaje que desea emplear, caso de que se ofrezca soporte para varios.
6.6.1.4. Cinepak
El codec ms utilizado si lo que interesa es el espacio. Permite definir el espacio entre cuadros
llave y la calidad interframe, eliminando ms o menos informacin en cada uno de los fotogramas
relativos. Tambin se suele poner definir la velocidad de transferencia de datos mxima soportada, de
modo que Cinepak reducir la calidad hasta permitir que los datos necesarios no sean superiores.
6.6.1.5. Sorenson Video
Parece que va a ser el sustituto natural de Cinepak. Tiene una gran calidad incluso con tasas de
transmisin mnimas, con lo que se est convirtiendo en una de las principales opciones para
transmisin de vdeo en Web.
Tambin es tremendamente asimtrico, como Cinepak.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 29/65

Tema 6.- Vdeo.

6.6.1.6. Indeo
Indeo es una tecnologa de compresin/descompresin de vdeo desarrollada por Intel para
procesadores Pentium, muy usada en los ficheros AVI, y QT, entre otros.
6.6.1.7. QuickTime
Es una definicin (aparecida hacia 1992) desarrollada por Apple Computer de la arquitectura para
un sistema multimedia multiplataforma de origen industrial. Se utiliza por desarrolladores de
herramientas y contenidos software para crear y distribuir de forma sincronizada, grficos, sonido,
vdeo, texto y msica al disponer de capacidad para albergar un cierto numero de pistas. Permite
reproducir archivos de diverso contenido con animaciones, msica, MIDI, audio, vdeo y dispone de un
limitado aspecto de mostrar una imagen con caractersticas de realidad virtual.
No requiere de hardware y est disponible en plataforma Mac 68K/PPC y Windows.
6.6.1.8. Animation
Es el codec ms utilizado para comprimir pelculas generadas por ordenador (2 o 3-d), por
ejemplo una animacin generada con Macromedia Director. Utiliza tambin compresin interframe.

6.6.2.

Nuevos formatos de compresin de vdeo


6.6.2.1.

DIVX/XVID

La razn de la existencia de los formatos DivX y XviD es su excelente capacidad de almacenar vdeo de
alta calidad en un fichero de tamao reducido que podamos insertar en un CD de 650-700-800 o 900 MB
de los llamados consumibles. El proceso de compresin de vdeo se hace en MPEG 4 por lo que esta
versin de MPEG y el cdec DivX van ya unidas dentro de la terminologa de los consumidores de
archivos DivX y Xvid. Por lo tanto, al contrario que los ficheros de DVD que van con compresin de
vdeo en MPEG 2, el DivX y el Xvid utilizan el la compresin en MPEG 4.
Conviene aclarar, de todas formas, que el usuario de DivX se va a topar con otra sigla imprescindible en
el campo de del vdeo digital: AVI. En s, AVI no es un formato de vdeo por s mismo; se trata de un
contenedor de formatos, como veremos ms adelante en este captulo. As, dentro de un archivo AVI
podemos usar diferentes mtodos de compresin de audio y vdeo, que estarn multiplexados. El fichero
expresa el cdec a utilizar para visualizar los datos contenidos en l, y el programa visualizador es el que
se encarga de mostrar el vdeo. Recordemos tambin que al crear un fichero AVI se puede elegir por
separado la forma de compresin de audio y de vdeo.
Las caractersticas principales del Xvid y del DivX son las siguientes:
Resolucin PAL (generalmente): 640x480 o menor
Compresin vdeo: MPEG 4
Compresin de audio: MP3, Ogg, WMA
Bitrate de vdeo: 300-1000 kbps
Tamao/minuto: 1-10 MB/min.
Compatibilidad con reproductores: cada vez mayor
Potencia necesaria: mucha
Calidad de visionado: notable

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 30/65

Tema 6.- Vdeo.

Por otro lado, las caractersticas del DVD son las siguientes:
Resolucin PAL: 720x576
Compresin vdeo: MPEG 2
Compresin de audio: MPEG 1, 2, AC3, DTS
Bitrate de vdeo: 3000-8000 Kbps
Tamao/minuto: 30-70 MB/min.
Compatibilidad con reproductores: mxima
Potencia necesaria: mucha
Calidad de visionado: excelente
Hagamos un poco de historia alrededor del DivX. Existen varios cdecs alrededor de este concepto. Por
un lado tenemos OpenDivX, conocido como DivX para Windows/Linux/Mac, que es parte del
proyecto de cdigo abierto del Proyecto Mayo, donde el cdec original es referido como DivX ;-) Codec.
Las versiones de estos dos cdecs tambin difieren. El original usa 3.xx, mientras que el del Proyecto
Mayo usa 4.xx. El cdec original DivX 3.xx se basa en el cdec MPEG-4 V3 de Microsoft (ASF se basa en
MPEG-4 V2). Este cdec fue hacheado y re-distribuido porque no se poda codificar ficheros AVI con este
cdec de Microsoft, slo se permita crear ficheros ASF/WMV. DivX 3.xx tambin inclua versiones
hacheadas de cdecs MP3 y WMA. El cdec DivX4.xx no tiene nada que ver con el de Microsoft, fue
desarrollado desde cero, y sigue en desarrollo. Ambos cdecs pueden estar instalados al mismo tiempo y
cada uno decodificar los contenidos codificados con ellos. Recientemente ha aparecido otra nueva
familia de cdecs, el DivX 5.x de DivXNetworks. DivX 5.1 pretende revolucionar la creacin, produccin
y distribucin de vdeo digital, incluso a travs de Internet. Es ms rpido que los cdecs anteriores y
ms eficiente, permitiendo la reproduccin en tiempo real de resoluciones de vdeo de alta definicin sin
usar hardware especial. Es capaz de decodificar flujos de vdeo MPEG-4 Simple Profile y MPEG-4
Advanced Simple Profile (ISO/IEC 14496-2).
XviD (DivX al revs, por si no lo habais notado) es un cdec que, como el DivX original, parte del
formato de compresin de vdeo MPEG-4. Sin embargo, en este caso, se desarrolla bajo el proyecto de
software libre del mismo nombre y, en la pgina web principal, slo encontraris los cdigos fuente de
este desarrollo, que se pueden compilar en diferentes plataformas. Soporta las siguientes caractersticas
de MPEG-4:
Codificacin I, P-Frame
I-Frames son cuadros de imagen, mientras que P-Frames son Patrones de Cuadros. Los Cuadros de
Imagen contienen imgenes completas. P-Frames contiene patrones de lo que cambia en la imagen,
ahorrando mucho espacio.
PMVFast y EPZS con patrn de estimacin de movimiento en diamante y cuadrado.
Deteccin Fast Motion que puede referir un patrn con forma de diamante o cuadrado a direcciones
diferentes.
inter4v mode
Capacidad de interpolacin rpida.
Precisin fullpixel y halfpixel
Incluso los movimientos halfpixel pueden codificarse. Una mejor precisin da lugar a una mejor
compresin con mejor calidad.
Cuantizaciones MPEG4 y H263
MPEG4 es el estndar del que deriv DivX. H263 es un subconjunto de este estndar ligeramente
modificado por Microsoft. La cuantizacin es el mapeado de la cantidad de valores de color a nmeros.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 31/65

Tema 6.- Vdeo.

Matrices de cuantizacin personalizadas


La cuantizacin puede hacerse usando matrices personalizadas, obteniendo posiblemente mejores
resultados si la matriz se hace para adaptarse a los datos de vdeo. Para el uso normal debera bastar con
la matriz por defecto que viene con XviD.
Cuantizacin adaptable / Mscara de luminosidad
La Cuantizacin y la Mscara de luminosidad son variables, dependiendo del material de entrada,
proporcionando por tanto mejores resultados en imgenes oscuras o con alto contraste.
Comparativa DivX4, Divx5 y XviD
La prueba se realiz con 2 archivos de vdeo, uno de 152 y otro de 59. Primero analizaremos el tiempo
de compresin con cada uno de los cdecs:
Archivo 1
DivX4

03:02

XviD

02:58

DivX5

02:55

Archivo 2
DivX4

01:37

XviD

01:34

DivX5

01:33

En este caso DivX4< XviD < DivX5. Las opciones adicionales para Divx5 suponen mayor tiempo de
CPU. Ahora miraremos el bitrate y el espacio consumido. Se hizo la codificacin en 1 pasada porque da
un rendimiento puro del cdec, y se estableci un bitrate de referencia.
Fuente 1
DivX4

10.532 KB

750 kbps

XviD

9.808 KB

698 kbps

DivX5

10.510 KB

749 kbps

Fuente 2
DivX4

6.230 KB

844 kbps

XviD

5.522 KB

753 kbps

DivX5

6.184 KB

838 kbps

El primer vdeo produce menor bitrate que el pedido, mientras que en el segundo es al revs, lo que
implica que no podemos confiar en el cdec para el bitrate. Para un bitrate ms ajustado necesitaramos
una segunda pasada. El segundo archivo es ms grande de los esperado porque la mitad de l son
secuencias de ftbol con zooms sobre jugadores, la parte ms difcil a comprimir.
Finalmente, analizaremos la calidad de la imagen obtenida. DivX5 en modo Fast Recompress y vid
presentan los problemas de demasiada pixelacin y cuadros visibles. Deberamos usar ms espacio para
mejorar la calidad. Es especialmente visible a pantalla completa. Los mejores resultados se obtienen con
DivX4 y DivX5, aunque este ltimo es ms rpido con las mismas preferencias. DivX5 parece ser ms una
evolucin que una revolucin ya que podemos reproducir archivos del 5 con el cdec 4 siempre y cuando
no se usen nuevas facilidades.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 32/65

Tema 6.- Vdeo.

6.6.2.2.

xVCD

xVCD representa eXtended VCD. Posee las mismas caractersticas que VCD pero es posible usar mayores
bitrates y resolucin para obtener mejor calidad de vdeo. xVCD es bsicamente todo lo que se codifica
usando vdeo MPEG-1, no cumple con el estndar VCD y se graba en modo VCD. xSVCD representa
eXtended SVCD y tiene las mismas caractersticas que SVCD, aunque podremos usar mayores bitrates y
resolucin para obtener mejor calidad de vdeo. Es bsicamente todo lo que se codifica con MPEG-2
vdeo, no cumple con el estndar SVCD y se graba en modo SVCD. xVCD puede reproducirse en
reproductores VCD pero no suele ocurrir lo mismo con xSVCD. Existen xVCD y xSVCD tanto en formato
PAL como NTSC, veamos sus caractersticas:
xVCD PAL:
Vdeo: MPEG-1 con CBR o VBR; 352x288 pxels: 25 frames/s.
Audio: 32-384 kbps MPEG-1 Layer 2.
Extra: Mens y captulos. Imgenes fijas 704x576, 352x288.
xSVCD PAL:
Vdeo: MPEG-2 con CBR o VBR; 352x288;352x576;720x576: 25 frames/s, hasta con 4 subttulos
Audio: 32-384 kbps MPEG-1 Layer 2 con hasta 2 pistas de audio.
Extra: Mens y captulos. Imgenes fijas 704x576, 352x288.
xVCD NTSC:
Vdeo: MPEG-1 con CBR o VBR; 352x240; 2997 frames/s
Audio: 32-384 kbps MPEG-1 Layer 2.
Extra: Mens y captulos. Imgenes fijas 704x480, 352x240.
xSVCD NTSC:
Vdeo: MPEG-2 con CBR o VBR; 352x240;352x480;720x480: 2997 frames/s, hasta con 4 subttulos
Audio: 32-384 kbps MPEG-1 Layer 2 con hasta 2 pistas de audio.
Extra: Mens y captulos. Imgenes fijas 704x480, 352x240.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 33/65

Tema 6.- Vdeo.

Comparativa de archivos de vdeo


Format VCD

SVCD

DVD

DivX
XviD
WMV

MOV

ASF
SMR
nAVI

RM

DV

480x480
480x576

720x480
720x576

640x480

640x480

320x240

320x240

720x480
720x576

Video MPEG1
Compression

MPEG2

MPEG2,
MPEG1

MPEG4

Sorenson,
Cinepak,
MPEG4

MPEG4

RM

DV

Video bitrate 1150 kbit/s


kbit/sec

1000~2500 3000~9000 300~1000


kbit/s
kbit/s
kbit/s

300~2000
kbit/s

100~500
kbit/s

100~500
kbit/s

25 Mbit/s

Audio MP1
Compression

MP1

MP1, MP2,
AC3, DTS,
PCM

MP3, WMA,
OGG, AAC,
AC3

Sorenson,
Cinepak,
MP3

MP3, WMA

RM

DV

Audio bitrate 224 kbit/s


kbit/sec

128~384
kbit/s

192~448
kbit/s

64~448
kbit/s

64~192
kbit/s

64~128
kbit/s

64~128
kbit/s

1000~1500
kbit/s

10 - 20
MB/min

30 - 70
MB/min

1 - 10
MB/min

1 - 20
MB/min

1-5
MB/min

1-5
MB/min

216 MB/min

35-60min

15-20min

60-180min

60-180min

120-300min 120-300min 3min

N/A

2-4hrs
(3-7hrs)

13-26hrs

13-26hrs

26-40hrs

26-40hrs

20min

High

Very High

Very High

High

Low

Low

High

Great*

Excellent*

Great*

Great*

Decent*

Decent*

Excellent

Resolution 352x240
NTSC 352x288
PAL

Size/min 10 MB/min
Min/74min 74min
CD
Hours/DVDR N/A
Computer Low
CPU Usage
Quality Good

resolucin aproximada
~ bitrate aproximado
DVD con menor calidad de vdeo, similar a VCD/SVCD
* la calidad del vdeo depende del bitrate y de la resolucin

6.6.3.

Contenedores de vdeo

Un contenedor de audio y vdeo no es un formato de compresin de vdeo, ni tampoco puede ser usado
para comprimir msica ni imgenes como MP3 o JPEG, no es un cdec. Un contenedor permite incluir en
un mismo archivo varios flujos de audio, vdeo y subttulos, lo que asegura que el audio y el vdeo
pueden ser reproducido en la mayora de reproductores de medios.
6.6.3.1.

AVI

El contenedor AVI fue presentado originalmente por Microsoft a comienzos de los 90, y fue diseado
como un contenedor a/v flexible para los formatos de compresin de audio/video de aquellos das. Hay
que entender que el AVI es slo una (aunque importante) parte de un completo trabajo multimedia
llamado 'Video para Windows' - VfW (Video for Windows) o la interface ACM (esto viene de los das en
los que Microsoft an se dedicaba a vender sus sistemas operativos a la gente, en vez de soluciones
multimedia tal y como estn intentando hacer hoy en da con WMV, as que tuvieron que construir su SO
atractivo para otros programadores). Por desgracia, este VfW framework no soporta muchas de las
caractersticas ms avanzadas que nos ofrecen los modernos formatos de compresin de audio y vdeo,
como la compresin de audio con Bitrate Variable (VBR), o el Framerate Variable en la compresin de
video (VFR). Aunque AVI fue mejorado con standars adicionales llamados 'Open DML AVI' a
finales/mediados de los 90, pronto llegaron sus limitaciones, como los 2 GB de tamao mximo de
archivo, no hay forma de que soporte los formatos de compresin tales como el excelente formato de
audio Ogg Vorbis, de cdigo abierto.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 34/65

Tema 6.- Vdeo.

Existen dos tipos generales de AVI, Los basados en Video for Windows (los primeros en aparecer) y los
basados en DirectShow (originalmente ActiveMovie). Y como hemos dicho, un AVI no es ms que un
contenedor que puede guardar datos en su interior codificados de diversas formas y con la ayuda de
diversos cdecs que aplican diversos factores de compresin, aunque para liar la cosa an ms si cabe,
tambin existe la posibilidad de almacenar los ficheros en un formato AVI "raw" o crudo, es decir, sin
compresin y muchos fabricantes aportan su granito de arena con cdecs que aaden ms confusin a
nuestra babel particular. Aunque un AVI puede tener n nmero de flujos, lo ms comn es un flujo de
vdeo (vids) y otro de audio (auds). Las cabeceras (o headers) del formato del flujo definen todo el
formato (incluida la compresin usada) de cada flujo. El formato estndar de un AVI basado en VfW
contempla la existencia de un flujo de video, uno de audio o ambos. As un AVI en VfW puede almacenar
slo audio, slo vdeo o ambos pero en flujos separados para cada tipo. A continuacin describimos la
estructura de un archivo AVI bsico.
Un archivo AVI se basa en el formato RIFF, que contiene una cabecera y un conjunto de listas. Los
ficheros AVI se identificador por AVI en la cabecera y poseen 2 listas obligatorias, que definen el
formato de los flujos y los datos de los flujos respectivamente. Un fichero AVI tambin podra incluir un
ndice que localiza los datos en el fichero. Un fichero AVI con estos componentes tiene la siguiente
forma:
RIFF ('AVI '
LIST ('hdrl' ... )
LIST ('movi' ... )
['idx1' (<AVI Index>) ]
)
La lista hdrl define el formato de los datos y es la primera lista requerida. La lista movi contiene los
datos de la secuencia AVI. idx1 contiene el ndice. Estos componentes deben aparecer en la secuencia
adecuada. Las extensiones OpenDML definen otro tipo de ndice identificado por indx. Las listas hdrl
y movi usan subbloques para sus datos. El siguiente fragmento AVI expande esas listas para describir
las necesidades a cubrir por estos subbloques.
RIFF ('AVI '
LIST ('hdrl'
'avih'(<Main AVI Header>)
LIST ('strl'
'strh'(<Stream header>)
'strf'(<Stream format>)
[ 'strd'(<Additional header data>) ]
[ 'strn'(<Stream name>) ]
...
)
...
)
LIST ('movi'
{SubChunk | LIST ('rec '
SubChunk1
SubChunk2
...
)
...
}
...
)
['idx1' (<AVI Index>) ]
)

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 35/65

Tema 6.- Vdeo.

HDRL
AVI Main Header
La lista hdrl comienza con la cabecera principal AVI que contiene un bloque avih. La cabecera
principal contiene informacin global para el fichero AVI, como el nmero de flujos en el fichero y las
dimensiones de la secuencia AVI. Esta es la informacin que contiene:

Nmero de frames
Nmero de flujos
Frames iniciales
Max bytes
Tamao de buffer
Microsegundos/frame
Frames/segundo
Tamao (p.ej., 320x240)
Flags

AVI Stream Headers


Tras el Main Header aparecen listas strl. Se requiere una lista strl para cada flujo de datos. Cada una
contiene informacin sobre un flujo del archivo y debe contener un bloque de cabecera de flujo (strh) y
uno de formato de flujo (strf). Adems, puede contener un bloque de datos de cabecera de flujo (strd) y
uno de nombre de flujo (strn).
La estructura de un strh es la siguiente:

Tipo de flujo (vids , auds)


Manejador de flujo (cvid para cinepak)
Muestras por segundo
Prioridad
Frames iniciales
Comienzo
Longitud en frames
Longitud en segundos
Flags
Tamao de Buffer
Calidad
Tamao de muestra

El bloque strf describe el formato de los datos en el flujo, por lo que depende del tipo de flujo. Esta es su
estructura:
Flujo de vdeo:

Tamao (ej, 320x240)


Profundidad de bit (ej, color 24 bits)
Colores usados
Compresin

Flujo de audio
wFormatTag: formato (ej, WAVE_FORMAT_PCM)
Nmero de canales
Muestras por segundos
Bytes medios por segundo

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 36/65

Tema 6.- Vdeo.

Nmero de bloques de alineamiento


Bits por muestra
Si existe un bloque strd, le sigue el formato de flujo. El formato y contenido de este bloque depende del
driver del cdec. Las aplicaciones que leen y escriben archivos AVI no necesitan interpretar esta
informacin, sino nicamente transferirla como bloque de memoria. El bloque strn contiene un string
terminado con el carcter nulo para describir el flujo. Las cabeceras de la lista hdrl se asocian a los datos
en la lista movi segn el orden de los bloques strl. El primer strl se corresponde con el flujo 0, el
segundo con el 1 y as sucesivamente.
MOVI
La lista movi contiene los frames de video y los samples de audio. Los bloques de datos pueden residir
directamente en la lista movi o ser agrupadas en listas rec, que agrupan bloques que deben ser ledos
juntos. Cada bloque de datos es identificado por un nmero de 2 dgitos seguidos de 2 caracteres que
describen el tipo de informacin del bloque. El significado de los caracteres es el siguiente:
Db frame de vdeo no comprimida
Dc frame de vdeo comprimida
Pc cambio de paleta
Wb datos de audio
Por ejemplo, si el flujo 0 contiene audio, los datos valdran 00wb. Si es de vdeo tendra valor 01db o
01dc.
El bloque opcional de ndice (idx1) puede seguir a la lista movi. El ndice contiene una lista de bloques
y su situacin en el archivo.
6.6.3.2.

OGM

OGM significa Ogg Media File y fue desarrollado por Tobias Waldogels, siendo un formato de vdeo
avanzado que puede hacer muchas cosas a las que no llega el formato AVI:
Soporte de mltiples pistas de subttulos
Soporte de mltiples pistas de audio en varios formatos (MP3, Dolby Digital, Ogg Vorbis, WAV).
Soporte de captulos
Soporte de audio OGG Vorbis.
OGM es fundamentalmente una extensin de Ogg, que no fue diseado originalmente para contener
audio y vdeo. Por ello, tienes ciertas limitaciones que limitan su aceptacin como el prximo gran
formato contenedor. Nuevos formatos contenedores tipo Matroska adquirirn un mayor protagonismo a
medio plazo. OGM no era un proyecto de cdigo abierto a pesar de basarse en el entorno Ogg, aunque
actualmente el creador se ha unido al equipo que lleva el proyecto Ogg y ha donado todo el cdigo.
Generalmente se usa la compresin Xvid aunque se est completando en Ogg Theora, supuestamente el
mejor codec para el formato OGM.
6.6.3.3.

Matroska

Matroska es un formato cdigo-abierto, multiplataforma, libre de patente, ms reciente que OGM.


Matroska no es un codec (como MPEG-1, XviD, DivX, o VP3), sino un contenedor (como OGM) donde
puedes poner video(s) + audio(s) + subttulo(s). Los formatos de audio soportados incluyen Ogg Vorbis,
AAC, MP3 y AC3. Los ficheros de Matroska son, o bien de mejor calidad o ms compactos que un OGM
(A groso modo, 174Mb comparados con 175Mb para un OGM), gracias a una nueva estructura llamada
EBML, tambin conocida como "XML binario". EBML permite obtener un gran nmero de ventajas si
hablamos en trminos de extensibilidad de formato y de compatibilidad con versiones anteriores.
Matroska ha sido diseado con el futuro en mente, incorporando caractersticas tales como:
Tecnologas para los Sistemas Multimedia Curso 2004/05 - 37/65

Tema 6.- Vdeo.

Los ficheros pueden ser emitidos mediante streaming por HTTP/RTP a travs de Internet
Bsqueda rpida en el fichero
Recuperacin ante errores
Mens (como los DVDs)
Entradas de captulos
Subttulos y audio seleccionables
Extensibilidad modular

La misma informacin de Audio/Video de un OGM puede ser almacenada de forma ms eficiente en


Matroska, resultando un significativo tamao menor en el fichero. Matroska tiene las mismas
capacidades, si no ms, que OGM, mientras que salva (ligeramente) 4Mb de capacidad por cada 700Mb
de informacin. Por estas razones, la tecnologa de Matroska podra hacer que la de OGM llegue a ser
obsoleta. En otras palabras, si el tamao del fichero Matroska y el OGM son iguales, la calidad del
Matroska ser superior. Por ejemplo:
175MB OGM = 160MB Video + 13.5MB Audio + 1.5MB Cabecera para entrelazado
175MB Matroska = 160MB Video + 14.5MB Audio + 0.5MB Cabecera para entrelazado
Gracias al reducido encabezado, deberas ser capaz de usar un bitrate mayor en Matroska y
continuar teniendo todava el mismo tamao de fichero. Un ejemplo de mejora con respecto a OGM se
puede ver en lo referente a los subttulos. Los subttulos en OGM pueden soportar varios idiomas
intercambiando lo que es llamado como "Pginas de Cdigo". Por ejemplo, el mismo cdigo E8 en
hexadecimal puede ser U+00E8 (e con acento grave) en el cdigo de Europa occidental, U+010D (c con
caron) en el cdigo de pgina de Europa central, o U+0438 (Russian small letter i) en cirlico. Un
carcter diferente puede tener distintos puntos en Unicode, como U+00E8, U+010D, y U+0438 en el
ejemplo superior. Windows 2000 y XP funcionan de esta forma internamente. Pero sistemas operativos
anteriores como MS-DOS usan el mismo cdigo (E8 en el ejemplo superior) para caracteres diferentes, y
los distinguen intercambiando los cdigos de pgina. Estos cdigos son incompatibles con Unicode e
incluso idiomas europeos.
Actualmente, los subttulos adjuntos al OGM usan este mtodo antiguo. Bsicamente, para ver los
subttulos en diferentes lenguajes, el cdigo de pgina debe ser intercambiado manualmente, lo que
puede ser una molestia. En algunos casos, aun as, los subttulos no se vern correctamente a pesar del
cambio manual realizado. Los softsubs en OGM no permiten notas (generalmente en un tamao de
fuente menor) ser aadidos en la parte superior de la pantalla. Las notas de Edicin son usadas como una
herramienta por los subtituladores para explicar una letra o un fondo cultural que puede no ser familiar
con los visores generales. Esto es actualmente la practica hardsubs (en fichero AVI); pero imposible en
subttulos softsub OGM. Adems, los subtituladores estn frustrados por la falta de libertad en el sistema
de estilismo y composicin de los subttulos OGM. Los subttulos estn diseados para no solo convencer
la idea del dilogo hablado, sino para crear el humor o configuracin. Por ejemplo, fuentes especiales
pueden ser usadas para un hechizo mgico, anuncio por radio, voz sinttica de IA, etc. Sin embargo, estas
herramientas estn limitadas cuando se trabaja con OGM. (Algunos fansubbers denotan que OGM es
intil por este motivo.) . Matroska soportar SSA y ASS, lo que significa que todo lo que se puede hacer
en hardsub, estar disponible en hardsub. Lo que es ms, Matroska va a soportar el innovador formato de
subtitulos basado en XML: USF.
Veamos en la figura siguiente la estructura de un archivo Matroska a grandes rasgos. El Header
contiene la informacin referida a la versin de EBML usada para crear el fichero. El campo Metaseek
contiene un ndice que localiza la situacin de los otros grupos en el fichero. Este elemento no es
necesario tcnicamente, pero evita tener que buscar a lo largo de todo el fichero elementos opcionales no
presentes, ya que los tems pueden ocurrir en cualquier orden. La seccin Segment Information contiene
informacin bsica referente al archivo, como el ttulo del archivo, un identificador nico para que pueda
ser identificado en cualquier momento y, en caso de ser parte de una serie de archivos, el identificador
del siguiente archivo. La seccin Track tiene informacin bsica sobre cada pista, si es de vdeo, audio o
subttulos, la resolucin de vdeo, la tasa de muestreo de audio, el cdec usado y datos privados del
cdec. En la seccin Chapters aparece la lista de captulos, que son una forma de predefinir puntos de

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 38/65

Tema 6.- Vdeo.

salto en el audio o el vdeo. La seccin Clusters contiene todos los frames de audio y vdeo para cada
pista. Los ndices para cada pista aparecen en la seccin Cueing data, de intencin similar al Metaseek.
Podremos adjuntar cualquier tipo de fichero (imgenes, webs, programas, codec) a un archivo Matroska a
travs de la seccin Attachment. Finalmente, la seccin Tagging contiene las etiquetas relacionadas con el
fichero y las pistas, como los ID3 en MP3. Contiene informacin sobre el cantante, compositor, actores o
quin hizo el archivo.
Header
Meta
Seek
Information
Segment
Information
Track
Chapters
Clusters
Cueing Data
Attachment
Tagging

Una vez descrita la estructura del archivo podemos proceder a entrar en mayor detalle en el mismo.

Level
0

Grouping

EBML

Header

Meta
Information

Segment

Segment
Information

Level 1

Level 2

Level 3

EBMLVersion
DocType

Seek

Seek
SeekHead
Seek

Info

SeekID
SeekPosition
SeekID
SeekPosition

Title
SegmentUID
Name
TrackEntry

Track

TrackNumber
TrackType

Tracks

Name
TrackEntry

TrackNumber
TrackType

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 39/65

Tema 6.- Vdeo.

Chapters

Edition
Entry

Chapters

Timecode
BlockGroup
Cluster

BlockGroup
BlockGroup

Clusters

Block
ReferenceBlock
Block

Timecode

Cluster

BlockGroup

Block

BlockGroup

Block

BlockGroup

Block

BlockGroup

CuePoint
Cueing Data

Block

Cues
CuePoint

Block
BlockDuration
CueTime
CuePosition
CueTime
CuePosition

AttachedFile
Attachment

Attachments
AttachedFile

Tag
Tagging

Tags
Tag

FileName
FileData
FileName
FileData

MultiTitle
Language
MultiTitle
Language

Header aparece al principio del archivo y es lo que indica si se puede leer o no el archivo. Incluye dos
campos, la EBMLVersion, para que el parser pueda saber si es capaz de leer o no el archivo y el DocType,
que dir si es un archivo Matroska o no.
La seccin MetaSeek contiene parejas de entradas <SeekID, SeekPosition> para cada punto a localizar
(Seek). SeekID contiene el identificador de un elemento de nivel 1 (Track, Cluster, etc). SeekPosition
indica el nmero de byte de comienzo.
Segment Information incluye Title para el ttulo del archivo y SegmentUID para identificar el archivo.
Este ID se genera aleatoriamente.
La porcin Track contiene el nombre de la pista (Name), el nmero (TrackNumber) y el tipo de pista
(TrackType). Tambin existen opciones para especificar el idioma y el cdec. Cada pista tiene un
identificador nico (TrackUID) que puede ser usado al editar un archivo del que disponemos varias
versiones. El TrackUID tambin se usa en Tagging.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 40/65

Tema 6.- Vdeo.

En un archivo Matroska existen generalmente muchos Clusters, que ayudan en la bsqueda de bloques y
en la proteccin contra errores. No hay lmites respecto de los datos que puede contener un cluster, pero
se les suele poner un lmite de 5 segundos o 5 megabytes. Al principio de cada cluster aparece un cdigo
de tiempo que indica cuando debe reproducirse el primer bloque del cluster. Entonces, hay varios
BlockGroups en cada cluster, conteniendo un bloque de datos y cualquier informacin relacionada con el
bloque. En el BlockGroup tambin existe un ReferenceBlock, que se usa en lugar de la descripcin bsica
P-Frame/B-Frame. Se indica el cdigo de tiempo del bloque necesitado y al poder existir tantos
ReferenceBlock como queramos, podemos conseguir estructuras referenciales bastante complejas.
En la seccin de Cues, para cada CuePoint existe un cdigo de tiempo (CueTime) y un listado exacto de la
posicin en el archivo para cada pista para ese cdigo de tiempo.
La estructura de Attachments es muy simple. Para cada archivo a adjuntar tenemos una estructura
AttachedFile, que se divide en el nombre (FileName) y el archivo (FileData). Tambin se puede almacenar
el tipo MIME y un nombre ms legible.
Llegamos a las Tags, que son posiblemente la parte ms compleja de Matroska. Cada Tag contiene toda la
informacin perteneciente a pistas/captulos especficos. Cada pista o captulo referido en un tag tiene su
UID en los tags. Adems contienen la informacin extra sobre el archivo, como guionista, cantante,
actores, director, edicin, precio, gnero, etc, y permite tener esta informacin en varios idiomas.

6.7. Hardware para editar vdeo


Para realizar una edicin de vdeo con las cmaras digitales tenemos tres alternativas :
- pasar la imagen ( analgica ) al ordenador a travs de una capturadora de vdeo analgica que
comprima a M-JPEG o MPEG-2 , editar y pasar el resultado a una cinta VHS, DV, CD-ROM o DVDRAM.
- pasar la imagen digital al ordenador a travs del FireWire, editar y volver a pasar la imagen a la cinta
DV a travs del FireWire ( mtodo ideal ).
- realizar la edicin a un vdeo VHS ( o DV ) y utlizar el software que suelen proporcionar los
fabricantes de cmaras. ( Edicin sencilla, simple remontaje de las imgenes )
El mejor mtodo, sin duda, es el segundo: editar en formato DV y volcar el resultado de la edicin a la
cinta miniDV. Luego lo veremos paso a paso. Si disponemos de una cmara con un puerto FireWire de
entrada/salida el escenario es idlico. Realizaramos la edicin en un entorno digital sin degradacin
alguna de las imgenes. Lo ms importante a tener en cuenta es que la conversin analgica/digital y la
compresin DTC se realiza en nuestra videocmara y por ello no es necesario comprar tarjetas
digitalizadoras o codecs especializados ( en principio ). Adems se evitan los problemas que solan tener
las digitalizadoras , tales como prdida de imgenes, etc. Otra ventaja es que el control de la cmara se
realiza tambin a travs del Firewire ( recordar que esta interface maneja seales de control en su propio
protocolo). Evitamos as tener que enchufar la interface LANC o JLIP.
El Equipo
Se necesita una cmara miniDV con interface Firewire ( IEEE1394) de entrada/salida. Ya sabes que
para el mercado europeo la mayoria de las miniDV estn "capadas" y la interface DV es solo de salida.
Pero no hay problema, es reversible y se pueden convertir en entradas/salidas. Existen tambin
magnetoscopios miniDV, una opcin para los semiprofesionales.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 41/65

Tema 6.- Vdeo.

Una tarjeta de interface Firewire para el ordenador.


Un software de edicin de video no-lineal tal como Adobe Premiere. Algunas de las tarjetas Firewire
incluyen versiones reducidas de este tipo de programas. Los programas ms populares y potentes son el
Adobe Premiere y el MediaStudio Pro.
Un ordenador potente con un gran disco duro. Tener en cuenta que el formato DV emana 3.7 Mbytes
de datos por segundo. 10 minutos son 2.2 G y 90 minutos son 20 Gigas. Adems se generan grandes
archivos temporales durante la edicin. En cuanto al ordenador, lo ms gordo posible. 256M de RAM ,
un disco duro de 30 Gigas, un buen monitor , una CPU a 500 Mhz o ms y poco ms. Todo esto es
relativamente barato hoy en da.
Una tarjeta de edicin DV con codec HW ( opcional ). Como veremos despus, hay operaciones en las
que es necesario descomprimir las imgenes DV al formato RGB u otros. Existen dos opciones : que lo
haga la CPU del ordenador a travs de un driver que suele venir con la tarjeta Firewire, o que lo haga
una tarjeta PCI con un chip especializado. La diferencia est en la velocidad que puede llegar a ser hasta
10 veces mayor usando el codec ( codificador/descodificador ) hardware. La eleccin depende de las
prisas y del dinero que tengamos. Conforme salen procesadores ms rpidos, va teniendo menos
sentido esta opcin.
Paso a Paso
Paso 1: Salir de paseo o de viaje y filmar lo que nos de la gana. Las imgenes son digitalizadas y
comprimidas en nuestra cmara en "tiempo real".
Paso 2: Copiar la filmacin digital al ordenador a travs del Firewire. Se realiza con alguna utilidad o
driver que suele venir con la tarjeta Firewire. No se produce la ms mnima degradacin de la imagen.
Paso 3: Usar Adobe Premiere u otro programa para la edicin. Aqu hay que sealar un punto
importante. Cuando queremos aadir filtros, ttulos o transiciones con Premiere, ste necesita
descomprimir las imgenes para tratarlas como bitmaps RGB. Esta descompresin la puede realizar un
codec software (que generalmente lo tenemos ya instalado ) o uno hardware que habra que comprar (
mucho ms caro y rpido). Una vez realizada la transicin o filtrado el codec vuelve a comprimir las
imgenes en el formato DV. Si no necesitamos aadir transiciones ni aplicar filtros, este codec no se
utiliza nunca. Pero est claro que siempre que editamos se aaden transiciones , ttulos, etc si no para
qu editamos ? Si no tenemos una aceleradora de edicin DV, la generacin de estas nuevas imgenes
con filtros, etc ( el llamado "render") puede llevar bastante tiempo. Una transicin sencilla entre dos
cortes puede llevar unos 10 segundos en un ordenador a 800Mhz. No es mucho, pero es que hay gente
que aade filtros a TODO el vdeo (para corregir tonalidades o dar un aspecto especial). En este caso, el
proceso puede durar varias horas dependiendo de la duracin del clip.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 42/65

Tema 6.- Vdeo.

Paso 4: Una vez acabada la edicin, lo lgico sera pasar el resultado a nuestra cmara a travs del
Firewire (una vez ms, con la mayora de las cmaras europeas no es posible, salvo que la "crackees").
Una posibilidad fascinante ser el paso a DVD, ya que se podra "transcodificar" haca una unidad
grabadora de DVD no siendo necesario que fuera "en tiempo real". Eso s, tardara unas cuantas horas y
hara falta un software que pasara de formato DV a MPEG2.

6.7.1.

Tarjetas firewire

Las tarjetas Firewire han pasado de ser una rareza a ser algo habitual en cualquier tienda o gran
superficie. No tienen mucha ciencia, son un mero puerto de datos. Pero como est muy orientado al
vdeo, se crea cierta confusin en los mercados y estas tarjetas se venden como "capturadoras de vdeo"
ms que como puertos de transfencia de datos ( es como llamar "puerto de ratn" a un "puerto serie" ).
Normalmente, las tarjetas suelen llevar el cable de conexin a la cmara incluido, pero hay que
asegurarse. Lo ms comn es que las tarjetas tengan tres puertos, pero la verdad es que con uno vamos
ya bien ( no conozco a nadie que haya usado alguna vez dos o ms puertos). Y tambin suelen venir con
un soft de edicin ms o menos potente.
La correcta instalacin y "ajuste fino del sistema" puede dar quebraderos de cabeza. Se comentarn estas
cosas ms adelante.
El bus IEEE1394 ( tambin llamado Firewire, iLink o terminal DV) es un bus serie de alta velocidad
complementario del USB que mejora la conectividad de dispositivos incluyendo videocmaras,
dispositivos de almacenamiento y perifricos. Debe cohexistir pacficamente con USB quedando ste
para perifricos de menor ancho de banda. No son compatibles. Las diferencias entre ambos buses las
podes encontrar :

Maximo nmero
de disposititivos
Insercin
en
caliente (enchufar
sin resetear)
Mx. longitud del
cable
entre
dispositivos
Velocidad
de
transferencia

1394/FireWire/i.Link

USB

62

127

4,5m

5m

400mbps (50MB/sec)

12mbps (1.5MB/sec)

Velocidad en el
800mbps (100MB/sec)
futuro
1Gbps+ (125MB/sec+)
Compatible
S
Macintosh
Conexin
de
dispositivos
S
Internos
- Videocmaras DV
- Cmaras de alta
resolucin
HDTV
Discos
duros
Perifricos tpicos - DVD-ROM Drives
Impresoras
- Escneres

version 2.0 hasta 460MB


?
No
Teclados
Ratones
Monitores
Joysticks
- Cmaras de baja
resolucin
- CD-ROM Drives de baja
velocidad
- Modems

El bus Firewire ( iLink, DV ), aunque similar, no es compatible con el USB.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 43/65

Tema 6.- Vdeo.

Ha sido adoptado por numerosas compaas y se vislumbra un creciento espectacular en su


implementacin. Microsoft e Intel lo han declarado como "obligatorio" en su especificacin PC98. Por
tanto es de esperar que en poco tiempo est integrado en la propia placa base del ordenador. Microsoft
lo soporta de modo natural en Windows 98, pero Intel se niega a sacar chip set Firewire : prefiere sacar
el USB-2 para no pagar un duro en royalties.
Este bus fue desarrollado por Apple para su gama de ordenadores con la idea de sustituir al bus SCSI.
Junto con Thomson tienen una patente en Reino Unido, pero slo aplicable a los fabricantes de chips y
en unas condiciones bastante favorables. A finales de 1995 el IEEE edit el actual estndar 1394.
Su filosofa es similar al USB, soportando Plug&Play, hasta 63 dispositivos e insercin sin necesidad de
apagar el equipo. Multiplica el ancho de banda llegando por el momento a los 400 Mbps (el USB est
limitado a 12 Mbps). Tambin proporciona hasta 15 W de potencia a los dispositivos conectados a l.
El bus es multimaster, con asignacin dinmica del nmero de nodo conforme son aadidos a la
cadena. Cada nodo acta como un repetidor, permitiendo formar topologas en rbol. Debido a la alta
velocidad en el bus, la distancia mxima del cable entre nodos, es de 4.5 m. Esta limitacin viene dada
bsicamente por la atenuacin de la seal en el cable. Como se pueden tener hasta 16 dispositivos en
una rama, la distancia mxima de la cadena llega a los 72 m.
El protocolo es tanto asncrono como iscrono. Esto significa que es posible negociar tanto un ancho de
banda fijo ( para dispositivos como las cmaras DV que necesitan una transferencia constante y en
tiempo real ) como variable ( para impresoras, escners, etc ) simultneamente por el mismo bus.
El conector se ha heredado de una famosa consola de juegos. Puede parecer raro, pero este conector ha
demostrado su fiabilidad y comodidad durante aos. Adems, es barato. Normalmente, las tarjetas
Firewire llevan un conector para 6 cables : 4 de seal ( en modo diferencial ) y dos ms para alimentar
los dispositivos externos (algunas tarjetas Firewire, como la Digital Origin IntroDV vienen con un
conector de 4 pines y un cable de 4 pines por ambos extremos. No es mala, idea ya que ese mismo cable
puede valer para interconectar dos cmaras miniDV). Las cmara de vdeo, sin embargo, montan un
conector de 4 pines , ya que no necesitan ser alimentadas externamente. Por tanto, se necesita un cable
de " 6 a 4 pines" para conectar una Firewire a una miniDV. Pero si queremos conectar dos cmaras
miniDV ( una de ellas con capacidad de grabacin) se necesita un cable de "4 a 4 pines". Mucho
cuidado, no conectar al reves estos conectores, aunque parezca imposible hay quin lo ha hecho ( en
el conector de la tarjeta firewire) con resultados fatales ( cmara con el circuito de entrada dv
quemado)

Matrox
Para clarificar conceptos, lo primero que hay que decir es que una interface Firewire es precsamente
eso: una interface de transferencia de datos. Se suele usar la palabra "capturadora Firewire", pero el
trmino no es correcto. No se realiza "captura" si no transferencia.

Matrox
La principal ventaja para el mundo del vdeo es la transferencia de audio y vdeo sin merma de la
calidad y sin prdida de "frames" o desincronizacin.
Por el momento hay muy pocas placas bases con este bus. Por consiguiente, hay que comprar una
tarjeta PCI IEEE1394.Al estar muy orientadas al mundo del video digital, suelen venir con programas

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 44/65

Tema 6.- Vdeo.

de edicin, que como es lgico, nos lo cobran. Los modelos OEM sin software ya estn en las 10 o
15.000 pesetas.
Existen tambin ordenadores "de marca" que incorporan esta interface. Tenemos el MAC G3, el porttil
de Sony ( Vaio ) y algn modelo de la gama Compaq Presario. El problemilla es el precio ...
Hay bastante confusin en torno a qu modelo escoger. Primero tenemos las diferencias hardware :
- Modelos bsicos , sin CODEC HW incluido : gran variedad de precios en funcin de el software que
la acompae y la marca. Realmente, desde el punto de vista HARDWARE, la Miro DV300 ( un pastn )
y la que venden los de AMB Products ( 12.000 PTAS.) no hay diferencias significativas. Suelen incluir
tres puertos Firewire.
- Modelos con CODEC HW : Aceleran notablemente ciertas funciones de edicin y suelen proporcionar
entradas/salidas analgicas. Aqu si se aplicara el concepto de "capturadora". Vienen bien cargadas de
soft y superan las 200.000 pelas.
Todas las tarjetas de hoy en da son compatibles con el estndar OHCI, que funcionan con AVI-1 (las
muy antiguas podian no ser compatibles OHCI y trabajar con ficheros AVI-2). Y otas las versiones
actuales de Premiere (6.0) , MediaStudio, etc son compatibles OHCI. Pero hay programas de edicin que
se empean en manejar soluciones a medida, es el caso de Avid Xpress DV 3, que solo trabaja (en
cuanto a transferencia) con tarjetas con el chip set de Texas I. (como la Pyro Basic).
A continuacin tenes una seleccin de tarjetas Firewire y capturadoras DV/MPEG-2 . El criterio de
eleccin no responde a ninguna lgica en particular, simplemente presento las ms conocidas o
interesantes desde mi punto de vista. La verdad es que en el mercado hay cientos de modelos. El soft
que incorporan puede variar dependiendo del momento de la compra.

6.7.2.

Videocmaras digitales

La parte ptica de una cmara digital se encarga de recoger la luz con la mayor precisin y calidad
posible. Suelen ser lentes zoom de unos 10x. En algunas Sony, son Carl Zeiss, mtico fabricante alemn
de ptica Es importante disponer de un buen zoom ya que el zoom digital deteriora la imagen. Mucho
ms importante, aunque los aficionados siempre lo olvidan, es tener una buena apertura gran angular.
En este sentido es difcil elegir ya que no est muy claro este dato en los folletos. En cuanto al dimetro
de la rosca para filtros, el tema es catico. Cada fabricante, incluso cada modelo, puede tener uno
distinto. Si se prev el uso de filtros hay que tener muy en cuenta la posible disponibilidad.
Es importante que el autofocus sea rpido y preciso. Algunas cmaras llevan un anillo giratorio que
facilita el enfoque manual. Os aseguro que es muy til, aunque tienen un tacto no muy bueno ( en
realidad, controlan indirectamente el motor del focus). Viene muy bien disponer de un modo de
"bloqueo del focus". En condiciones difciles, los autofocus enloquecen un poco. Lo profesionales
siempre trabajan con enfoque manual.
Todas incorporan un iris para ajustar la exposicin. Tambin juegan con la ganancia electrnica del
CCD para controlar la exposicin. Normalmente es posible trabajar en modo manual, pero pocos
modelos ofrecen un control total del iris ( suele haber un ajuste para subir o bajar la sensibilidad pero no
un ajuste absoluto de la apertura del iris independiente de la ganancia electrnica). Es interesante que
tengan, al menos, bloqueo de la exposicin, para evitar cambios bruscos al hacer un barrido de paisajes
con diferente luminosidad. Algunos modelos de la gama alta disponen de un filtro de densidad neutra,
sumamente til para evitar la saturacin del CCD en tomas con exceso de luz (playa,nieve) o para
resaltar efectos estticos (disminuir la profundidad de campo usando aperturas muy grandes). Slo las
mejores cmaras incorporan el "zebra pattern" : indicacin en el visor de las zonas sobreexpuestas
[aunque en todas las Sony es posible habilitar esta funcin conociendo ciertos cdigos]
Otro detalle a tener en cuenta es el control de balance de blanco. Debido a las distintas fuentes de luz,
con distinta composicin cromtica, es necesario ajustar dicha composicin. Las cmaras suelen tener
un ajuste automtico, pero nunca est de ms ( es muy interesante ) un control manual. Con l, basta
poner una cartulina blanca delante del objetivo y activar el ajuste. La cmara almacenar este nuevo
valor cromtico. Es tambin til para realizar efectos y cambiar el tono de las tomas artificialmente. Hay
alguna cmara que no tiene control manual ( las menos ) que deben ser evitadas.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 45/65

Tema 6.- Vdeo.

La velocidad de obturacin se controla electrnicamente en el propio CCD, es decir, no existe unas


"cortinillas" realmente. Variando las frecuencias de control del CCD se consigue variar la velocidad de
exposicin. Evidentemente, el formato PAL impone ofrecer 25 imgenes por segundo ( 50 cuadros de
mitad de resolucin, entrelazados) , cada uno de ellos expuesto el tiempo que se haya seleccionado ( ya
sea manualmente o auto).
Tal como ocurre en el campo de la fotografa, el juego de velocidad y exposicin determina el resultado
final de la imagen. Las velocidades de obturacin altas se deben usar al filmar objetos en movimiento
rpido, sobre todo si se quiere que la cmara lenta o la pausa brinden imgenes bien definidas.
Normalmente, en modo auto, las cmaras trabajan a 1/100. De la misma manera, la apertura permite
controlar la profundidad de campo ( rea de la imagen enfocada). Aperturas pequeas dan la mxima
profundidad de campo a costa de menor luminosidad. Y viceversa: apertura grande implica poca
profundidad de campo. Esto permite resultados estticos remarcables, sobre todo al efectuar retratos, en
los que queda muy bien un fondo desenfocado ( por tanto, habr que ajustar una apertura mxima y
usar un zoom bastante potente, tanto para resaltar el efecto como para lograr suavizar los contornos de
la cara). Pero bueno, estas disquisiciones tienen ms que ver con aspectos de "tcnicas de filmacin", etc)
De todos modos, estos ajustes lo suelen hacer automticamente las cmaras dotadas de "modos de
operacin" ( retrato, deportes, etc ). La mejor manera de saber los resultados es la experimentacin.
Antes del CCD, se antepone un filtro ptico para eliminar la parte del espectro no visible. Vamos, que se
elimina el infrarojo y el ultravioleta. Las cmaras con "Night Shot" ( visin nocturna por infrarojos)
deben quitar este filtro.
Las imgenes capturadas por las lentes son transformadas en seales elctricas por el CCD ( Charge
Coupled Device) . ste est compuesto por miles de puntos sensibles a la luz ( ms de 500.000 ).
Actualmente todas las cmaras usan CCD de formato 4:3, pero en un futuro se usar el 16:9 ( hay una
Sharp que s lo tiene, pero incomprensiblemente no parece que tenga mucho exito.). En las cmaras del
segmento medio-bajo se usa un solo CCD que captura los tres colores primarios. Por tanto, hay que
dividir entre tres para obtener la resolucin real ( no es tan secillo como digo ) . El CCD en s mismo,
siempre es monocromo. Se anteponen unos filtros con los colores primarios para obtener la informacin
de color. En los modelos de alta gama y profesionales se usan tres CCD, uno para cada color.
Previamente se divide la luz usando un prisma dicroico. La resolucin terica del estandar DV es
720x576 para el sistema PAL y 720x480 para el NTSC usado en USA. Las cmaras para el mercado USA
llevan CCDs con menor nmero de puntos, ya que su resolucin es menor.
En la imagen, vemos un sistema de 3 CCDs

Sony
Para las cmaras de 1 CCD se anteponen al CCD unos patrones de color como los siguientes:

Filtro de colores primarios

Filtro de colores complementarios

Canon usa filtros de colores primarios, me parece que los dems usan el de complementarios. Este
ltimo proporciona un poco ms de luminosidad ya que usa colores ms claros. Como ves, el verde
est presente de manera muy notable en ambos patrones: el ojo humano es muy sensible a este color. La

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 46/65

Tema 6.- Vdeo.

disposicin est planeada para minimizar el efecto moir. Se suele anteponer un filtro suavizador para
evitar el aliasing de las imgenes ( detalles de alta frecuencia que son errneamente considerados como
de baja frecuencia y forman patrones geomtricos)
Para el primero, las ecuaciones de colorimetra son bastante sencillas y se pueden hacer en con matrices
analgicas o por procesado digital :
Y = .299 R + .587 G + .114 B
R-Y = .701 R - .587 G - .114 B
B-Y = -.299 R - .587 G + .886 B
Existe un tipo de CCD, llamado de exploracin progresiva, que proporciona mejor resolucin sobre
todo en el modo fotografa "sobre cinta". De hecho, todos y cada uno de los "fotogramas" ser una
imagen completa, de total resolucin. Normalmente, la captura se realiza entrelazada, es decir, una
imagen se compone de dos campos, cada uno de ellos con la mitad de informacin ( en un campo se
capturan las lneas pares y en otro las impares). El CCD de exploracin progresiva captura cada campo
de forma completa. Pero hay pocos modelos que ofrezcan exploracin progresiva a 25 fotogramas por
segundo (f.p.s). Este modo de grabacin es muy apreciado entre los que quieren dar a sus grabaciones
un "film look" (aspecto de cine). Claro est que hay que realizar un entrelazado para mantener el
formato PAL, pero la imagen capturada ofrece ms calidad. ( Los sistemas de TV muestran la imagen
"entrelazada", es decir, dividida en dos campos , uno con lneas horizontales pares y otro con las
impares. )

Las cmaras con exploracin progresiva a 25 fps, presentan dos ventajas : todos los fotogramas son
"completos", podemos elegir cualquiera de ellos como "foto". La segunda ventaja es que la reproduccin
en pantallas progresivas (no entrelazadas) ser mucho mejor. Las pantallas de ordenador son
progresivas y se espera que algn da las TV de alta resolucin tambin lo sean. Una de las quejas ms
comunes de los "novatos" en el campo de la edicin es "por qu se v tan mal el vdeo miniDV en el
ordenador" y "por qu tiene unas franjas horizontales" . La explicacin est relacionada con lo
anteriormente dicho: si quieres evitar este efecto hay que desentrelazar el video miniDV ( esto lo hacen
los programas de edicin) pero a costa de perder resolucin. La gente que necesita mucha calidad de
imagen y parada perfecta, no quieren ni oir hablar de los modos entrelazados. Los fabricantes aducen
que el modo entrelazado est bien, y que el ojo humano es capaz de remezclar los dos campos, siendo la
resolucin aparente muy similar al modo no entrelazado. Como ya se ha mencionado, el cine trabaja en
modo progresivo a 24 fps, por lo que muchos cinematgrafos de bajo presupuesto estn usando
cmaras miniDV PAL progresivas ( a 25 fps ) para realizar trabajos que luego se pasan a celuloide.
Sony, para el modo foto, implementa un sistema llamado "progresive shutter" que siempre ha dado
mucho de que hablar ya que nadie de Sony lo ha querido explicar a fondo. Sony, para el modo foto, en
vez de usar un CCD con exploracin progresiva, lo que usa es un obturador mecnico, que de algn
modo, congela la imagen. Qu pasa si no tenemos este obturador mecnico? Pues que el CCD (no
progresivo) captara la imagen y empezara la transferencia de lneas del CCD a la electrnica de la
cmara. Primero las pares y luego las impares. Pero cuando lleguemos a las impares, como el obturador
sigue abierto (hemos supuesto que no existe) la imagen puede haber cambiado, sobre todo en imgenes
en movimiento. Lo que hace Sony es poner un obturador, para cerrar el objetivo. De este modo, las

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 47/65

Tema 6.- Vdeo.

lneas impares almacenadas en el CCD son las "viejas", las correspondientes al momento en que se
capturaron las pares, y no hay corrimiento de la imagen. Es un truquillo enrevesado, que yo lo entiendo
de esta manera.
En cuanto al tamao, los CCDs suelen ser de 1/3 " o 1/4". Podemos decir que cuanto ms pixels y ms
grande de tamao, mejor. Un CCD de 1/3" es un 50% ms luminoso que uno de 1/4", pero la ltima
moda es ponerlos de 1/4" (! y decir que es de 1/3" ! ). El tamao del CCD tiene una segunda
implicacin, a tener en cuenta sobre todo en el campo profesional. Los principios de la ptica imponen
su ley, resultando que cuanto menor sea el CCD ms fcil resulta construir pticas con zoom potentes y
ms profundida de campo tienen las tomas. Esto puede ser un problema, a veces queremos tomas con
muy poca profundidad de campo (enfoque selectivo, muy usado en cine), adems en cmaras con
pticas intercambiables hay que tener muy encuenta el tamao del CCD ya que las distancias focales
varian en funcin de dicho tamao. [Esto es lo que ocurre, por ejemplo, al intentar usar un objetivo para
cmaras fotograficas en una cmara Canon XL1, el CCD es muchsimo menor que la pelcula de 35 mm]
Siendo el CCD un punto de vital importancia los fabricantes podran estirarse un poco y no usar este
dato como maniobra de segmentacin del mercado, pero estas cosas siempre son iguales. En el mercado
hay cmaras que van desde los 350.000 pixels hasta los 1.200.000. Pero para miniDV cal es el tamao
de CCD ptimo? La respuesta es sencilla: 3 CCD (uno para cada color ) de tamao efectivo 720x576, es
decir, 3 CCD de 414Kpixels ( se suele redondear a 420 o 470K por problemas tcnicos). De hecho, las
cmaras profesionales usan estos tamaos de CCD. Para cmaras de 1 CCD el clculo no es tan simple
ya que tenemos una matriz de filtros de color antepuesta. Pero se puede considerar en torno a 1.2M
efectivos el tamao mximo razonable (en el mercado hay cmaras con CCD de ms pixels, pero estn
orientados a conseguir mejor "modo foto" y hay que tener presente que la estabilizacin digital de
imagen gasta un buen nmero de pixels, tal como se ver ms adelante).

CCD JVC
Una aclaracin sobre el tema de la resolucin. Ya hemos comentado que el sistema DV trabaja con una
matriz de 720x576 pixels. Esto significa que la parte digital de la cmara (compresor DV, mezclador de
imgenes, corrector de errores, etc ) trabaja con imgenes en ese formato : 720x576 x 24 bits. Pero eso no
significa que todas las cmaras miniDV del mercado tengan, en la realidad, la misma resolucin.
Interviene la ptica y el CCD: si son mediocres o con pocos pixels est claro que no se llegar a la
mxima resolucin. Los fabricantes saben que pocos usuarios se van a poner a medir la resolucin.
Tambin saben que nuestros televisores son "normales", no son de alta definicin. Por ello, en las
cmaras de segmento medio-bajo, montan pticas y CCD que ellos ya saben que no van a conseguir la
mxima resolucin posible. Pero no hay que preocuparse mucho: cualquier modelo se ve muy bien.
Pero qu es la resolucin? este tema dara para un apartado entero, pero voy a resumir. Es la capacidad
para mostrar detalles pequeos. Se mide en lneas horizontales, es decir, en el nmero de lneas
horizontales perfectamente distinguibles unas de otras sin que se forme un "todo". En la prctica lo que
se hace es grabar con la cmara un "poster" o "carta estndar de resolucin". Es parecido a la "carta de
ajustes". Incluye una serie de lneas concntricas cada vez ms juntas. All donde nuestra cmara no sea
capaz de distinguir una lnea de la adyacente, ser el lmite de resolucin expresado en lneas. Pero la
resolucin no es todo ni muchsimo menos: hay que considerar la pureza de color, el contraste, la
saturacin, etc, factores tan importantes o ms que la resolucin "bruta". Sabemos que el sistema PAL de
televisin especifica 625 lneas (575 tiles): cuidado, este es el mximo posible terico, pero est claro
que pocas videocmaras o televisores brindan esa resolucin. Todo esto que acabo de contar est
ultrasimplificado y contiene algunos errores conceptuales.
Una vez captada la imagen por las pticas y el CCD, hay que digitalizar esta seal. Dicha seal tendr
componentes analgicos RGB (esto se entiende mejor si pensamos en cmaras con 3 CCD, uno para
cada color) . Hay que pasarla a un formato digital suceptible de ser comprimido y almacenado en la
cinta. La digitalizacin la realiza un convertidor analgico/digital ( A/D). Consiste en un chip
especializado que toma muestras de la seal a intervalos fijos ( frecuencia de muestreo). A cada muestra
se le asigna un valor dependiendo de su amplitud. El nmero de valores o "escalones" posibles depende
del nmero de bits ( en nuestro caso hay 8 por color primario, con los cuales se pueden definir hasta 256

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 48/65

Tema 6.- Vdeo.

valores de tonalidad primaria). A continuacin se realiza una conversin del espacio RGB al YUV
(Y=luminancia, U=R-Y, V=B-Y). La seal de luminancia se muestrea a una frecuencia de 13.5 Mhz,
mientras que la R-Y y la B-Y se hace a 3.375 Mhz. Es decir , 4 veces menos, ya que el ojo humano es
mucho menos sensible al color. Por tanto la relacin es 4:1:1 (para el sistema PAL, se usa 4:2:0 ms difcil
del explicar, y peor para realizar mltiples ediciones). En sistemas de vdeo profesionales, como el D-1
sin compresin, se usa una relacin 4:2:2 , es decir, el B-Y y el R-Y se muestrean al doble para as obtener
una mejor calidad de la seal de color.

4:2:2 : las muestras de color (Cr, Cb)


van intercaladas con las de luminancia

4:1:1 : las muestras de color (Cr,Cb) van


cada 4 muestras de luminancia. Ambos
colores van juntos.

4:1:1 : las muestras de color (Cr,Cb) van


intercaladas con las muestras de
luminancia, pero alternativamente.

Diagramas propiedad de Panasonic Broadcast and Digital Systems


La relacin seal/ruido est entorno a los 54dB ( hay autores que indican 60 dB, depende tambin de
cmo se mida) , incluso mejor que la del estndar (analgico) profesional Betacam SP( 51 dB). Cada uno
de los tres componente se cuantifica en 8 bits ( 3x256 valores posibles, 16 millones de colores ). Como ya
se ha dicho, el formato de la matriz de imagen es de 720x576. Al final, tenemos 162 millones de bits por
segundo. Es una bestialidad que hay que comprimir de alguna manera.
El dispositivo que realiza la compresin o descompresin se denomina CODEC. El mtodo de
compresin se basa en DTC ( discrete cosine transform ) y coeficientes variables. . Es un mtodo muy
complejo, que no vamos a explicar a fondo, que requiere una potencia de clculo muy grande ( y todo
ello "sobre la marcha"). La compresin es "intraframe" al estilo del M-JPEG. Esto significa que no se
obtienen compresiones tan grandes como con el sistema MPEG-2, que utiliza compresin "interframe".
La ventaja es que la parada de imagen es mejor y la edicin ms sencilla y precisa. Un buffer almacena
cada uno de los dos campos de que se compone la imagen ( van interpolados, es decir, una imagen se
compone de dos campos ). Si hay poca diferencia entre ellos, la imagen se comprime como si fuera un
solo campo. Si las diferencias son grandes, se comprimen individualmente. Adiccionalmente, los pixels
de un campo se agrupan en matrices de 8x8, que a su vez se agrupan de 4 en 4. Cada juego de cuatro
bloques se comprimen de acuerdo a unas tablas de quantizacin. Dependiendo de nuevo de las

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 49/65

Tema 6.- Vdeo.

necesidades se aplica mayor o menor compresin. El sistema es adaptativo dando mayor detalle a
aquellas reas de la imagen que as lo precisen ( esta es la ventaja sobre el M-JPEG) . Al final, el factor de
compresin es de 5:1, quedando 25 Mbits por segundo de informacin de vdeo con un flujo constante.
A este sistema de compresin se le llama DV-25. Un asunto que suele provocar polmica: son todos los
CODEC iguales ? Pues la respuesta es que NO. El estndar deja abierta algunas cosillas y los fabricantes
tienen que ponderar sus parmetros de la mejor manera posible, unos tratarn de dar mayor nitidez
pero podrn tener problemas de efecto moir, etc. Pero paree ser que son todos muy similares. Por otro
lado, la compresin DV no est exenta de problemas, entre los ms conocidos est el "mosquito noise" y
el "quilting".
Como ya se ha mencionado, este sistema es menos agresivo que el MPEG2 del DVD, brindando una
mejor parada de imagen y una edicin campo a campo. El sistema MPEG-2 usa compresin interframe,
es decir, se compara una campo con el/los siguientes para determinar el grado de compresin a usar.
Simplificando mucho, podemos decir que si dos imgenes son similares, simplemente se almacenan las
diferencias ( o lo vectores de movimiento). Por tanto, no existe una correlacin clara entre una imagen y
su campo "original", lo cual dificulta la edicin en un ambiente domstico. Con equipos semi-pro o
profesionales no hay problemas ya que decodificando dos cadenas mpeg independietemente y en
tiempo real, es posible una edicin perfectamente precisa. El MPEG-2 se toma mucho ms tiempo para
analizar las imgenes y necesita un procesador ms potente y memorias adiccionales, con mayor
consumo de energa. Todo esto llev a los fabricantes de cmaras a la necesidad de disear un sistema
de compresin ms simple. Pero tericamente, el mpeg-2 puede brindar igual o ms calidad que el DV25. Por otra parte, para obtener un M-JPEG equivalente al DV, la relacin de compresin debe ser de
3:1.
En algn punto de esta cadena entra el procesado de imgenes, tales como efectos especiales, zoom,
estabilizacin digital,etc. Los efectos de fundido y disolucin hacen uso de una memoria y de un
mezclador digital. El zoom digital deteriora la imagen y suele ser impracticable ms all de 40x.
Para conseguir una buena estabilizacin digital se debe emplear un CCD sobredimensionado.
Internamente se determinan unos vectores de movimiento, moviendse la zona efectiva de captacin en
consonancia para minimizar las vibraciones. Hay que imaginrselo como una ventana de imagen dentro
de la cual hay otra ventana menor pero mvil. Si el CCD no est sobredimensionado, al usar la
estabilizacin digital se observar un pequeo efecto zoom y una cierta degradacin de la imagen. Este
sistema no est libre de fallos ( artifacts ) y tiende a producir imgenes un poco "turbias". Para evitarlo
hay cmaras que aumenta la velocidad de obturacin hasta 1/100, con una cierta prdida de luz. ( Esto
es un punto importante. Mucha gente se queja de la poca sensibilidad de las miniDV. Lo que hay que
hacer es deshabilitar la estabilizacin digital en escenas con poca luz, o bien forzar a mano una
velocidad de obturacin 1/50).
Un tema controvertido es el de los pixels efectivos. Si suponemos que hay una ventana o recuadro
interior menor, habra que preguntarse de cantos pixels se compone. Es lo que Sony y otros llaman
pixels efectivos. Por ejemplo, segn el catlogo de Sony, la PC1 tiene un CCD de 810.000 puntos, de los
cuales 400.000 son efectivos. Hasta ahora yo pensaba que cuando no se activa la estabilizacin digital ,
se usaba todo el CCD para obtener la mejor imagen posible, y que cuando se activaba se perda un poco
de calidad. Ultimamente me estoy temiendo que el nmero de pixels es fijo, 400.000 en nuestro ejemplo,
independientemente de que decidamos activar o no la estabilizacin ( al menos en mi cmara JVC J70 ya
que no observo la menor diferencia en cuanto a resolucin ). Si nos fijamos en cmaras con
estabilizacin ptica, veremos que el nmero de pixels totales es casi igual que el de efectivos ( siempre
es menor por cuestiones tcnicas ).
Por tanto, una cmara con un CCD de p.ejemplo 540.000 pixeles totales y 510.000 efectivos con
estabilizacin ptica, dara ms calidad que una con 810.000 pixels totales y 400.000 efectivos con
estabilizacin digital. Cuantos ms puntos de "sobra" haya, mejor ser la estabilizacin. Por ejemplo, la
JVC DV3, con 540.000 pixels, no va muy sobrada que digamos, so pena de degradar la imagen ( de ah
las quejas que he ledo sobre su estabilizacin ). Es preferible la estabilizacin ptica slo presente en
unos pocos modelos, la cual detecta los movimientos y los corrige pticamente mediante pequeos
ajustes de las lentes. Segn he ledo, la invento all por los aos 60 Juan de la Cierva.
Me da la impresin de que hay un par de formas de llevar a cabo la estabilizacin digital. Sony se
decanta por tener detectores de movimiento y actuar sobre los circuitos de estabilizacin digital. Los
dems fabricantes creo que usan algoritmos digitales para determinar el posible movimiento de las

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 50/65

Tema 6.- Vdeo.

imgenes.
El sistema de correccin de errores es muy potente ( ECC ) para evitar que un defecto en la cinta afecte
a la imagen. De hecho, los drops-out o pequeos saltos son virtualmente inexistentes.
El audio se graba tambin digitalmente y en estreo. Y sin compresin. Podemos elegir entre dos pistas
a 16 bits / 48Khz o cuatro pistas a 12 bits / 32Khz. El primer mtodo nos brinda una calidad incluso
superior al CD. El segundo posibilita el doblaje y la insercin de bandas sonoras, con una calidad
bastante buena. Sera deseable disponer de un control de ganancia de audio ajustable. Las cmaras
suelen llevar un Control Automtico de Ganancia ( AGC) para ajustar la sensibilidad de los micrfonos
a los distintos ambientes. Un aspecto negativo es que el audio no va perfectamente sincronizado con el
vdeo. Digamos que a "X" fotogramas no les corresponden exactamente "Y" muestras de sonido. Esto
complica un poco la edicin a nivel profesional (la edicin analgica, con la digital no hay problemas)
Adems de audio y vdeo, en la cinta se almacena informacin de control. Se codifican seales de
tiempo, ndices y otras necesarias para el modo fotografa. Por fin, toda esta informacin es almacenada
en la cinta. Al final, el flujo de datos es ligeramente superior a 28Mbits/s ( 25 del video + audio +
control + etc )
La cassete usada ( mini DV), es aprox. la mitad de tamao que una de 8 mm. Mide tan slo 66 x 48 x
12.2 mm. La cinta es de 1/4 " ( 6.35 mm). La composicin es completamente nueva con una doble capa
de metal evaporado. Lleva un recubrimiento de carbono para darle resistencia y lubricacin. Algunas
cintas incorporan una memoria donde es posible almacernar informacin adiccional tales como los
parmetros de la imagen ( velocidad, apertura ) e indices temticos. La cmara debe soportar esta
opcin.Es una cassete, por tanto hay que seguir todas las precauciones habituales o ms. Actualmente se
fabrican de 30 y 60 m, pudiendo usarse el modo LP ( no merma la calidad pero no es posible el doblaje
de audio) para obtener hasta 90 m de tiempo de grabacin. Acaba de salir en Japn una cinta de
Panasonic que dura hasta 2 h en modo LP. Parece ser que realmente slo hay dos fabricantes de cintas :
Sony y Panasonic ( JVC pertenece al mismo grupo industrial que Panasonic, asi que ... ). Segn dicen, se
diferencian en la composicin del lubricante y no es bueno andar mezclndolos ( se enscian las cabezas
). Os recomiendo usar siempre la misma marca ( hasta que sepamos si es cierto o es una nueva leyenda
negra).

El tambor y las cabezas de grabacin son , por supuesto, un autntico desafo. Decir que gira a 9000
r.p.m ( un vdeo VHS a 1800 ), la velocidad de la cinta es de 18.9 mm/ sec y la anchura de las pistas es
de 10 micras para el modo de grabacion SP ( en el Hi-8 es de 20 micras) . Para el modo LP ( la cinta dura
un 50% ms de tiempo), adems de perderse las dos pistas auxiliares de audio, la anchura de pista se
reduce a 6.7 micras, por lo que podemos perder fiabilidad y tener problemas al tratar de reproducir
nuestras grabaciones en otras cmaras. Los formato profesionales DVCPRO y DVCAM usan pistas de
15 y 18 micras.
En ngulo de inclinacin de las pistas es de 9 resultando en una longitud de pista de 35mm. En la
siguiente figura se muestra su disposicin:

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 51/65

Tema 6.- Vdeo.

Tenemos los siguientes sectores de informacin :


- Insert and Track : ( estara abajo en la figura ) : Contiene informacin para en correcto seguimiento de
la cinta.
- Audio sector : Contiene tanto audio como informacin auxiliar. Como ya se ha dicho puede acomodar
dos pistas de 16 bits / 48Khz como cuatro de 12 bits ( no lineal ) / 32 Khz.
- Video Sector : Contiene la informacin de video y datos auxiliares ( fecha de la grabacin, apertura y
velocidad y otros datos ) .
- Subcode sector : contiene varios tipos de informacin, siendo el ms inportante el "timecode" o "cdigo
de tiempo". Es una marca en forma de hh:mm:ss:ff ( hora, minuto, segundo y fotograma ) que
identificada de forma nica cada fotograma que se graba. Muy til para determinar los puntos de
entrada y salida en una edicin.
Una ventaja de la grabacin digital es que puede incluir una gran cantidad de datos auxiliares tales
como subttulos, tabla de contenidos, karaoke, teletexto, etc (no implementado por ahora en ninguna
cmara que yo sepa ).
Entradas, salidas, baterias y otras florituras.
Las salidas. Todas las cmaras disponen de salida de video compuesto y S-Video. Siempre que se pueda
se debe usar sta ltima ya que brinda mejor calidad de imagen. ( La salida S-Vdeo lleva por separado
la luminancia y la crominancia, mientras que la de vdeo compuesto las lleva mezcladas. Esto implica
que en nuestro TV deben ser separadas de nuevo con las consiguiente degradacin que introducen los
filtros de separacin empleados ).
Como es lgico, todas tienen tambin salida estreo de audio ( nivel de "linea"). Si se quiere conectar
unos cascos para monitorizar el sonido hay que acoplar un amplificador (algunos modelos llevan una
salida especfica para auriculares)
Hoy en da casi todas llevan tambin la salida digital DV ( llamada tambin i-Link, Firewire o IEEE1394
). Permite transferir las imgenes a un ordenador sin merma alguna de calidad.
Algunas disponen de un puerto serie RS232 o usan una interface JLIP/LANC ampliada, para
transferencias de imgenes fijas ( "PC port" ) . Es lento pero barato. Solo unas pocas pero cada vez ms,
disponen de puerto USB para la transferencia de imgenes fijas.
La entrada de micrfono. Todas tienen entrada de micrfono, muy til para solucionar el problema de
las cmaras ms pequeas que captan su propio ruido de los motores. Normalmente es necesario
conectar un micrfono con alimentacin propia ( con una pequea batera). ! Cuidado !. Esta entrada no
suele ser muy propicia para grabaciones de msica, etc. Es decir, estn exclusivamente pensadas para

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 52/65

Tema 6.- Vdeo.

conectar micrfonos. El problema es el Control Automtico de Ganancia ( AGC) que va a tender a


comprimir la msica y a meter ruido en los pasajes ms dbiles. Adems, tiene una alta sensibilidad,
por lo que hay que intercalar un divisor resistivo. Lo ideal sera poder desactivar el AGC, cosa posible
en algunos modelos, creo. Algn modelo ( Sony VX2000 y otros ) tienen un conmutador que permite
seleccionar entre entrada de micro o "nivel de lnea". Cuidado, la nueva generacin de cmaras no suele
tener la entrada de micrfono en la cmara, si no en la "estacin de anclaje". Unos pocos modelos
(normalmente de Sony) incluyen esta entrada en la zapata de flash "inteligente". Esto permite acoplar
un micrfono "inteligente" ( y caro ... ) que ajusta su sensibilidad en funcin del uso del zoom ptico que
hagamos.
De entrada de vdeo hay que olvidarse ( salvo la SONY TRV900, PC-120,la PC9, JVC DVX10, varios
modelos de Panasonic y Canon .... y otras que van saliendo poco a poco). Simplemente, no les interesa
ponerla. No les costara ms de 2000 ptas en fbrica poner un chip convertidor A/D. El problema viene
de la posibilidad de grabar con alta calidad de la imagen y de la oposicin de la industria del vdeo y
del cine por posibles problemas de piratera, etc. Tambin hay un problema de aranceles comunitarios.
Los aparatos con capacidad de grabar tienen un arancel especial. Adems hay un cupo, por tanto si las
cmaras se las considera "magnetoscopios" estn comiendose parte del cupo de que dispone cada
fabricante japons.
En cuanto a la entrada DV, slo la SONY TRV900 , PC-120, PC-9, la Panasonic DX110, la JVC 9600 ,
Canon MV20i, la XL1, JVC DVX9 y 10, todas las Canon que acaban en "i" ... y otras la tienen ( esta lista
est creciendo poquito a poco). Aqu el problema est , de nuevo, en un arancel especial que pone la
CEE a los aparatos "grabadores de fuentes externas". OJO, pues en la publicidad de las pginas web
americanas hablan de "entrada-salida DV". En Europa, slo salida. Para ms informacion ver DV-In.
Todas tienen un visor ( viewfinder ) y , la mayora una pequea pantalla en color. La tecnologa suele
ser LCD / TFT de alta resolucin. Es importante que sea de la mayor resolucin posible ya que de lo
contrario ser difcil enfocar y ajustar la exposicin correctamente. Los visores suelen ser de 0.5" y
existen varios modelos : de 113.000, 160.000 o de 180.000 pixels ( ste ltimo lo monta la PC9 por
ejemplo). En cuanto a pantallas LCD hay una mayor variedad. Realmente, no son gran cosa y hay que
fijarse tanto en el nmero de pixels como en el ngulo de visin posible.
Casi todos los modelos emplean baterias de Li-ion ( litio in). Es la ltima tecnologa en este campo, con
muchas ventajas sobre las anteriores :
- Alta capacidad y bajo peso/volumen. Triplican en rendimiento a las de Ni-MH.
- No efecto memoria. Se pueden recargar en cualquier momento, no siendo necesaria su descarga total
previa.
La tarjeta de memoria flash es la ltima moda: permiten trabajar en "modo foto real" tal como lo hacen
las cmaras de fotos digitales. La foto es almacenada 64MB. Cuantas fotos caben en una tarjetita de
memoria? Lo vemos es la siguiente tabla, sacada del catlogo de Sony ( para la PC100):

4 MB

8 MB

16 MB

32 MB

64 MB

640 x 480

20

40

82

164

329

1152 x 864

12

25

52

104

Otras cmaras, como la JVC DVL9800 llegan hasta 1024 x 768, con capacidades similares. Este cartucho
de memoria no es estandar y no sueles ser compatible entre distintas marcas. Solo algunos modelos
llevan este invento. Normalmente se ofrece el mismo modelo, con o sin memoria flash. Suele encarecer
unas 40.000 pesetas. Cuando compramos la cmara, la suelen suministrar con el cartucho de menos
capacidad ( 4 MB).
Vemos como con 64MB tenemos para sacar las fotos de todo un buen viaje. ! Qu pasada ! El chip es
"memoria flash", un tipo especial que permite la reescritura total o parcial de la memoria no volatil (eso
s, un poco lento comparada con la escritura en una RAM).
Para finalizar se muestra un posible diagrama de bloques de una cmara DV :

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 53/65

Tema 6.- Vdeo.

Basta con incluir un convertidor A/D adicional para tener entradas de video. Podemos decir, que las
cmaras miniDV son uno de los cacharros electrnicos que ms tecnologa llevan dentro.

6.8. Proceso de creacin de vdeo en multimedia


Debido al coste en tiempo, espacio, equipo (y dinero, por supuesto, si sumamos todo esto)
especialmente alto del vdeo, el proceso de creacin debe estar bien planificado para conseguir el
resultado apetecido sin desperdiciar ms recursos que los imprescindibles. Podramos generalizar el
proceso de elaboracin de vdeo en los siguientes pasos: Diseo, obtencin, digitalizacin, edicin e
integracin.

6.8.1. Diseo (guin)


Igual que en el software, deberamos disear el esquema del vdeo a incluir en nuestra aplicacin
multimedia. Para eso suelen usarse distintas tcnicas:

Diagrama de flujo de la aplicacin, indicando todos los puntos donde aparecen vdeos y
recogiendo todos y cada uno de ellos, identificando posibles partes comunes y
determinando las necesidades siempre antes de empezar a obtener los medios.

Guin de cada vdeo a elaborar (como en el proceso cinematogrfico, aunque aqu caben
posibilidades de interaccin o integracin de otro tipo de medios). Se suele usar mucho el
concepto de storyboard, que es una especie de desarrollo en vietas dibujadas a nivel
esquemtico de lo que va a contener el vdeo.

Los storyboards se pueden usar para ms partes de una aplicacin multimedia (animaciones,
efectos grficos, incluso diseo de interfaz). Cada vieta puede indicar anotaciones adicionales de voz
en off, de msica, efectos pretendidos, duracin aproximada en tiempo, tipo de plano de cmara, etc.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 54/65

Tema 6.- Vdeo.

Otro punto importante del diseo es la calidad que va a tener el vdeo final, en cuanto a tamao
del marco (resolucin), tipo de compresin asumida, etc.

6.8.2. Filmacin/obtencin de los cortes de vdeo y audio


Una vez que est claro que hay que filmar o que vdeos ya filmados hay que obtener, viene el
proceso de obtener el material audiovisual. Para obtener resultados profesionales normalmente hay que
contar con equipo profesional, con lo que es una parte que habitualmente se subcontrata en produccin
multimedia.

6.8.3. Revisin y digitalizacin


Antes de digitalizar, hay que revisar cuidadosamente el material obtenido para no utilizar
demasiado tiempo y espacio en cortes no utilizables (aunque la precisin de dcimas de segundo ya se
alcanzar despus en la produccin del montaje). Es conveniente agrupar todo el proceso de
digitalizacin para que todo el material est disponible cuando despus se realiza el montaje.

6.8.4. Edicin/montaje
Este es el proceso ms interesante y normalmente el ms complejo y consumidor de tiempo de la
produccin de vdeo. Si los dems pasos se realizan correctamente no habr demasiados problemas
aunque cualquier defecto notado en este punto obligar probablemente a volver a obtener partes de
vdeo o sonido.
Los programas de edicin no lineal de vdeo actuales, como Adobe Premiere, permiten
incorporar de modo sencillo gran cantidad de efectos y posibilidades de edicin para acabados
semiprofesionales. Lo veremos en las prcticas.
En la edicin hay que sincronizar el sonido con el vdeo. A menudo para esto se graba sonido
independiente del vdeo (voces en off, bandas sonoras, efectos de sonido, etc.). Aunque es un proceso
que puede hacerse con posterioridad a elaborar el vdeo completo, en ocasiones es vital considerarlo
como una parte fundamental o incluso inicial de la edicin (por ejemplo, para elaborar un videoclip
musical, o para conseguir que una voz en off que describa un paisaje tenga suficiente tiempo como para
decir todo lo que se quiere decir sin que se nos acabe el vdeo).
De la misma forma, los grficos estticos, las animaciones a combinar con el vdeo y las
titulaciones se pueden elaborar en el montaje o preparar antes cuando su complejidad es considerable.

6.8.5. Integracin
En la integracin se hace todo tipo de trabajo adicional al vdeo finalizado. Por ejemplo aadir
interactividad con un programa de autor.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 55/65

Tema 6.- Vdeo.

6.9. Edicin de vdeo


Simplemente comentamos un par de aspectos de la edicin de vdeo.

6.9.1. Edicin lineal y no lineal


La edicin lineal usa algn componente analgico, de modo que sobre la marcha tenemos que
generar efectos de transicin, montaje y superposicin para crear el vdeo final. Hacen falta dos o tres
magnetoscopios (uno de grabacin).
En la edicin no lineal, en cambio, todo el soporte se digitaliza previamente, con lo que podemos
editar lo que sea necesario sin necesidad de sincronizacin previa, retocar el resultado, etc. utilizando
solamente el ordenador en el proceso. Con un magnetoscopio puede ser suficiente, primero para
digitalizar las tomas que queramos procesar y finalmente para registrar el resultado final.

Figura 14. Edicin lineal y no lineal.

6.9.2. Efecto croma


El efecto croma es muy conocido en edicin de vdeo y consiste en determinar un color como
transparente para poder superponer dos vdeos o un vdeo con una imagen (las clsicas filmaciones
sobre fondo azul). Tambin puede realizarse este efecto si la pista de vdeo contiene canal alfa.

6.10. Vdeo en Internet


En la actualidad todo lo que se hace de vdeo en Internet se realiza con plug-ins.
Ancho de banda:
Hay dos maneras de reproducir vdeos:
Asncrona: cargndolos primero y visualizndolos despus. Si tenemos suficiente tiempo
y espacio, esto se puede hacer ya hoy sin ningn problema.
Sncrona: visualizndolos segn se cargan. Dadas las caractersticas especiales del vdeo
como soporte, esto nos obliga a:
o Tener suficiente ancho de banda

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 56/65

Tema 6.- Vdeo.

Dedicar gran parte del hardware, porque realmente la nica manera de tener
ancho de banda es con una buena lnea, un buen servidor, y un mecanismo de
codificacin/decodificacin en tiempo real.
(Realmente la ecuacin es sencilla: si no somos capaces de cargar a la misma
velocidad a la que se consume -visualiza-, no se puede visualizar en tiempo real.
Con suficiente calidad y tamao, visualizar un vdeo significa por encima de las
500 Kb/seg.)

Aunque no es lo ideal, parece que en unos cuantos aos se tendr que tender a mtodos
asncronos (pido ahora - veo despus), aunque es de esperar que el retardo cada vez sea menor.
Video on Demand (VOD):
Va a ser otro interesante mercado para servicios interactivos. Por ello es un mercado potencial
para desarrollo multimedia.
Hay dos modelos distintos de VOD (no se sabe todava cul se impondr), en funcin del
comportamiento de los dispositivos (set-top boxes):
Push:
o El dispositivo domstico es una especie de terminal "tonto" audiovisual.
o Manda comandos al servidor, recibe los datos de l, y los visualiza.
o Esto es, la aplicacin (el visualizador de pelcula, por ejemplo) se encuentra en el
servidor.
o Slo la visualizacin y las comunicaciones tienen que estandarizarse para fabricar
dispositivos.
Pull:
o El servidor opera como una fuente de datos (ya sea para carga -downloaded- o
para muestra en directo -streamed-).
o La aplicacin, que tambin se carga del servidor, se ejecuta en el dispositivo, que
no puede ser por ello un terminal "tonto".
o Las propias aplicaciones deben estandarizarse entonces entre el servidor y el
dispositivo usuario.

6.10.1.

Soporte de vdeo para Web

QuickTime:
Es el ms universal (Windows, Mac, Unix...). Desarrollado por Apple.
Adems de vdeo digital tambin suministra entornos de gestin de audio digital, realidad
virtual 3D y otros tipos de datos multimedia con un soporte basado en pistas.
AVI:
(Audio Video Interleave) Slo para Windows. Carece del sofisticado soporte multimedia y de
sincronizacin de QT.
Otros formatos:
MPEG (Motion Picture Experts Group) es el ms utilizado, aunque es bastante exigente en software
(y/o hardware).
Vdeo contnuo:
Hay software de vdeo con streaming (visualiza segn se va cargando) para Internet, siempre con
la limitacin de la velocidad de conexin y considerando que los servidores tienen que tener una
infraestructura ejemplar para dar servicio suficiente al flujo de datos de salida. Algunos son:
VDOLive. Suministra reproductores y utilidades de creacin gratuitos. Tiene un sistema
de compresin propietario, VDOWave, que intenta conservar audio y velocidad de
cuadro a costa de la calidad de imagen.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 57/65

Tema 6.- Vdeo.

6.10.2.

StreamWorks. Es algo diferente, est diseado para ser un servicio de difusin y codec en
tiempo real. Utiliza una variedad de MPEG, e intenta conservar la calidad de la imagen a
costa de la velocidad de cuadro. Con mdems ms bien parece una secuencia de
diapositivas que un vdeo.

Insertar clips en pginas Web

Podemos reproducir un archive de vdeo en una pgina web creando un hipervnculo. Al pinchar
sobre dicho hipervnculo, se abre el reproductor adecuado como una aplicacin independiente y el
usuario puede ver el archivo. Podemos crear un enlace de la siguiente forma:
<a href=my_file.rm>My Real File</a>.
Crear un enlance a un servidor de streaming es por lo general ms complicado. Un enlace a un
servidor de streaming Windows media es de la forma :
<a href=mms://mystreamingserver.myuni.ac.uk/mymedia/my_file.asf>
y para un RealServer:
<a href=rtsp://mystreamingserver.myuni.ac.uk/mymedia/my_file.rm>.
Los caracteres a la izquierda de // se refieren al protocolo usado para controlar el flujo, aunque no
todos los navegadores lo soportan. Existen dos opciones:
1) Usar un puntero al ramgen
En este caso crearemos un enlace con un formato especial de la forma:
<a href=http://[realserver.com]:[port]/ramgen/file.rm>Click me</ a>, donde realserver.com y port
indican el nombre del servidor y el nmero de puerto.
<a href=http://mystreamingserver.myuni.ac.uk:8080/ramgen/myclipspath/myvideo.rm> Click me
</a>
2) Usar un fichero de texto auxiliar
Esta alternativa consiste en crear un archivo de redireccin .ram/.asx. Este archivo redirige al lugar del
archivo de vdeo y proporciona el protocolo necesario para tratar con el archivo.

6.10.3.

Vdeo Conferencia en Web

La videoconferencia se basa en la captura de contenidos en directo, lo cual presenta una serie de ventajas
e incovenientes. Como ventajas podemos destacar las siguientes:

Oportunidad para aumentar el impacto del evento a una audiencia ms numerosa. Por ejemplo,
podramos dar clase en varias universidades al mismo tiempo o posibilitar el aprendizaje a
distancia.
Los eventos en directo permiten comunicacin en los dos sentidos. Por ejemplo, los alumnos
podran comunicarse con el profesor.
Permite el almacenado del evento para posteriores consultas.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 58/65

Tema 6.- Vdeo.

Como desventajas podemos destacar:

Se necesita mucha mayor planificacin tcnica y personal para un evento en directo que para uno
por demanda.
Se requiere de una conexin rpida, que deber ser comprobada de antemano.
Dependiendo del volumen de la audiencia y de la cantidad de ancho de banda de ella,
deberemos ser capaces de satisfacer esa demanda.
Deberamos tener una mquina secundaria capaz de emitir por si ocurriera algn problema.

A continuacin veremos algunas caractersticas a grosso modo de la videoconferencia actual


Ancho de banda:
Una configuracin tpica de video conferencia hoy en da puede ser una ventana de 160x120, 1 a
10 cuadros por segundo, y calidad telefnica de audio.
Ms que el vdeo son interesantes el resto de utilidades aadidas: pizarras, chat, e incluso
compartir aplicaciones (s, s, ya s que hay cientos de juegos que se pueden jugar por la Web).
Segn la utilizacin, pueden hacerse conexiones punto a punto o multicast (un emisor, mltiples
receptores).
Algunos programas como CU-SeeMe requieren servidores dedicados, reflectores, a travs de los
que se establece la vdeo conferencia. La mayora de los programas, no obstante, como QuickTime
Conferencing, BeingThere , y VideoPhone, no los necesitan. Lo que s suele haber son servidores de
apoyo para conocer quines estn en cada momento en la red dispuestos a compartir una agradable
vdeo conferencia con un desconocido...
Cu-SeeMe:
Debido a su gratuidad (ha sido desarrollado en la Universidad de Cornell) es bastante utilizado
por los que intentan hacer vdeo conferencia a travs de Internet.
Veamos sus posibilidades:
Enviar y recibir vdeo en B/N (160x120)
Enviar y recibir audio con calidad de radio AM
Realizar vdeo conferencias punto a punto con otros usuarios
Participar en vdeo conferencias de mlltiples usuarios usando software reflector
Comunicarse adicionalmente con "chat" de texto
Compartir adicionalmente grficos de pantalla completa
El Enhanced CU-SeeMe es comercial y permite vdeo color y caractersticas adicionales.
Utilizacin:
La utilizacin que hoy en da se puede hacer de la vdeo conferencia a travs de Internet no es
usarla como tal, porque la calidad es nfima (si la necesitamos debemos sacrificar coste y utilizar
sistemas dedicados de vdeo conferencia... ni siquiera en Internet se dan duros a cuatro pesetas).
Lo que s puede ser interesante es para ser usada como apoyo, para ver la cara de nuestro
interlocutor de cuando en cuando, y para presentar material adicional (esto s que es factible).
Pensemos que en realidad lo importante de la transmisin (aparte de la cara y del factor humano)
ser la informacin o la discusin que nos haya llevado hasta all y s podemos transmitir
transparencias, pequeas animaciones, textos, grficos, etc., y compartir pizarras o voz en tiempos
aceptables.
Si hablamos de intranets, la vdeo conferencia s es una realidad, pero siempre usada con mesura
porque es fcil tender a colapsar la red (sobre todo si se dejan vdeo conferencias tranquilamente en
background durante todo el da, como sucede en algunas corporaciones de USA).

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 59/65

Tema 6.- Vdeo.

6.10.4.

Real Audio & Vdeo

Real Audio y Real Vdeo (de RealNetworks) son tecnologas orientadas a transmisin de
informacin multimedia temporal (es decir, fundamentalmente vdeo y sonido) a travs de Internet.
Permiten hacer reproduccin streaming (progresiva), es decir, minimizando el tiempo de descarga
necesario para empezar la reproduccin.
Hay cinco elementos implicados en la produccin y visualizacin final de Real Audio o Vdeo:
Las herramientas y codificadores (1) que crean o capturan datos multimedia (2). Estos son transmitidos
usando servidores centrales (3) a lo largo de redes (4) hasta reproductores (5) en los ordenadores cliente,
tanto en directo como por peticin especfica.

Visto de otro modo:

RealSystem permite no slo transmitir vdeo o sonido, sino animacin vectorial (grficos, texto,
imgenes, etc.) y presentaciones sincronizadas. Se puede combinar con Flash (de Macromedia).
Adems el plug-in de RealNetworks no slo utiliza su formato propietario, sino que tambin
reproduce ficheros con formato SMIL (ver captulo de estndares).

6.10.5.

Vdeo Streaming

Real Networks fue pionero en streaming y ahora tiene competidores en Microsoft, Apple, etc. Streaming
es un mtodo de hacer que el vdeo, el audio y otros contenidos multimedia disponibles a travs de
Internet. La ventaja del streaming es que permite un acceso por demanda ms sensible a recursos
multimedia. A la hora de generar una reproduccin correcta, los datos de vdeo deben estar disponibles
en la secuencia correcta sin interrupcin. Hasta hace poco tiempo, el vdeo deba ser descargado
completamente para poder ser reproducido. Mediante streaming, el archivo permanece en el servidor. La
parte inicial se copia en un buffer y, tras un breve retardo, se comienza la reproduccin mientras se sigue
recibiendo el resto del archivo. Proporciona un mtodo firme para controlar la emisin por la interaccin
entre el servidor y el ordenador. El servidor regula el flujo segn la congestin de red y optimiza la
presentacin en el ordenador del receptor.
En la siguiente figura vemos una perspectiva global del proceso de streaming. En primer lugar, debemos
capturar los contenidos que vamos a emitir, bien mediante filmacin, contenido previamente grabado,
etc. Esos contenidos han de ser digitalizados y codificados en un formato que permita ser transmitido

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 60/65

Tema 6.- Vdeo.

mediante streaming. A continuacin, se depositarn los contenidos codificados en el servidor, que se


encargar de hacer llegar los contenidos a la audiencia.

Por qu es diferente el streaming de vdeo? Principalmente, las imgenes en movimiento son


generalmente usadas conjuntamente a otros recursos web tales como pginas web, transparencias y
debates. Cuando creamos vdeo para streaming, es importante optimizar el tamao del fichero con
respecto a la velocidad de conexin del usuario. Es posible crear archivos que se sirvan a diversas
velocidades. Para optimizar la grabacin, debemos codificarla, lo cual tiene un doble propsito:
compresin para entrega web y almacenamiento en un formato de vdeo adecuado. La forma de codificar
el vdeo depende de dos cuestiones principales:
1) Reproductor de medios a usar (p.ej., Windows Media Player, RealOne Media Player, etc)
2) Conexin a Internet disponible
La compresin es vital para emitir a travs de la web. Si el archivo es demasiado grande, la calidad de
imagen/sonido ser muy pobre. El tamao medio de vdeo digital es 4 MB por segundo en AVI, y pocos
ordenadores pueden recibir tal cantidad de datos. Con una conexin de 56 K se podra recibir alrededor
de 4 KBps, por lo que la compresin es necesaria. Durante la fase de codificacin existe la opcin de
especificar el tamao de la ventana de vdeo. Esto se puede hacer en fase de edicin. La siguiente
operacin a realizar es aplicar un cdec al vdeo/audio para reducir el tamao de datos a enviar. El
resultado habr que almacenarlo en un formato adecuado, como pueden ser QuickTime, RealVideo y
Windows Media. Por ejemplo, RealNetworks y Windows Media ofrecen la posibilidad de codificar para
mltiples velocidades de conexin.
A continuacin veremos los principales reproductores de medios:
RealNetworks: Sus productos son compatibles con SMIL (Synchronised Multimedia Integration
Language) y diseados para integrar varios tipos de contenidos en el reproductor. Ofrece un reproductor
bsico gratuito que da buen servicio en varios sistemas operativos. Puede hacer streaming de Windows
Media, RealVideo y QuickTime. Da una calidad excelente a velocidades de MODEM. Las caractersticas
avanzadas de codificacin son de pago.
WindowsMedia: Diseado para ser embebido y controlado desde otras fuentes como pginas HTML o
comandos Java/VBScript. Tiene la principal ventaja del control y enlace de fuentes de medios
compatibles con la web. Es gratuito y no tiene restricciones de uso. Las aplicaciones para codificar son de
fcil uso y manejo y tiene gran calidad de audio y vdeo a partir de 128 kbps. Como desventajas podemos
decir que ofrece baja calidad de audio en streaming de video a velocidad de MODEM, requiere del uso de
IE para ver medios embebidos, los streams solo se pueden ver en Windows o Macintosh, necesita un
plug-in para Netscape y un servidor Windows.
Apple QuickTime: Tiene la habilidad de mostrar varios medios sincronizados con su reproductor a travs
de SMIL y ser controlado externamente al ser embebidos en una pgina web, aunque no alcanza la misma
funcionalidad que el reproductor de RealNetworks ni el Windows Media Player. Calidad de vdeo muy

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 61/65

Tema 6.- Vdeo.

alta con una conexin a Internet rpida, reproduce una amplia gama de formatos, tiene soporte SMIL y
soporta panormicas de 360 y formatos de medios. Por el contrario, requiere la compra de un paquete
para hacer archivos MOV en PCs y da baja calidad por debajo de 1000Kbps al hacer streaming en tiempo
real.

Qu software servidor necesitamos?


Los formatos principales de streaming ofrecen software servidor que controla el acceso y la
distribuin. Este software necesitar ejecutarse en una plataforma servidora con el sistema operativo
apropiado.
Servidor RealNetwork
Es una plataforma muy estable, rpida y amigable. Tiene posibilidades de administracin remota y
es muy seguro. Soporta: Microsoft Windows NT/2K/XP/.NET, todo tipo de Linux, FreeBSD y Solaris. Es
de fcil instalacin y permite configurarse en algn servicio ya existente. Soporta streaming de
QuickTime tanto a nivel de archivo como en directo. Sin embargo es costoso. Formatos soportados:
Windows Media, QuickTime, RealVideo, MPEG-1, MPEG-2, MP3 y MPEG-4.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 62/65

Tema 6.- Vdeo.

Microsoft Windows Media Server:


A diferrencia de RealNetworks, no es un producto individual sino que viene dentro del servidor
W2000/.NET, por lo que slo se ejecuta sobre un Windows Server. Es capaz de manejar ms de 3000
usuarios por servidor sin coste de licencia. Es una plataforma rpida y eficiente aunque los archivos no
estn tan seguros.
Apple QuickTime Streaming Server / Darwin Streaming Server
Es una solucin basada en Macintosh, para los que ofrece un amplio rango de compatibilidad de ficheros
de streaming, incluyendo los estndares MOV, MP3, MPEG-4 y Shockwave Flash a ms de 4000 usuarios
por servidor. Tambin proporciona un servidor gratuito basado en PERL llamado Darwin para:
Red Hat Linux 7.1
Solaris 8 (SPARC)
Windows NT Server 4.0/Windows 2000 Server
Darwin no es muy amigable y su configuracin debe ser realizada mediante documentos de texto y
requiere de un administrador experto, aunque mantiene el amplio abanico de formatos de archivo
compatibles y ms de 2000 usuarios por servidor. Por debajo de 512 Kbps es inferior a los otros pero por
encima de 1000 kbps ofrece mayor calidad.

6.11. Herramientas para el tratamiento de vdeo


Adobe Premiere
El programa Adobe Premiere es una aplicacin muy interesante para la edicin de vdeo no lineal.
Sus potentes herramientas de edicin de audio y vdeo en tiempo real proporcionan un control preciso
sobre casi todos los aspectos de produccin. Este producto permite incorporar efectos especiales, edicin
basada en la lnea de tiempo, transiciones, captura de vdeo analgico y digital y mezclado de audio.
Desde el inicio podemos seleccionar las preferencias de nuestros proyectos, incluyendo la resolucin, la
compresin, FPS, calidad de audio, etc y podremos importar a nuestros proyectos clips, audio e
imgenes. Contiene mens contextuales para ajustar la transparencia, velocidad, etc de nuestros clips, as
como los efectos especiales de audio y vdeo. Nuestras composiciones pueden ser pre-visualizadas a
partir del momento actual de la lnea de tiempos. Podemos escalar las FPS para una mejor visualizacin
de nuestro proyecto, as como hacer zooms del mismo. Es compatible con un gran nmero de cmaras
DV y tambin acepta la mayora de formatos de vdeo comprimido, incluyendo mov, avi o mpeg.
Finalmente, tiene un amplio abanico de opciones de salida, desde guardarlo en disco hasta enviarlo a
nuestra cmara DV, exportarlo a formatos windows media, quicktime y real video, o enviarlo a un vdeo
a travs de la salida de TV.

Ulead MediaStudio Pro


MediaStudio Pro es una suite completa de vdeo digital que incluye herramientas para la captura de
vdeo, la edicin de audio y vdeo, creacin de ttulos y de DVDs. En tiempo real permite la captura de
contenidos MPEG, previsualizacin en cualquier formato y salida a televisin, cinta o DV. Permite la
edicin de MPEG nativo y el tratamiento de audio Dolby AC-3, as como integra los software grficos y
3D de Alead. El mdulo de creacin de DVD permite una solucin completa de DV a DVD, permitiendo
la creacin de contenidos para emisiones, cintas, Internet, CD y DVD.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 63/65

Tema 6.- Vdeo.

MediaStudio Pro 7

Premiere 6.5

Direct From Timeline

Render to File First

Real-time Preview
(System-Dependant)

Minimum 3 DV
Streams + 2 Graphics

Minimum 2 DV
Streams + 1
FX/Filter

Real-time Print to TV / Cam-Monitor

Direct From Timeline

Render to File First

113

75

57

74

2D, 3D, Cylinder,


Sphere

2D Only

Integrated

Separated Module

Systems / Format Supporting


Dual CPU Support
Dual head Display Card Support
Hyper-Threading-Ready
Optimized for Pentium 4 and AMD 3DNow!
DV with OHCI IEEE-1394 Support
Sony MICROMV Support
Dolby AC-3 Audio Support
Flash Format Support
Windows Media Format 9 Support
DV Type 1/Type2 for Capturing/Editing/Export
Support
Alternative DV Codec Support
Capturing
DV Album
Voice-Over Recording
MPEG-Direct Real-time Capture
DVD-VR Support
Direct Capture to WMV Format
Seamless Capture in FAT32 System
Split by Scene DV Capturing
Customized Capture Preset Template
Plug & Play Capture
Color Calibration During Capture
VBR/Field Based MPEG-2 Encoding
Editing
Summary Timeline

DV/MPEG Scene Detection


DV Type 1 & 2 Format Converting
Global Filter for All Project
Auto Slideshow
Key-Frameable Variable Speed
Performance / Complexity Indicator Bar
Non-square Pixel Rendering (16:9)
Video Server plug-in
DV SmartPlay
Rolling Credit
Title Animation / Title Effects
Multiple Key Frame Control
Extract Multiple Audio Track
Audio Mixer
Create File over 4G in FAT32 System
Effect
Real-time Transition Effect / Filter Preview
Number of Transition Effects
Number of Video Filters
Applying Video Filters to A Region of the Video Only
Moving Path Types
DVD/SVCD/VCD Authoring Integrated
Audio Editing Module
Video Centric Painting Module
Powerful Vector-Based Character Generation Module
Integrated with 3D Title Graphic Package

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 64/65

Tema 6.- Vdeo.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 65/65

También podría gustarte