Está en la página 1de 54

LA SEÑAL DIGITAL DE VÍDEO

ING. MIGUEL OLIVARES MSC.


1. PRINCIPIOS BÁSICOS DE VÍDEO

• Una secuencia de vídeo es una sucesión de imágenes


que producen sensación de movimiento.
• El ojo humano ante una sucesión rápida de imágenes
tenemos la percepción de un movimiento continuo
(persistencia de la retina, físico y etimólogo inglés
Peter Mark Rogent (1779-1869)).
• Una cámara de cine/vídeo no es otra cosa que una
cámara de fotos que ”captura fotos muy rápido".
1. Principios Básicos de Vídeo

EJEMPLO

4 fotogramas de dibujos animados, los dibujos son también un


formato progresivo y en algunos casos en animación se usa una
velocidad de reproducción bastante inferior: 15 imágenes (o
fotogramas) por segundo. Aún así, como se puede apreciar, las
diferencias entre cuadro y cuadro son muy escasas.

La señal digital de vídeo EPV 2009 3


1. Principios Básicos de Vídeo

PRINCIPIOS BÁSICOS DE VÍDEO

• La imagen que percibimos está compuesta de ondas


electromagnéticas (λ: 250nm - 780nm).
– A diferentes longitudes de onda, diferentes sensaciones de color.
• El ojo es más sensible a unos colores que a otros.
• Los mecanismos de percepción visual humanos son
menos sensibles y estrictos que los auditivos.
• Ej.: Variaciones de frecuencia, supresión de imágenes, etc..

La señal digital de vídeo EPV 2009 4


2. CAPTURA DE LA IMAGEN
• La captura de la imagen mediante una cámara supone el primer paso
para el tratamiento de video digital.
• La cámara de video descompone la luz en sus tres colores primarios
(RGB), esta información es codificada y/o comprimida para su
almacenamiento en cinta, en disco de ordenador o para su
transmisión (y posterior visualización en un televisor)

DECODIFICADOR
SEPARADOR CODIFICADOR SEÑAL TUBO
PRIMARIOS IMAGEN
CODFICADA
R

B
2. Captura de la imagen

ADQUISICIÓN DE VIDEO

• Células fotosensibles que transforman la luz en impulsos eléctricos.

• Distintas tecnologías CCD y CMOS

• Resolución: 800.000 píxeles (muestras) a 3 millones.

• Iluminación mínima (lux rating, 1-5 lux).

• Relación de aspecto 4:3, 16:9, 1.85 (61:33)

• 1 ó 3 CCD’s (RGB) o (HSI), 4:3 16:9


2. Captura de la imagen

FRECUENCIA DE MUESTREO

• La frecuencia con la que se captura una imagen de la


realidad varía de unos sistemas a otros.

• Principalmente las tasas de muestreo son:


• 24 cine digital
• 25 PAL
• 30 NTSC
• Otras variaciones.
2. Captura de la imagen

ESCANEO PROGRESIVO

• En el escaneo progresiva en cada instante de tiempo se captura una imagen


completa, una fotografía.
• Es la estrategia utilizada en cine analógico y digital y en muchos formatos de HD.
2. Captura de la imagen

EL CINE

• Es un formato "progresivo" Eso quiere decir que se pasa de una imagen a


otra rápidamente Vemos una imagen COMPLETA y, casi de inmediato, vemos
la siguiente..
• La sucesión de fotogramas se realiza a una cadencia de 24 fotogramas por
segundo, es decir, en un segundo pasan 24 imágenes con un intervalo de
oscuridad entre ellas. Si tenemos en cuenta que vemos 24 imágenes por
segundo, cada imagen se reproduce durante 0,04167 segundos.
• Esta sucesión de fotogramas, si bien produce una sensación de movimiento,
motiva un cierto parpadeo o centelleo perfectamente perceptible durante el
paso de una imagen clara y el intervalo de oscuridad.
• El parpadeo se evita aumentando la cadencia de las imágenes. El aumento
del número de fotogramas motivaría películas con rollos más largos y en
consecuencia, más caras.
EL CINE: PARPADEO

• Se recurre a la doble o triple obturación, es decir, cada fotograma se proyecta dos o


tres veces y por tanto, se duplica o triplica la cadencia. En otras palabras, el
parpadeo se elimina proyectando la película con una velocidad de proyección a 48
o 72 fotogramas por segundo.
• En un principio los proyectores eran del tipo 48 fotogramas por segundo (doble
obturación), pero se evidenció que con proyectores con elevada salida de luz se
apreciaba de forma considerable el parpadeo.
• A medida que la luminosidad de la pantalla se incrementa, la persistencia de la
retina disminuye y en consecuencia, resulta visible el parpadeo.
• Debido a estas circunstancia, en las salas de cine de gran luminosidad se utiliza la
triple obturación (72 fotogramas por segundo).
• En televisión, especialmente PAL, también ha ocurrido algo similar, ya que con las
pantallas de talla grande (superior a 70 cm) se aprecia un notable parpadeo, lo cual
se solventa a través de la técnica de los 100 Hz en Europa.
2. Captura de la imagen

ESCANEO ENTRELAZADO

• En el escaneo entrelazado en cada instante de tiempo se captura una parte


de una imagen completa.
• Es la estrategia utilizada en televisión analógica, video analógico y video digital
SD.
2. Captura de la imagen

ESCANEO ENTRELAZADO

• Si consideramos que una imagen se representa


mediante una matriz de puntos.
• El idea es capturar primero las filas pares y luego las
impares. A cada grupo de líneas, par o impar, se le
llama “campo”:
• El campo A o superior (Upper o Top en inglés) formado por
las líneas pares (Even en inglés) y
• el campo B, inferior o secundario (Lower o Bottom en
inglés) formado por las líneas impares (Odd en inglés)
2. Captura de la imagen

EL ORIGEN DE VIDEO ENTRELAZADO ES LA TV

• La pantalla de un televisor no funciona como un proyector de cine,


que muestra imágenes "de golpe“ barrido entrelazado.
• Un televisor está dividido en líneas horizontales, 625 en televisores
PAL y 525 en televisores NTSC.
• Estas líneas no muestran todas a la vez un mismo fotograma, sino
que la imagen comienza a aparecer en las líneas superiores y
sucesivamente se van rellenando el resto hasta llegar a las líneas
más inferiores. Un único fotograma no es mostrado "de golpe",
sino de modo secuencial. Al igual que pasaba con el cine, este
proceso de actualización de líneas es tan rápido que, en principio, a
nuestro ojo le pasa desapercibido y lo percibimos todo como un
continuo.
2. Captura de la imagen

TRAZADO DE LÍNEAS EN PANTALLA CRT


2. Captura de la imagen

JUSTIFICACIÓN DEL VIDEO ENTRELAZADO

• Los primeros televisores hacían que cuando la imagen


actualizada llegaba a las últimas líneas (las inferiores)
la imagen de las líneas superiores comenzaba a
desvanecerse.
• La retina mantiene una imagen durante un tiempo
antes de que desaparezca (valor mínimo: 50 imag/s).
En caso de estar por debajo de ese valor se produce el
efecto de parpadeo de imagen (flicker).
2. Captura de la imagen

LOS CAMPOS

• El "truco" está en dividir las líneas del televisor


en pares e impares. A cada grupo de líneas, par o
impar, se le llama "campo". Así tendríamos el
campo A o superior (Upper o Top en inglés)
formado por las líneas pares (Even en inglés) y el
campo B, inferior o secundario (Lower o Bottom
en inglés) formado por las líneas impares (Odd
en inglés)
• Primero se actualiza un grupo de líneas (campo)
y, acto seguido se actualiza el otro.
• Esto hace que el ancho de banda se reduzca a la
mitad
2. Captura de la imagen

CONSECUENCIAS DEL ENTRELAZADO

• La primera consecuencia es que estamos dividiendo un único fotograma


en dos campos. Ya no vamos a tener 25 o 30 cps (cuadros por segundo,
PAL y NTSC) sino 50 o 60 semi-imágenes o, más correctamente, campos
por segundo.
• De ese modo, un único fotograma (fotografía, o dibujo en este caso), que
tiene un tamaño "completo" se dividiría en dos imágenes con la mitad de
líneas (la mitad de resolución vertical).
• Eso, en principio, no representaría problema alguno si no fuera porque
cada campo se corresponde a un momento distinto en el tiempo, de modo
que cada campo ofrece una imágen distinta
2. Captura de la imagen

CAMPO A/B
CAMPO A/B
2. Captura de la imagen

CONSECUENCIAS DEL ENTRELAZADO

• La segunda consecuencia es que trabajar con vídeo entrelazado no supone


problema alguno cuando el destino del vídeo sea un televisor, puesto que un
televisor analógico NECESITA vídeo entrelazado.
• Sin embargo, el monitor de nuestro ordenador funciona en modo progresivo, esto
es, mostrando imágenes "de golpe", igual que en el cine.
• Siempre que reproduzcamos vídeo entrelazado en un monitor lo veremos
"rayado", como en la imagen de arriba, ya que se sumarán los dos campos para
mostrar el vídeo con la resolución completa.
• Cuando una escena es estática, no hay cambios, ambos campos coinciden, o varían
mínimamente, y la reproducción parece correcta a nuestros ojos.
2. Digitalización

DIGITALIZACIÓN O CODIFICACIÓN

• Esta fase genérica se encarga de determinar la secuencia de matrices en el


formato inicial que permita la cámara, a partir de la información del CCD.

DECODIFICADOR
SEPARADOR CODIFICADOR SEÑAL TUBO
PRIMARIOS IMAGEN
CODFICADA
R

B
2. Digitalización

MUESTREO

• Lo primero es recoger la información de los ccd a intervalos regulares


(frecuencia de muestreo, 24,25p,30p 50i,60i), a este proceso se le denomina
muestreo
2. Digitalización

MUESTREO

• Para saber cuantas muestras deberemos obtener en cada


intervalo se debe conocer:
• Relación de aspecto.
• Aspecto del píxel.
• Resolución de la imagen.
• Estrategia utilizada progresivo o entrelazada.
• Cuantificación.
• Codificación.
• Estrategia de compresión.
2. Digitalización

• ITU-R (CCIR-601): Estándar para la digitalización de señales de TV.


• Define los parámetros de muestreo, cuantificación, barrido y resolución de
imagen que se deben tomar para digitalizar una señal de TV analógica.

• Parámetros de barrido:
• Dos formatos (NTSC y PAL/SECAM)
• 525 líneas y 858 muestras/línea - 30 frames/seg.
• 625 líneas y 864 muestras/línea - 25 frames/seg.

• Las muestras corresponden a la luminancia (Y): Intensidad de luz de cada


pixel (cantidad de blanco).
• Las diferencias de color Cr (U) y Cb (V) se muestrean a la mitad (429/línea,
432/línea): Sub-sampling 4:2:2.
24
2. Digitalización

• Cada línea tiene una zona visible (línea activa). Este estándar define una
línea activa de 720 pixels.
• Se define un número de líneas visibles por cuadro:
• 480 (NTSC), 576 (PAL/SECAM).

• Barrido entrelazado:
• Un cuadro (frame) está formado por dos campos:
• El primero con las líneas impares y el segundo con las pares.

Línea
completa
Tiempo

Línea activa
720 muestreos

• Frecuencia de muestreo única.


• 525x858x30* = 625x864x25 = 13,5 MHz. 25
2. Digitalización

• Codificación y recodificación.
• Cada muestra RGB se codifica con 24 bits/color.
• La conversión de RGB a YCbCr (YUV) se realiza mediante una matriz de
conversión (aproximada):
• Y = 0.3R + 0.6G + 0.1B
• U = B - Y (Diferencia de color azul) (equiv. Cb=U/2+128)
• V = R - Y (Diferencia de color rojo) (equiv. Cr=V/1.6+128)
• Cada uno de los componentes se codifica con 8 bits.
• Y (8 bits): rango 16-235
• Cb (8 bits) y Cr (8 bits): rango 16-240
720
720 360

480 480
o 480 o
576 o 576
R 576 Cb
G Y Cr
B
Subsampling 4:2:2 26
2. Digitalización

RESOLUCIÓN DE LA IMAGEN

• La resolución de la imagen es el número de pixeles verticales por el número de


pixeles horizontales.
2. Digitalización

RESOLUCIÓN DE LA IMAGEN
2. Digitalización

RELACIÓN DE ASPECTO

• La relación de aspecto de una imagen es un número que describe la forma del


fotograma. Dividiendo la anchura por la altura se obtiene la relación de
aspecto.
• No importa la unidad utilizada.
• También es posible expresar la relación como una proporción.
2. Digitalización

RELACIÓN DE ASPECTO

Academy (1.85:1) y Scope (2.35:1) comparado con 4:3 (1.33:1)


2.- Digitalización

ASPECTO DEL PIXEL

• Todos los monitores de ordenador y formatos gráficos


usan pixeles cuadrados, esto es misma distancia
horizontal que vertical.

• En cambio en algunos formatos de video digital el


aspecto del píxel no es cuadrado sino rectangular con
la finalidad de preservar la relación de aspecto.
2.- Digitalización

RELACIÓN DE ASPECTO Y ASPECTO DEL PÍXEL

• En una relación de aspecto de 4:3 (TV), si tenemos 576 líneas (pixeles


verticales) necesitamos 768 pixeles de anchura para mantener esa relación
con pixeles cuadrados.

• El formato DV PAL tiene 720 pixeles de anchura de los sólo aprovechamos


704 centrados (8 a cada lado para otro tipo de información) ocupando una
relación de aspecto de 4/3 de su altura.

• Para conseguir esto se establece una estrategia de aspecto de píxel


rectangular, pixeles bajos y anchos.

• La relación de aspecto actual de los pixeles son de 12:11 (1.09) DV PAL y de


10:11(0.9) DV NTSC
2.- Digitalización

RELACIÓN DE ASPECTO Y ASPECTO DEL PÍXEL


2.- Digitalización

CONVERSIÓN ENTRE RELACIONES DE ASPECTO

n Históricamente se han
planteado dos propuestas:
pan and scan y letterbox:
n Con pan y scan se pierde
información.
n Con letterbox se escala la
imagen para adecuarla a 4:3
perdiendo parte del encuadre.
n El proceso inverso es similar.
2.- Digitalización

CUANTIFICACIÓN

• Cada muestra se representa con gran precisión mediante un número


en un proceso que se denomina cuantificación.
• De esta forma una imagen monocromática estará formada por una
matriz rectangular de puntos en los que se almacena el brillo en
forma numérica.
• Los puntos se conocen como células de la imagen o píxeles.
• Si queremos representar una imagen en color , cada imagen se
compone de tres capas superpuestas de muestras una para cada
componente de color.
2.- Digitalización

PROFUNDIDAD DE LA IMAGEN

• El número de bits que hace falta para representar un


píxel de una imagen es la profundidad de la imagen y su
valor depende de la precisión con la que estemos
trabajando.

• Precisiones habituales es 8bits o 10bits por píxel si la


imagen es en tonos grises.
2.- Digitalización

CODIFICACIÓN RGB

• Cada muestra de la imagen lleva asociado tres valores


que indican la cantidad Rojo(R), Verde (G) y azul (B).
• Si tomamos 8 bits para representar el nivel de cada
componente de color obtendremos la máxima precisión
que el ojo humano es capaz de percibir.
• En este caso la profundidad de la imagen es 24 (3x8)bits
2.- Digitalización

CODIFICACIÓN RGB

• Cuando codificamos una imagen en RGB realizamos un


barrido de la pantalla (ccd’s) línea a línea, desde la
esquina inferior izquierda hasta la superior izquierda,
almacenando para cada píxel cada una de sus tres
componentes.
• Cuando la imagen tiene una profundidad de 16 bits se
almacena 2 bytes por píxel, de forma que se usan 5 bits
por componente de color y no se usa el último de los
bits.
CODIFICACIÓN: RGB

39
2.- Digitalización

CODIFICACIÓN YUV

• Durante las primeras décadas de la emisión de tv no se


emitía en color. Al llegar la tv en color no se podía pasar a
transmitir RGB (pese a que un tv tiene tres cañones uno
para cada uno). Para mantener los equipos de B&N, la
solución fue la codificación YUV.
• La conversión de RGB a YCbCr (YUV) se realiza mediante
una matriz de conversión (aproximada):
• Y = 0.3R + 0.6G + 0.1B
• U = B - Y (Diferencia de color azul) (equiv. Cb=U/2+128)
• V = R - Y (Diferencia de color rojo) (equiv. Cr=V/1.6+128)
CODIFICACIÓN: YCBCR

41
2.- Digitalización

CODIFICACIÓN YUV

n Debido a que el ojo humano es mas sensible a


los cambios de intensidad y menos sensible a
los cambios de crominancia, podemos codificar
la imagen tomando menos información de
crominancia de la que en principio nos ofrece la
conversión vista.
n De esta forma podemos plantear las siguientes
codificaciones:
n 4:2:0
n 4:2:2
n 4:4:4
2.- Digitalización

CODIFICACIÓN YUV

• El esquema de codificación YUV se muestra como una relación de 3


números 4:4:4, donde:
• Y o Luma horizontal muestreo.
• Cr o U factor horizontal (relativo al primer dígito)
• Cb o V factor horizontal (relativo al primer dígito), excepto cuando es cero, que
indica que el factor horizontal es igual al segundo dígito y además Cr y Cb se
codifican 2:1 verticalmente.

43
2.- Digitalización

CODIFICACIÓN YUV/SUBSAMPLING
CODIFICACIÓN: Y SUBSAMPLING (I)
CODIFICACIÓN: Y SUBSAMPLING X2 (II)

46
CODIFICACIÓN: Y SUBSAMPLING X4 (III)
CODIFICACIÓN: Y SUBSAMPLING X8 (IV)
CODIFICACIÓN: CBCR SUBSAMPLING (V)
CODIFICACIÓN: CBCR SUBSAMPLING X2 (VI)
CODIFICACIÓN: CBCR SUBSAMPLING X4 (VII)
CODIFICACIÓN: CBCR SUBSAMPLING X8 (VIII)
CINTAS DV

También podría gustarte