Clase 1 PDF

LA SEÑAL DIGITAL DE VÍDEO
ING. MIGUEL OLIVARES MSC.

1. PRINCIPIOS BÁSICOS DE VÍDEO
• Una secuencia de vídeo es una sucesión de imágenes

que producen sensación de movimiento.
• El ojo humano ante una sucesión rápida de imágenes
tenemos la percepción de un movimiento continuo
(persistencia de la retina, físico y etimólogo inglés
Peter Mark Rogent (1779-1869)).
• Una cámara de cine/vídeo no es otra cosa que una
cámara de fotos que ”captura fotos muy rápido".
1. Principios Básicos de Vídeo
EJEMPLO
4 fotogramas de dibujos animados, los dibujos son también un

formato progresivo y en algunos casos en animación se usa una
velocidad de reproducción bastante inferior: 15 imágenes (o
fotogramas) por segundo. Aún así, como se puede apreciar, las
diferencias entre cuadro y cuadro son muy escasas.
La señal digital de vídeo EPV 2009 3

1. Principios Básicos de Vídeo
PRINCIPIOS BÁSICOS DE VÍDEO
• La imagen que percibimos está compuesta de ondas

electromagnéticas (λ: 250nm - 780nm).
– A diferentes longitudes de onda, diferentes sensaciones de color.
• El ojo es más sensible a unos colores que a otros.
• Los mecanismos de percepción visual humanos son
menos sensibles y estrictos que los auditivos.
• Ej.: Variaciones de frecuencia, supresión de imágenes, etc..
La señal digital de vídeo EPV 2009 4

2. CAPTURA DE LA IMAGEN
• La captura de la imagen mediante una cámara supone el primer paso
para el tratamiento de video digital.
• La cámara de video descompone la luz en sus tres colores primarios
(RGB), esta información es codificada y/o comprimida para su
almacenamiento en cinta, en disco de ordenador o para su
transmisión (y posterior visualización en un televisor)
DECODIFICADOR
SEPARADOR CODIFICADOR SEÑAL TUBO
PRIMARIOS IMAGEN
CODFICADA
R
B
2. Captura de la imagen
ADQUISICIÓN DE VIDEO
• Células fotosensibles que transforman la luz en impulsos eléctricos.
• Distintas tecnologías CCD y CMOS
• Resolución: 800.000 píxeles (muestras) a 3 millones.
• Iluminación mínima (lux rating, 1-5 lux).
• Relación de aspecto 4:3, 16:9, 1.85 (61:33)
• 1 ó 3 CCD’s (RGB) o (HSI), 4:3 16:9

FRECUENCIA DE MUESTREO
• La frecuencia con la que se captura una imagen de la

realidad varía de unos sistemas a otros.
• Principalmente las tasas de muestreo son:

• 24 cine digital
• 25 PAL
• 30 NTSC
• Otras variaciones.
ESCANEO PROGRESIVO
• En el escaneo progresiva en cada instante de tiempo se captura una imagen

completa, una fotografía.
• Es la estrategia utilizada en cine analógico y digital y en muchos formatos de HD.
EL CINE
• Es un formato "progresivo" Eso quiere decir que se pasa de una imagen a

otra rápidamente Vemos una imagen COMPLETA y, casi de inmediato, vemos
la siguiente..
• La sucesión de fotogramas se realiza a una cadencia de 24 fotogramas por
segundo, es decir, en un segundo pasan 24 imágenes con un intervalo de
oscuridad entre ellas. Si tenemos en cuenta que vemos 24 imágenes por
segundo, cada imagen se reproduce durante 0,04167 segundos.
• Esta sucesión de fotogramas, si bien produce una sensación de movimiento,
motiva un cierto parpadeo o centelleo perfectamente perceptible durante el
paso de una imagen clara y el intervalo de oscuridad.
• El parpadeo se evita aumentando la cadencia de las imágenes. El aumento
del número de fotogramas motivaría películas con rollos más largos y en
consecuencia, más caras.
EL CINE: PARPADEO
• Se recurre a la doble o triple obturación, es decir, cada fotograma se proyecta dos o

tres veces y por tanto, se duplica o triplica la cadencia. En otras palabras, el
parpadeo se elimina proyectando la película con una velocidad de proyección a 48
o 72 fotogramas por segundo.
• En un principio los proyectores eran del tipo 48 fotogramas por segundo (doble
obturación), pero se evidenció que con proyectores con elevada salida de luz se
apreciaba de forma considerable el parpadeo.
• A medida que la luminosidad de la pantalla se incrementa, la persistencia de la
retina disminuye y en consecuencia, resulta visible el parpadeo.
• Debido a estas circunstancia, en las salas de cine de gran luminosidad se utiliza la
triple obturación (72 fotogramas por segundo).
• En televisión, especialmente PAL, también ha ocurrido algo similar, ya que con las
pantallas de talla grande (superior a 70 cm) se aprecia un notable parpadeo, lo cual
se solventa a través de la técnica de los 100 Hz en Europa.
ESCANEO ENTRELAZADO
• En el escaneo entrelazado en cada instante de tiempo se captura una parte

de una imagen completa.
• Es la estrategia utilizada en televisión analógica, video analógico y video digital
SD.
ESCANEO ENTRELAZADO
• Si consideramos que una imagen se representa

mediante una matriz de puntos.
• El idea es capturar primero las filas pares y luego las
impares. A cada grupo de líneas, par o impar, se le
llama “campo”:
• El campo A o superior (Upper o Top en inglés) formado por
las líneas pares (Even en inglés) y
• el campo B, inferior o secundario (Lower o Bottom en
inglés) formado por las líneas impares (Odd en inglés)
EL ORIGEN DE VIDEO ENTRELAZADO ES LA TV
• La pantalla de un televisor no funciona como un proyector de cine,

que muestra imágenes "de golpe“ barrido entrelazado.
• Un televisor está dividido en líneas horizontales, 625 en televisores
PAL y 525 en televisores NTSC.
• Estas líneas no muestran todas a la vez un mismo fotograma, sino
que la imagen comienza a aparecer en las líneas superiores y
sucesivamente se van rellenando el resto hasta llegar a las líneas
más inferiores. Un único fotograma no es mostrado "de golpe",
sino de modo secuencial. Al igual que pasaba con el cine, este
proceso de actualización de líneas es tan rápido que, en principio, a
nuestro ojo le pasa desapercibido y lo percibimos todo como un
continuo.
TRAZADO DE LÍNEAS EN PANTALLA CRT

JUSTIFICACIÓN DEL VIDEO ENTRELAZADO
• Los primeros televisores hacían que cuando la imagen

actualizada llegaba a las últimas líneas (las inferiores)
la imagen de las líneas superiores comenzaba a
desvanecerse.
• La retina mantiene una imagen durante un tiempo
antes de que desaparezca (valor mínimo: 50 imag/s).
En caso de estar por debajo de ese valor se produce el
efecto de parpadeo de imagen (flicker).
LOS CAMPOS
• El "truco" está en dividir las líneas del televisor

en pares e impares. A cada grupo de líneas, par o
impar, se le llama "campo". Así tendríamos el
campo A o superior (Upper o Top en inglés)
formado por las líneas pares (Even en inglés) y el
campo B, inferior o secundario (Lower o Bottom
en inglés) formado por las líneas impares (Odd
en inglés)
• Primero se actualiza un grupo de líneas (campo)
y, acto seguido se actualiza el otro.
• Esto hace que el ancho de banda se reduzca a la
mitad
CONSECUENCIAS DEL ENTRELAZADO
• La primera consecuencia es que estamos dividiendo un único fotograma

en dos campos. Ya no vamos a tener 25 o 30 cps (cuadros por segundo,
PAL y NTSC) sino 50 o 60 semi-imágenes o, más correctamente, campos
por segundo.
• De ese modo, un único fotograma (fotografía, o dibujo en este caso), que
tiene un tamaño "completo" se dividiría en dos imágenes con la mitad de
líneas (la mitad de resolución vertical).
• Eso, en principio, no representaría problema alguno si no fuera porque
cada campo se corresponde a un momento distinto en el tiempo, de modo
que cada campo ofrece una imágen distinta
CAMPO A/B
CAMPO A/B
CONSECUENCIAS DEL ENTRELAZADO
• La segunda consecuencia es que trabajar con vídeo entrelazado no supone

problema alguno cuando el destino del vídeo sea un televisor, puesto que un
televisor analógico NECESITA vídeo entrelazado.
• Sin embargo, el monitor de nuestro ordenador funciona en modo progresivo, esto
es, mostrando imágenes "de golpe", igual que en el cine.
• Siempre que reproduzcamos vídeo entrelazado en un monitor lo veremos
"rayado", como en la imagen de arriba, ya que se sumarán los dos campos para
mostrar el vídeo con la resolución completa.
• Cuando una escena es estática, no hay cambios, ambos campos coinciden, o varían
mínimamente, y la reproducción parece correcta a nuestros ojos.
2. Digitalización
DIGITALIZACIÓN O CODIFICACIÓN
• Esta fase genérica se encarga de determinar la secuencia de matrices en el

formato inicial que permita la cámara, a partir de la información del CCD.
DECODIFICADOR
SEPARADOR CODIFICADOR SEÑAL TUBO
PRIMARIOS IMAGEN
CODFICADA
R
B
2. Digitalización
MUESTREO
• Lo primero es recoger la información de los ccd a intervalos regulares

(frecuencia de muestreo, 24,25p,30p 50i,60i), a este proceso se le denomina
muestreo
2. Digitalización
MUESTREO
• Para saber cuantas muestras deberemos obtener en cada

intervalo se debe conocer:
• Relación de aspecto.
• Aspecto del píxel.
• Resolución de la imagen.
• Estrategia utilizada progresivo o entrelazada.
• Cuantificación.
• Codificación.
• Estrategia de compresión.
2. Digitalización
• ITU-R (CCIR-601): Estándar para la digitalización de señales de TV.

• Define los parámetros de muestreo, cuantificación, barrido y resolución de
imagen que se deben tomar para digitalizar una señal de TV analógica.
• Parámetros de barrido:
• Dos formatos (NTSC y PAL/SECAM)
• 525 líneas y 858 muestras/línea - 30 frames/seg.
• 625 líneas y 864 muestras/línea - 25 frames/seg.
• Las muestras corresponden a la luminancia (Y): Intensidad de luz de cada

pixel (cantidad de blanco).
• Las diferencias de color Cr (U) y Cb (V) se muestrean a la mitad (429/línea,
432/línea): Sub-sampling 4:2:2.
24
2. Digitalización
• Cada línea tiene una zona visible (línea activa). Este estándar define una
línea activa de 720 pixels.
• Se define un número de líneas visibles por cuadro:
• 480 (NTSC), 576 (PAL/SECAM).
• Barrido entrelazado:
• Un cuadro (frame) está formado por dos campos:
• El primero con las líneas impares y el segundo con las pares.
Línea
completa
Tiempo
Línea activa
720 muestreos
• Frecuencia de muestreo única.

• 525x858x30* = 625x864x25 = 13,5 MHz. 25
2. Digitalización
• Codificación y recodificación.
• Cada muestra RGB se codifica con 24 bits/color.
• La conversión de RGB a YCbCr (YUV) se realiza mediante una matriz de
conversión (aproximada):
• Y = 0.3R + 0.6G + 0.1B
• U = B - Y (Diferencia de color azul) (equiv. Cb=U/2+128)
• V = R - Y (Diferencia de color rojo) (equiv. Cr=V/1.6+128)
• Cada uno de los componentes se codifica con 8 bits.
• Y (8 bits): rango 16-235
• Cb (8 bits) y Cr (8 bits): rango 16-240
720
720 360
480 480
o 480 o
576 o 576
R 576 Cb
G Y Cr
B
Subsampling 4:2:2 26
2. Digitalización
RESOLUCIÓN DE LA IMAGEN
• La resolución de la imagen es el número de pixeles verticales por el número de

pixeles horizontales.
2. Digitalización
RESOLUCIÓN DE LA IMAGEN
2. Digitalización
RELACIÓN DE ASPECTO
• La relación de aspecto de una imagen es un número que describe la forma del

fotograma. Dividiendo la anchura por la altura se obtiene la relación de
aspecto.
• No importa la unidad utilizada.
• También es posible expresar la relación como una proporción.
2. Digitalización
RELACIÓN DE ASPECTO
Academy (1.85:1) y Scope (2.35:1) comparado con 4:3 (1.33:1)

2.- Digitalización
ASPECTO DEL PIXEL
• Todos los monitores de ordenador y formatos gráficos

usan pixeles cuadrados, esto es misma distancia
horizontal que vertical.
• En cambio en algunos formatos de video digital el

aspecto del píxel no es cuadrado sino rectangular con
la finalidad de preservar la relación de aspecto.
2.- Digitalización
RELACIÓN DE ASPECTO Y ASPECTO DEL PÍXEL
• En una relación de aspecto de 4:3 (TV), si tenemos 576 líneas (pixeles

verticales) necesitamos 768 pixeles de anchura para mantener esa relación
con pixeles cuadrados.
• El formato DV PAL tiene 720 pixeles de anchura de los sólo aprovechamos

704 centrados (8 a cada lado para otro tipo de información) ocupando una
relación de aspecto de 4/3 de su altura.
• Para conseguir esto se establece una estrategia de aspecto de píxel

rectangular, pixeles bajos y anchos.
• La relación de aspecto actual de los pixeles son de 12:11 (1.09) DV PAL y de

10:11(0.9) DV NTSC
2.- Digitalización
RELACIÓN DE ASPECTO Y ASPECTO DEL PÍXEL

2.- Digitalización
CONVERSIÓN ENTRE RELACIONES DE ASPECTO
n Históricamente se han
planteado dos propuestas:
pan and scan y letterbox:
n Con pan y scan se pierde
información.
n Con letterbox se escala la
imagen para adecuarla a 4:3
perdiendo parte del encuadre.
n El proceso inverso es similar.
2.- Digitalización
CUANTIFICACIÓN
• Cada muestra se representa con gran precisión mediante un número

en un proceso que se denomina cuantificación.
• De esta forma una imagen monocromática estará formada por una
matriz rectangular de puntos en los que se almacena el brillo en
forma numérica.
• Los puntos se conocen como células de la imagen o píxeles.
• Si queremos representar una imagen en color , cada imagen se
compone de tres capas superpuestas de muestras una para cada
componente de color.
2.- Digitalización
PROFUNDIDAD DE LA IMAGEN
• El número de bits que hace falta para representar un

píxel de una imagen es la profundidad de la imagen y su
valor depende de la precisión con la que estemos
trabajando.
• Precisiones habituales es 8bits o 10bits por píxel si la

imagen es en tonos grises.
2.- Digitalización
CODIFICACIÓN RGB
• Cada muestra de la imagen lleva asociado tres valores

que indican la cantidad Rojo(R), Verde (G) y azul (B).
• Si tomamos 8 bits para representar el nivel de cada
componente de color obtendremos la máxima precisión
que el ojo humano es capaz de percibir.
• En este caso la profundidad de la imagen es 24 (3x8)bits
2.- Digitalización
CODIFICACIÓN RGB
• Cuando codificamos una imagen en RGB realizamos un

barrido de la pantalla (ccd’s) línea a línea, desde la
esquina inferior izquierda hasta la superior izquierda,
almacenando para cada píxel cada una de sus tres
componentes.
• Cuando la imagen tiene una profundidad de 16 bits se
almacena 2 bytes por píxel, de forma que se usan 5 bits
por componente de color y no se usa el último de los
bits.
CODIFICACIÓN: RGB
39
2.- Digitalización
CODIFICACIÓN YUV
• Durante las primeras décadas de la emisión de tv no se

emitía en color. Al llegar la tv en color no se podía pasar a
transmitir RGB (pese a que un tv tiene tres cañones uno
para cada uno). Para mantener los equipos de B&N, la
solución fue la codificación YUV.
• La conversión de RGB a YCbCr (YUV) se realiza mediante
una matriz de conversión (aproximada):
• Y = 0.3R + 0.6G + 0.1B
• U = B - Y (Diferencia de color azul) (equiv. Cb=U/2+128)
• V = R - Y (Diferencia de color rojo) (equiv. Cr=V/1.6+128)
CODIFICACIÓN: YCBCR
41
2.- Digitalización
CODIFICACIÓN YUV
n Debido a que el ojo humano es mas sensible a

los cambios de intensidad y menos sensible a
los cambios de crominancia, podemos codificar
la imagen tomando menos información de
crominancia de la que en principio nos ofrece la
conversión vista.
n De esta forma podemos plantear las siguientes
codificaciones:
n 4:2:0
n 4:2:2
n 4:4:4
2.- Digitalización
CODIFICACIÓN YUV
• El esquema de codificación YUV se muestra como una relación de 3

números 4:4:4, donde:
• Y o Luma horizontal muestreo.
• Cr o U factor horizontal (relativo al primer dígito)
• Cb o V factor horizontal (relativo al primer dígito), excepto cuando es cero, que
indica que el factor horizontal es igual al segundo dígito y además Cr y Cb se
codifican 2:1 verticalmente.
43
2.- Digitalización
CODIFICACIÓN YUV/SUBSAMPLING
CODIFICACIÓN: Y SUBSAMPLING (I)
CODIFICACIÓN: Y SUBSAMPLING X2 (II)
46
CODIFICACIÓN: Y SUBSAMPLING X4 (III)
CODIFICACIÓN: Y SUBSAMPLING X8 (IV)
CODIFICACIÓN: CBCR SUBSAMPLING (V)
CODIFICACIÓN: CBCR SUBSAMPLING X2 (VI)
CODIFICACIÓN: CBCR SUBSAMPLING X4 (VII)
CODIFICACIÓN: CBCR SUBSAMPLING X8 (VIII)
CINTAS DV

Clase 1 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clase 1 PDF

Cargado por

Copyright:

Formatos disponibles

LA SEÑAL DIGITAL DE VÍDEO

ING. MIGUEL OLIVARES MSC.

• Una secuencia de vídeo es una sucesión de imágenes

4 fotogramas de dibujos animados, los dibujos son también un

La señal digital de vídeo EPV 2009 3

PRINCIPIOS BÁSICOS DE VÍDEO

• La imagen que percibimos está compuesta de ondas

La señal digital de vídeo EPV 2009 4

• Células fotosensibles que transforman la luz en impulsos eléctricos.

• Distintas tecnologías CCD y CMOS

• Resolución: 800.000 píxeles (muestras) a 3 millones.

• Iluminación mínima (lux rating, 1-5 lux).

• Relación de aspecto 4:3, 16:9, 1.85 (61:33)

• 1 ó 3 CCD’s (RGB) o (HSI), 4:3 16:9

• La frecuencia con la que se captura una imagen de la

• Principalmente las tasas de muestreo son:

• En el escaneo progresiva en cada instante de tiempo se captura una imagen

• Es un formato "progresivo" Eso quiere decir que se pasa de una imagen a

• Se recurre a la doble o triple obturación, es decir, cada fotograma se proyecta dos o

• En el escaneo entrelazado en cada instante de tiempo se captura una parte

• Si consideramos que una imagen se representa

EL ORIGEN DE VIDEO ENTRELAZADO ES LA TV

• La pantalla de un televisor no funciona como un proyector de cine,

TRAZADO DE LÍNEAS EN PANTALLA CRT

JUSTIFICACIÓN DEL VIDEO ENTRELAZADO

• Los primeros televisores hacían que cuando la imagen

• El "truco" está en dividir las líneas del televisor

CONSECUENCIAS DEL ENTRELAZADO

• La primera consecuencia es que estamos dividiendo un único fotograma

CONSECUENCIAS DEL ENTRELAZADO

• La segunda consecuencia es que trabajar con vídeo entrelazado no supone

• Esta fase genérica se encarga de determinar la secuencia de matrices en el

• Lo primero es recoger la información de los ccd a intervalos regulares

• Para saber cuantas muestras deberemos obtener en cada

• ITU-R (CCIR-601): Estándar para la digitalización de señales de TV.

• Las muestras corresponden a la luminancia (Y): Intensidad de luz de cada

• Frecuencia de muestreo única.

• La resolución de la imagen es el número de pixeles verticales por el número de

• La relación de aspecto de una imagen es un número que describe la forma del

Academy (1.85:1) y Scope (2.35:1) comparado con 4:3 (1.33:1)

ASPECTO DEL PIXEL

• Todos los monitores de ordenador y formatos gráficos

• En cambio en algunos formatos de video digital el

RELACIÓN DE ASPECTO Y ASPECTO DEL PÍXEL

• En una relación de aspecto de 4:3 (TV), si tenemos 576 líneas (pixeles

• El formato DV PAL tiene 720 pixeles de anchura de los sólo aprovechamos

• Para conseguir esto se establece una estrategia de aspecto de píxel

• La relación de aspecto actual de los pixeles son de 12:11 (1.09) DV PAL y de

RELACIÓN DE ASPECTO Y ASPECTO DEL PÍXEL

CONVERSIÓN ENTRE RELACIONES DE ASPECTO

• Cada muestra se representa con gran precisión mediante un número

• El número de bits que hace falta para representar un

• Precisiones habituales es 8bits o 10bits por píxel si la

• Cada muestra de la imagen lleva asociado tres valores

• Cuando codificamos una imagen en RGB realizamos un

• Durante las primeras décadas de la emisión de tv no se

n Debido a que el ojo humano es mas sensible a

• El esquema de codificación YUV se muestra como una relación de 3

También podría gustarte