Documentos de Académico
Documentos de Profesional
Documentos de Cultura
T4 Video
T4 Video
de vídeo.
1. Introducción. Bibliografía
2. Características del vídeo. [FLU95] Fluckiger, “Understanding
networked multimedia”
Captura de vídeo analógico.
[TSU99] Introduction to video coding
Digitalización.
standards for multimedia communication
Tipos de vídeo (según su calidad). [H.264] Overview of the H.264 / AVC Video
Parámetros específicos de red. Coding Standard
3. Compresión de vídeo. [MPEG4] MPEG-4 Overview
Redundancia temporal. [HiJa94] Compressing still and moving
Estimación de movimiento. images with wavelets
Estándares: MPEG y H.261.
4. Conclusiones.
2
2.1 Captura de vídeo analógico I
Arquitecturas de red para la distribución de contenidos
Lentes t
483
3
2.1 Captura de vídeo analógico II
Arquitecturas de red para la distribución de contenidos
Y: Luminancia (intensidad).
Placa de U y V: Diferencias de color.
Filtros barrido
a El ojo humano es más sensible a
R
Lentes la intensidad (brillo) que a la
G a t información de color (sub-
sampling).
B a
t
Divisor
t TV Color
R
Y+C Demod. G CRT
Y Conv. B
R U
Cámara G C
B V
TV B&W
Codificador Modulador Y+C Y
Filtro CRT
4
2.1 Captura de vídeo analógico III
Arquitecturas de red para la distribución de contenidos
Parámetros de barrido:
Relación de aspecto (ancho:alto): 4:3
Existen distintos estándares:
NTSC (Usa y Japón): 525 líneas, 30 frames/s
PAL/SECAM (Resto): 625 líneas, 25 frames/s.
Algunas líneas (superiores e inferiores) no son visibles.
5
2.1 Captura de vídeo analógico IV
Arquitecturas de red para la distribución de contenidos
Continuidad de movimiento.
Viene determinada por el número de cuadros diferentes por
segundo.
No se recomienda utilizar menos de 25 cuadros/s.
6
2.2 Digitalización I
Arquitecturas de red para la distribución de contenidos
Parámetros de barrido:
Dos formatos (NTSC y PAL/SECAM)
525 líneas y 858 muestras/línea - 30
frames/seg.
625 líneas y 864 muestras/línea - 25
frames/seg.
Las muestras corresponden a la
luminancia (Y): Intensidad de luz de
cada pixel (cantidad de blanco).
Las diferencias de color Cr (U) y Cb (V)
se muestrean a la mitad (429/línea,
432/línea): Sub-sampling 4:2:2. 7
2.2 Digitalización III
Arquitecturas de red para la distribución de contenidos
Codificación y recodificación.
Cada muestra RGB se codifica con 24 bits/color.
La conversión de RGB a YCbCr (YUV) se realiza mediante una matriz
de conversión (aproximada):
Y = 0.3R + 0.6G + 0.1B
U = B - Y (Diferencia de color azul) (equiv. Cb=U/2+128)
V = R - Y (Diferencia de color rojo) (equiv. Cr=V/1.6+128)
Cada uno de los componentes se codifica con 8 bits.
Y (8 bits): rango 16-235
Cb (8 bits) y Cr (8 bits): rango 16-240
720
720 360
480 480
o 480 o
576 o 576
R 576 Cb
G Y Cr
B
Subsampling 4:2:2
9
2.2 Digitalización III
Arquitecturas de red para la distribución de contenidos
Formatos de codificación
CIF (Common Intermediate Format) Usado
para estandarizar las resoluciones horizontal y
vertical en píxels de secuencias de vídeo en
componentes YCbCr.
Se diseñó para convertir fácilmente PAL ↔ NTSC y
se propuso inicialmente en el estándard H.261.
Define una secuencia de vídeo con resolución de
352x288 (HxV) y una frecuencia de cuadro de
aproximadamente 29.97 cuadros/seg con
codificación de color YCbCr 4:2:0.
10
2.2 Digitalización III
Arquitecturas de red para la distribución de contenidos
Formatos de codificación
Todos los formatos XCIF resultan en imágenes con
relación de aspecto 4:3
11
Arquitecturas de red para la distribución de contenidos
2.2 Digitalización III
12
2.2 Digitalización III
Arquitecturas de red para la distribución de contenidos
Beyond HD
4K significa algo diferente si
se trata del televisor en tu
casa o en un proyector en un
cine.
4K es una resolución
horizontal de 4,096 pixeles,
establecida por Digital Cinema
Initiatives (DCI)
La resolución vertical en 4K
(Cinema 4K) no se especifica
-> 4K no es UHD
14
Tem a 4: Codificación y com presión
de vídeo.
1. Introducción. Bibliografía
2. Características del vídeo.
[FLU95] Fluckiger, “Understanding
networked multimedia”
Captura de vídeo analógico. [TSU99] Introduction to video coding
Digitalización. standards for multimedia communication
Tipos de vídeo (según su calidad). [H.264] Overview of the H.264 / AVC Video
Coding Standard
Parámetros específicos de red. [MPEG4] MPEG-4 Overview
3. Compresión de vídeo. [HiJa94] Compressing still and moving
images with wavelets
Redundancia temporal.
Estimación de movimiento.
Estándares: MPEG y H.261.
4. Conclusiones.
16
2.4 Tipos de vídeo (según su calidad) II
Arquitecturas de red para la distribución de contenidos
Videoconferencia (Low-speed).
Tasas de bits pequeñas (alrededor de 128 Kbps)
Resolución de imagen 4 veces inferior al vídeo digital.
ITU-TS H.261: Common Intermediate Format (CIF) 352x288
La secuencia de cuadros/s se reduce entre 5 y 10.
17
Tem a 4: Codificación y com presión
de vídeo.
1. Introducción. Bibliografía
2. Características del vídeo.
[FLU95] Fluckiger, “Understanding
networked multimedia”
Captura de vídeo analógico. [TSU99] Introduction to video coding
Digitalización. standards for multimedia communication
Tipos de vídeo (según su calidad). [H.264] Overview of the H.264 / AVC Video
Coding Standard
Parámetros específicos de red. [MPEG4] MPEG-4 Overview
3. Compresión de vídeo. [HiJa94] Compressing still and moving
images with wavelets
Redundancia temporal.
Estimación de movimiento.
Estándares: MPEG y H.261.
4. Conclusiones.
Tasa de bits.
19
2.5 Parámetros específicos de red II
Arquitecturas de red para la distribución de contenidos
20
2.5 Parámetros específicos de red III
Arquitecturas de red para la distribución de contenidos
Tasa de error.
El vídeo comprimido es más sensible a los errores.
La degradación de la calidad de vídeo percibida depende:
BER (Bit Error Rate) de la red. Número de errores de bit por unidad de
tiempo
Del tipo de error (simple, ráfaga, bloque, etc.)
Donde se produce ese error.
El índice de compresión de vídeo.
Mecanismos de recuperación ante errores:
Técnicas de protección de la señal.
– FEC (Forward Correction Codes).
– Marcas de resincronización.
– Reversible VLC.
– Técnicas de paquetización.
Ocultación de errores (error concealment)
– Cuando se pierden bloques o llegan demasiado tarde.
– Técnicas de extrapolación e interpolación de cuadros.
21
Tem a 4: Codificación y com presión
de vídeo.
1. Introducción. Bibliografía
2. Características del vídeo.
[FLU95] Fluckiger, “Understanding
networked multimedia”
Captura de vídeo analógico. [TSU99] Introduction to video coding
Digitalización. standards for multimedia communication
Tipos de vídeo (según su calidad). [H.264] Overview of the H.264 / AVC Video
Parámetros específicos de red. Coding Standard
[MPEG4] MPEG-4 Overview
3. Compresión de vídeo. [HiJa94] Compressing still and moving
images with wavelets
Redundancia temporal.
Estimación de movimiento.
Estándares: MPEG y H.261.
4. Conclusiones.
23
Redundancia temporal (MPEG-1)
Arquitecturas de red para la distribución de contenidos
F1 F2 F3
24
Redundancia temporal (MPEG-1)
Arquitecturas de red para la distribución de contenidos
Vector de movimiento
Cuadro de referencia Δx = -20, Δy = 0
Macrobloques
idénticos
F1 F2
25
Redundancia temporal (MPEG-1)
Arquitecturas de red para la distribución de contenidos
Búsqueda de macrobloques.
Se buscan los macrobloques del cuadro a codificar en el cuadro de
referencia.
Si se encuentra el mismo macrobloque, sólo se codifica el vector de
movimiento correspondiente.
Si no se encuentra exactamente el mismo se elige el más parecido
(macrobloque INTER).
Se codifica el vector de movimiento.
Se calcula el macrobloque error (las diferencias) aplicándole codificación
estilo JPEG (DCT, quant, RLE+VLC en zigzag).
Si no se encuentra ningún bloque similar (mb. INTRA)
Se codifica dicho macrobloque con codificación estilo JPEG.
26
Redundancia temporal (MPEG-1)
Arquitecturas de red para la distribución de contenidos
Tipos de cuadros
I (Intracoded frames): Cuadro codificado usando JPEG
(autocontenido).
P (Predictive frames): Cuadro basado en las diferencias
respecto a un cuadro de referencia anterior (tipo I).
B (Bidirectional frames): Cuadros basados en la interpolación
de un cuadro anterior y otro posterior en la secuencia (tipo I
o P).
F1 Macrobloque F2 F3
encontrado!! Macrobloque
encontrado!!
27
Redundancia temporal (MPEG-1)
Arquitecturas de red para la distribución de contenidos
I B B P B B P B B I
28
Redundancia temporal (MPEG-1)
Arquitecturas de red para la distribución de contenidos
29
Tem a 4: Codificación y com presión
de vídeo.
1. Introducción. Bibliografía
2. Características del vídeo.
[FLU95] Fluckiger, “Understanding
networked multimedia”
Captura de vídeo analógico. [TSU99] Introduction to video coding
Digitalización. standards for multimedia communication
Tipos de vídeo (según su calidad). [H.264] Overview of the H.264 / AVC Video
Parámetros específicos de red. Coding Standard
[MPEG4] MPEG-4 Overview
3. Compresión de vídeo. [HiJa94] Compressing still and moving
Redundancia temporal. images with wavelets
Estimación de movimiento.
Estándares: MPEG y H.261.
4. Conclusiones.
31
Estimación de movimiento.
Arquitecturas de red para la distribución de contenidos
O(MB ) = (2 p + 1) 3MN
2
O(FS ) = O(MB )
IJF
MN
Ejemplo:
Broadcast TV (I=720, J=480, F=30, N=M=16)
Coste de este algoritmo: 29.89 GOPS (p=15) ó 6.99 GOPS (p=7)
33
Algortimos: Three-Step Search.
Arquitecturas de red para la distribución de contenidos
MV: (7,-2)
1 1 1
3 3 3
2 2 3 2 3
3 3 3
1. Busca en la posición (0,0)
1 1 2 1 2
2. S=2N-1 (step size)
3. Busca 8 posiciones a +/-S
2 2 2 píxeles alrededor de (0,0)
4. De las nueva posiciones
1 1 1 elige aquella con el SAD
menor.
5. S=S/2 y el nuevo origen de
(0,7) (7,7) búsqueda el punto obtenido
(-7,7)
en 4.
6. Repetir pasos 3-5 hasta que
Coste: S=1.
( )
Examina 8 log 2 p + 1 puntos
1.02 GOPS (p=15) ó 770 MOPS (p=7).
34
Algoritmos: Búsqueda logarítmica.
Arquitecturas de red para la distribución de contenidos
( p ) + 5 puntos
pixel. Sino hacer lo mismo pero con
Examina 4 log 2 los 4 puntos distribuidos en “+”.
523 MOPS (p=7).
36
Algoritmos: OTS (One-at-a-Time Search)
Arquitecturas de red para la distribución de contenidos
MV: (-4,-3)
9
8
7
1. Establece el origen en (0,0).
6
2. Selecciona el origen y las dos
5 4 3 2 1 1 1
posiciones vecinas en el eje X
6 3. Calcula la posición que menor
SAD exhiba. Si es el origen ir
al paso 5.
4. Establece el nuevo origen en la
posición que ha ofrecido el
menor SAD. Ir al paso 2.
(0,7) (7,7) 5. Repetir los pasos 2 al 4
(-7,7)
seleccionando las posiciones
en el sentido vertical (eje Y).
Coste:
Examina 12 puntos
369 MOP. Puede dar lugar a mínimos locales !
37
Algoritmos: Vecino más próximo.
Arquitecturas de red para la distribución de contenidos
A b A b A
Se incrementan notablemente las
c d c d c
prestaciones del algoritmo de
estimación de movimiento a expensas
A b A b A de un mayor coste computacional.
H.263 utiliza está técnica, incluso se
c d c d c propone utilizar ¼ y 1/8 de píxel para
el estándar H.264
A b A b A
40
Tem a 4: Codificación y com presión
de vídeo.
1. Introducción. Bibliografía
2. Características del vídeo.
[FLU95] Fluckiger, “Understanding
networked multimedia”
Captura de vídeo analógico. [TSU99] Introduction to video coding
Digitalización. standards for multimedia communication
Tipos de vídeo (según su calidad). [H.264] Overview of the H.264 / AVC Video
Parámetros específicos de red. Coding Standard
[MPEG4] MPEG-4 Overview
3. Compresión de vídeo. [HiJa94] Compressing still and moving
Redundancia temporal. images with wavelets
Estimación de movimiento.
Estándares: MPEG y H.261.
4. Conclusiones.
42
Arquitecturas de red para la distribución de contenidos
Relación entre los estándares MPEG.
43
MPEG-1.
Arquitecturas de red para la distribución de contenidos
Propósito de MPEG-1
Almacenamiento en CD-ROM de audio (calidad CD) y vídeo (calidad
VCR) sincronizado (1,5 Mbps).
44
MPEG-1
Arquitecturas de red para la distribución de contenidos
Características de MPEG-1:
Resolución de imagen: 352x(288 ó 240) (PAL/NTSC).
Reducción de color (sub-sampling): 4:2:0.
Barrido progresivo (no entrelazado).
Tasa de cuadros: 25/30 (PAL/NTSC).
Incluye cuadros de tipo D (DC-coded):
Operaciones de avance rápido (Fast Forward).
Codificador/decodificador asimétrico.
45
MPEG-2
Arquitecturas de red para la distribución de contenidos
46
MPEG-2
Arquitecturas de red para la distribución de contenidos
Características de MPEG-2.
Soporta barrido entrelazado y progresivo.
Puede trabajar con distintas resoluciones (nivel):
CIF: 352x288/240 (VCR quality) (Compatibilidad MPEG-1)
Principal: 720x576/480 (studio-quality)
High-1440: 1440x1152 (HDTV)
High: 1920x1080 (HDTV)
Define varios perfiles de implementación
Detalles de los algoritmos de compresión y parámetros de imagen,
barrido, etc.
El multiplexado y sincronización es más general y flexible que
MPEG-1
Se pueden multiplexar/sincronizar varias fuentes de audio, vídeo y
datos (ej.: subtítulos en varios idiomas).
47
MPEG-4
Arquitecturas de red para la distribución de contenidos
Propósito:
Diseño de aplicaciones multimedia interactivas distribuidas.
Aplicación:
Televisión digital
Compatibilidad con MPEG-2 (backware compatibility)
Aplicaciones multimedia interactivas
El usuario puede interaccionar con los objetos multimedia de la sesión.
Distribución de información multimedia (tipo WWW)
A través de una red, se permitirá el acceso y distribución a información
multimedia, facilitando su diseño y presentación.
48
MPEG-4
Arquitecturas de red para la distribución de contenidos
Características:
Accesibilidad de la información de manera universal y robusta.
Alta interactividad con la información multimedia.
Definición de escenarios virtuales compuestos por objetos
independientes (AVOs).
El usuario puede modificar/configurar el escenario actual.
Codificación conjunta de datos sintéticos y reales.
Codificación eficiente de la información.
Mejoras en la compresión y multiplexación de la información.
Codificación de objetos con forma irregular.
49
3.3 Estándar H.261.
Arquitecturas de red para la distribución de contenidos
51
Estándar H.261.
Arquitecturas de red para la distribución de contenidos
Características de H.261:
Formato de imagen: YCbCr
CIF: 352x288 (opcional)
QCIF: 176x144 (obligatorio)
Reducción de color: 4:2:0
Tasa de cuadros/seg: como máximo 30 max.
52
Estándar H.261.
Arquitecturas de red para la distribución de contenidos
53
Estándar H.261.
Arquitecturas de red para la distribución de contenidos
54
Otros estándares H.26x.
Arquitecturas de red para la distribución de contenidos
Comparación subjetiva
entre MPEG-4 y
H.264. Secuencia de
vídeo Foreman (CIF @
30 fps) comprimida a
32 Kbits/s
56
4. Conclusiones
Arquitecturas de red para la distribución de contenidos
57