Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Codificacion
Codificacion
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Digitalizacin y Codificacin de vdeo. Tipos de
vdeo.
Redundancia temporal.
Estimacin de movimiento: algoritmos.
Estndares: MPEG e ITU
Bibliografa
[FLU95] Understanding networked
multimedia
[GIB98] Digital Compression for
Multimedia
[TSU99] Introduction to video coding
standards for multimedia communication
[JPEGESC] JPEG escalado - Tesis
[JPEGAD] JPEG image coding with
adaptive quantization
[TSU99] Introduction to video coding
standards for multimedia communication
[H.264] Overview of the H.264 / AVC
Video Coding Standard
[MPEG4] MPEG-4 Overview
[HiJa94] Compressing still and moving
images with wavelets
Difusin de
TECNOLOGAS
DE vdeo.
RED AVANZADAS Master IC 2011-2012
Simtricos
Coste computacional similar (Ej: Videoconferencia).
Calidad de la seal
- BER (Bit Error Ratio)
- SNR (Signal/Noise)
- MOS (Mean Opinion Score)
Eficiencia
- Tasa de compresin
Complejidad
- Espacio de memoria
- Potencia (mW)
- Operaciones/Seg.
Retardo
Source encoding
Codifica los datos basndose en las caractersticas y
propiedades de estos.
Suelen ser tcnicas de compresin con prdidas.
Se obtienen tasas de compresin elevadas.
Codificadores/decodificadores de propsito especfico.
Ejemplos:
Differential, transform, vector quantization, etc.
3- Codificacin y difusin de
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Difusin de vdeo.
TECNOLOGAS DE RED AVANZADAS Master IC 2011-2012
1
S pi log
2
(p H
= probabilidad
del smbolo
i)
i
pi
i
1
H S 6 log 2 6 2.585
6
7
Statistical encoding
Codificacin Huffman.
Codificacin aritmtica.
Codificacin Huffman
Ejemplo:
9
ABCDE(39)
1
BCDE(24)
0
BC(13)
0
A(15) B(7)
1
0
C(6) D(6)
DE(11)
1
E(5)
Smbolo
Cdigo
100
101
110
111
Codificacin aritmtica
Ejemplo:
Supongamos slo dos smbolos, A y B con una
probabilidad de P(A)=1/3 y P(B)=2/3.
1
1
P(A) = 1/3
1
8/9
AA
AB
2/3
BA
16/27
P(B) = 2/3
segmento
cdigo
AAA
AAB
ABA
ABB
31/32
15/16
14/16
.11111
.1111
.1110
6/8
.110
BAA
BAB
10/16
.1010
4/8
.100
BBA
3/8
.011
BBB
1/4
.01
4/9
8/27
BB
0
1
2
Run-length encoding
Este
1
3
315A0737654A1827A0143
3- Codificacin y difusin de
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Difusin de vdeo.
TECNOLOGAS DE RED AVANZADAS Master IC 2011-2012
Codificacin Diferencial
Transform encoding
Se basa en transformar el dominio (Ej.: del
temporal al de la frecuencia) de los datos de
entrada (Ej.: seal de audio).
Restar a todos los
pixels el valor del
Imgen BW
Ejemplos:
primero
4x4 pixels
Aritmtica:
Fourier:
160
161
160
159
160
165
167
160
161
166
165
160
F(t)
160
158
161
160
160
1
0
-1
0
5
7
0
1
6
5
0
0
-2
1
0
1
7
Vector quantization
Ejemplo:
Imagen original dividida
en vectores de nxn pixels
0
2
3
0
Si
1
9
0
2
2
4
1
2
2
0
0
0
0
0
Code-book
0
1
2
3
4
001022032200400
Codificacin
con prdida*.
3- Codificacin y difusin de
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Difusin de vdeo.
TECNOLOGAS DE RED AVANZADAS Master IC 2011-2012
Audible
No audible
24
Digitalizacin y cuantificacin.
La
Digitalizacin y cuantificacin.
Cuantificacin:
PCM
Digitalizacin y cuantificacin.
Cuantificacin
PCM lineal
Cuantificaciones
no-lineales (logartmica)
Inconvenientes:
Necesidad de un sintetizador en ambos extremos (calidad de
sonido diferente).
Aplicable solo a msica.
2
8
Voz (telefona)
Se define para los servicios de telefona digital.
Estndar G.711 (ITU): Codificacin logartmica.
Japn y USA: Transformacin -law.
Resto: Transformacin A-law. (+)
Parmetros:
Seal de audio de 3.5 KHz (BW).
Sf = 8 KHz
8 bits/muestra.
Tasa de bits: 64Kbps (N-ISDN).
CD-Digital Audio.
Calidad de audio superior: Sonido Hi-Fi estereofnico.
Utiliza una codificacin lineal. Las diferencias de amplitud
deben ser respetadas por igual.
Parmetros:
Seal de audio de 20 KHz (BW).
Sf = 41.1 KHz
16 bits/muestra.
Soporta estereofona (dos canales)
Tasa de bits: 1.411 Mbps.
3
0
Parmetros especficos.
Audio comprimido:
Calidad telefnica: 32, 16, 4 Kbps (ADPCM, CELP)
Calidad CD: 192 Kbps. (MPEG audio)
3
1
Parmetros especficos.
Tasas de error:
3
2
X[n]
Xp[n-1]
3
4
diferencial adaptativa:
D[n]
C[n]
Quantizer
(adaptive)
Predictor
module
Codificador
C[n] Dequantizer
(adaptive)
Xp[n] Dq[n]
Dq[n]
Dequantizer
(adaptive)
Xp[n-1]
Xp[n]
Predictor
module
Decodificador
diferencial adaptativa:
X[n]
D[n]
Xp[n-1]
Delay
Quantizer
(adaptive)
+
Codificador
Dq[n]
C[n] Dequantizer
(adaptive)
Xp[n] Dq[n]
Predictor
module
3
6
C[n]
Dequantizer
(adaptive)
Xp[n-1]
Xp[n]
Delay
Decodificador
3
7
Variantes CELP:
3
8
Calidad telefnica
Tasa de bits
(Kbps)
64
2.4
32
4.15
13
4.8
16
8
1-8
8
6.3
5-6
2.4
Nombre
MOS
PCM (PSTN)
LPC-10
G.721 ADPCM
INMARSAT
GSM
CELP (US 1016)
G.728 (LD-CELP)
VSELP
QCELP
G.729
G.723.1
Half-Rate GSM
New LPC
4.4
2.7
4.1
3.2
3.6
3.2
4
3.5
3.4
4.2
3.98
3.4
3.3
Calidad CD
Estndares MPEG/audio (Estndar ISO)
MPEG (Moving Pictures Expert Group)
MPEG/audio ofrece altos ndices de compresin,
manteniendo la calidad del audio del stream original.
Son algoritmos de compresin con prdidas*.
MPEG-1 /audio
Muestreos: 32, 44.1 y 48 KHz.
Soportan uno o dos canales (diferentes modos de
operacin).
Tasas de bits: 32 a 256 Kbps/canal.
Indices de compresin: 2.7 a 24.
MPEG-2 /audio
4
0
MPEG-1 audio.
Time-Frec
Sub-band
filtering
Asig. Bits.
Cuantizador
Codificador
Modelo
psico-acst.
Datos auxiliares
(opcional)
Decodificador
Stream de bits
comprimido
Desensamblado
Reconst.
de bandas
Datos auxiliares
(opcional)
4
4
Formato del
stream de bits
Stream de bits
comprimido
Transformacin
Frec-Time
PCM audio
Nivel I:
Se divide la seal de audio en 32 bandas de 750 Hz.
Tasa de muestreo: 48 Khz. Tamao de trama: 384 muestras
El umbral de enmascaramiento (SMR) se calcula con una
FFT de 512 puntos (modelo psico-acstico).
Para cada sub-banda se escoge uno de los 15 cuantizadores
definidos en funcin del SMR y la tasa de bits requerida.
Nivel II:
Utiliza un tamao de trama de 1152 muestras, una FFT de
1024 puntos (clculo del SMR) y una cuantizacin ms fina.
Nivel III:
4
5
1
MSE
N
s i s i
i 1
1
SNR (dB) 10 log10
4
6
s i
i 1
MSE
2552
PSNR 10 log10
MSE
Resultados:
Fuente:
Estreo, 16bits, 48KHz,
256 Kbps
Compresin 6:1
En condiciones de
escucha ptimas, expertos
en audicin han sido
incapaces de distinguir
secuencias comprimidas
de sus originales.
3- Codificacin y difusin de
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Difusin de vdeo.
TECNOLOGAS DE RED AVANZADAS Master IC 2011-2012
51
52
480
o
576
Muestra Y
480
o
576
720
Cb
Cr
Cb
Cr
Formato 4:2:2
720
Y
240
o
288
Formato 4:2:0
360
Y
480
o
576
Formato 4:4:4
480
o
576
5
4
Muestra Cr + Muestra Cb
720
480
o
576
360
Y
480
o
576
Cb
Cr
Formato 4:1:1
180
Cb
Cr
Compresin de imagen.
Una imagen suele presentar redundancia
espacial:
Redundancia espacial:
Las imgenes tienen informacin redundante susceptible
de ser eliminada o reducida (por ejemplo, el color del
cielo en una foto suele ser uniforme y azul :-).
El proceso de compresin de imagen consistir en:
1) Eliminar en la medida de lo posible la redundancia
espacial utilizando tcnicas de source encoding
(normalmente mediante transformada matemtica).
2) Codificar los datos obtenidos en el paso anterior usando
entropy enconding (elimina aun ms la redundancia
espacial).
Para conseguir mayores ndices de compresin, este proceso
ser con prdidas (cuantizacin de los datos).
56
3- Codificacin y difusin de
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Difusin de vdeo.
TECNOLOGAS DE RED AVANZADAS Master IC 2011-2012
Prep. de
bloques
DCT
Cuantiz.
Codificacin entrpica
Run
Length
Tabla
Huffman
Imagen
codificada
Tabla
Coeficiente
DCT
Amplitud
x
y
6
0
Transformada
DCT
Fx
Fy
2 x 0
16
Transformada
directa
Si u 0, C (u )
1
2
Si u 1, C (u ) 1
C (u )
( 2 x 1)u
S (u ) cos
2
16
u 0
7
s ( x)
Transformada
inversa
2N
2N
2N
x 0 y 0
6
1
1
pixel ( x, y )
2N
N 1 N 1
(2 x 1)i
(2 y 1) j
cos
2N
2N
150
88
21
4
1
0
0
0
70
56
34
6
0
1
0
0
38
22
12
3
5
0
0
0
16
9
4
7
0
0
0
0
4
2
0
0
2
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
Coeficientes DCT
0
0
0
0
0
0
0
0
Tabla de
cuantificacin
1
1
2
4
8
16
32
64
1
1
2
4
8
16
32
64
2
2
2
4
8
16
32
64
4
4
4
4
8
16
32
64
8
8
8
8
8
16
32
64
16
16
16
16
16
16
32
64
32
32
32
32
32
32
32
64
64
64
64
64
64
64
64
64
150
88
10
1
0
0
0
0
70
56
17
1
0
0
0
0
19
11
6
1
0
0
0
0
4
8
1
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Coeficientes DCT
cuantificados
0
0
0
0
0
0
0
0
150
88
10
1
0
0
0
0
70
56
17
1
0
0
0
0
19
11
6
1
0
0
0
0
4
8
1
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
150-70-88-10-56-19-4-11-17-1-0-1-6-8-0-0-0-1-1-0-0-0-0-0-2-..(39 0s)
150-70-88-10-56-19-4-11-17-1-0-1-6-8-A0/3-A1/2-A0/5-2-A0/39
6
4
Zig-zag
ordering
Run-lenght
decoder
Inverse
DCT
Huffman
decoder
110001110011100010..
40
44
52
68
62
47
36
48
44
52
55
45
48
67
56
55
47
40
36
56
56
40
23
36
40
47
67
60
48
55
67
55
40
40
63
52
40
55
62
52
55
48
62
55
36
40
44
47
79
67
52
36
47
36
49
47
75
79
72
60
62
62
47
36
39
50
54
58
64
56
43
42
49
49
46
47
52
52
50
50
38
38
43
50
51
51
47
40
47
46
55
59
54
55
58
53
45
45
54
55
45
44
51
50
55
57
60
57
48
45
49
51
70
65
53
43
41
42
43
48
76
72
60
55
60
55
42
39
DCT
411
20
-11
-8
-3
3
8
1
-18 14 -8 24
-34 27 -9 -11
-23 -1
5 -19
-5 14 -14 -8
9
7
2 -10
-2 -17 8
7
1
-2
3
-2
-8 -4
2
2
transformadas
Bloque de muestras
Quant
IDCT
102 -2
2 -4
-1 -2
0
0
0
0
0
0
0
0
0
0
1 0 1
2 0 0
0 0 -1
1 -1 0
0 0 0
-1 0 0
0 0 0
0 0 0
0
0
0
0
0
0
0
0
0 -1
0 0
-1 0
0 0
0 0
0 0
0 0
0 0
102 -2
2 -4
-1 -2
0
0
0
0
0
0
0
0
0
0
1 0 1
2 0 0
0 0 -1
1 -1 0
0 0 0
-1 0 0
0 0 0
0 0 0
0
0
0
0
0
0
0
0
0 -1
0 0
-1 0
0 0
0 0
0 0
0 0
0 0
Cdigo
0
1
2
100
00
01
1110
1111 0
1111 10
1111 110
1111 1110
10
1111 1111 0
11
1111 1111 1
Tabla para la DC
1 0 1
2 0 0
0 0 -1
1 -1 0
0 0 0
-1 0 0
0 0 0
0 0 0
0
0
0
0
0
0
0
0
0 -1
0 0
-1 0
0 0
0 0
0 0
0 0
0 0
0
0
0
0
0
1
-2
2
-1
-4
1
2
Nivel
EOB
0
0
0
0
0
1
2
3
4
5
Cdigo
10
11s
0100
0010
0000
0010
s
1s
110s
0110 s
Run
1
1
1
1
2
2
Escape
1
2
3
4
1
2
011s
0001 10s
0010 0101 s
0000 0011 00s
0101 s
0000 100s
0000 01
Cdigo VLC
0100
0100
111
0000
110
0001
1
0
1101
100
0000
01 RRRR RR NNNN NNNN
1 0 1
2 0 0
0 0 -1
1 -1 0
0 0 0
-1 0 0
0 0 0
0 0 0
0
0
0
0
0
0
0
0
0 -1
0 0
-1 0
0 0
0 0
0 0
0 0
0 0
Tasa de compresin:
Valores
N/A
0
0
0
0
0
1
0
5
3
5
0
2
4
7
EOB
4
-2
2
-1
-4
1
2
-2
1
1
-1
-1
-1
-1
-1
Cdigo VLC
101 100 0
0100 1
0100 0
111
0000 1101
110
0001 100
0100 1
0001 110
0011 10
0001 111
111
0101 1
0011 01
0001 001
10
44
52
55
45
48
67
56
55
47
40
36
56
56
40
23
36
40
47
67
60
48
55
67
55
40
40
63
52
40
55
62
52
55
48
62
55
36
40
44
47
79
67
52
36
47
36
49
47
75
79
72
60
62
62
47
36
39
50
54
58
64
56
43
42
49
49
46
47
52
52
50
50
38
38
43
50
51
51
47
40
47
46
55
59
54
55
58
53
45
45
54
55
45
44
51
50
55
57
60
57
48
45
49
51
70
65
53
43
41
42
43
48
76
72
60
55
60
55
42
39
(Calidad)
s i s i
i 1
3- Codificacin y difusin de
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Difusin de vdeo.
TECNOLOGAS DE RED AVANZADAS Master IC 2011-2012
JPEG escalado
Motivacin
Fundamentos del JPEG escalado
Compatibilidad con JPEG estndar
Cuantificacin variable
Resultados
Motivacin
Bloques de 16x16
FDCT 16x16
Imagen
16x16 a 8x8
Cuantificador
Codificador
de entropa
Imagen
comprimida
Descuantificador
8x8 a 16x16
Bloques de 16x16
IDCT 16x16
Imagen
Original
Tasa 24 - 180K
JPEG estndar
JPEG escalado
Compresin 78:1
Tasa 0.3 - 2.2K
Original
Tasa 24 - 180K
JPEG estndar
JPEG escalado
Compresin 128:1
Tasa 0.18 - 1.4K
DCT n=8
DCT n=16
Mezcla de formatos
Imagen
Leda como
JPEG escalado
JPEG estndar
JPEG estndar
JPEG escalado
Se obtiene
Cuantificacin variable
S 0,1 ms
S 0,7
Sq afecta
Sq 0,1
Sq 0,7
0,0 conseguir
S
Para
ceros hay que incrementar los valores Qvu, lo que0,0
a todos los bloques
S 1,0 S 1,1
S 7,0 S 7,1
S 1,7
S 7,7
Cuantificacin
S
redondeo vu Sq vu
Q vu
Sq 1,0 Sq 1,1
Sq 7,0 Sq 7,1
Sq 1,7
Sq 7,7
S vu
S vu
,
si
um bral
Q vu
Q vu
0,
en otro caso
Sq vu
redondeo
Zona 1:
Hasta 47 ceros
Umbral 1,0
Zona 2:
de 48 a 55 ceros
Umbral 1,5
Zona 3:
de 56 a 59 ceros
Umbral 2,5
Zona 4:
de 60 a 63 ceros
Umbral 1,0
Sin cuantificacin
adaptativa
Con cuantificacin
adaptativa
Sin cuantificacin
adaptativa
Con cuantificacin
adaptativa
Resultados
JPEG estndar
JPEG escalado
JPEG estndar
JPEG escalado
estndar
escalado
adaptativo
30
29
28
27
26
SNR'
25
24
23
22
21
Lena 512x512
20
0,1
0,15
0,2
0,25
0,3
Tasa de bits
0,35
0,4
0,45
0,5
estndar
estndar (1:2)
26
escalado
escalado (1:2)
adaptativo
adaptativo (1:2)
25
24
23
SNR'
22
21
20
19
0,15
0,2
0,25
0,3
Tasa de bits
0,35
0,4
0,45
0,5
1,1
Escalado
Adaptativo
SNR' Escalado y Adaptativo / Estndar
1,08
1,06
1,04
1,02
0,98
0,1
0,15
0,2
0,25
0,3
Tasa de bits
0,35
0,4
0,45
0,5
3- Codificacin y difusin de
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Difusin de vdeo.
TECNOLOGAS DE RED AVANZADAS Master IC 2011-2012
Introduccin
Una secuencia de vdeo es una sucesin de
imgenes que producen sensacin de movimiento.
El proceso completo de transmisin de vdeo con
compresin consiste en:
Adquisicin del vdeo a transmitir.
Captura analgica de la secuencia de imgenes.
Digitalizacin del vdeo.
Placa de
barrido
a
Lentes
9
2
483
Filtros
R
Lentes
Placa de
barrido
Y:
Y:Luminancia
Luminancia(intensidad).
(intensidad).
UUyyV:
V:Diferencias
Diferenciasde
decolor.
color.
El
Elojo
ojohumano
humanoesesms
mssensible
sensibleaa
lalaintensidad
intensidad(brillo)
(brillo)que
queaalala
informacin
informacinde
decolor
color(sub(subsampling).
sampling).
t
t
Divisor
TV Color
t
Y+C
Y
R
Cmara G
B
9
3
Demod.
Conv.
R
G
B
CRT
U
V
Codificador Modulador
TV B&W
Y+C
Filtro
CRT
9
4
Continuidad de movimiento.
Viene determinada por el nmero de cuadros diferentes por
segundo.
No se recomienda utilizar menos de 25 cuadros/s.
Digitalizacin
ITU-R (CCIR-601): Estndar para la digitalizacin
de seales de TV.
Define los parmetros de muestreo, cuantificacin, barrido y
resolucin de imagen que se deben tomar para digitalizar
una seal de TV analgica.
Parmetros de barrido:
Dos formatos (NTSC y PAL/SECAM)
525 lneas y 858 muestras/lnea - 30 frames/seg.
625 lneas y 864 muestras/lnea - 25 frames/seg.
Digitalizacin II
Cada lnea tiene una zona visible (lnea activa). Este
estndar define una lnea activa de 720 pixels.
Se define un nmero de lneas visibles por cuadro:
480 (NTSC), 576 (PAL/SECAM).
Barrido entrelazado:
Un cuadro (frame) est formado por dos campos:
El primero con las lneas impares y el segundo con las
Lnea
pares.
completa
Tiempo
Lnea activa
720 muestreos
Digitalizacin III
Codificacin y recodificacin.
Cada muestra RGB se codifica con 24 bits/color.
La conversin de RGB a YCbCr (YUV) se realiza mediante una
matriz de conversin (aproximada):
Y = 0.3R + 0.6G + 0.1B
U = B - Y (Diferencia de color azul) (equiv. Cb=U/2+128)
V = R - Y (Diferencia de color rojo) (equiv. Cr=V/1.6+128)
360
720
480
o
576
9
8
480
o
576
480
o
576
Cb
Cr
Subsampling 4:2:2
9
9
Codificacin: RGB
1
0
0
Codificacin: YCbCr
1
0
1
1
0
2
1
0
3
1
0
4
1
0
5
1
0
6
1
0
7
1
0
8
Videoconferencia (Low-speed).
Tasas de bits pequeas (alrededor de 128 Kbps)
Resolucin de imagen 4 veces inferior al vdeo digital.
ITU-TS H.261: Common Intermediate Format (CIF) 352x288
3- Codificacin y difusin de
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Difusin de vdeo.
TECNOLOGAS DE RED AVANZADAS Master IC 2011-2012
Redundancia temporal
Se basa en la similitud de cuadros sucesivos en
una secuencia de vdeo.
Ej.: Secuencias de plano esttico.
Macrobloques (macroblocks)
16x16 pixels (6 bloques de 8x8: 4Y,1U y 1V).
F1
1
1
6
F2
F3
Cuadro de referencia
Macrobloques
idnticos
F1
1
1
7
Vector de movimiento
x = -20, y = 0
F2
Bsqueda de macrobloques.
Se buscan los macrobloques del cuadro a codificar en el
cuadro de referencia.
Si se encuentra el mismo macrobloque, slo se codifica
el vector de movimiento correspondiente.
Si no se encuentra exactamente el mismo se elige el
ms parecido (macrobloque INTER).
Se codifica el vector de movimiento.
Se calcula el macrobloque error (las diferencias) aplicndole
codificacin estilo JPEG (DCT, quant, RLE+VLC en zigzag).
1
1
8
Cuadro de tipo B
basado en F1 y F3
F1
F2
Macrobloque
encontrado!!
Cuadro de tipo P
basado en F1
Macrobloque
encontrado!!
F3
I
1
2
0
1
2
1
3- Codificacin y difusin de
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Estimacin de movimiento.
Se define una funcin de coste que calcula el
error entre dos macrobloques, por ejemplo, SAE
(Sum of Absolute Errors)*
N 1 M 1 :
SAE i, j C i, j R i, j
i 0
j 0
O MB 2 p 1 3MN
Ejemplo:
1
2
5
(0,-7)
MV:
MV:(7,-3)
(7,-3)
1
3 3 3
2 3 2 3
3 3 3
2
1
2
1
1.1.
2.2.
3.3.
4.4.
5.5.
(0,7)
(-7,7)
(7,7)
6.6.
Coste:
1
2
6
(7,-7)
Busca
Buscaen
enlalaposicin
posicin(0,0)
(0,0)
N-1
S=2
(step
size)
S=2N-1 (step size)
Busca
Busca88posiciones
posicionesaa+/-S
+/-S
pxeles
alrededor
de
(0,0)
pxeles alrededor de (0,0)
De
Delas
lasnueva
nuevaposiciones
posicioneselige
elige
aquella
con
el
SAD
menor.
aquella con el SAD menor.
S=S/2
S=S/2yyelelnuevo
nuevoorigen
origende
de
bsqueda
el
punto
obtenido
bsqueda el punto obtenido
en
en4.4.
Repetir
Repetirpasos
pasos3-5
3-5hasta
hastaque
que
S=1.
S=1.
(0,-7)
(7,-7)
MV:
MV:(5,-3)
(5,-3)
1.1.
4
5 5 5
2 5 3 5 4
5 5 5
1
2
3.3.
1
1
4.4.
(-7,7)
(0,7)
Coste:
1
2
7
2.2.
Examina 20 puntos
616 MOPS (p=7 y N=2).
(7,7)
5.5.
6.6.
Busca
Buscaen
enlalaposicin
posicin(0,0)
(0,0)yyestablece
establece
S=N
(step
size)
S=N (step size)
Selecciona
Selecciona44posiciones
posicionesaaSSpxeles
pxeles
del
origen
en
los
ejes
X
e
Y.
del origen en los ejes X e Y.
Calcula
Calculalalaposicin
posicinque
queofrece
ofreceelel
menor
menorSAD,
SAD, fijndola
fijndolacomo
comoelelnuevo
nuevo
origen
de
la
bsqueda
origen de la bsqueda
SiSiesta
estaposicin
posicineseslalacentral
centralde
delas
las55
seleccionadas
seleccionadasS=S/2
S=S/2
SiSiS=1
S=1iriralalpaso
paso6,6,sino
sinoiriralalpaso
paso2.2.
Selecciona
Seleccionaelelorigen
origenactual
actualyylas
las88
posiciones
posicionesde
dealrededor,
alrededor,yycalcula
calcula
aquella
que
minimiza
el
SAD
aquella que minimiza el SAD
(0,-7)
MV:
MV:(-3,-5)
(-3,-5)
2
4
1
4
1.1.
1
3
3
2
(7,-7)
2.2.
2
3
3
1
3.3.
4.4.
5.5.
(0,7)
(-7,7)
Coste:
1
2
8
Examina 4 log 2 p
523 MOPS (p=7).
(7,7)
5 puntos
Establece
Estableceelelorigen
origenen
enlalaposicin
posicin
N-1
(0,0).
(0,0).S=2
S=2N-1(step
(stepsize)
size)
Selecciona
4
posiciones
Selecciona 4 posicionesaa+/-S
+/-S
pxeles
del
origen
formando
pxeles del origen formandouna
una
cruz
(X)
y
el
propio
origen.
cruz (X) y el propio origen.
Calcula
Calculalalaposicin
posicinque
queofrece
ofreceelel
menor
menorSAE,
SAE, fijndola
fijndolacomo
comoelel
nuevo
nuevoorigen
origende
delalabsqueda
bsqueda
SiSi(S>1)
entonces
S=S/2
(S>1) entonces S=S/2yyva
vaalal
punto
punto2.2.Sino
Sinoiriralalpunto
punto5.5.
SiSilalamejor
mejorposicin
posicinest
esten
enelelpunto
punto
superior
superiorizquierda
izquierdaooinferior
inferiorderecha
derecha
de
la
X,
evaluar
4
puntos
ms
de la X, evaluar 4 puntos msen
en
forma
de
X
a
una
distancia
de
+/-1
forma de X a una distancia de +/-1
pixel.
pixel.Sino
Sinohacer
hacerlolomismo
mismopero
perocon
con
los
los44puntos
puntosdistribuidos
distribuidosen
en+.
+.
(0,-7)
9
8
7
6
4 3
6
(7,-7)
MV:
MV:(-4,-3)
(-4,-3)
1.1.
2.2.
2 1
1 1
3.3.
4.4.
5.5.
(0,7)
(-7,7)
Coste:
1
2
9
Examina 12 puntos
369 MOP.
(7,7)
Establece
Estableceelelorigen
origenen
en(0,0).
(0,0).
Selecciona
el
origen
y
las
Selecciona el origen y lasdos
dos
posiciones
vecinas
en
el
eje
posiciones vecinas en el ejeXX
Calcula
Calculalalaposicin
posicinque
quemenor
menor
SAD
SADexhiba.
exhiba.SiSieseselelorigen
origenirir
alalpaso
paso5.5.
Establece
Estableceelelnuevo
nuevoorigen
origenen
enlala
posicin
posicinque
queha
haofrecido
ofrecidoelel
menor
menorSAD.
SAD.IrIralalpaso
paso2.2.
Repetir
Repetirlos
lospasos
pasos22alal44
seleccionando
seleccionandolas
lasposiciones
posiciones
en
el
sentido
vertical
en el sentido vertical(eje
(ejeY).
Y).
(0,-7)
3 2
3 2 1
1 1
1
1.1.
2.2.
2
1
3.3.
4.4.
(0,7)
(-7,7)
Coste:
1
3
0
MV:
MV:(-3,-4)
(-3,-4)
(7,-7)
Examina 12 puntos
369 MOP.
(7,7)
Calcula
CalculaelelSAD
SADdel
del(0,0).
(0,0).
Establece
el
origen
de
Establece el origen debsqueda
bsquedaaalala
posicin
posicindel
delvector
vectorsupuesto
supuesto
(predicted
vector)
(predicted vector)
Selecciona
Selecciona44posiciones
posicionesalrededor
alrededor
del
delorigen
origenen
enforma
formade
de+.
+.
SiSielelorigen
de
bsqueda
origen de bsqueda(o(olala
posicin
posicin0,0
0,0en
enlalaprimera
primeraiteracin)
iteracin)
ofrece
el
menor
SAD
entonces
ofrece el menor SAD entoncesfin
fin
de
debsqueda.
bsqueda.
Sino
Sinoestablece
estableceelelnuevo
nuevoorigen
origende
de
bsqueda
en
la
posicin
que
menor
bsqueda en la posicin que menor
SAD
SADha
haofrecido.
ofrecido.
3- Codificacin y difusin de
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Difusin de vdeo.
TECNOLOGAS DE RED AVANZADAS Master IC 2011-2012
Estndar MPEG.
Conjunto de estndares ISO para la grabacin y
transmisin digital de audio y vdeo.
En su evolucin se han desarrollado varias
versiones del estndar MPEG:
MPEG-1 (ISO 11172) (91):
CD-ROM vdeo (1,5 Mbps).
1
3
5
MPEG-1
MPEG-1 (ISO 11172) (91)
MPEG-Vdeo (IS 11172-2)
MPEG-Audio (IS 11172-3)
MPEG-System (IS 11172-1):
Multiplexado y sincronizacin.
Propsito de MPEG-1
Almacenamiento en CD-ROM de audio (calidad CD) y vdeo
(calidad VCR) sincronizado (1,5 Mbps).
1
3
6
MPEG-1
Caractersticas de MPEG-1:
Resolucin de imagen: 352x(288 240) (PAL/NTSC).
Reduccin de color (sub-sampling): 4:2:0.
Barrido progresivo (no entrelazado).
Tasa de cuadros: 25/30 (PAL/NTSC).
Incluye cuadros de tipo D (DC-coded):
Operaciones de avance rpido (Fast Forward).
Codificador/decodificador asimtrico.
Tasa
de compresin: 27:1.
Los codificadores de audio
y vdeo trabajan por
separado.
1
3
7
Audio
encoder
Salida
MPEG-1
Reloj
Vdeo
encoder
System
Mux.
MPEG-2
Conjunto de estndares ISO 13818 (93).
Propsito:
Mejorar la calidad de imagen respecto al anterior sin
incrementar excesivamente la tasa de bits requerida
Calidad de vdeo profesional (studio-quality) y HDTV
Aplicacin:
Difusin de seales de TV, HDTV, VOD
MPEG-2
Caractersticas de MPEG-2.
Soporta barrido entrelazado y progresivo.
Puede trabajar con distintas resoluciones (nivel):
CIF: 352x288/240 (VCR quality) (Compatibilidad MPEG-1)
Principal: 720x576/480 (studio-quality)
High-1440: 1440x1152 (HDTV)
High: 1920x1080 (HDTV)
1
3
9
MPEG-4
Propsito:
Diseo de aplicaciones multimedia interactivas distribuidas.
Aplicacin:
Televisin digital
Compatibilidad con MPEG-2 (backware compatibility)
1
4
0
MPEG-4
Caractersticas:
Accesibilidad de la informacin de manera universal y
robusta.
Alta interactividad con la informacin multimedia.
Definicin de escenarios virtuales compuestos por objetos
independientes (AVOs).
El usuario puede modificar/configurar el escenario actual.
1
4
2
MPEG-4
1
4
3
Estndar H.261.
Caractersticas de H.261:
Formato de imagen: YCbCr
CIF: 352x288 (opcional)
QCIF: 176x144 (obligatorio)
1
4
4
Estndar H.261.
Slo se definen dos tipos de cuadros: I y P.
No existen secuencias predefinidas de cuadros.
Decisin de codificacin I o P para cada cuadro.
Estndar H.261.
PSC
GOB Start
Addr
Type
DC
1
4
6
PType
GOB1
Grp#
Quant
Run, Valor
GOB2
Quant
Vector
...
MB1
CBP
....
GOBm
...
b0
Run, Valor
MBn
b1
EOB
...
b5
1
4
7
Conclusiones
Las imgenes son captadas por cmaras de vdeo que
proporcionan una seal analgica RGB.
La digitalizacin est basada en el estndar ITU-R
En funcin de la calidad de vdeo deseada, existen diversos
formatos de imagen, barrido, etc.
Se definen distintos parmetros de red de importancia para
el transporte de vdeo
Algoritmos de compresin de vdeo
Fundamentos: Redundancia temporal
Algoritmos de estimacin de movimiento: Alto coste computacional.
Estndares de compresin:
Familia MPEG: 1-2-4
Diseados para procesar vdeo digital de calidad (Sector consumo).
3- Codificacin y difusin de
informacin multimedia
Factores de diseo de un codec
Codificacin basada en la entropa
Ejemplos: Huffman, Aritmtica, etc.
Compresin de vdeo.
Difusin de vdeo.
TECNOLOGAS DE RED AVANZADAS Master IC 2011-2012
Introduccin.
Desde el punto de vista de la red:
Un stream de vdeo ha de ser paquetizado para su transporte.
La prdida de paquetes implica una degradacin de la calidad de
vdeo que observa el destinatario.
Es por ello que resulte de inters el estudio de tcnicas que
protejan el vdeo en su viaje al destino y que los errores
detectados puedan ser ocultados al usuario final Video
resilience.
1
5
1
Control de flujo.
Las tcnicas de control de flujo debern regular el
bitrate de salida para conseguir la mejor relacin
calidad/productividad.
El control de flujo es una herramienta que al mismo
tiempo nos permite prevenir situaciones de
congestin en la red.
Para que un sistema de control de flujo funcione es
necesario obtener de la red informacin acerca del
ancho de banda disponible en cada momento (i.e.
RTCP receiver reports).
Existen diferentes formas de realizar un control de
flujo:
Cuantizacin variable (Variable-quantization)
Resolucin reducida (Reduced resolution)
Codificacin multinivel (Multi-layer coding)
Etc..
Variable
length
Fixed length
Picture
Bit stuffing
ESTUF, PSTUF
Synchronizatio
n
Addresing
Quant. step
size
Administrative
Spare
PSC(22), ECS(22)
TR(8), TRB(3)
PQUANT(5),DBQUANT(2
)
PTYPE(13),CPM(1),PSBI(
2)
PEI(1), PSPARE(8)
Group of
Blocks
Bit Stuffing
GSTUF
Synchronizatio
n
Addresing
Administrative
Quant. step
size
GBSC(17)
GN(5)
GSBI(2), GFID(2)
GQUANT(5)
Administrative
Motion
MCBPC,MODB,
CBPY
MVD, MVD2-4,
MVDB
Administrative
Quant. step
size
COD(1), CBPB(6)
DQUANT(2)
Macrobloc
k
Block
DCT
of
INTRADC(8)
Parmetros
de longitud TCOEFF
fija y variableDC
enterms
un stream
de vdeo H.263
Coefficients
Intra DCT
La contribucin
los parmetros de longitud
(exceptde
Intra
Coeff. variable en el bitrate final es
DC terms)
mucho mayor
que los de longitud fija, a pesar de ser menos.
154
Source
Encoder
Buffe
r
Output
Cuantizacin variable.
El mecanismo de control de flujo ms utilizado es:
Ajuste del valor de Qp del siguiente cuadro, GOB o MB,
basndose en la ocupacin actual del buffer (estado de la red).
Xdonde
SS
indica
elQ
nmero
de bits requeridos para codificar el
i , p ,b
i , p ,b
i , p ,b
cuadro anterior, y Q es el
todos los MBs
bitrate N p ,b
R
codificar en el GOP
Sino (cuadros P y B)
R R S i , p ,b
158
i , p ,b
j
Bj es el nmero
T de bits
j 1generados al codificar los
i , p ,b
i , p ,b
dMBs
B cuadro
del
hasta el MB j (incluido este)
0
j 1
MB_cnt
El valor final del buffer virtual (dji,p,b cuando j=MB_Cnt) se utiliza como
valor de llenado inicial para el siguiente cuadro del mismo tipo.
A continuacin se calcula el valor de referencia del cuantizador Q j
para MBj:
d j 31
Qj
bitrate
2
framerate
Paso 3: Determinacin del valor del cuantizador (mquantj) de
MBj.
Clculo de la actividad espacial de MBj:
Usando el valor de los pixels originales de los cuatro bloques de 8x8 de
luminancia (n=1..4) y los cuatro bloques de 8x8 de luminancia de los pixels
organizados por campos (n=5..8)
159
1 64 n
vblk n Pk P_mean n
64 k 1
1 64 n
P_mean n Pk DCn
64 k 1
mquant j Q j N_act j
El valor de mquantj se recorta para que entre en el intervalo
[1,31] y se utilice como valor de cuantizacin de MBj.
160
161
Conclusiones.