Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Disertantes:
Ing. Marcelo Tenorio
Ing. Pablo N. De Csare
Ing. Edgardo Marchi
Ing. Marcos Cervetto
Laboratorio de Radiocomunicaciones
Codificacin de fuente
Codificacin de fuente
Agenda
Codificacin de fuente
Agenda
Compresin de audio
Enmascaramiento en el dominio de la frecuencia y el tiempo
Capa de sistema
Elementary stream
Packetized Elementary stream
Header PES
Orden de transmisin y reproduccin
Transport Stream
Header TS
Sincronizacin del programa
Estructura de un programa MPEG
PAT PMT NIT...
Frecuencia de repeticin de tablas
Niveles y Perfiles MPEG 2 y 4
Ejemplos comerciales
Mediciones y errores
SDTV : 324Mbps
HDTV : 1.5Gbps
4:4:4
Tasa de 324Mbps
Las seales de video digital sin compresin tienen una elevada tasa de bit para poder ser transmitidos
Alta capacidad de almacenamiento.
Para edicin y produccin en Real Time.
Reduccin de datos
Para comprimir los datos es posible remover la informacin redundante y/o irrelevante
Redundante
Reduccin de redundancia
Reduccin de Irrelevancias
superflua
Innecesaria
No puede ser percibida por los sentidos, esta reduccin siempre esta asociada a perdida
irrecuperable de informacin
Reduccin de datos
Reduccin de 25%
Reduccin de datos
Reduccin de la resolucin de color
Las seales de diferencia de color son muestreadas a la mitad de velocidad que la luminancia y adems es
reducido el ancho de banda
4:2:2
Muy utilizado.
Se intercalan los pxel que llevan toda la informacin de Luma y Croma y los que llevan solo Luma
Tasa de 270Mbps
ITU-BT.R 601
CCIR601
R
G
B
matriz
Y
Cb
Cr
Para Luminancia
5.75MHz
Fs=13.5MHz
A/D
A/D
Cb
A/D
Cr
270Mbit/s
ITU-BT.R 601
CCIR601
A/D
1.5Mbit/s
A/D
4:2:2
Reduccin de datos
El ojo humano no puede distinguir entre resolucin vertical y horizontal, tambin es posible reducir la
resolucin de color a la mitad en la direccin vertical sin efectos perceptibles
4:2:0
Tasa de 162Mbps
Redundancias
Redundancia Espacial
En un mismo cuadro
Redundancia temporal
Entre cuadros
Compresin
Sin perdidas
Con Perdidas
No es necesario codificar
componentes de informacin No
Observables
Optimiza redundancias
Completamente reversible
PKZip
Informacin y Entropa
2)
3)
bit !!!
MPEG-4
16x16 8x4
16x8 4x8
8x16 4x4
8x8
Cuadro
ejemploDCT.m
DCT
DCT
ejemploDCT.m
DCT
compresion_img.m
Percepcin Visual
DCT + cuantificacin
Frecuencia Espacial
DCT + cuantificacin
Zig-Zag
Alternado
Despus de la cuantizacin la matriz de coeficientes sigue teniendo una simetra diagonal desde la
esquina superior izquierda a la inferior derecha. Hay dos mtodos de lectura de coeficientes, el
Zig-Zag y el Alternado.
La matriz leda en un proceso de Zig-Zag que genera una gran cantidad de ceros adyacentes, que
optimiza el uso de cdigos entropicos.
La matriz leda en forma alternada lee primero las componentes de frecuencia espacial vertical.
Cdigos entrpicos
Los mas usados son
DPCM : Diferencial Pulse code Modulation
(predictivo)
VLC: Variable Code Modulation
Huffman usado en MPEG 2,3,4
Codificacin diferencial
Codificacin diferencial
Codificacin Aritmtica
CABAC
(Context Adaptative Binary Arithmetic Coding)
MPEG-4 part 10 AVC
CABAC tiene mltiples modelos de probabilidad para diferentes contextos, el
codificador selecciona el modelo de probabilidad a usar, a continuacin,
utiliza la informacin de elementos cercanos a optimizar la estimacin de la
probabilidad.
Binarizacin
DCT
VLC
Modelo
Contextual
Codificacin
Aritmtica
Redundancias Temporal
Las imgenes en movimiento contiguas difieren muy poco una de otra
La solucin
Redundancias Temporal
DPCM : Diferencial Pulse Code Modulation
Imagen Diferencia
Imagen Actual
Imagen Previa
Vectores de movimiento
baja
Compresin
alta
Tasa de bits
Estos son:
Cuadros Intra-Codificados o Cuadros I
baja
alta
Cuadro I
Intracodificadas o Cuadros I
Procedimiento de compresin parecido al JPEG
Son imgenes que se codifican en forma independiente, sin aprovechar
ninguna redundancia temporal
Se utilizan para realizar la prediccin del movimiento. Como el ojo es mas
sensible a la informacin de luminancia, es esta la que solo se codifica
En la memoria quedan almacenados los cuadros de referencia sin cuantizar
DCT
Cuantizacin
Lectura
Coeficientes
Codificacin
Entrpica
Inversa de
Cuantizacin
IDCT
+
Memoria
Vectores de movimiento
Diagrama simplificado
Control de
Tasa
Cuadro P
Predecidas o Cuadros P
La codificacin se realiza utilizando la compensacin de movimiento hacia
delante a partir de una imagen previa I u otra P. Pueden propagar errores y se
utiliza para la prediccin de imgenes B u otras P.
Se estiman los vectores de movimiento con la entrada de video y el cuadro de
referencia almacenado.
DCT
Cuantizacin
Lectura
Coeficientes
Codificacin
Entrpica
Inversa de
Cuantizacin
IDCT
+
Memoria
Vectores de movimiento
Diagrama simplificado
Control de
Tasa
Cuadro B
Bidireccionales o Cuadros B
Se obtienen usando compensacin de movimiento bidireccional a partir de
imgenes I y P.
Esta codificado por la interpolacin entre los cuadros I y P.
No se utilizan para predecir ninguna imagen, no propagan error
DCT
Cuantizacin
Lectura
Coeficientes
Codificacin
Entrpica
Inversa de
Cuantizacin
IDCT
+
Memoria
Vectores de movimiento
Diagrama simplificado
Control de
Tasa
Orden de codificacin
Como los I solo exploran la redundancia espacial (como un JPEG) y son utilizados como
referencia para los cuadros P y B. Por eso los cuadros I son los primeros en ser codificados.
N=G.O.P.
RECOMENDACIN ITU
M=3
N=12
codificacin entrpica
+
transformada discreta coseno DCT.
Niveles y Perfiles
MPEG-2
Niveles y Perfiles
MPEG-2
High
MP&HL
80Mbps
1920x1152
60fps
1920x1080
50fps
NIVELES
High-1440
SP&H14L
60Mbps
1440x1152
60fps
1440x1080
60fps
Main
720x480
60fps
720x576
50fps
SP&ML
15Mbps
SSP&H14
L
15Mbps
MP&ML
15Mbps
SNR&ML
15Mbps
MP&LL
4Mbps
SNR&LL
4Mbps
4:2:0
I,P
4:2:0
I,P,B
simple
Main
Low
352x240
60fps
352x288
50fps
Muestreo
secuencia
HP&HL
100Mbps
HP&H14L
80Mbps
20Mbps
HP&ML
20Mbps
4:2:0
I,P,B
4:2:2
I,P,B
4:2:2
I,P,B
SNR
Scalable
Spatial
scalable
High
PERFILES
MPEG-4
Principales diferencias
Implementacin de 16bits
MPEG-4
Fondos
Objetos en primer plano
Niveles y Perfiles
MPEG-4
Nmero de niveles
1485
99
64 kbit/s
80 kbit/s
192 kbit/s
256 kbit/s
128x96@30.9 (8)
176x144@15.0 (4)
1b
1485
99
128 kbit/s
160 kbit/s
384 kbit/s
512 kbit/s
1.1
3000
396
192 kbit/s
240 kbit/s
576 kbit/s
768 kbit/s
1.2
6000
396
384 kbit/s
480 kbit/s
1152 kbit/s
1536 kbit/s
1.3
11880
396
768 kbit/s
960 kbit/s
2304 kbit/s
3072 kbit/s
11880
396
2 Mbit/s
2.5 Mbit/s
6 Mbit/s
8 Mbit/s
2.1
19800
792
4 Mbit/s
5 Mbit/s
12 Mbit/s
16 Mbit/s
2.2
20250
1620
4 Mbit/s
5 Mbit/s
12 Mbit/s
16 Mbit/s
40500
1620
10 Mbit/s
12.5 Mbit/s
30 Mbit/s
40 Mbit/s
3.1
108000
3600
14 Mbit/s
17.5 Mbit/s
42 Mbit/s
56 Mbit/s
3.2
216000
5120
20 Mbit/s
25 Mbit/s
60 Mbit/s
80 Mbit/s
245760
8192
20 Mbit/s
25 Mbit/s
60 Mbit/s
80 Mbit/s
4.1
245760
8192
50 Mbit/s
62.5 Mbit/s
150 Mbit/s
200 Mbit/s
4.2
522240
8704
50 Mbit/s
62.5 Mbit/s
150 Mbit/s
200 Mbit/s
589824
22080
135 Mbit/s
168.75 Mbit/s
405 Mbit/s
540 Mbit/s
5.1
983040
36864
240 Mbit/s
300 Mbit/s
720 Mbit/s
960 Mbit/s
Nmero de niveles
High Profile
High 10 Profile
128x96@30.9 (8)
176x144@15.0 (4)
176x144@30.3 (9)
320x240@10.0 (3)
352x288@7.5 (2)
320x240@20.0 (7)
352x288@15.2 (6)
320x240@36.0 (7)
352x288@30.0 (6)
320x240@36.0 (7)
352x288@30.0 (6)
352x480@30.0 (7)
352x576@25.0 (6)
352x480@30.7(10)
352x576@25.6 (7)
720x480@15.0 (6)
720x576@12.5 (5)
352x480@61.4 (12)
352x576@51.1 (10)
720x480@30.0 (6)
720x576@25.0 (5)
720x480@80.0 (13)
720x576@66.7 (11)
1280x720@30.0 (5)
1280x720@60.0 (5)
1280x1024@42.2 (4)
1280x720@68.3 (9)
1920x1088@30.1 (4)
2048x1024@30.0 (4)
1280x720@68.3 (9)
1920x1088@30.1 (4)
2048x1024@30.0 (4)
1920x1088@64.0 (4)
2048x1088@60.0 (4)
1920x1088@72.3 (13)
2048x1024@72.0 (13)
2048x1088@67.8 (12)
2560x1920@30.7 (5)
3680x1536/26.7 (5)
1920x1088@120.5 (16)
4096x2048@30.0 (5)
4096x2304@26.7 (5)
Ejemplos para alta resolucin @
frame rate
(max stored frames)
in Level
Sistema Auditivo
Sistema Auditivo
Laberinto
Caracol
Odo externo
Odo interno
Modelo Psicoacusico
Enmascaramiento
Tono de enmascaramiento
Umbral de enmascaramiento
Modelo Psicoacusico
Enmascaramiento
Modelo Psicoacusico
Enmascaramiento
enmascaramiento.mdl
Entrada de audio
Filtrado
(M)DCT
CUANTIZADOR
sub-bandas
FFT
MODELO
PSICOACUSTICO
El audio se divide en subbandas, luego se aplica la MDCT para obtener una resolucion fina en frecuencia de
cada sub-banda.
De forma paralela se procesa el espectro para que junto con el modelo psicoacsico realizar la reduccion de
irrelevancias
Capa de sistema
Codificado
r
de video
Empaquetad
or
Codificado
r
de audio
Empaquetad
or
E.S.
MUX
de TS
MUX
de PS
TS
PS
P.E.S.
000001h
8bits
Max. 64kB 16bit
16 bits
El tamao del paquete es variable
0000h: el paquete puede xceder los 64kB
P.E.S.
PTS
Indica cuando un cuadro decodificado puede ser presentado a la salida del decodificador.
DTS
Indica cuando un cuadro I,B o P debe ser decodificado.
El valor de clock utilizado es de 90kHz en un contador de 33bits
P.E.S.
www.tektronix.com
P.E.S.
T.S.
Los PES son paquetes grandes, no adecuados para ser transmitidos en un canal de comunicacin.
Los PES son divididos en paquetes de longitud constante, 184byte de datos mas 4bytes de
cabecera llamado Transport Stream packet.
El proceso de formacin de los paquetes de transporte est sujeto al cumplimiento de las dos
condiciones fundamentales siguientes:
a). El primer byte de cada PES-Packet debe ser el primer byte del payload de un transport
packet.
b). Un transport packet solamente puede contener datos tomados de un PES-Packet.
Header T.S.
Sinc: 47h
Error flag: error en etapas previas
Start flag: Inicio de un PES
Priority: prioridad del paquete respecto los
demas
PID: identifica cada secuencia PES
8191 paquete de relleno.
0000 (PSI) Program Specific Information
Header T.S.
Header T.S.
www.tektronix.com
Multiplexado de PES en TS
Interviene en el proceso de transmisin asignando los PES de cada una de las fuentes de audio,
video y datos a la trama de transporte
Una vez determinados los PIDs de los PES de audio, video y datos. Estos son inyectados al deco.
La decodificacin necesita una sincronizacin adicional.
El primer paso es sincronizar el reloj del transmisor con el receptor.
27MHz
0,037s
La PAT es una tabla PSI que lista todos los programas contenidos en un flujo de transporte y apunta a los a la
tabla que contienen informacin sobre los programas llamada PMT .
Los E.S. de audio,video y datos pertenecientes a los programas individuales se describen en una PMT.
El mecanismo le proporciona al receptor la informacin para saber que PES de audio, video y datos esta
asociado a cada uno de los programas que se transmiten.
Al programa #59201 le
corresponde la PMT con
PID = 0x102
PID3
PID2
PID1
0x00
PID=0x00
Puntero a
PMT2
Puntero a
PMT3
PID3
PID2
PID1
PID
Puntero a
PMT1
Puntero al audio ES
Puntero al video ES
Mediciones INTI
Al modulador
Preguntas
Errores
Errores
TS_sync_loss
Sync_byte_Error
47h
Errores
PAT_error
Como la estructura de cada programa es abierta, se transmite la composicin de cada
programa en TS especiales. El mas importante es el PAT que se transmiten en TS
con PID=0 y TableID=0. Si esta tabla se pierde o tiene errores no se puede hacer la
decodificacin.
PAT_error ocurre
-
Se pierde el PAT
El perodo de repeticin es mayor a 500ms
Errores
PMT_error
Para cada programa el PMT es transmitido max. cada 500ms.
El PID del PMT esta en la PAT
El PMT contiene los respectivos PID de todos los ES pertenecientes a un programa
PMT_error ocurre
-
Errores
PID_error
Si el PID informado en una PMT no hay forma de decodificar el MPEG, porque no se puede
acceder al ES
Continuity_Count_Error
Continuity_Count_Error
Referencias