Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Compresion de Fuente
Compresion de Fuente
f.rico@entel.upc.es
(compresin)
(control de errores)
Codificacin de fuente
Codificacin de canal
Criptografa
Codificacin de fuente
Sin prdidas: La informacin decodificada es idntica a la original:
Huffman, Lempel-Ziv, etc.
Con prdidas: La informacin decodificada puede ser distinta de la original
JPEG,MPEG,etc.
f.rico@entel.upc.es
z
z
Incertidumbre:
Incertidumbre antes del suceso
Informacin:
Informacin despus del suceso
Incertidumbre
Resuelta
Informacin
Proporcionada
f.rico@entel.upc.es
S1,
S1 S2 sucesos independientes:
(S)=logb(1/p(S))
Unidades: b=2 bit b=e nat
f.rico@entel.upc.es
H = I = p ( Si ) I ( Si )
i
H = p ( Si ) log 2 (1 / p ( Si ))
i
f.rico@entel.upc.es
Bits
Cdigo A Cdigo B
1
00
0
2
01
10
3
10
110
3
11
111
1,75
2
1,75
Entropa Long. Med. Long. Med.
f.rico@entel.upc.es
Tipos de Cdigos
z
z
Requisito:
Ninguna palabra cdigo es prefijo de otra
f.rico@entel.upc.es
Cdigos Instantneos
Instantneo Decodificacin nica
Decodificacin nica Instantneo
Ejemplo:
No es instantneo pero es
de decodificacin nica
A = {a 1 , , a n } con longitudes
alfabeto
n
{L 1 , , L n }
D smbolos
D Lk 1
k =1
Ejemplo Sm bolo
A
B
C
D
1 1 1 1
+ + + =1
4 4 4 4
1 1 1 1
+ + + =1
2 4 8 8
1 1 1 1
+ + + = 0.9375 < 1
2 4 8 16
f.rico@entel.upc.es
Lmite Fundamental
z
H l
Lema de Gibbs
z
i =1
con qi = 1
i =1
0 H ( x ) log 2 A
La entropa es mxima cuando los smbolos
son equiprobables
f.rico@entel.upc.es
Aspecto de la Entropa
f.rico@entel.upc.es
Huffman
Huffman adaptativo (*)
Aritmticos
Rfagas
Lempel-Ziv
Cdigos de Huffman(i)
z
0.5
0.25
0.125
0.125
1
0.5
0.25
Smbolo Cdigo B
1
A
01
B
001
C
010
D
f.rico@entel.upc.es
Cdigos de Huffman(ii)
0.55
1
0.45
0.30
0.13
0.12
0.55
0.25
l = 1.80 dig.bin./simb.
H = 1.7892 bits.
Smbolo Cdigo B
0
A
11
B
101
C
100
D
f.rico@entel.upc.es
0,45
0,45
0,3
0,3
0,45
0,13
0,45
0,12
0,3
0,13
0,3
0,12
0,13
0,13
0,12
0,12
0,45
0,3
0,45
0,3
0,13
0,45
0,12
0,45
0,13
0,3
0,12
0,3
0,13
0,12
0,13
0,12
0,2025
0,135
0,135
0,09
0,0585
0,0585
0,054
0,054
0,039
0,039
0,036
0,036
0,0169
0,0156
0,0156
0,0144
00
110
101
1111
0111
0110
0101
0100
11101
11100
10011
10010
100011
100010
100001
100000
f.rico@entel.upc.es
f.rico@entel.upc.es
A=00
B=01
C=10
D=11
A=00
B=10
C=101
D=100
A=0
B=11
C=101
D=100
A=11
B=0
C=101
D=100
A 00 A
B 10 B
B 11 B
A 11 A
P(A)=1/4
P(B)=1/4
P(C)=1/4
p(D)=1/4
P(A)=2/5
P(B)=1/5
P(C)=1/5
p(D)=1/5
P(A)=2/6
P(B)=2/6
P(C)=1/6
p(D)=1/6
P(A)=2/7
P(B)=3/7
P(C)=1/7
p(D)=1/7
A=00
B=01
C=10
D=11
A=00
B=10
C=111
D=110
A=0
B=11
C=101
D=100
A=11
B=0
C=101
D=100
f.rico@entel.upc.es
10
Cdigos Aritmticos
z
z
z
z
z
f.rico@entel.upc.es
0.2
0.3
0.1
0.2
0.1
0.1
0
0.2
0+0.2*0.5=0.1
0+0.2*0.6=0.12
0.1+0.02*0.2=0.104
0.1+0.02*0.5=0.11
0.104+0.006*0.8=0.1088
0.104+0.006*0.9=0.1094
ACBEF 0.1088+0.0006*0.9=0.10934
0.1088+0.0006*1=0.1094
[0,0.2)
A
[0.2,0.5)
[0.5,0.6) AC
[0.6,0.8)
[0.8,0.9) ACB
[0.9,1)
ACBE
0.2
0.1
0.12
0.104
0.11
0.1088 0.1094
0.10934 0.1094
f.rico@entel.upc.es
11
Decodificacin
A
B
C
D
E
F
0.2
0.3
0.1
0.2
0.1
0.1
[0,0.2)
[0.2,0.5)
[0.5,0.6)
[0.6,0.8)
[0.8,0.9)
[0.9,1)
0,10934
0,10934 A
(0,10934-0)/0,2
0,5467 C
(0,5467-0,5)/(0,6-0,5) 0,467 B
(0,467-0,2)/(0,5-0,2)
0,89 E
(0,89-0,8)/(0,9-0,8)
0,9 F
f.rico@entel.upc.es
Cdificacin Lempel-Ziv
z
f.rico@entel.upc.es
12
LZ-77: Ejemplo
A
f.rico@entel.upc.es
LZ-77:Algoritmo
1
2
3
4
f.rico@entel.upc.es
13
LZSS: Ejemplo
A
A A B C (3,3) C A
f.rico@entel.upc.es
LZ-78: Ejemplo
A
DICCI0NARIO
1
AB
ABC
CA
DICCI0NARIO
AB
ABC
CA
f.rico@entel.upc.es
14
LZW: Ejemplo
DICCI0NARIO
1
DICCI0NARIO
1
AA
AA
AB
AB
BC
BC
CA
CA
AAC
AAC
CB
CB
10
BCC
10
BCC
f.rico@entel.upc.es
LZMW: Ejemplo
DICCI0NARIO
DICCI0NARIO
AA
AA
BC
BC
AAC
AAC
BCC
BCC
f.rico@entel.upc.es
15
Burrows-Wheeler (i)
z
Transformacin !REVERSIBLE
P
0C
1O
2L
3L
4E
5B
6A
A
C
O
L
L
E
B
B
A
C
O
L
L
E
E
B
A
C
O
L
L
L
E
B
A
C
O
L
L
L
E
B
A
C
O
U
O
L
L
E
B
A
C
P
6A
5B
0C
4E
3L
2L
1O
B
E
A
L
L
O
C
E
L
B
L
O
C
A
L
L
E
O
C
A
B
L
O
L
C
A
B
E
O
C
L
A
B
E
L
U
C 0
A
O
B
E
L
L
SALIDA: CAOBELL,0
f.rico@entel.upc.es
Burrows-Wheeler (ii)
z
Sorprendentemente? la transformacin
anterior (para bloques de algunos KB)
agrupa los caracteres en rfagas.
Usando luego codificadores sencillos,se
consiguen tasas de compresin altas.
f.rico@entel.upc.es
16
Inversin de la BWT
0
0
1
2
3
4
5
6
U
C
A
O
B
E
L
L
P
A
B
C
E
L
L
O
1
3
0
4
5
6
2
0 1 3 4 5 6 2
C A B E L L O
f.rico@entel.upc.es
17
Prestaciones
z
Tamao
Bits/Byte
Leyenda
BWT-ARI(A)
BWT-ARI(B)
gzip(LZ-77)
ARI
compress(LZW)
pack(Huffman)
f.rico@entel.upc.es
18