Está en la página 1de 47

1

Fotogrametría Digital
Tema 6 – Preprocesamiento de Imágenes en Fotogrametría Digital

Prof. Dr. Jorge Delgado García


Dpto. Ingeniería Cartográfica, Geodésica y Fotogrametría
Universidad de Jaén
jdelgado@ujaen.es

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
2

Justificación:
La inclusión de este tema se justifica por el hecho de la importancia que tiene en Fotogrametría
Digital las tareas de manipulación previa y almacenamiento de las imágenes digitales debido al
volumen necesario. Por tanto, es fundamental el conocimiento de las diferentes estrategías de
gestión de almacenamiento aplicadas en Fotogrametría Digital así como de las técnicas
fundamentales de compresión de imágenes y los efectos que tienen sobre la calidad de las
mismas.

Objetivos:
• Conocer los sistemas de almacenamiento básicos de imágenes digitales fotogramétricas.
• Conocer las estrategias fundamentales de gestión de ficheros de imágenes digitales en el
flujo de trabajo fotogramétrico.
• Conocer y analizar las diferentes técnicas de compresión de imágenes digitales, con un
especial hincapié en los efectos que tienen sobre las imágenes.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
3

Estructura del Tema


6.1 Sistemas de Almacenamiento y Manipulación de Imágenes Digitales Fotogramétricas
6.1.1 Sistemas de Almacenamiento de Imágenes Digitales Fotogramétricas
6.1.2 Manipulación de Imágenes Digitales Fotogramétricas
6.2 Compresión de imágenes digitales
6.2.1 Métodos de compresión no degradativos
6.2.2 Métodos de compresión degradativos

Bibliografía
• González y Woods. Tratamiento Digital de Imágenes. Addison-Wesley/Diaz de Santos
• Lammi,J. y Sarjakoski, T. (1995). Image Compression by the JPEG Algorithm. PE&RS. 61(10), 1261-1266.
• Lizard Tech (1997). Mr SID. White Paper. 13 pág. Información de la compañía.
• Lynch, T. (1985). Data Compression Techniques and Applications. Lifetime Learning Publications. Belmont,
California.
• Novak, K. y Shanin, F.S. (1996). A Comparison of two Image Compression Techniques for Softcopy
Photogrammetry. PE&RS, 62(6), 695-701.
• Rabbani, M. y Jones, P. (1990). Digital Image Compression Techniques. SPIE Optical Engineering Press,
Bellingham, Washington.
• Storer, J. (1988). Data Compression: Methods and Theory. Computer Science Press. Rockville, Maryland.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
4

Sistemas de almacenamiento de imágenes digitales

• Discos magnéticos: Grabación de datos al modificar la posición del campo magnético.


Discos flexibles, Discos duros, Matrices de discos duros (RAID)
Ley de Murch: “Cada 18 meses se duplica la capacidad de los discos duros”
Sistemas de cintas. DAT, DLT, Exabyte. Velocidad baja. Secuencial.
Baterías de cintas. Sistemas robotizados.
• Discos ópticos: Sistemas tipo RAD (información leída y escrita por un láser)
WORM: CD/DVD. 120mm diámetro. Capac: 1Gb. Veloc: 7.6Mb/s (x52). 1x=0.2Mb/s
DVD: Capac.máxima: 17Gb. Veloc.máxima: x16.
• Sistemas holográficos

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
5

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
6

NAS (Network Attached Storage):


Tecnología de almacenamiento dedicada a compartir la capacidad de almacenamiento de un
servidor con ordenadores personales o servidores clientes a través de una red (normalmente
TCP/IP), haciendo uso de un Sistema Operativo optimizado para dar acceso con los protocolos
CIFS, NFS, FTP o TFTP. Son dispositivos a los que se accede desde los equipos a través de
protocolos de red (normalmente TCP/IP). También se podría considerar que un servidor que
comparte sus unidades por red es un sistema NAS, pero la definición suele aplicarse a sistemas
específicos.
Los protocolos de comunicaciones NAS son basados en ficheros por lo que el cliente solicita el
fichero completo al servidor y lo maneja localmente, están por ello orientados a información
almacenada en ficheros de pequeño tamaño y gran cantidad. Los protocolos usados son
protocolos de compartición de ficheros como NFS, Microsoft Common Internet File System
(CIFS).

Normalmente, estos dispositivos están dispuestos en RAID (Redundant Arrays of Independent


Disks) o contenedores de almacenamiento redundante.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
7

RAID (Redundant Arrays of Independent Disks – Redundant Array of Inexpensive Disks)


Sistema de almacenamiento que usa múltiples discos duros entre los que distribuye o replica los
datos. Los beneficios de un RAID respecto a un único disco son uno o varios de los siguientes:
mayor integridad, mayor tolerancia a fallos, mayor throughput (rendimiento) y mayor capacidad.
En sus implementaciones originales, su ventaja clave era la habilidad de combinar varios
dispositivos de bajo coste y tecnología más antigua en un conjunto que ofrecía mayor capacidad,
fiabilidad, velocidad o una combinación de éstas que un solo dispositivo de última generación y
coste más alto. En el nivel más simple, un RAID combina varios discos duros en una sola unidad
lógica. Así, en lugar de ver varios discos duros diferentes, el sistema operativo ve uno solo. Los
RAID suelen usarse en servidores aunque se encuentran también como opción en los
ordenadores personales más avanzados.

De igual forma, el cambio de «barato» a «independiente» confunde a muchos sobre el pretendido


propósito del RAID. Incluso hay algunas implementaciones del concepto RAID que usan un solo
disco. Pero en general, diremos que cualquier sistema que emplee los conceptos RAID básicos de
combinar espacio físico en disco para los fines de mejorar la fiabilidad, capacidad o rendimiento
es un sistema RAID.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
8

SAN (Storage Area Network)


Es una red concebida para conectar servidores, matrices (arrays) de discos y librerías de soporte.
Principalmente, está basada en tecnología fibre channel y más recientemente en iSCSI. Su
función es la de conectar de manera rápida, segura y fiable los distintos elementos que la
conforman. Su coste es más elevado que un NAS.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
9

Sistemas de manipulación de imágenes digitales fotogramétricas

• Sistema de almacenamiento individual.


Coste reducido / Inversión gradual. Capacidad en torno a 1 Tb
• Sistema de almacenamiento centralizado.
Coste elevado / Gran inversión / Elevado rendimiento / Capacidad varios Tb (20-30)
• Sistema de almacenamiento jerárquico (HSM)
Diferentes sistemas de coste de almacenamiento variable / Optimización de
recursos.
• Digitalización/Procesado/Borrado
Elevado coste digitalización. Necesidad de repetir ciertos procesos (OI).
Deterioro de los negativos originales.

El volumen de salvaguarda es un verdadero problema … una empresa de tamaño medio


puede generar en torno a 30-40 Tb/año … más de 6000 DVDs.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
10

Compresión de imágenes digitales


La compresión de las imágenes digitales es una necesidad para la mayoría de las aplicaciones
fotogramétricas, en las que suele existir un número considerable de imágenes de gran
tamaño que deben ser almacenadas en un espacio limitado o bien transmitidas de un
sistema a otro.

Diferencia entre información y datos (González y Woods,1996):


“éste podría ser el caso si una persona muy habladora y otra muy parca en palabras
contasen la misma historia. Aquí la información en la historia; las palabras son los datos
necesario para relatar la información. Si las dos personas emplean diferente número de
palabras para contar la misma historia se crean dos versiones distintas de la misma, y al
menos una de ellas incluye datos no esenciales. Es decir, contienen datos (o palabras) que
bien proporcionan información sin relevancia o bien vuelven a decir lo que ya se sabía”.

Objetivo fundamental: Reducción de la cantidad de datos necesarios para la representación de la


información original, eliminando los datos que no aportan información (datos redundantes).
Así se consigue la reducción del número de bits requeridos para representar una imagen
eliminando las redundancias existentes en la misma.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
11

Conceptos básicos de Teoría de la Información

Entropia:
Es un parámetro que mide el grado de desorden o caos en un sistema termodinámico.
Es una medida del grado de incertidumbre.
Es una medida del contenido de información medio por símbolo en una fuente.
Es una medida del contenido de información real de una imagen (Lynch, 1983)

La cantidad de información I(ai) para un símbolo ai viene dado por la expresión:


1
I(ai )  log 2  log 2p(ai )
p(ai )
Siendo su valor medio la entropía:
N N
E   p(ai ) I(ai )   p(ai )  log 2p(ai )
i 0 i 0

se expresa en bits/simbolo (bits/pixel) y su cálculo requiere el conocimiento propio de


la fuente.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
12

Cuantificación de la redundancia: Si n1 y n2 representan el tamaño de dos ficheros que


contienen la misma información, la redundancia relativa se define como:

1 n1
RD  1 CR 
CR n2
donde CR se denomina relación o tasa de compresión y se define como la relación entre el
número de bits de la imagen original (n1) dividido por el número de bits de la imagen
comprimida (n2).
Si n2=n1, CR=1 y RD=0 (no existe información redundante)
Si n2<n1, CR>1 y RD≈1 (compresión significativa, redundancia alta)
Si n2>>n1, CR≈0 y RD<0 (no existe compresión)
Tipos de redundancias:
Espacial: Debida a la correlación del ND de un píxeles y los ND de los vecinos.
Espectral: Correlación entre los niveles digitales de las diferentes bandas o canales.
Temporal: Correlación entre las imágenes tomadas en momentos diferentes (video).

Entropía máxima: Hmáx = log2 M, donde M es el número de niveles digitales.


R = log2 M - H (Lynch, 1985).

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
13

• La compresión de imágenes es una necesidad real en Fotogrametría al requerir las


imágenes una gran cantidad de información para garantizar un nivel de calidad similar al
que tenían las imágenes analógicas.

• La compresión de datos es la técnica que se emplea para la reducción de la redundancia


de la representación de los datos para disminuir los requerimientos de almacenamiento
y los costes (y tiempos) de transmisión.

• La reducción de los requerimientos de almacenamiento equivale a incrementar la


capacidad de los sistemas de almacenamiento y las tasas de transmisión (bandwidth).

• La compresión se considera básica para el desarrollo de los sistemas de comunicación y


las aplicaciones multimedia en entorno web.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
14

Ventajas:
- Reducción de almacenamiento
- Reducción de los tiempos de transmisión (incremento ancho de banda)
- Mejor acceso a las bases de datos
- Se puede implementar sistemas de seguridad asociados a la compresión
- Reducción de los costes (y tiempos) de backup
Inconvenientes:
- Tiempo de compresión/descompresión
- Compatibilidad de formatos
- Pérdida de información
- Errores en la transmisión

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
15

Imagen Terrestre Imagen Marca


Bits/pixel Imagen Aérea
(Carretera) (Target)
Entropía 5.79 3.36 2.75
Redundancia 2.21 4.64 5.25

La tasa de compresión máxima sin pérdida de información se define como (Storer, 1988):
log2 M
C máx 
H

Esta tasa se alcanza cuando la codificación de la imagen da lugar a una tasa (bits/píxel)
similar a la entropía, para ello es necesario eliminar o reducir la correlación entre los
píxeles y además codificar los píxeles de una forma tan eficiente como sea posible.
Es importante tener en cuenta que existen diferentes métodos y estrategias de compresión,
obteniendo diferentes resultados dependiendo de las características de las imágenes.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
16

Proceso de Compresión-Descompresión (CODEC)

Imagen original (D) Imagen comprimida c(D) Imagen restaurada (D´)


Compresión Descompresión

Tipos de Compresión-Descompresión (CODEC)


a) Lossless: no degradativa (D=D’)
b) Lossy: degradativa (existe pérdida de información) (D≠D’)
c) Perceptual lossless

Objetivo:
Compresión máxima dentro de unos niveles de pérdida de información que no afecten a la
calidad del trabajo final.

Al respecto hay que tener en cuenta que aunque la degradación sea inapreciable al nivel
de visión del ojo humano si puede tener importantes efectos cuando esta imagen sea
tratada mediante un sistema informático de procesamiento de imágenes.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
17

Etapas de la compresión
1) Elección del tipo de compresión (degradativa – no degradativa)
2) Elección del modelo de compresión:
a) Estático: con códigos fijos y predeterminados
b) Dinámico: con códigos que se ajustan a la fuente (adaptativos)
3) Reducción de la redundancia de los datos: transformación de los datos
4) Reducción de la entropía: cuantización
Medida de la calidad de la imagen comprimida
1) Medidas subjetivas
MOS: Mean observers score (mean opinion score). Valoración de 1 a 5
2) Medidas objetivas
 1 M N 2  
M N

1 M N
  I (i, j)    I2 (i, j) 
RMSE   I(i, j)  I' (i, j)
2
SNR  20 log 10  MN
i 1 j 1
  10 log 10  M N i1 j1 
MN i1 j1 

RMSE 
   I(i, j)  I' (i, j) 
2

   i1 j1 
 255 
PSNR  20 log 10  
 RMSE 
3) Tiempo de compresión
4) Complejidad de la compresión

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
18

Estándares de compresión
1) Imagen fija
International Organization of Standarization (ISO)
International Telecommunication Union –Telecommunication Sector-(ITU-T)

1992: Joint Photographic Expert Group (ISO/IEC IS 10918-1; ITU-T T-81)


2) Video
MPEG: MPEG 1 ISO 11172 (1994) -> 1.5 Mbps
MPEG 2 ISO 13818 (1995) -> 6 Mbps

MPEG 21
3) Audio
MPEG: MPEG 1 Layer III (MP3)
MPEG 2 – MPEG 4
4) Texto
Lempel-Ziv (LZ): LZ77, LZ78, LZZZ, LZW, LZC, LZWAJ, ZIP, GZIP, PKZIP, PKUNZIP

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
19

Métodos de compresión no degradativos (lossless compression)


Se utilizan cuando se requiere que la imagen reconstruida sea idéntica a la imagen original.
Por ejemplo: Imágenes médicas en las que las variaciones de niveles digitales pueden
modificar el diagnóstico final.

La compresión no degradativa también es frecuentemente aplicada en Teledetección, donde


las características espectrales de las imágenes deben ser preservadas. Como es lógico
esperar, las tasas de compresión de este tipo de métodos son sensiblemente inferiores
comparadas con los métodos degradativos (Rabbani y Jones, 1990).

Los métodos de compresión no degradativos más frecuentemente empleados son:


- run lenght encoding (RLE)
- codificación Huffman
- codificación Huffman modificada

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
20

Run Lenght Encoding (RLE)


Es un método muy simple. Emplea la redundancia existente entre datos consecutivos, así por
ejemplo, en las imágenes suelen existir áreas niveles digitales constantes (series de valores
repetitivos que son denominadas runs), y son representadas en la imagen comprimida mediante
un valor que indica el número de veces que se repite el dato y el propio dato:
AAAABBBBBCCCCCCCCDEEEE (Long: 22 bytes) 4A5B8C1D4E (Long: 10 bytes)
Es importante tener en cuenta que si no existen cadenas consecutivas con el mismo valor, el
tamaño del fichero comprimido resultante será mayor que el original, al requerir dos valores para
cada píxel (número de repeticiones y dato).

RLE modificado (formato MacPaint): Consiste en la introducción de un código adicional (en nuestro
ejemplo, el carácter +) que indica cuando se está empleando la codificación. Así resultaría:
ABCDDDDDDDDEEEEEEEEE (Long: 20 bytes) ABC+8D+9E (Long: 9 bytes)
Inconveniente: 3 valores para cada cadena.
Ventaja: Flexibilidad para compresión de imágenes que presentan zonas homogéneas y
heterogéneas.
RLE: Formatos PCX, GEM, TIFF y TGA.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
21

Método de Huffman (1952)


Se basa en el empleo de códigos de longitud variable que sustituyen a los valores originales de la
imagen. La longitud del código de codificación es inversamente proporcional a la frecuencia
de aparición del dato en la imagen digital. Es la misma filosofía que el empleado de Morse …
la longitud de cada carácter es proporcional a la frecuencia de aparición del mismo. Ejemplo:
E se codifica como . ; Q se codifica como - - . -

Los códigos Huffman se calculan a partir del análisis de los datos de la imagen original y
asignando códigos de menor longitud a los datos más frecuentes, siendo el objetivo la
reducción del número medio de bits por carácter empleado para la codificación.

Así si se considera el siguiente párrafo:


“Ésta era la inscripción que había en la puerta de cristal de una tiendecita, pero naturalmente sólo
se veía así cuando se miraba a la calle, a través del cristal, desde el interior en penumbra.”
(La historia interminable, Michael Ende)

Se calcularía el histograma de frecuencia de caracteres.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
22

Símbolo Frec.Abs. Código Long.Cód. Símbolo Frec.Abs. Código Long.Cód.


Espacio 34 000 3 p 4 001000 6
A 24 010 3 o 4 001001 6
E 22 100 3 , 3 011110 6
R 12 0110 4 i 3 011111 6
L 11 1010 4 b 3 011100 6
N 11 1011 4 m 3 011101 6
S 10 1100 4 v 2 111110 6
T 10 1101 4 ó 2 111111 6
I 10 1110 4 h 1 1111010 7
C 7 00101 5 q 1 1111011 7
D 7 00110 5 É 1 1111000 7
U 6 00111 5 é 1 1111001 7

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
23

Símbolos con mayor frecuencia: Spc (34), a (24) y e (22). Longitud que reciben los códigos
Huffman más= cortos (longitud igual a 3).
Ejemplo de codificación: Palabra separada por letras: c - r - i - s - t - a – l
Códigos de cada letra: 00101 - 0110 - 1110 - 1100 - 1101 - 010 - 1010
Almacenamiento: 1 byte/carácter. Total: 56 bits (7 bytes).
Compresión: Espacio: 28 bits, TC: 2.0, E: 99.29%, H: 3.9717 bits/símbolo, Espacio mínimo:
27.8019 bits.

Obtención de códigos:
1) Ordenar las probabilidades de los símbolos que componen el alfabeto de la fuente de mayor a
menor.
2) comenzando por los símbolos con menores probabilidades pa y pb crear un nuevo nodo, cuya
probabilidad sea la suma de pa y pb (reducción de la fuente).
3) repetir el proceso utilizando el nuevo nodo hasta que quede uso solo con probabilidad igual a 1.
4) etiquetar cada rama situada a la izquierda con un 0 y cada rama en la derecha con un 1
(asignación de códigos).
5) el código de cada símbolo original será determinado por la sucesión de los códigos impuestos
desde la raíz hacía las ramas.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
24
Símb olo Frec.Abs. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
<Espacio> 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 38 44 48 62 82 110
a 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 28 34 38 44 48 62 82
e 22 22 22 22 22 22 22 22 22 22 22 22 22 22 22 23 24 28 34 38 44 48
r 12 12 12 12 12 12 12 12 12 12 13 15 18 20 22 22 24 24 28 34 38
l 11 11 11 11 11 11 11 11 11 12 12 13 15 18 20 22 22 24 24 28
n 11 11 11 11 11 11 11 11 11 11 12 12 13 15 18 20 22 22 24
s 10 10 10 10 10 10 10 10 10 11 11 12 12 13 15 18 20 22
t 10 10 10 10 10 10 10 10 10 10 11 11 12 12 13 15 18
i 10 10 10 10 10 10 10 10 10 10 10 11 11 12 12 13
c 7 7 7 7 7 7 7 8 8 10 10 10 11 11 12
d 7 7 7 7 7 7 7 7 8 8 10 10 10 11
u 6 6 6 6 6 6 6 7 7 8 8 10 10
p 4 4 4 4 4 6 6 6 7 7 8 8
o 4 4 4 4 4 4 6 6 6 7 7
, 3 3 3 4 4 4 4 6 6 6
í 3 3 3 3 4 4 4 4 6
b 3 3 3 3 3 4 4 4
m 3 3 3 3 3 3 4
v 2 2 2 3 3 3
ó 2 2 2 2 3
h 1 2 2 2
q 1 1 2
É 1 1
é 1
Total: 192

Símb olo Cód 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22


<Espacio> 00 0 00 0 00 0 00 0 00 0 00 0 00 0 00 0 00 0 00 0 00 0 00 0 00 0 00 0 00 0 00 0 00 0 11 10 01 00 1 0
a 01 0 01 0 01 0 01 0 01 0 01 0 01 0 01 0 01 0 01 0 01 0 01 0 01 0 01 0 01 0 01 0 00 1 00 0 11 10 01 00 1
e 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 011 01 0 00 1 00 0 11 10 01
r 0110 0110 0110 0110 0110 0110 0110 0110 0110 0110 0011 0010 111 110 10 1 10 0 011 01 0 00 1 00 0 11
l 1010 1010 1010 1010 1010 1010 1010 1010 1010 0111 0110 0011 0010 111 110 10 1 10 0 011 01 0 00 1
n 1011 1011 1011 1011 1011 1011 1011 1011 1011 1010 0111 0110 0011 0010 111 110 10 1 10 0 011
s 1100 1100 1100 1100 1100 1100 1100 1100 1100 1011 1010 0111 0110 0011 0010 111 110 10 1
t 1101 1101 1101 1101 1101 1101 1101 1101 1101 1100 1011 1010 0111 0110 0011 0010 111
i 1110 1110 1110 1110 1110 1110 1110 1110 1110 1101 1100 1011 1010 0111 0110 0011
c 001 01 001 01 001 01 001 01 001 01 001 01 001 01 1111 1111 1110 1101 1100 1011 1010 0111
d 00111 00111 00111 00111 00111 0 0110 0 0110 001 01 001 00 1111 1110 1101 1100 1011
u 01110 01110 01110 01110 01110 00111 00111 0 0110 001 01 001 00 1111 1110 1101
p 001000 001000 001000 001000 001000 01110 01110 00111 0 0110 001 01 001 00 1111
o 001001 001001 001001 001001 001001 001000 01111 01110 00111 0 0110 001 01
, 01111 0 01111 0 01111 0 11110 11110 001001 001000 01111 01110 00111
í 011111 011111 011111 01111 0 11111 11110 001001 001000 01111
b 011100 011100 011100 011111 01111 0 11111 11110 001001
m 011101 011101 011101 011100 011111 01111 0 11111
v 111110 111110 111110 011101 011100 011111
ó 111111 111111 111111 111110 011101
h 1111010 11110 0 11110 0 111111
q 1111011 1111010 11110 1
É 1111000 1111011
é 1111001

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
25

Condiciones de los códigos Huffman:


a) Condición de prefijo: dos códigos no pueden tener el mismo prefijo, no necesitando carácter
de fin de código en el proceso de compresión/descompresión. Ejemplo: Si la u tiene el código
00111, no puede existir ningún código que comience con los dígitos 00111.
b) Dos símbolos no pueden recibir el mismo código.
c) La longitud de un código dado nunca puede ser menor que la de un código más probable.

Frecuencia Relativa (% )
20

15

10

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Número Digital

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
26

ND Prob. 1 2 3 4 5 6 7 8 9 10 11 12 13 14
7 0.1474 0.1474 0.1474 0.1474 0.1474 0.1474 0.1474 0.1474 0.1548 0.1965 0.2368 0.2684 0.3022 0.4293 0.5706
8 0.1420 0.1420 0.1420 0.1420 0.1420 0.1420 0.1420 0.1420 0.1474 0.1548 0.1965 0.2368 0.2684 0.3022 0.4293
6 0.1264 0.1264 0.1264 0.1264 0.1264 0.1264 0.1264 0.1264 0.1420 0.1474 0.1548 0.1965 0.2368 0.2684
9 0.1196 0.1196 0.1196 0.1196 0.1196 0.1196 0.1196 0.1196 0.1264 0.1420 0.1474 0.1548 0.1965
10 0.1066 0.1066 0.1066 0.1066 0.1066 0.1066 0.1066 0.1132 0.1196 0.1264 0.1420 0.1474
5 0.0884 0.0884 0.0884 0.0884 0.0884 0.0884 0.0899 0.1066 0.1132 0.1196 0.1264
11 0.0608 0.0608 0.0608 0.0608 0.0608 0.0664 0.0884 0.0899 0.1066 0.1132
4 0.0524 0.0524 0.0524 0.0524 0.0524 0.0608 0.0664 0.0884 0.0899
0 0.0395 0.0395 0.0395 0.0395 0.0504 0.0524 0.0608 0.0664
3 0.0339 0.0339 0.0339 0.0339 0.0395 0.0504 0.0524
2 0.0241 0.0241 0.0263 0.0325 0.0339 0.0395
1 0.0183 0.0183 0.0241 0.0263 0.0325
12 0.0142 0.0142 0.0183 0.0241
13 0.0128 0.0135 0.0142
14 0.0110 0.0128
15 0.0025

ND Prob. Cód 1 2 3 4 5 6 7 8 9 10 11 12 13 14
7 0.1474 001 001 001 001 001 001 001 001 000 11 10 01 00 1 0
8 0.1420 010 010 010 010 010 010 010 010 001 000 11 10 01 00 1
6 0.1264 011 011 011 011 011 011 011 011 010 001 000 11 10 01
9 0.1196 100 100 100 100 100 100 100 100 011 010 001 000 11
10 0.1066 110 110 110 110 110 110 110 101 100 011 010 001
5 0.0884 0000 0000 0000 0000 0000 0000 111 110 101 100 011
11 0.0608 1010 1010 1010 1010 1010 0001 0000 111 110 101
4 0.0524 1011 1011 1011 1011 1011 1010 0001 0000 111
0 0.0395 1111 1111 1111 1111 1110 1011 1010 0001
3 0.0339 00010 00010 00010 00010 1111 1110 1011
2 0.0241 11101 11101 11100 00011 00010 1111
1 0.0183 000110 000110 11101 11100 00011
12 0.0142 000111 000111 000110 11101
13 0.0128 111001 111000 000111 Tamaño original: 131072 bytes, H: 3.5185 bits/símbolo,
14 0.0110
15 0.0025
1110000
1110001
111001
Tamaño mínimo sin pérdida de información: 115294 bits.
Long.media código ponderada en función de la frecuencia: 3.5415 bits/símbolo
Espacio requerido: 116048 bits, Tc: 1.13, E: 97.68%.
Decodificación:
1111-000110-000110-0000-010-010-100-001...110-100-010-001-1011
0 1 1 5 8 8 9 7 ... 10 9 8 7 4

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
27

Inconveniente del método Huffman:


Requiere realizar dos pasadas sobre cada imagen. 1) Histograma, 2) Compresión.
Alternativa: Codificación Huffman con códigos estándares (peor compresión, menos tiempo)

Otros métodos de compresión no degradativa:

1. Método de READ modificado: es una modificación del método de Huffman en la que se divide la imagen en
líneas y se aplica codificación Huffman a cada grupo de líneas. Cada porción de imagen es codificada de
acuerdo a estas codificaciones.
2. Método LZW: Apareció en 1984 (aunque las bases aparecieron en 1977) y supuso la pérdida de la
hegemonía del método de Huffman. Se basa en la codificación a nivel de cadena en lugar de a nivel de
dato. El algoritmo es muy simple … aunque su implementación es bastante compleja. Se basa en la
búsqueda de cadenas de caracteres con códigos simples que se almacenan en una tabla de consulta. La
mayor parte de los programas que emplean LZW utilizan códigos de 12 bits por lo que existen 4096
códigos disponibles, de los cuales los 256 (0-255) primeros se emplean para la codificación de los
caracteres individuales y los restantes (256-4095) para representar combinaciones de datos que
presenten repetibilidad.
3. Codificación aritmética: Se diferencia de los métodos anteriores en que se realiza la codificación de cadenas
completas en un sólo código de tipo real de punto flotante. A mayor longitud de la cadena, se necesitara
un mayor número de dígitos y, por tanto, una mayor precisión del número empleado como código. Este
sistema requiere realizar dos lecturas de la imagen, una en la que se calculan las frecuencias y otra en la
que se realiza la codificación propiamente dicha.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
28

1.0 0.46 0.4033 0.37819


1 1 1 0.3781 1
0.9
0.45
0.400 0.3779
0.8
0.44
0.3777
0.7
2 0.43 2 0.395 2 2
0.3775
0.6
0.42
0.3773
0.5 0.390
0.41
0.4 3 3 3 0.3771 3

0.40 0.385
0.3 0.3769

4 0.39 4 4 0.3767 4
0.2
0.380
0.1 0.38 0.3765
5 5 5 5
Ejemplo de codificación aritmética
0.0 0.37 0.3763 0.37630

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
29

Métodos de compresión degradativos

La diferencia principal entre las técnicas degradativas y no degradativas es la inclusión de un


proceso de cuantificación en las primeras. Mediante este proceso se reduce el número de
símbolos, produciendo la degradación de la imagen y aumentando la tasa de reducción al
reducir el número de bits necesario para el almacenamiento de cada símbolo.
Las técnicas de compresión degradativa constan típicamente de tres etapas:

Descomposición o transformación de la imagen. Transformación de la imagen en un nuevo


dominio, el dominio de la frecuencia, para reducir el rango dinámico de la señal (valores de
gris) y para eliminar las correlaciones entre los valores de gris originales.
Cuantificación. Los valores transformados se convierten a un conjunto finito de datos más
reducidos, para reducir el número de bits necesarios para el almacenamiento. El tipo y grado
de cuantificación es el factor clave, tanto en la tasa de compresión y en la calidad de la
imagen restaurada.
Codificación de los símbolos. Los símbolos resultantes deben ser codificados empleando para ello
algún método óptimo, como, por ejemplo, la codificación Huffman o la codificación
aritmética.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
30

JPEG

El estándar JPEG define tres sistemas básicos de compresión:


1. el sistema básico de tipo degradativo y que se basa en la aplicación de la transformación
de coseno discreto y es el más difundido debido a sus amplias posibilidades de
utilización
2. el sistema de codificación extendida, para aplicaciones de mayor compresión o mayor
precisión
3. el sistema de codificación independiente sin pérdidas de tipo degradativo y que se
emplea para compresiones reversibles, que es poco empleado.

Se divide en cuatro etapas:


1. División de la imagen original en subbloques de tamaño 8x8 pixels
2. Transformación de Coseno Discreto (FDCT)
3. Cuantificación (sólo en el método JPEG degradativo)
4. Codificación de entropía (Huffman o Aritmética)

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
31

Bloque 8x8 Transformación Datos de la imagen


Codificación
Imagen Original Coseno Discreto Cuantización comprimida
Huffman
Directa

Bloque 8x8 Imagen Transformación Datos de la imagen


Decodificación
Descomprimidal Coseno Discreto Decuantización comprimida
Huffman
Inversa
a) La transformación DCT
Comienza con la división de la imagen en porciones de tamaño 8x8 píxeles (tiles), que se
procesan de izquierda a derecha y de arriba abajo, modificando sus niveles digitales al restarle
el valor 2n-1, es decir, 128 para las imágenes usuales de 256 tonos de gris -n=8 bits-.
52 55 61 66 70 61 64 73 -76 -73 -67 -62 -58 -67 -64 -55
63 59 66 90 19 85 69 72 -65 -69 -62 -38 -19 -43 -59 -56
62 59 68 11 14 10 66 73 -66 -69 -60 -15 16 -24 -62 -55
63 58 71 12 15 10 70 69 -65 -70 -57 -6 26 -22 -58 -59
67 61 68 10 12 88 68 70 -61 -67 -60 -24 -2 -40 -60 -58
79 65 60 70 77 68 58 75 -49 -63 -68 -58 -51 -65 -70 -53
85 71 64 59 55 61 65 83 -43 -57 -64 -69 -73 -67 -63 -45
87 79 69 68 65 76 78 94 -41 -49 -59 -60 -63 -52 -50 -34
Imagen original Imagen original - 128

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
32

Cada porción se transforma al dominio de la frecuencia empleando la función de DCT.


 2x  1u   2 y  1v 
N 1N 1
Cu, v   u v    f x, ycos cos
2 N   2 N 
x 0y 0

para u,v = 0, 1, 2, ..., N-1 y su correspondiente inversa es:


 2x  1u   2 y  1v 
N 1N 1
f x, y     u vCu, vcos cos
2 N   2 N 
x 0y 0

1 2
donde α(u),α(v)= para u,v=0 y para u,v=1, ...,N-1.
N N

DCT es un método muy aplicado para la compresión al ser simple y rápido. Se trata de un
método independiente de la imagen. No supone pérdida de información sino que modifica el
tipo de representación de la imagen compactando la información en unos pocos coeficientes.
-415 -29 -62 25 55 -20 -1 3
7 -21 -62 9 11 -7 -6 6
-46 8 77 -25 -30 10 7 -5
-50 13 35 -15 -9 6 0 3
11 -8 -13 -2 -1 1 -4 1
-10 1 3 -3 -1 0 2 -1
-4 -1 2 -1 2 -3 1 -2
-1 -1 -1 -2 -1 -1 0 -1
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN
Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
33

b) Cuantificación.
Sólo se aplica si se desea una compresión degradativa (lo que equivale en la mayor parte de los casos, una
mayor tasa de compresión). Consiste en la normalización de los coeficientes obtenidos de la DCT, aplicando una
normalización predefinida en la normativa del estándar, que será la misma para todos los bloques. Cada
componente de la matriz de normalización Q(u,v) es un entero 8-bit (0 a 256) que determina el grado de
cuantización. Dichos componentes son calculados de forma que los pequeños valores estén asociados con
frecuencias bajas y los valores elevados con frecuencias altas. El nivel de compresión de la imagen puede ser
modificado mediante la introducción de cambios en esta matriz, mediante el producto por una constante. Así, a
diferentes matrices de normalización le corresponden diferentes tasas de compresión.
Los coeficientes normalizados son cuantificados mediante la aplicación de un redondeo al número entero
más próximo, así, por ejemplo, para el primer coeficiente (0,0), el resultado sería:
T (0,0) = Redondeo [ -415 / 16 ] = -26
16 11 10 16 24 40 51 61 -26 -3 -6 2 2 0 0 0
12 12 14 19 26 58 60 55 1 -2 -4 0 0 0 0 0
14 13 16 24 40 57 69 56 -3 1 5 -1 -1 0 0 0
14 17 22 29 51 87 80 62 -4 1 2 -1 0 0 0 0
18 22 37 56 68 109 103 77 1 0 0 0 0 0 0 0
24 35 55 64 81 104 113 92 0 0 0 0 0 0 0 0
49 64 78 87 103 121 120 101 0 0 0 0 0 0 0 0
72 92 95 98 112 100 103 99 0 0 0 0 0 0 0 0

JPEG-75 Cuantificación y redondeo

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
34

Es la etapa donde se produce una mayor reducción del tamaño a la vez que la pérdida de información más
importante, reduciendo el número de valores distintos. El coeficiente superior izquierda es denominado DC,
mientras que el resto reciben la denominación de AC. La cuantificación de los coeficientes AC produce
numerosos ceros, especialmente para las frecuencias más altas. Para aprovechar este hecho, la matriz
bidimensional de coeficientes se transforma en una vector unidimensional mediante su ordenación en zig-zag.
Esta ordenación ordena los coeficientes cuantificados en un orden aproximadamente descendente, la mayoría
de los coeficientes de la zona final son ceros.
DC
-26 -3 -6 2 2 0 0 0

1 -2 -4 0 0 0 0 0

-3 1 5 -1 -1 0 0 0

-4 1 2 -1 0 0 0 0

1 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0
Por tanto, la secuencia final sería:
[-26 -3 1 -3 -2 -6 2 -4 1 -4 1 1 5 0 2 0 0 -1 2 0 0 0 0 0 -1 -1 EOB]
siendo EOB un carácter especial de fin de bloque –end of block–.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
35

c) Codificación de entropía
Consiste en la codificación de los coeficientes normalizados, para ello se resta al DC el
correspondiente DC del bloque anterior, dando lugar a un DC diferencial que es un valor bajo
debido a la elevada correlación entre los bloques. Cada DC diferencial es codificado mediante la
aplicación de un método de código de longitud variable, así como cada valor de AC.

Compresión de imágenes en color


El esquema básico para la compresión se basa en el trabajo con imágenes de 8 bits, pero puede
ser aplicado a imágenes a color. Esta compresión se realiza mediante la compresión de cada uno
de los canales de información, pudiéndose aplicar a cualquier tipo de modelo de color, si bien es
aconsejable aplicarlo al modelo YUV (Y: iluminancia, UV: cromacidad) en la que cada uno de los
canales es independiente.

Compresión de imágenes de gran tamaño


La descompresión es un proceso largo, para evitar esperas excesivas se suele dividir en elementos
de menor tamaño y posteriormente se almacena un catálogo de forma que se permita un rápido
acceso a cada una de las partes de la imagen. Esto permite además que sólo se descomprima el
fragmento de imagen en la que deseemos trabajar, lo que supone un gran ahorro de tiempo ya que
aunque el proceso de compresión sea más lento, éste usualmente sólo se realiza una vez, mientras
que el de descompresión suele ser más frecuente.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
36

Proceso
Compresión

Catálogo
Imagen Fraccionada

Bloques de tamaño variable

Efectos geométricos de la compresión JPEG


En Fotogrametría es esencial la calidad geométrica. La calidad se puede empeorar en un proceso
de compresión de la imagen en dos formas:
1) Por perdida de calidad radiométrica (cuando el posicionamiento de los elementos se
realiza en una imagen borrosa)
2) Por deformación de los objetos en alguna (o las dos) direcciones.
Estas degradaciones pueden ser en ambos casos locales o globales.

La pérdida de calidad geométrica de la imagen depende de diversos factores:


- método y cantidad de compresión
- distribución de ND en la imagen digital
- la calidad de la imagen original

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
37

De los métodos considerados dentro del estándar JPEG, únicamente el método de no


degradativo asegura el mantenimiento de la calidad geométrica y radiométrica de la imagen, si
bien como demuestran Mikhail et al (1984) la compresión DCT produce el desplazamiento
máximo de 0.5 píxeles de los elementos cuando se aplica una tasa de compresión de 1:16 a una
imagen de 8 bits.
Lammi y Sarjakoski (1995): Influencia de la compresión en la calidad geométrica de imágenes
color.
Precisión (medida de la calidad interna o repetibilidad de las medidas)
Exactitud (medida de la calidad externa -global- de las medidas comparadas con alguna
referencia considerada como representativa de la realidad).

Escáner Sharp JX-600 (600ppp) y tres tasas 1:7 (Excelente), 1:15 (Alta) y 1:66 (Regular).
Calidad visual: 1:7 (Muy buena); 1:15 (Buena – se observan los efectos); 1:66 (Mala).
Calidad geométrica: 50 elementos (tamaño mayor de 8 píxeles). 20 medidas en la imagen
original y 10 medidas en las comprimidas con precisión de subpixel.
Imagen (Nivel de compresión) Emax RSME V
Excelente (1:7) 0.27 0.12 99
Alta (1:15) 0.73 0.18 99
Regular (1:66) 2.76 0.50 99
Diferencias expresadas en píxeles

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
38

Efectos de la compresión JPEG. Se puede observar el efecto de la división en subbloques

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
39

Codificación Jerárquica Predictiva (HPC):

Se utiliza para la compresión para imágenes de video. El algoritmo comienza con la creación de
una representación a escala a distintos niveles de la imagen original. Así por ejemplo, una imagen
de un tamaño de 1024x1024 píxeles se descompone en cinco imágenes correspondientes a cinco
niveles de escala: 512x512, 256x256, 128x128 y 64x64. La pirámide se crea mediante la
convolución de las imágenes de mayor resolución mediante la aplicación de un operador gausiano
y el aumento del tamaño del píxel al doble.

Se calculan las imágenes diferencia entre los niveles. Las diferencias representan los
componentes de alta frecuencia del nivel previo de la pirámide. La imagen original puede ser
reconstruida a partir de su representación en el nivel de menor resolución (64x64 píxeles) y de las
imágenes diferencia. Los valores diferencia son normalmente pequeños y pueden ser codificados y
almacenados en un número reducido de bits, de forma que se alcanza una compresión sin
pérdida de información, no obstante para obtener mayor tasa de compresión se utiliza la
cuantificación, que produce degradación de la imagen y una compresión más eficaz pero con
pérdida de calidad.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
40

El algoritmo de la HPC consta de las siguientes etapas:


- Creación de una pirámide gausiana con kernel 3x3
- Calculo de las imágenes diferencia
- Almacenamiento en profundidad de color variable (8:5:3:1)

La tasa de compresión es de 3.6 (8:5:3:1). Para obtener mayores tasas las imágenes
diferencia deben ser almacenadas con menor número de bits, aunque con la desventaja de un
mayor riesgo de degradación de la imagen.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
41

Es un método más rápido que el método JPEG, Novak y Shanin (1996) realizan un estudio
comparativo entre ambos métodos, tanto en lo relativo a tasas de compresión, como a calidad
de las imágenes restauradas y velocidad de ejecución.

La tasa de compresión está relacionada con el método empleado:


JPEG-75, tasa de 5.9 HPC-8.5.3.1, tasa de 3.6
JPEG-40, tasa de 12.5 HPC-8.3.3.1, tasa de 4.5
JPEG-25, tasa de 42.

alcanzándose errores medios cuadráticos inferiores al píxel en todos los métodos, con máximos
inferiores al píxel en los métodos JPEG-75 y HPC-8.5.3.1.

Tiempo de ejecución: 1Mb imagen HPC: 5 s (Sun Sparcstation2)


JPEG: 20s

Una ventaja adicional del HPC es contar con una imagen de resolución variable para los
cálculos de carácter iterativo.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
42

PIRÁMIDE DE IMÁGENES IMÁGENES DIFERENCIA


64x64 Cuantización 8 bit
128x128
Cuantización 5 bit
256x256

Cuantización 3 bit
512x512

Cuantización 1 bit

1024x1024

IMAGEN ORIGINAL

Imagen Original (Nivel 0) (1024x1024) Imagen Nivel 4 (64x64). Ampliada 16 veces

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
43

Cuantificación vectorial
Al igual que el JPEG, comienza con la división de la imagen en bloques de tamaño n x n píxeles,
si bien en este caso no existe ninguna predefinición en cuanto al tamaño de los mismos, si bien
es frecuente el empleo de tamaño de 4x4 píxeles.
Estos bloques son comparados con un conjunto predefinido de bloques representativos
(codebook), la comparación se establece mediante el cálculo de la sumatoria de las diferencias de
cada elemento del bloque con cada elemento de cada uno de los bloques incluidos en el libro de
códigos. Aquel código que presente una suma de diferencias menor será elegido como
representativo y el bloque de la imagen original será sustituido por el índice del bloque
seleccionado.
Las relaciones de compresión son elevadas, así por ejemplo, para una imagen de 24 bits/píxel
(color RGB) es necesario un espacio de 384 bits para un bloque de 4x4 píxeles que pueden
comprimirse en 10 bytes si se emplea una tabla de códigos de 1024 posibilidades (Tc=38.4).
La parte más compleja del método es la definición de los bloques codificados predefinidos. A
priori, la solución más acertada podría parecer escoger como bloques aquellas porciones de la
imagen que aportan más información (por ejemplo, bordes) si bien es necesario tener en cuenta
que la frecuencia de aparición de dichos elementos en la imagen global es baja, con lo cual la
imagen comprimida tendrá poca calidad.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
44

Compresión fractal
Supone una ruptura total con la filosofía actual en cuanto a técnicas de compresión de
imágenes. En ella se almacenan son las fórmulas que nos van a dar lugar a la imagen. Por tanto,
estas técnicas son independientes de la resolución de la imagen.

Las tasas de compresión son muy elevadas (en torno a 100) y con muy buenos resultados con
imágenes naturales.

Se basan en la división de la imagen original en porciones más pequeñas, y dichas porciones en


otras más pequeñas y sucesivamente, estableciendo de una forma analítica las relaciones
existentes entre las diferentes porciones, denominadas regiones del dominio. Las regiones son
definidas en función de técnicas clásicas de análisis de imágenes tales como detección de bordes,
análisis textural, ... . Al igual que el resto de los métodos degradativos, la compresión fractal
introduce efectos en la imagen tales como suavizado y eliminación de detalles, no siendo, en
principio aconsejable su utilización cuando el objetivo del trabajo fotogramétrico sea la restitución.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
45

Transformaciones de wavelet discretas

Son técnicas que tienen actualmente un gran auge. La más conocida es MrSID (Multiresolution
Seamless Image Database), que está implementado en software de Fotogrametría y Teledetección y
que es empleado por organismos como el FBI (base de datos de huellas dactilares).

Obtiene tasas en torno a 70:1 (color), es decir, 3 veces más que con otros métodos similares –
JPEG-. Mr.SID presenta en cuanto a su estructura general ciertas analogías con el método JPEG, con
la diferencia de que en el caso de Mr.SID se aplica una transformación de wavelet discreta (DWT) en
lugar de una transformación de coseno discreto (DCT).

La principal ventaja de DWT frente a DCT es su carácter no local, con lo que proporciona mejores
tasas de compresión y una menor degradación de la imagen. DCT se basa en una transformación
Fourier e intenta describir la imagen como una superposición de ondas de cosenos. Estas ondas son
infinitas, por lo que requiere partir la imagen en bloques de tamaño reducido (8x8) y aplicar la
transformación en cada bloque (teselado en la imagen comprimida).

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
46

El principal problema que presenta la DWT frente a la DCT es la cantidad de memoria requerida en
la transformación. La división en bloques de la DCT aunque puede llegar a producir efectos
indeseados en la imagen es muy eficiente (considera al bloque individualmente). DWT requiere el
acceso a la imagen completa (complicado con imágenes de gran tamaño -> división de la imagen en
bloques).

Una ventaja muy importante de DWT es que es una transformación multirresolución, incorporando
la posibilidad de la descompresión selectiva de porciones de la imagen. Esto facilita de una forma
muy importante la visualización a todas las escalas de trabajo en especial las pequeñas y medianas,
con tiempos de descompresión mucho más reducidos que los de LZW o JPEG.

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
47

JPEG2000

Se trata de un nuevo estándar de compresión que se basa en el empleo de DWT en lugar de DCT.

Ventajas:
- Superior rendimiento de compresión: PSNR= 0.25 bits/pixel
- Permite comprimir imágenes de tono continuo y bitono
- Perfectamente adaptado a imágenes de más de 8 bits/canal (preparado para 38 bits)
- Permite comprimir imágenes de (232-1) x (232-1) con tan sólo 214 componentes
- Puede ser definido como degradativo o no degradativo
- Se puede predefinir el tamaño de la imagen comprimida
- Permite la codificación a nivel de ROI
- Muy robusto
- Permite incorporar metainformación JPX
- Permite incorporar sistemas de seguridad

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN


Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría

También podría gustarte