Está en la página 1de 12

La imagen a continuación consiste en una matriz rectangular de

3.871.488 píxeles. El color de cada píxel es determinante.

extraído por componentes rojo, verde y azul, cada uno

requiere un byte de memoria de la computadora. Ingenuo-

ly, esperamos que la imagen requiera 11,614,464

bytes Sin embargo, el tamaño del archivo JPEG contiene

Esta imagen tiene solo 734,268 bytes, aproximadamente 16

veces más pequeño Describiremos la compresión

algoritmo, desarrollado por Joint Photographic

Grupo de expertos (JPEG), que permite que la imagen sea

almacenado de manera compacta.

En lugar de especificar el rojo, el verde y el azul.

componentes de un color, es conveniente usar tres

diferentes cantidades: luminancia Y, que está muy cerca

relacionado con el brillo del color y azul

y crominancia roja C by C r, que aproximadamente

determinar el matiz Transformación afín invertible

se traduce entre las dos representaciones; para

ejemplo, para recuperar el rojo R, el verde G y el azul

Componentes B, utilizamos

Tenga en cuenta que la luminancia contribuye igualmente a

Los tres componentes de color. Para ayudar a visualizar esto

transformación, mostramos los colores que resultan

de arreglar la luminancia y mezclar varios

valores de crominancia.

Cb

Cr

Cb

Cr
Y = 0 Y = 100

El algoritmo procede dividiendo la imagen.

en 8 por 8 bloques de píxeles que son independientemente

procesada. Aquí hay un bloque de muestra.

Los componentes (Y, C b, C r) en nuestra muestra 8by8

el bloque se muestra a continuación; regiones más claras corresponden

a valores mayores.

Observe que los valores de luminancia producen un

versión en escala de grises de la imagen. Como psico-visual

los experimentos muestran que el ojo humano es más sensible

Sitive a los valores de luminancia, la transformación de color

concentra la información más importante en

a un solo componente. La televisión en color utiliza un

modelo de color similar, lo que permite la tele-

visiones para mostrar eficientemente imágenes en color que son

emisión.

Por razones que se explicarán más adelante, nosotros

ahora expresa los valores de los componentes como un lineal

combinación de funciones de coseno de aumento

frecuencia. Por ejemplo, si Y x, y es la luminancia

en la columna xy en la fila y de nuestro bloque, escribimos

Y x, y =

77

u=0

77

v=0

C u, v F u, v cos
? (2x + 1) uπ

dieciséis

× cos

? (2y + 1) vπ

dieciséis

(No es necesario que las constantes de normalización C u, v

nos importa.) Los coeficientes F u, v se encuentran por

la transformación bidimensional del coseno discreto

(DCT)

F u, v = C u, v

77

x=0

77

y=0

Y x, y cos

? (2x + 1) uπ

dieciséis

× cos

? (2y + 1) vπ

dieciséis

y eficientemente calculada usando una versión del

Transformada rápida de Fourier.


Los valores de los componentes en la mayoría de los bloques.

no cambian rápidamente, y el ojo humano no es

particularmente sensible a estos cambios. Por lo tanto,

los coeficientes DCT correspondientes a frecuencias más altas

las frecuencias probablemente serán pequeñas y pueden ser ignoradas

sin afectar nuestra percepción de la imagen.

la observación motiva nuestro método para cuantificar

los coeficientes DCT para que puedan almacenarse como

enteros

Se utilizan dos ingredientes en la cuantización.

proceso. El primero es un parámetro α, elegido por el

usuario para controlar la cantidad de compresión y

La calidad de la imagen. Valores mayores de plomo α

a archivos más pequeños e imágenes de menor calidad.

El segundo ingrediente es una matriz de 8 por 8 Q =

[Q u, v] con los coeficientes cuantificados por redondeo

F u, v / αQ u, v. Los Q u, v se eligen empíricamente y

normalmente tienen valores más grandes para frecuencias más altas

para enfatizar esas frecuencias. Para

postura, una matriz típica utilizada para cuantificar el

coeficientes de luminancia DCT es

Q=
16 11 10 16 24 40 51 61

12 12 14 19 26 58 60 55

14 13 16 24 40 57 69 56

14 17 22 29 51 87 80 62

18 22 37 56 68109103 77

24 35 55 64 81104113 92

49 64 78 8710312120101

72 92 95 98 112 100 103 99

Reconociendo que la luminancia lleva más importancia


información visual importante, utilizamos diferentes ma-

Trices para cuantificar los coeficientes que describen

luminancia y crominancia. Procesando nuestro sam-

bloque ple con un valor intermedio de α, el

coeficientes de luminancia cuantizados para nuestra muestra

bloque se muestran a continuación.

77

44

00

00

00

00

00

-2

00

-1

00

00

00

00

00

00

00

00

00

00
00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00

00
00

00

00

00

00

00

00

00

00

00

00

00

tu

Los coeficientes cuantificados están ordenados por

bajando las flechas para que aparezcan las frecuencias más bajas

primero.

Los coeficientes cuantificados para la luminancia.

componente en nuestra muestra y luego producir el se-

Quence 7, −2, 4, 1, 0, 1, 0, 1, −1 seguido de 55

ceros En lugar de almacenar cada cero, simplemente

registrar el número de ceros, lo que reduce el

requisito de almacenamiento significativamente. Com más

La presión se obtiene utilizando un código Huffman para

almacenar la secuencia de coeficientes de forma compacta.

La imagen se reconstruye invirtiendo esto

proceso. Los coeficientes cuantificados dan aprox-

valores imados de F u, v. Estos, a su vez, le dan al

Componentes (Y, C b, C r) y el componente (R, G, B)


nents. El bloque reconstruido se muestra a la

derecho del original.

La transformada discreta de Fourier (DFT) puede aparecer

pera preferible a la DCT ya que es más fácil

calculado sin embargo, nuestra elección del DCT es

explicado por nuestro deseo de concentrar el

formación en los coeficientes de baja frecuencia. por

ejemplo, considere los valores, y x, de un componente

en una fila de un bloque de 8 por 8. El DFT expresa

y x como una combinación lineal de funciones cuyo

el período es 8, lo que resulta en una extensión periódica de

y x. La transformación, por lo tanto, sigue innecesariamente

el cambio entre y 7 e y 8 = y 0, que puede

conducir a importantes contribuciones de alta frecuencia.

En la figura siguiente, los valores y x se muestran en

negro mientras que las aproximaciones dadas por los tres

términos de frecuencia más baja de la transformada de Fourier

están en rojo

01234567

En comparación, el DCT expresa x como un lineal

combinación de funciones cuyo período es 16 y

que son simétricos sobre x = 7.5. Esto alisa

fuera la extensión apropiada de y x para que el

DCT requiere una contribución relativamente pequeña de

términos de alta frecuencia. Abajo vemos lo análogo

aproximación dada por el DCT y tenga en cuenta la

mejora en la aproximación. (Estas figuras

aparecer en [2].)

01234567
Como los bloques de 8 por 8 se procesan independientemente

de forma discontinua, discontinuidades en los bordes de los bloques

llegar a ser aparente a altas relaciones de compresión. En

Además, a menudo es deseable tener la capacidad de

reconstruir eficientemente la imagen en intermedio

Resoluciones Estas razones y otras llevaron a la

creación del algoritmo de compresión JPEG 2000.

Entre otras diferencias, JPEG 2000 reemplaza el

DCT con una transformada wavelet discreta.

El algoritmo JPEG 2000 divide la imagen en

bloques más grandes, quizás del tamaño 256 por 256. Para ilustrar-

concentrar la transformación wavelet, arreglar una fila de píxeles

en un bloque y que y x represente los valores de uno de

los componentes. Ahora forma coeficientes wavelet

l x = (y 2x + y 2x + 1) / 2

h x = (y 2x - y 2x + 1) / 2.

Los h x se denominan coeficientes de "paso alto", ya que

detectan cambios de alta frecuencia, mientras que l x

son coeficientes de "paso bajo". Ordénelos enumerando

todos los coeficientes de paso bajo seguidos por el alto

pasar coeficientes y realizar la misma operación

en las columnas de coeficientes wavelet para obtener

bloques de coeficientes:

LH HH

LL HL

Los coeficientes en el subbloque LL son ob-

se obtiene promediando más de 2 por 2 bloques de píxeles

y por lo tanto representan una versión de menor resolución de

la imagen. Los otros tres subbloques describen el


cambios necesarios para construir la imagen en el

mayor resolución. iteramos este proceso en la LL

subbloque almacenando así la imagen cada vez más

Resoluciones más bajas.

LH HH

LL HL

LH HH

LL HL

LH HH

LL HL

LH HH

LL HL

El procedimiento de cuantificación detecta las regiones donde

los valores no cambian significativamente para que

los coeficientes de paso alto pueden ignorarse de forma segura.

En lugar de la transformada wavelet descrita

arriba, que promedia dos valores adyacentes, el

El algoritmo JPEG 2000 utiliza las Cohen-Daubechies-

Transformación wavelet Feauveau (9,7), que encuentra un

promedio ponderado sobre nueve valores adyacentes y

así produce imágenes más suaves.

La complejidad del algoritmo JPEG 2000,

comparado con el del algoritmo JPEG original,

es un orden de magnitud mayor, y bajo y

relaciones de compresión medias, la calidad de la im-

edades producidas por JPEG 2000 no es sustancialmente

mejor. Sin embargo, a relaciones de compresión muy altas,

donde el uso de JPEG de 8 por 8 bloques puede causar

calidad de imagen para deteriorarse severamente, JPEG 2000


Ofrece resultados significativamente mejores.

Desde JPEG 2000 nos pide que trabajemos más para pro-

Duce imágenes de calidad generalmente comparable, es

No es una opción claramente superior a JPEG. En efecto,

actualmente solo unos pocos navegadores web son capaces de

mostrando imágenes JPEG 2000. Su principal avance

tage radica en proporcionar un formato mucho más flexible

para trabajar con imágenes en entornos donde

La mayor complejidad no es problemática.

Por ejemplo, la capacidad de reconstruir eficientemente

La imagen en diferentes resoluciones, lo que resulta

del uso de la transformada wavelet, permite

usuarios para buscar visualmente a través de muchas imágenes en

Una baja resolución rápidamente. JPEG 2000 también permite

regiones, designadas por un usuario quizás, para ser deshabilitadas

jugado en una resolución más alta, una razón por la que

se usa comúnmente en imágenes médicas. Finalmente

es posible para fotografías digitales, almacenadas en un

tarjeta de memoria de la cámara en formato JPEG 2000,

para ser convertido eficientemente a una resolución menor a

reducir el uso de memoria después de tomarlos. JPEG

2000, diseñado aproximadamente diez años después de JPEG,

También incluye otras características, como la capacidad de

cifrar imágenes, cuya necesidad no se anticipó

más temprano.

También podría gustarte