Jpeg

La imagen a continuación consiste en una matriz rectangular de
3.871.488 píxeles. El color de cada píxel es determinante.
extraído por componentes rojo, verde y azul, cada uno
requiere un byte de memoria de la computadora. Ingenuo-
ly, esperamos que la imagen requiera 11,614,464
bytes Sin embargo, el tamaño del archivo JPEG contiene
Esta imagen tiene solo 734,268 bytes, aproximadamente 16
veces más pequeño Describiremos la compresión
algoritmo, desarrollado por Joint Photographic
Grupo de expertos (JPEG), que permite que la imagen sea
almacenado de manera compacta.
En lugar de especificar el rojo, el verde y el azul.
componentes de un color, es conveniente usar tres
diferentes cantidades: luminancia Y, que está muy cerca
relacionado con el brillo del color y azul
y crominancia roja C by C r, que aproximadamente
determinar el matiz Transformación afín invertible
se traduce entre las dos representaciones; para
ejemplo, para recuperar el rojo R, el verde G y el azul
Componentes B, utilizamos
Tenga en cuenta que la luminancia contribuye igualmente a
Los tres componentes de color. Para ayudar a visualizar esto
transformación, mostramos los colores que resultan
de arreglar la luminancia y mezclar varios
valores de crominancia.
Cb
Cr
Cb
Cr
Y = 0 Y = 100
El algoritmo procede dividiendo la imagen.
en 8 por 8 bloques de píxeles que son independientemente
procesada. Aquí hay un bloque de muestra.
Los componentes (Y, C b, C r) en nuestra muestra 8by8
el bloque se muestra a continuación; regiones más claras corresponden
a valores mayores.
Observe que los valores de luminancia producen un
versión en escala de grises de la imagen. Como psico-visual
los experimentos muestran que el ojo humano es más sensible
Sitive a los valores de luminancia, la transformación de color
concentra la información más importante en
a un solo componente. La televisión en color utiliza un
modelo de color similar, lo que permite la tele-
visiones para mostrar eficientemente imágenes en color que son
emisión.
Por razones que se explicarán más adelante, nosotros
ahora expresa los valores de los componentes como un lineal
combinación de funciones de coseno de aumento
frecuencia. Por ejemplo, si Y x, y es la luminancia
en la columna xy en la fila y de nuestro bloque, escribimos
Y x, y =
77
u=0
77
v=0
C u, v F u, v cos
? (2x + 1) uπ
dieciséis
× cos
? (2y + 1) vπ
dieciséis
(No es necesario que las constantes de normalización C u, v
nos importa.) Los coeficientes F u, v se encuentran por
la transformación bidimensional del coseno discreto
(DCT)
F u, v = C u, v
77
x=0
77
y=0
Y x, y cos
? (2x + 1) uπ
dieciséis
× cos
? (2y + 1) vπ
dieciséis
y eficientemente calculada usando una versión del
Transformada rápida de Fourier.

Los valores de los componentes en la mayoría de los bloques.
no cambian rápidamente, y el ojo humano no es
particularmente sensible a estos cambios. Por lo tanto,
los coeficientes DCT correspondientes a frecuencias más altas
las frecuencias probablemente serán pequeñas y pueden ser ignoradas
sin afectar nuestra percepción de la imagen.
la observación motiva nuestro método para cuantificar
los coeficientes DCT para que puedan almacenarse como
enteros
Se utilizan dos ingredientes en la cuantización.
proceso. El primero es un parámetro α, elegido por el
usuario para controlar la cantidad de compresión y
La calidad de la imagen. Valores mayores de plomo α
a archivos más pequeños e imágenes de menor calidad.
El segundo ingrediente es una matriz de 8 por 8 Q =
[Q u, v] con los coeficientes cuantificados por redondeo
F u, v / αQ u, v. Los Q u, v se eligen empíricamente y
normalmente tienen valores más grandes para frecuencias más altas
para enfatizar esas frecuencias. Para
postura, una matriz típica utilizada para cuantificar el
coeficientes de luminancia DCT es
Q=
16 11 10 16 24 40 51 61
12 12 14 19 26 58 60 55
14 13 16 24 40 57 69 56
14 17 22 29 51 87 80 62
18 22 37 56 68109103 77
24 35 55 64 81104113 92
49 64 78 8710312120101
72 92 95 98 112 100 103 99
Reconociendo que la luminancia lleva más importancia

información visual importante, utilizamos diferentes ma-
Trices para cuantificar los coeficientes que describen
luminancia y crominancia. Procesando nuestro sam-
bloque ple con un valor intermedio de α, el
coeficientes de luminancia cuantizados para nuestra muestra
bloque se muestran a continuación.
77
44
00
00
00
00
00
-2
00
-1
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
tu
Los coeficientes cuantificados están ordenados por
bajando las flechas para que aparezcan las frecuencias más bajas
primero.
Los coeficientes cuantificados para la luminancia.
componente en nuestra muestra y luego producir el se-
Quence 7, −2, 4, 1, 0, 1, 0, 1, −1 seguido de 55
ceros En lugar de almacenar cada cero, simplemente
registrar el número de ceros, lo que reduce el
requisito de almacenamiento significativamente. Com más
La presión se obtiene utilizando un código Huffman para
almacenar la secuencia de coeficientes de forma compacta.
La imagen se reconstruye invirtiendo esto
proceso. Los coeficientes cuantificados dan aprox-
valores imados de F u, v. Estos, a su vez, le dan al
Componentes (Y, C b, C r) y el componente (R, G, B)

nents. El bloque reconstruido se muestra a la
derecho del original.
La transformada discreta de Fourier (DFT) puede aparecer
pera preferible a la DCT ya que es más fácil
calculado sin embargo, nuestra elección del DCT es
explicado por nuestro deseo de concentrar el
formación en los coeficientes de baja frecuencia. por
ejemplo, considere los valores, y x, de un componente
en una fila de un bloque de 8 por 8. El DFT expresa
y x como una combinación lineal de funciones cuyo
el período es 8, lo que resulta en una extensión periódica de
y x. La transformación, por lo tanto, sigue innecesariamente
el cambio entre y 7 e y 8 = y 0, que puede
conducir a importantes contribuciones de alta frecuencia.
En la figura siguiente, los valores y x se muestran en
negro mientras que las aproximaciones dadas por los tres
términos de frecuencia más baja de la transformada de Fourier
están en rojo
01234567
En comparación, el DCT expresa x como un lineal
combinación de funciones cuyo período es 16 y
que son simétricos sobre x = 7.5. Esto alisa
fuera la extensión apropiada de y x para que el
DCT requiere una contribución relativamente pequeña de
términos de alta frecuencia. Abajo vemos lo análogo
aproximación dada por el DCT y tenga en cuenta la
mejora en la aproximación. (Estas figuras
aparecer en [2].)
01234567
Como los bloques de 8 por 8 se procesan independientemente
de forma discontinua, discontinuidades en los bordes de los bloques
llegar a ser aparente a altas relaciones de compresión. En
Además, a menudo es deseable tener la capacidad de
reconstruir eficientemente la imagen en intermedio
Resoluciones Estas razones y otras llevaron a la
creación del algoritmo de compresión JPEG 2000.
Entre otras diferencias, JPEG 2000 reemplaza el
DCT con una transformada wavelet discreta.
El algoritmo JPEG 2000 divide la imagen en
bloques más grandes, quizás del tamaño 256 por 256. Para ilustrar-
concentrar la transformación wavelet, arreglar una fila de píxeles
en un bloque y que y x represente los valores de uno de
los componentes. Ahora forma coeficientes wavelet
l x = (y 2x + y 2x + 1) / 2
h x = (y 2x - y 2x + 1) / 2.
Los h x se denominan coeficientes de "paso alto", ya que
detectan cambios de alta frecuencia, mientras que l x
son coeficientes de "paso bajo". Ordénelos enumerando
todos los coeficientes de paso bajo seguidos por el alto
pasar coeficientes y realizar la misma operación
en las columnas de coeficientes wavelet para obtener
bloques de coeficientes:
LH HH
LL HL
Los coeficientes en el subbloque LL son ob-
se obtiene promediando más de 2 por 2 bloques de píxeles
y por lo tanto representan una versión de menor resolución de
la imagen. Los otros tres subbloques describen el

cambios necesarios para construir la imagen en el
mayor resolución. iteramos este proceso en la LL
subbloque almacenando así la imagen cada vez más
Resoluciones más bajas.
LH HH
LL HL
LH HH
LL HL
LH HH
LL HL
LH HH
LL HL
El procedimiento de cuantificación detecta las regiones donde
los valores no cambian significativamente para que
los coeficientes de paso alto pueden ignorarse de forma segura.
En lugar de la transformada wavelet descrita
arriba, que promedia dos valores adyacentes, el
El algoritmo JPEG 2000 utiliza las Cohen-Daubechies-
Transformación wavelet Feauveau (9,7), que encuentra un
promedio ponderado sobre nueve valores adyacentes y
así produce imágenes más suaves.
La complejidad del algoritmo JPEG 2000,
comparado con el del algoritmo JPEG original,
es un orden de magnitud mayor, y bajo y
relaciones de compresión medias, la calidad de la im-
edades producidas por JPEG 2000 no es sustancialmente
mejor. Sin embargo, a relaciones de compresión muy altas,
donde el uso de JPEG de 8 por 8 bloques puede causar
calidad de imagen para deteriorarse severamente, JPEG 2000

Ofrece resultados significativamente mejores.
Desde JPEG 2000 nos pide que trabajemos más para pro-
Duce imágenes de calidad generalmente comparable, es
No es una opción claramente superior a JPEG. En efecto,
actualmente solo unos pocos navegadores web son capaces de
mostrando imágenes JPEG 2000. Su principal avance
tage radica en proporcionar un formato mucho más flexible
para trabajar con imágenes en entornos donde
La mayor complejidad no es problemática.
Por ejemplo, la capacidad de reconstruir eficientemente
La imagen en diferentes resoluciones, lo que resulta
del uso de la transformada wavelet, permite
usuarios para buscar visualmente a través de muchas imágenes en
Una baja resolución rápidamente. JPEG 2000 también permite
regiones, designadas por un usuario quizás, para ser deshabilitadas
jugado en una resolución más alta, una razón por la que
se usa comúnmente en imágenes médicas. Finalmente
es posible para fotografías digitales, almacenadas en un
tarjeta de memoria de la cámara en formato JPEG 2000,
para ser convertido eficientemente a una resolución menor a
reducir el uso de memoria después de tomarlos. JPEG
2000, diseñado aproximadamente diez años después de JPEG,
También incluye otras características, como la capacidad de
cifrar imágenes, cuya necesidad no se anticipó
más temprano.

Jpeg

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Jpeg

Cargado por

Copyright:

Formatos disponibles

La imagen a continuación consiste en una matriz rectangular de

3.871.488 píxeles. El color de cada píxel es determinante.

extraído por componentes rojo, verde y azul, cada uno

requiere un byte de memoria de la computadora. Ingenuo-

ly, esperamos que la imagen requiera 11,614,464

bytes Sin embargo, el tamaño del archivo JPEG contiene

Esta imagen tiene solo 734,268 bytes, aproximadamente 16

veces más pequeño Describiremos la compresión

algoritmo, desarrollado por Joint Photographic

Grupo de expertos (JPEG), que permite que la imagen sea

almacenado de manera compacta.

En lugar de especificar el rojo, el verde y el azul.

componentes de un color, es conveniente usar tres

diferentes cantidades: luminancia Y, que está muy cerca

relacionado con el brillo del color y azul

y crominancia roja C by C r, que aproximadamente

determinar el matiz Transformación afín invertible

se traduce entre las dos representaciones; para

ejemplo, para recuperar el rojo R, el verde G y el azul

Tenga en cuenta que la luminancia contribuye igualmente a

Los tres componentes de color. Para ayudar a visualizar esto

transformación, mostramos los colores que resultan

de arreglar la luminancia y mezclar varios

El algoritmo procede dividiendo la imagen.

en 8 por 8 bloques de píxeles que son independientemente

procesada. Aquí hay un bloque de muestra.

Los componentes (Y, C b, C r) en nuestra muestra 8by8

el bloque se muestra a continuación; regiones más claras corresponden

Observe que los valores de luminancia producen un

versión en escala de grises de la imagen. Como psico-visual

los experimentos muestran que el ojo humano es más sensible

Sitive a los valores de luminancia, la transformación de color

concentra la información más importante en

a un solo componente. La televisión en color utiliza un

modelo de color similar, lo que permite la tele-

visiones para mostrar eficientemente imágenes en color que son

Por razones que se explicarán más adelante, nosotros

ahora expresa los valores de los componentes como un lineal

combinación de funciones de coseno de aumento

frecuencia. Por ejemplo, si Y x, y es la luminancia

en la columna xy en la fila y de nuestro bloque, escribimos

(No es necesario que las constantes de normalización C u, v

nos importa.) Los coeficientes F u, v se encuentran por

la transformación bidimensional del coseno discreto

y eficientemente calculada usando una versión del

Transformada rápida de Fourier.

no cambian rápidamente, y el ojo humano no es

particularmente sensible a estos cambios. Por lo tanto,

los coeficientes DCT correspondientes a frecuencias más altas

las frecuencias probablemente serán pequeñas y pueden ser ignoradas

sin afectar nuestra percepción de la imagen.

la observación motiva nuestro método para cuantificar

los coeficientes DCT para que puedan almacenarse como

Se utilizan dos ingredientes en la cuantización.

proceso. El primero es un parámetro α, elegido por el

usuario para controlar la cantidad de compresión y

La calidad de la imagen. Valores mayores de plomo α

a archivos más pequeños e imágenes de menor calidad.

El segundo ingrediente es una matriz de 8 por 8 Q =

[Q u, v] con los coeficientes cuantificados por redondeo

F u, v / αQ u, v. Los Q u, v se eligen empíricamente y

normalmente tienen valores más grandes para frecuencias más altas

para enfatizar esas frecuencias. Para

postura, una matriz típica utilizada para cuantificar el