Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Facultad de de
Ingeniera
Escuela de
Ciencias
Procesamiento de
Imgenes
Sptimo Semestre
Realizado: 08/2002
Informtica-Matemtica
Ingeniera
Procesamiento de Imgenes
Documento
Clave
ECI 724
Fecha de
Validacin y
Liberacin
Sep 2002
Versin
V 1.0
Localizacin
Magntica
\\uce\informatica\basededatos\manual
El contenido que conforma las Materias de Multimedia y
Procesamiento de Imgenes ha sido suministrada y
obtenida de las siguientes fuentes:
Fuente
Elaborado
por
Revisado por
Aprobado por Ing. Franz Del Pozo
Procesamiento de Imgenes
INDICE
1.
1.1 El
1.1.1
1.1.2
1.1.3
1.1.4
2.
13
13
13
15
21
21
INTRODUCCIN
22
23
24
24
24
25
3.
UN MODELO DE IMAGEN
25
3.1
Muestreo y Cuantificacin
25
26
26
27
28
29
30
31
32
32
4.
MEJORA DE LA IMAGEN
39
4.1
39
4.2
40
4.3
41
TRANSFORMACIONES DE INTENSIDAD
4.3.1 Negativos de Imgenes
4.3.2 Aumento del Contraste
4.3.3
42
42
42
43
3
Procesamiento de Imgenes
4.3.4
4.3.5
4.3.6
4.3.7
4.3.8
43
44
44
45
46
5.
FILTRADO ESPACIAL
47
5.1
Filtros Suavizantes
48
5.2
48
5.3
48
6.
FILTROS REALZANTES
49
6.1
49
6.2
Filtrado High-boost
50
6.3
Filtros Diferenciales
50
7.
52
7.1
Filtrado homomrfico
53
8.
55
8.1
56
9.
MODELOS DE COLOR
57
9.1
Modelo RGB
57
9.2
Modelo CMY
58
9.3
Modelo YIQ
58
9.4
Modelo HSI
59
10.
COMPRESIN DE IMGENES
59
10.1
Fundamentos
59
10.2
Redundancia de Codificacin
60
10.3
61
Procesamiento de Imgenes
10.4
Redundancia Psicovisual
62
11.
62
11.1
63
11.2
64
11.3
Codificacin de Huffman
64
12.
65
13.
65
13.1
66
13.2
66
13.3
67
13.4
68
13.5
Compresin de imgenes basada en la Transformada
Discreta del Coseno (DCT).
69
14.
COMPRESIN JPEG
70
14.1
Sistema Bsico
14.1.1
Clculo de la DCT
14.1.2
Cuantificacin de los coeficientes de la DCT
14.1.3
Asignacin del Cdigo de Longitud Variable
72
72
73
73
14.2
Imgenes en color.
14.2.1
Aspectos psicovisuales.
74
75
15.
78
CONCLUSIONES
Procesamiento de Imgenes
CONTENIDO
COMPACTOS
MANUAL
DE LOS DISCOS
ADJUNTADOS
AL
Procesamiento de Imgenes
REQUERIMIENTOS
REQUERIMIENTOS
CLASE
DE
LA
SALA
DE
Pizarra.
Tiza lquida
Borrador
REQUERIMIENTOS DE LABORATORIO
HARDWARE
Retroproyector.
Computadoras con requerimientos bsicos.
Impresora.
SOFTWARE
Power Point
Procesamiento de Imgenes
Procesamiento de Imgenes
TEXTO EN CURSIVA
Se lo emplea para referirse a un tema de menor importancia.
PARNTESIS
Para hacer una breve explicacin o aclaracin del tema tratado.
Ejemplos breves.
Procesamiento de Imgenes
10
Procesamiento de Imgenes
11
Procesamiento de Imgenes
Procesamiento de Imgenes
13
Procesamiento de Imgenes
Brillo
Percibido
Blanco
Sin
lnea
14
Procesamiento de Imgenes
Blanco
Intensidad
Real
Negro
Posicin
15
Procesamiento de Imgenes
pueden
hacer
Blanco
Intensidad
Real
Negro
Posicin
Figura 6. Intensidad real de las franjas de escala de grises en la
Fig. 5
16
Procesamiento de Imgenes
Procesamiento de Imgenes
CONTRASTE SIMULTNEO
18
Procesamiento de Imgenes
Blanco
Intensidad
Real
Negro
Posicin
19
Procesamiento de Imgenes
20
Procesamiento de Imgenes
Procesamiento de Imgenes
2. Introduccin
El procesamiento de imgenes realizadas por un computador se conoce
como procesamiento digital de imgenes y se utiliza para analizar
una imagen o para transformarla en una imagen nueva.
El procesamiento digital de imgenes, es una disciplina que desarrolla
las bases tericas y algortmicas mediante las cuales pueda extraerse
informacin del mundo real, de manera automtica a partir de una
imagen observada, de un conjunto de imgenes o de una secuencia. Tal
informacin pudiera relacionarse con el reconocimiento de objetos
genricos, descripciones tridimensionales del mismo, posicin y
orientacin del objetos o la medicin de cualquier propiedad espacial tal
como la distancia entre dos puntos bien definidos o la seccin
transversal del objeto.
En la actualidad el campo del procesamiento digital de imgenes est
en continua evolucin; en los ltimos aos ha aumentado
significativamente el inters en la morfologa de imgenes, el
procesamiento de imgenes en color, la compresin el
22
Procesamiento de Imgenes
Una imagen digital es una imagen f(x ,y) que se ha discretizado tanto
en coordenadas espaciales como en el brillo; as pues una imagen
digital puede considerarse como una matriz cuyos ndices de fila y
columna identifican un punto de la imagen y el valor del
correspondiente elemento de la matriz indica el nivel de gris en ese
punto. Los elementos de una distribucin digital de este tipo se
denominan elementos de la imagen o mas comnmente pixeles
picture elements. Si las dimensiones de la matriz que representa la
imagen son MxN, se debiera establecer un ndice n, que denotara la
posicin sobre las columnas y pudiera variarse entre 0 y N - 1, de igual
forma un ndice m que denote la posicin sobre las filas, y que pudiera
tomar valores entre 0 y M -1.
Las tcnicas de procesamiento digital aplicadas sobre cierta regin de
una imagen, que involucran el anlisis de la informacin que poseen los
puntos ubicados alrededor del que se desea estudiar, son comnmente
denominadas Tcnicas de Procesamiento por rea o Regin.
las
etapas
fundamentales
Segmentaci
n
del
Procesamiento
Representaci
ny
Descripcin
Preprocesad
o
Base de Conocimiento
Reconocimient
oe
Interpretacin
Adquisicin
de imgenes
23
de
Procesamiento de Imgenes
2.1.1
Adquisicin de la imagen
2.1.2
Preprocesamiento de la Imagen
2.1.3
Segmentacin
2.1.4
Reconocimiento e Interpretacin
3. Un Modelo de Imagen
El termino de imagen se refiere a una funcin bidimensional de la luz y
la intensidad, ala que se la indica por f(x,y), donde el valor de la
amplitud f en las
coordenadas espaciales (x,y) da la intensidad
(iluminacin) en ese punto . Puesto que la luz es una forma de energa
tenemos:
0 < f(x,y) <
24
Procesamiento de Imgenes
f(x,y) =
Procesamiento de Imgenes
3.2.1
Vecinos de un Pixel
3.2.2
Conectividad
26
Procesamiento de Imgenes
N4(p), o bien
N4(q) es
3.2.3
Procesamiento de Imgenes
28
Procesamiento de Imgenes
3.2.4
B=
1
0
0
0
0
1
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
29
Procesamiento de Imgenes
B+ =
1
0
0
0
0
1
1
0
1
0
0
0
0
0
0
1
1
0
1
0
0
0
1
0
0
3.2.5
Medidas de Distancia
D(p,q)= D(q,p) y
30
Procesamiento de Imgenes
3.2.6
p+q
Sustraccin
p+q
Multiplicacin p+q
Divisin
p+q
p and q
O:
p or q
Complemento: Not p
Estas operaciones son funcionalmente completas en el sentido que
pueden ser combinadas para formar cualquier otra operacin lgica. Las
operaciones lgicas son herramientas bsicas para el procesamiento de
imgenes binarias, donde se emplean tareas como el enmascaramiento,
la deteccin de caracteres y el anlisis de formas.
Adems el procesamiento de imgenes enteras pxel a pxel, las
operaciones aritmticas y lgicas puede emplearse en operaciones
orientadas a los vecinos. E l procesamiento de vecinos se formula
habitualmente en el contexto de las denominadas mscaras (filtros) u
operaciones de enmascarado. La idea de las operaciones con mscaras
consiste en permitir que el valor asignado a un determinado pxel sea
una funcin de su propio nivel de gris y de los niveles de grises de sus
vecinos.
31
Procesamiento de Imgenes
Transformaciones Bsicas
Traslacin
1
0
0
0
1
0
0
0
1
X0
Y0
Z0
X
Y
Z
1
X*
Y* =
Z*
1
1
0
0
0
1
0
0
0
1
X0
Y0
Z0
X
Y
Z
1
v=
32
Procesamiento de Imgenes
X
Y
Z
1
Y v* es un vector columna cuyos componentes son las coordenadas
transformadas:
v=
X*
Y*
Z*
1*
XXXXXDDD
Con esta notacin la matriz empleada para la Traslacin es :
T=
1
0
0
0
0
1
0
0
0
0
1
0
X0
Y0
Z0
1
v*= Tv
Rotacin
Realizar la rotacin
33
Procesamiento de Imgenes
cos
- sen
0
0
0
0
sen
cos
1
0
0
0
0
1
0
0
1
0
0
0
se realiza
0
0
0
cos
sen
0
-sen
cos 0
0
0
1
cos 0
0
1
sen
0
0
- sen 0
0
0
0
cos 0
0
1
34
Procesamiento de Imgenes
V*=AV
Matrices Inversas:
Son aquellas que realizan la transformacin
opuesta y que pueden ser obtenidas por inspeccin. Ejemplo matriz
inversa de traslacin
T=
1
0
0
0
0
1
0
0
0
0
1
0
- X0
- Y0
- Z0
1
Transformaciones de Perspectiva
Una
transformacin
de
perspectiva
tambin
denominada
transformacin
de
imagen
proyecta
puntos
del
espacio
tridimensional sobre un plano. Estas desempea un importante papel
en el campo del procesamiento de imagen por cuanto proporcionan
una aproximacin al modo en que se forma una imagen viendo el
mundo tridimensional.
Sean (X,Y,Z) las coordenadas globales de cualquier punto en un
escenario tridimensional (Supondremos que Z> ). Nuestro primer
paso es obtener una relacin que proporcione las coordenadas (x,y)
de la proyeccin del punto sobre el plano imagen. Esto conseguimos
usando la semejanza de tringulos as:
x
x
x
Z Z
Y
Y
Y
Z Z
x
y
y y
Z
Z
w=
X
Y
35
Procesamiento de Imgenes
Z
Y su correspondiente en coordenadas homogneas es:
Wk =
kX
kY
Kz
k
P=
1
0
0
0
0
1
0
0
0
0
1
-1/
0
0
0
1
Ck = P W k =
0
1
0
0
0
0
1
-1/
0
0
0
1
kX
kY
Kz
k
kX
kY
Kz
- Kz/ +k
C=
0
1
X
Y
Z
X/( -Z)
Y/( -Z)
Z/( -Z)
donde P 1 es:
36
Procesamiento de Imgenes
1
0
0
0
P=
0
1
0
0
0
0
1
1/
0
0
0
1
Ch =
kx0
k y0
0
k
Wk =
kx0
k y0
0
k
o en coordenadas cartesianas:
C=
i.
X
Y
Z
x0
y0
0
Estas ecuaciones muestran que hay que conoce algo mas sobre el
punto que se ha generado en la imagen. Esta observacin, puede
37
Procesamiento de Imgenes
Ck =
se deduce que:
kx0
k y0
kz
(kz/ )+k
Wk =
W=
X
ii. Y
Z
x0/( +Z)
y0/( +Z)
z0/( +Z)
4. Mejora de la Imagen
El objetivo principal de las tcnicas de mejora es procesar una imagen
de forma que resulte ms adecuada que la original en una aplicacin
especfica.
38
Procesamiento de Imgenes
(x,y)
Imagen
1
x
E
s=T(r)
39
m
Oscuridad < - > luz
Procesamiento de Imgenes
F{f(x)}= F(u) =
f ( x)
e[-i2max]dx
Donde i=(-1)1/2
Las tcnicas en el dominio de frecuencia utilizan el teorema de
convolucin. Sea g(x,y) una imagen formada por la convolucin de
una imagen f(x,y) y un operador lineal invariante de posicin (Un
operador invariante de posicin es aquel cuyo resultado solo
depende del valor de f(x,y) en un punto de la imagen y no de la
posicin del punto ) h(x,y), es decir:
g(x,y) = h(x,y)*f(x,y)
Entonces por el teorema de la convolucin, se cumple la siguiente
relacin en el dominio de de la frecuencia:
G(u,v) = H(u,v)*F(u,v)
Donde G,H y F son las transformadas de Fourier de g,h y f
respectivamente.
En una aplicacin tpica de mejora de imagen , f(x,y) es conocida y el
objetivo, despus de calcular F(u,v) es seleccionar H(u,v) que ponga
nfasis en los componentes de alta frecuencia de F(u,v).
La funcin h(x,y) caracteriza un sistema cuya misin es la de producir
una imagen de salida g(x,y) a partir de la imagen de entrada f(x,y);
40
Procesamiento de Imgenes
f(x,y)
h(x,y)
g(x,y)
(a)
F(u,v)
h(x,y)
G(u,v)
(b)
En la figura (a) , h(x,y) caracteriza un sistema cuya misin es la de
producir una imagen de salida (g(x,y) a partir de una imagen de entrada
f(x,y)) . El sistema realiza la convolucin de h(x,y) con la imagen de
entrada y da el resultado como salida. El teorema de convolucin
permite una visin diferente del proceso en el sentido de que el mismo
resultado se obtienen multiplicando F(u,v) por H(u,v) para dar G(u,v) .
Tomando la transformada de Fourier inversa de la salida se obtiene la
imagen deseada.
Transformaciones de Intensidad
4.3.1
Negativos de Imgenes
41
Procesamiento de Imgenes
T(r)
L-1
FUNCIN DE TRANSFORMACIN
4.3.2
Las imgenes con poco contraste pueden ser debidas a diversas causas,
como iluminacin deficiente
o incluso incorrecta seleccin de la
apertura de la lente durante la captacin de la imagen. La idea
subyacente en las tcnicas de aumento del contraste consiste en
incrementar el rango dinmico de los niveles de gris de la imagen que
se esta procesando, en la siguiente figura se muestra una
transformacin tpica empleada para la mejora del contraste. La
ubicacin de los puntos (r1,s1) y (r2,s2) controla la forma de la funcin de
transformacin . Por ejemplo si r1=s1 y r2=s2 , la transformacin es una
funcin lineal que no produce cambios en los niveles de gris. Si r 1= r2 y
s1= 0 y s2 =L-1, la transformacin se convierte en una funcin umbral
que crea una imagen binaria. Los valores intermedios de (r 1,s1) y (r2,s2)
producen varios grados de dispersin de los niveles de gris de la imagen
de salida, afectando de esta forma al contraste. En general, se supone
que r1, r2 y s1 s2 de forma que la funcin sea de valor nico y
montonamente creciente. Esta condicin mantiene el orden de nivel de
gris y de
(r2,s2)
T(r)
42
(r1,s1)
r
L-1
Procesamiento de Imgenes
4.3.3
4.3.4
43
L-1
L-1
Procesamiento de Imgenes
4.3.5
4.3.6
Procesamiento de Histogramas
p(rk)
p(rk)
El histograma
de una imagen digital con
niveles de gris en el rango
[0,L-1) es una funcin discreta p(r k ) =nk/n , donde rk es el k-simo nivel
Oscura
Imagen
de gris , nk es Imagen
el nmero
de pixeles de la imagen
con ese nivel de gis, n
es el nmero total de pixeles de la imagen yBrillante
k = 0,1,2, ..,L - 1.
De forma general se puede decir que p(r k) da una idea del valor de
probabilidad que aparezca el nivel de gris r k . La representacin grfica
de esta funcin para todos los valores de k proporciona una descripcin
global de la apariencia de una imagen.
(a)
r
(b)
rk
Por ejemplo la siguiente figura kmuestra los histogramas de cuatro
tipos
bsicos
de
imgenes.
p(rk)
p(rk)
Imagen de
bajo
contraste
Imagen de
alto
contraste
44
(c)
(d)
Procesamiento de Imgenes
4.3.7
Sustraccin de Imgenes
Procesamiento de Imgenes
4.3.8
Promediado de la Imagen
Sea una imagen g(x,y) con ruido (distorsiones) causado por la adicin
de una funcin de ruido en (x,y) a una imagen original f(x,y), es decir:
g(x,y) = f(x, y) + (x, y)
en donde se realizar la hiptesis de que en cada par de coordenadas
(x, y) el ruido es una funcin sin correlacin y tiene un valor medio cero.
El objetivo ser reducir los efectos del ruido a base de sumar un
conjunto de imgenes [gi (x, y)].
Si una imagen g(x,y) esta formada por el promediado de M imgenes
diferentes con ruido:
M
g(x,y)= 1/M
gi (x,y)
i 1
entonces se tiene:
E[g (x,y)] = f (x, y)
( )= 1/M ( 2)
g x,y
(x,y)
( ) = 1/ M
g x,y
(x,y)
46
Procesamiento de Imgenes
5. Filtrado Espacial
El empleo de mscaras espaciales para el procesamiento de imgenes
se denomina frecuentemente Filtrado Espacial y las mscaras se
denominan filtros espaciales. A continuacin consideraremos filtros
espaciales lineales y no lineales para la mejora de la imagen.
Los filtros denominados de paso bajo atenuan o eliminan las
componentes de alta frecuencia en el dominio de Fourier a la vez que
dejan inalteradas las bajas frecuencias. Las componentes de alta
frecuencia caracterizan los bordes y los restantes detalles muy
marcados de la imagen, por ello el efecto de introducir un filtrado de
paso bajo es el de hacer borrosa la imagen. De forma similar los filtros
de paso alto atenuan o eliminan las componentes de baja frecuencia.
Como estas componentes son responsables de las caractersticas poco
variables de la imagen como el contraste global y la intensidad media,
el resultado neto de un filtrado de paso alto es la reduccin de estas
caractersticas y en correspondencia una aparente agudizacin de los
bordes y de los restantes detalles finos. Un tercer tipo de filtrado se
denomina filtrado de paso banda, que elimina regiones seleccionadas
de frecuencias intermedias. Estos filtros se emplean en la restauracin
de imgenes.
Independientemente del tipo de filtro lineal que se emplee la
aproximacin bsica consiste en sumar productos entre los coeficientes
de la mscara y las intensidades de los pixeles bajo la mscara en un
punto determinado de la imagen. En una mscara de 3x3 con
coeficientes w1, w2,..., w9 y notando por z 1, z2,... z9 a los niveles de gris
de los pixeles bajo la mscara, la respuesta de una mscara lineal es:
R = w1Z1 + W2Z2 + ...+ W9Z9
Procesamiento de Imgenes
Procesamiento de Imgenes
6. Filtros Realzantes
El objetivo principal del realce es el de destacar los detalles finos de una
imagen o intensificar detalles que han sido disminuidos, bien sea por
error o bien por efecto natural del mtodo de adquisicin de la imagen.
Las aplicaciones del realce de las imgenes son variadas e incluyen
aplicaciones que van desde imgenes mdicas hasta las inspecciones
industriales.
-1 -1 -1
-1 8 -1
-1 -1 -1
49
Procesamiento de Imgenes
Procesamiento de Imgenes
(1/9) x
-1 -1 -1
-1 w -1
-1 -1 -1
f/ x
f/ y
1/2
f=mag( f ) = ( f/ x)1/2 + ( f/ x
)1/2
1/2
2
)|
51
Procesamiento de Imgenes
f = |(Z5 Z 9) + (Z6 Z 8) |
0
-1
-1
-1
0
1
-1
0
1
-1
-1
-1
0
0
0
1
1
1
52
Procesamiento de Imgenes
7. Mtodos en el Dominio de
Frecuencia
Las mejoras en una imagen a travs del mtodo de dominio de
frecuencia, simplemente tratan de calcular la transformada de Fourier
de la imagen a intensificar, multiplicar el resultado por la funcin de
transferencia de un filtro y fina(mente, tomar la transformada de Fourier
inversa a una imagen mejorada.
En la prctica, las pequeas mscaras espaciales son mucho ms
empleadas que la transformada de Fourier debido a su facilidad de
implementacin y su velocidad de operacin. Sin embargo, existen
problemas que no se pueden resolver con tcnicas espaciales, un
ejemplo de este tipo de problemas es el filtrado homomrfico, que es
problema a tratar a continuacin.
F{ i(x,y)} F{ r(x,y)}
53
Procesamiento de Imgenes
= I(u,v) + R(u,v)
Si se procesa Z(u,v) por medio de un filtro cuya funcin sea H(u, v)
entonces tenemos:
S(u, v} = H(u,v) Z(u,v)
= H(u,v) I(u,v) + H(u,v) R(u,v)
donde S(u,v) es el resultado de la transformada de Fourier del resultado.
En el dominio espacial:
s(x, y) = F-1 { S(u, v)}
= F-2
R(u,v)}
haciendo
i (x,y) = F-1 { H(u,v) I(u,v) }
r (x,y) = F-1 { H(u,v) R(u,v)}
la ecuacin puede expresarse de la forma:
s(x, y) = i (x, y) + r (x, y)
Finalmente como z(x,y) se form a base de tomar el logaritmo de la
imagen original f(x,y), la operacin inversa proporciona la imagen
mejorada g(x, y) deseada; es decir:
g(x,y) = es(x,y)
g(x,y) = e i(x,y) e r(x,y)
g(x,y) = i0 (x,y) r0 (x,y)
con
i0 (x,y) = e i (x,y)
r0 (x,y)= e r (x,y)
que son las componentes de iluminacin y reflectancia de la imagen de
salida.
La siguiente figura muestra de manera resumida todo este proceso, el
cual es un caso particular de una clase de sistemas conocidos bajo el
54
Procesamiento de Imgenes
f(x,y)
ln
FFT
(FFT)-1
H(u,v)
g(x,y)
f(x,y)
YH
YL
D(u,v)
La figura anterior muestra la Seccin transversal de una funcin con
filtro con simetra circular Utilizada para el filtrado homomrfico. D(u,v)
55
Procesamiento de Imgenes
8. Procesamiento de Imgenes en
Color
EI empleo de color en el procesamiento de imgenes esta motivado por
dos factores principales. Primero, en el anlisis automtico de imgenes
el color representa un potente descriptor que a menudo simplifica 1a
identificacin de un objeto. Segundo, en el anlisis de imgenes, el
inters reside en que el ojo humano es capaz de discernir miles de
matices e intensidades de color, en comparacin con slo dos docenas
de niveles de gris.
El procesamiento de imgenes en color se divide en dos reas
fundamentales:
Procesamiento en color real o todo color
Procesamiento en falso color
En la primera categora, las imgenes en cuestin se adquieren
mediante un sensor de color como una cmara de televisin o un
scanner a color. En la segunda categora el problema consiste en
asignar un nivel de color a una determinada intensidad monocromtica.
Hasta hace relativamente poco tiempo el procesamiento de imgenes a
color se realizaba al nivel de falso color El importante progreso realizado
ltimamente a nivel de hardware ha hecho que el procesado a color se
haga en color real.
56
Procesamiento de Imgenes
Debido a la estructura del ojo humano, todos los colores se ven como
combinaciones variables de los denominados tres colores primarios:
rojo, verde, azul, notados por R, G, B respectivamente.
Los colores primarios pueden sumarse para obtener los colores
secundarios de luz: magenta (rojo ms azul), cian (verde ms azul), y
amarillo (rojo ms verde). Mezclando los tres calores primarios o uno
secundario con su color primario opuesto en las proporciones adecuadas
se obtiene luz blanca.
Las caractersticas generalmente empleadas para distinguir un color de
otro son: brillo, tono y saturacin. E1 brillo est relacionado con la
intensidad. El tono est relacionado con el color dominante ta1 como
percibe el observador. La saturacin se refiere a la pureza relativa o
cantidad de luz blanca mezclada con un tono.
El tono y la saturacin considerados conjuntamente constituyen la
cromaticidad, por tanto un color se puede caracterizar por su brillo y
cromaticidad.
Las cantidades de rojo, verde y azul necesarias Para formar un color
particular se denominan los valores triestmulos y se indican por X,Y,Z
respectivamente. As un color queda especificado Por sus coeficientes
tricromticos definidos como:
x = X/(X+Y+Z)
y = Y/(X+Y+Z)
z = Z/(X+Y+Z)
Evidentemente, X+Y+ Z = 1.
9. Modelos de Color
EI objetivo del modelo de color es el de facilitar la especificacin de los
57
Procesamiento de Imgenes
58
Procesamiento de Imgenes
1
= 1
1
R
G
B
R
G
B
Procesamiento de Imgenes
10.1
Fundamentos
60
Procesamiento de Imgenes
10.2
Redundancia de Codificacin
L rk = l (rk ) pr (rk )
k 0
Procesamiento de Imgenes
10.3
10.4
Redundancia Psicovisual
Procesamiento de Imgenes
Codificador
de canal
Canal
Decodificador
del canal
Codificador de
Fuente
63
f(x,y)
Procesamiento de Imgenes
MODELO DE UN SISTEMA GENERAL DE COMPRESIN
11.1
Conversor
Cuantificador
Codificador de
Smbolos
canal
MODELO DE CODIFICADOR
canal
Decodificad
or de
Smbolos
Conversor
Inverso
f(x,y)
MODELO DE DECODIFICADOR
64
Procesamiento de Imgenes
11.2
11.3
Codificacin de Huffman
Procesamiento de Imgenes
66
Procesamiento de Imgenes
13.1
13.2
67
Procesamiento de Imgenes
13.3
Procesamiento de Imgenes
13.4
Transformada Discreta del Coseno
(DCT).
La Transformada Discreta del Coseno es un caso especial de la
Transformada Discreta de Fourier (DFT) en la que se eliminan los
coeficientes senoidales. Una DCT produce tantos coeficientes tiles
como muestras de entrada.
Para el procesamiento de imgenes, se necesitan transformaciones
bidimensionales. En este caso, por cada frecuencia horizontal se lleva a
cabo una bsqueda de todas las frecuencias verticales posibles.
La DCT es separable, lo que significa que es posible obtener la DCT
bidimensional mediante la realizacin de clculos en cada dimensin de
manera separada.
Un factor significante que afecta al error de codificacin de la
transformada y a la complejidad de clculo es el tamao de la
subimagen o bloque. En la mayora de las aplicaciones, las imgenes se
subdividen de forma que la correlacin (redundancia) entre bloques
adyacentes se reduce a un nivel aceptable y de modo que n sea una
potencia entera de dos, siendo n la dimensin del bloque. Esta ultima
condicin simplifica el clculo de las transformadas de los bloques. En
Y 0
(2 x 1)
16
Sux cos
(2 y 1)v
16
cos
69
Procesamiento de Imgenes
T
(2 x 1)
16
u 0
v 0
16
u,v
cos
13.5
Compresin de imgenes basada en
la Transformada Discreta del Coseno
(DCT).
Para las imgenes se toma cada campo individual (o cuadros en
estndares de exploracin progresiva) y se trata independientemente
de cualquier otro campo o cuadro. La Figura 99 muestra un ejemplo de
distintos coeficientes de una DCT para un bloque de 8x8 pixeles que
sumndolos en distintas proporciones producirn cualquier bloque de
pixeles original. El coeficiente superior izquierdo lleva la componente
continua (DC) del bloque. Se tratar de un valor unipolar
70
Procesamiento de Imgenes
Procesamiento de Imgenes
Procesamiento de Imgenes
14.1
Sistema Bsico
73
Procesamiento de Imgenes
14.1.1
Clculo de la DCT
8 pixels
8 pixels
14.1.2
74
Procesamiento de Imgenes
14.1.3
Codificador
de Entropa
Cuantificad
or
Imagen
Comprimida
Imagen 8*8
Tabla de
Especificacione
s
Tabla de
Especificacione
s
Tabla de
Especificacione
s
Tabla de
Especificacione
s
Procesamiento de Imgenes
14.2
Imgenes en color.
B Y
+0.5
2
Cr =
R Y
+0.5
1.6
Y2
Y3
Y4
Y5 Y6
Y7
Y8
Y9
Y1
0
Y1
1
Y1
2
Y1
3
Y1
4
Y1
5
Y1
6
Cr 2
Cb1 Cb2
Cr 3 Cr 4
Cb3 Cb4
Cr1
76
Procesamiento de Imgenes
14.2.1
Aspectos psicovisuales.
11
10
16
24
40
51
61
12
12
14
19
26
58
60
55
14
13
16
24
40
57
69
56
14
17
22
29
51
87
80
62
18
22
37
56
68
10
10
77
77
Procesamiento de Imgenes
24
35
55
64
81
10
4
11
3
92
49
64
78
87
10
3
12
1
12
0
10
1
72
92
95
98
11
2
10
0
10
3
99
17
18
24
47
99
99
99
99
18
21
26
66
99
99
99
99
24
26
56
99
99
99
99
99
47
67
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
99
78
Procesamiento de Imgenes
15. Conclusiones
El sistema visual humano tiene limitaciones fundamentales en la
respuesta en frecuencia, como lmites para resolver detalles finos, o
transiciones de intensidad.
Los factores limitantes son el nmero y organizacin de los
fotorreceptores en la retina, la calidad de la parte ptica del ojo (crnea,
humor acuoso, cristalino, y humor vtreo), y la transmisin y
procesamiento de la informacin visual al cerebro.
79
Procesamiento de Imgenes
El ojo humano puede observar todos los colores del espectro visible,
"mezclando" los tres colores primarios, rojo, verde y azul, lo que se
aprovecha en la televisin, con las seales R, G y B.
La agudeza del odo humano es asombrosa, ya que puede detectar
cantidades minsculas de distorsin y aceptar un enorme rango
dinmico. Ya que el odo analiza el sonido con bandas crticas, algunas
tcnicas de compresin de audio se aprovechan de este hecho,
dividiendo el espectro de frecuencias de audio en bandas para disminuir
el flujo de bits.
El enmascaramiento aumenta el umbral de audicin, y los compresores
toman ventaja de este efecto aumentando el ruido de fondo, el cual
permite expresar a la onda de audio con menos bits.
El odo es slo capaz de extraer una cierta proporcin de la informacin
contenida en un determinado sonido, siendo redundante el sonido
adicional, llamndose a este fenmeno entropa perceptual.
La velocidad de transferencia de datos de salida de un codificador es
prcticamente independiente de la frecuencia de muestreo de entrada.
Esto se debe a que la entropa del sonido se encuentra en la forma de
onda y no en el nmero de muestras que la llevan.
La calidad de reproduccin de un sistema digital de video bien diseado
es independiente del medio y depende nicamente de la calidad de los
procesos de conversin.
Procesamiento de Imgenes
81
Procesamiento de Imgenes
82