Introduccion Al Procesamiento de Imagenes Con Matlab PDF

Introducción al Procesamiento
de Imágenes con Matlab

1era Parte
Departamento de Computación
Facultad de Ciencias Exactas y Naturales
Universidad de Buenos Aires
Taller de Informática I – 1er Cuatrimestre 2016
Andrea Manna
Que es una imagen?
• Una imagen es una función bidimensional f(x,y), donde x e
y representan las coordenadas espaciales y el valor de f en
cualquier par de coordenadas (x,y) representa la
intensidad de la imagen en dicho punto.
• Una imagen digital f[x,y] descrita en un espacio 2D
discreto se deriva de una imagen análoga f(x,y) en un
espacio 2D continuo a través de un proceso llamado
digitalización
• Matlab almacena las imágenes como vectores
bidimensionales (matrices), en el que cada elemento de la
matriz corresponde a un sólo pixel.
Trabajar con imágenes en Matlab es equivalente a

trabajar con matrices
Ejemplo
Descripción de una imagen
• Al digitalizarla, la imagen
continua en 2D es dividida en
M filas y N columnas
• La intersección de una fila y
una columna se llama pixel.
• El valor asignado a las
coordenadas [m,n] con
m= {1,2,...,M} y
n= {1,2,...,N} es f(m,n)
• Es común que una imagen
contenga sub-imagenes
llamadas regiones de interés
(ROI, regions of interest)
Tipos de datos en una imagen
El tipo de dato que contendrá una imagen puede ser de varios tipos
(según el tipo de dato de cada pixel):
• double: Doble precisión, números en punto flotante que varían en un

rango aproximado de -10308 a 10308 (8 bytes por elemento)
• uint8: Enteros de 8 bits en el rango de [0,255] (1 byte por elemento)
• uint16: Enteros de 16 bits en el rango de [0, 65535] (2 bytes por elemento)
• uint32: Enteros de 32 bits en el rango de [0, 4294967295] (4 bytes por
elemento)
• int8: Enteros de 8 bits en el rango de [-128, 127] (1 byte por elemento)
• int16: Enteros de 16 bits en el rango de [-32768, 32767] (2 bytes por
elemento)
• int32: Enteros de 32 bits en el rango de [-2147483648,2147483647] (4
bytes por elemento)
• logical: Los valores son 0 ó 1 (1 bit por elemento)
Tipos de datos en una imagen
Nosotros trabajaremos con tres tipos principales de imágenes:
• Imagen de intensidad es una matriz de datos cuyos valores han sido
escalados para que representen intensidades de una escala de grises. Cuando
los elementos de una imagen de intensidad son de clase uint8 (enteros
almacenados en 8 bits) o de clase uint16 (enteros almacenados en 16 bits),
pueden almacenar, respectivamente, 28=256 valores en el
16
rango [0:255] o 2 =65536 valores en el rango[0:65535]. Si la imagen es de
clase double, los valores son números en punto flotante (que se almacenan
en 32 bits). En este último caso, los valores se toman en el rango de [0:1] por
convención.
• La imagen binaria es una imagen en blanco y negro. Cada pixel tiene asignado
un valor lógico de 0 ó 1 donde 0 representa el negro y 1 el blanco
• La imagen en color es como la imagen de intensidad pero tiene tres canales,
es decir, a cada pixel le corresponden tres valores de intensidad (RGB) en
lugar de uno.
Color vs Blanco y Negro
Conversión de un tipo a otro
Cuando realizamos transformaciones matemáticas de
imágenes, a menudo necesitamos que la imagen sea de
tipo double. Pero cuando la leemos y almacenamos
ahorramos espacio usando codificación entera. Podemos
usar las siguientes funciones:
• im2uint8: de cualquier tipo a uint8,
• im2double: de cualquier tipo a double,
• im2bw: de cualquier tipo a logical,
• rgb2gray: RGB color a gris, o sea de tres capas a una sola.
Ejemplo: I es de tipo entero y quiero convertirla a double
>>D= im2double(I)
Nota: Se pueden utilizar también las
funciones de conversión de tipo, pero
el resultado es diferente
Aplicaciones en Geología
Tipos de archivos de imágenes
• GIF (Graphics Interchange Format)
• JPEG (Joint Photographic Experts Group)
• PNG (Portable Network Graphics)
• PNM (Portable Any Map)
– PPM - Imágenes en color
– PBM - Imagenes binarias
– PGM - Imagenes en escala de grises
– PAM - General, y no unicamente de imágenes
• BMP (Windows Bitmap format)
• TIFF (Tag Image File Format)
• EPS, TGA, PCX, FITS, DCX - CCITT
Lectura, visualización y escritura de
imágenes en Matlab
• Para leer una imagen se usa el comando imread:
I= imread(‘nombre_archivo’)
Ejemplo:
I=imread(‘lena_std.tif’);
Si observamos el workspace, vemos la variable I
definida como una matriz de tres dimensiones:
imágenes en Matlab
• Para visualizar una imagen
se usa el comando imshow:
imshow(I)
Donde I es la matriz leída

con el comando anterior.
Ojo!!! Ya no utilizamos el
nombre del archivo. A partir
de ahora nos manejamos
con la matriz donde leímos
la imagen.
imágenes en Matlab
• Como vimos, la variable I tiene 3 dimensiones. Esto es porque la imagen
tomada con el comando imread posee 3 canales. Podemos manipular cada
canal por separado:
J= I(:, : , 1); Esto significa “Dame todas las
filas y todas las columnas del canal 1 y guardalo en J”
Cuando vamos a visualizar J en el espacio de trabajo, vemos que tiene 2
dimensiones. Esto es porque extrajimos una capa o canal.
>> I=imread('lena_std.tif');
>> subplot(2,2,1)
>> imshow(I)
>> subplot(2,2,2)
>> imshow( I(:,:,1) )
>> subplot(2,2,3)
>> imshow( I(:,:,2) )
>> subplot(2,2,4)
>> imshow( I(:,:,3) )
imágenes en Matlab
• ¿Por que cuando hacemos
>> J= I(:, : , 1)
>>imshow( I(:,:,1) )
la imagen se ve en blanco y negro?
• Simplemente porque tomamos un
solo canal de los 3 que tiene la
imagen
• Si vemos cada canal por separado lo
que se visualiza son las intensidades
en escala de gris de cada canal (rojo,
verde y azul)
La variable J posee dos dimensiones y por eso se visualiza en
gris!!!
imágenes en Matlab
• ¿Como haríamos para ver cada canal en su color?
• Lo que debemos hacer es “anular” los otros canales
asignandoles el valor 0.
• Veamos a Lena solo en el canal rojo:
>> T = I; %hago copia de la imagen
>> T(:,:,2) = 0; %Capa verde en cero
>> T(:,:,3) = 0; %Capa azul en cero
>> imshow(T)
La variable T posee tres dimensiones y por eso se visualiza en

color!!!
imágenes en Matlab
• Una vez procesada la imagen, podemos
guardarla en otro archivo. Supongamos que
queremos guardar un trozo de la figura de
Lena. Tenemos que usar el comando:
imwrite(I , ‘nombre_archivo’)
Ejemplo:
>> G = I(238:293 , 241:357 , :); % Extraemos una subimagen
>> imshow(G)
>> imwrite(G , ’trozoLena.png’)
Manipulación de una imagen
Como vimos antes hay muchas opciones una
vez que tenemos la imagen en el workspace:
• Hemos visto que podemos extraer una capa
• Hemos visto que podemos extraer una
subimagen
• Hemos visto que podemos anular (poner en
cero) uno o dos canales
Podemos generar una imagen con Matlab. Para
eso precisamos una matriz:
>> h= zeros( [500,500,3], 'uint8');
Ahora tenemos que darle color. Para eso vamos a
manipular pequeñas subimagenes y coloreamos:
>> h(1:250, 1:250, 1)=70;
>> h(1:250, 251:end, 1)=120;
>> h(251:end, 1:250, 1)=230;
>> h(251:end, 251:end, 1)=180;
>> imshow(h)
Solo manipulamos el primer canal!!

Vamos a modificar el resto de los canales con otros colores:
>> h(1:250, 1:250, 2)=220;

>> h(1:250, 251:end, 2)=25;
>> h(251:end, 1:250, 2)=100;
>> h(251:end, 251:end, 2)=50;
>> imshow(h)
Alteramos los colores del canal 2!!

(El canal 3 aún está en cero)
Vamos a modificar el último canal:
>> h(1:250,1:250,3)=150;
>> h(1:250,251:end,3)=235;
>> h(251:end,1:250,3)=22;
>> h(251:end,251:end,3)=197;
>> imshow(h)
Alteramos los colores del canal 3!!

Ahora los 3 canales poseen diferentes intensisdades de gris que combinadas
las 3 capas, forman el color de la imagen
Combinación de colores
Histograma de una imagen
• El histograma de una imagen f es una gráfica que representa los
niveles de intensidad del color de f con respecto al número de
píxeles presentes en f con cada intensidad de color
• Puede ayudarnos para controlar la exposición en nuestras fotos, así
como para corregir los colores.
• El eje horizontal representa los diferentes tonos de gris desde el
negro puro (a la izquierda) al blanco puro (a la derecha).
• El eje vertical representa el número de pixeles que contiene la
imagen para cada tono representado en el eje horizontal.
• El histograma nos ayudará a hacernos una idea de cómo es de
correcta la exposición de una imagen. Así, en una fotografía
subexpuesta la gráfica tenderá a desplazarse a la izquierda y en una
fotografía sobreexpuesta tenderá a desplazarse a la derecha. Una
imagen que contenga todos los tonos de grises tendrá un histograma
más o menos uniforme a lo largo de todo el eje horizontal.
• Propiedades:
– La imagen f no se puede deducir a partir de hf

– Dos imágenes diferentes pueden tener asociado el
mismo histograma
– Los histogramas no contienen información espacial
sobre la imagen
• Tonos Apagados: Se trata de una imagen oscura
• Sombras o zonas oscuras: Imagen con muchas zonas

oscuras o fondo negro. El histograma tiende a irse a la
izquierda
• Sobreexposición: La imagen tiene zonas muy claras o “quemadas”
• Sombras pálidas: La imagen no posee zonas oscuras, no hay picos

a la izquierda. Tampoco hay zonas quemadas, o sea no hay picos a
derecha. Pero se trata de una imagen clara
• Contraluz: Este histograma posee forma de U. Hay zonas muy claras y otras muy oscuras. Hay
pocas zonas grises
• Distribución homogénea: El histograma de una foto homogénea se distribuye a lo largo de todo el

eje horizontal. Al no haber zonas quemadas ni excesivamente oscuras no encontraremos picos ni
grandes “montañas” en la gráfica. Es importante saber que el hecho de una distribución sea
homogénea no siempre significa que la imagen está correctamente expuesta. Dependerá
estrictamente de las características tonales de la imagen
• El comando Matlab para realizar histograma de una imagen es imhist
• Atención!!: El comando imhist debe usarse solamente con imágenes en
escala de grises.
>>imhist(I) % retorna el grafico del histograma con el eje x dividido en 256 partes
>>imhist(I,n) % retorna el grafico del histograma con el eje x dividido en n partes
>>[counts,x] = imhist(___) % No realiza el gráfico, sino que retorna dos vectores:
x= contiene todos los valores de intensidad, desde 0 a 255 o desde 0 a n

(según el comando hist que se use)
counts= contiene la cantidad de cada valor de intensidad guardado en x
• Ejemplo. Si tomamos la imagen de Lena, podríamos visualizar el
histograma de cada uno de sus canales de la siguiente manera:
3500
3000
>>subplot(2,2,1) 2500
2000
>>imshow(I) 1500
1000
>>xlabel ('imagen color') 500
>>subplot(2,2,2) imagen color

0 50
canal rojo
100 150 200 250
>>imhist(I(:,:,1))
3000
>>xlabel ('canal rojo')

3500
2500
3000
2000 2500
>>subplot(2,2,3) 1500 2000
1500
>>imhist(I(:,:,2))
1000
1000
500
500
>>xlabel ('canal verde') 0
0 50
canal verde
100 150 200 250
0
0 50
canal azul
100 150 200 250
>>subplot(2,2,4)
>>imhist(I(:,:,3))
>>xlabel ('canal azul')
• Tomemos el canal 1:
>> I1= I(:,:,1);
>> [counts,x] = imhist(I1) ;
>> x(100:110) >> counts(100:110)
99 1559 4500
100 1418 4000
101 1384 3500

102 1319
3000
103 1342
104 1156 2500
105 1120 2000
106 955 1500

107 969 1000
108 828
500
109 782
>> bar(x,counts) 0
-50 0 50 100 150 200 250 300
Histograma de la imagen que se construyó de
4 colores:
• Como debería ser este histograma? Pruébelo!!

• Volviendo a la imagen de Lena, veamos el
histograma de la capa 1 (rojo)
3500
3000 Vemos que el histograma se encuentra sesgado

2500
a derecha, esto es, la imagen en la capa roja es
2000
1500
bastante clara. Lo comprobamos:
1000
500
0 50 100 150 200 250

• Es decir que, basándonos en el histograma
podemos observar que la imagen es demasiado
clara ¿Cómo podríamos oscurecerla?
>> I2= I(:,:,1);
>> max(max(I2))
255
>> min(min(I2))
54
>> I3 =I2 – 50;
¿Qué logramos con esto?
Capa 1 Original Capa 1 modificada
3500
3500
3000
3000
2500 2500
2000 2000
1500 1500
1000 1000
500 500
0 0
0 50 100 150 200 250 0 50 100 150 200 250

• A veces no es tan fácil emparejar los colores de
una imagen, dada la variedad de valores de
intensidad.
• Un histograma ideal es aquel que se extiende
ocupando casi todo el rango de tonos
• Para lograr un histograma ideal, se suele utilizar
un comando para ecualizar una imagen
• Ecualizar: El objetivo de la ecualización es que la
imagen tenga una distribución uniforme sobre
toda la escala de grises.
Ecualización de una imagen
• Función de probabilidad de ocurrencia de cada nivel de
intensidad :
histograma rk ∈ [0,255]
Para ecualizar el histograma se realiza la siguiente operación:
1) Se obtiene el histograma
2) Calcular los nuevos valores de intensidades utilizando la función de probabilidad de
ocurrencia
3) Reemplazar las intensidades

El comando que se utiliza para ecualizar una imagen es histeq:
J = histeq(I,n) donde
I es la imagen en escala de grises que queremos ecualizar
n es la cantidad de niveles de grises que se quieren utilizar en la
ecualizacion. Por defecto, se usan 256 niveles de grises
Ejemplo: (usando la capa 1 de Lena)
>> J1= histeq(I1) ó
>> J1= histeq(I1, 128) si se quiere con, por ejemplo, 128 niveles de
grises
• Comparando la imagen de Lena original y la imagen ecualizada queda:
3500
5000
>>J1= histeq(I1)
4500
3000
4000 >>imshow(J1)
>>imhist(J1)
2500 3500
3000
2000
2500
1500 2000
1500
1000
1000
500
500
0 0
0 50 100 150 200 250

0 50 100 150 200 250
La ecualización del histograma genera una imagen cuyos niveles de intensidad son
igualmente probables y, además, cubren todo el rango [0,255]. El resultado neto de este
proceso es una imagen cuyo rango dinámico ha sido incrementado, que tenderá a
poseer un mayor contraste.
• Veamos otro ejemplo:
5000
5000
4500
4500 >> I=imread('semillas.png');
4000
4000
3500
3500 >> I1=I(:,:,1);
3000
>> imshow(I1)
3000
2500 2500
2000 2000
1500
1000
1500
1000
>> figure,imhist(I1);
500
0
500
0
>> g=histeq(I1,256);
0 50 100 150 200 250
0 50 100 150 200 250 >> figure,imshow(g);
>> figure,imhist(g);
Ejercicios
1. Tome la imagen de Lena e intente extraer la subimagen en color correspondiente
a la boca en la variable BOCA
2. ¿Que tipo de dato obtuvo? ¿double o uint8?
3. Tome el canal 3 de la imagen de Lena. Pasarlo a double utilizando el comando
im2double.
4. Repetir el mismo ejercicio anterior pero en vez de usar la función im2double,
utilice la función double. ¿Dio el mismo resultado? Chequearlo. En caso
negativo, ¿Cómo puede utilizar la función double para lograr el resultado
deseado? Pista: recuerde que im2double es una función que transforma
elementos uint8 en elementos double entre 0 y 1.
5. Arme una imagen teniendo en cuenta la siguiente información para cada una de
las capas:
C1= rand(300); % Capa 1
C2= rand(300); % Capa 2
C3= rand(300); % Capa 3
6. Muestre el histograma de cada una de las capas de la imagen anterior. ¿Qué
puede deducir? ¿Qué pasa si se realiza la ecualización de estas capas?

Introduccion Al Procesamiento de Imagenes Con Matlab PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Introduccion Al Procesamiento de Imagenes Con Matlab PDF

Cargado por

Copyright:

Formatos disponibles

Introducción al Procesamiento

de Imágenes con Matlab

Trabajar con imágenes en Matlab es equivalente a

• double: Doble precisión, números en punto flotante que varían en un

Donde I es la matriz leída

La variable T posee tres dimensiones y por eso se visualiza en

Solo manipulamos el primer canal!!

>> h(1:250, 1:250, 2)=220;

Alteramos los colores del canal 2!!

Alteramos los colores del canal 3!!

– La imagen f no se puede deducir a partir de hf

• Sombras o zonas oscuras: Imagen con muchas zonas

• Sombras pálidas: La imagen no posee zonas oscuras, no hay picos

• Distribución homogénea: El histograma de una foto homogénea se distribuye a lo largo de todo el

x= contiene todos los valores de intensidad, desde 0 a 255 o desde 0 a n

>>xlabel ('imagen color') 500

>>subplot(2,2,2) imagen color

>>xlabel ('canal rojo')

>>subplot(2,2,3) 1500 2000

>>xlabel ('canal verde') 0

100 1418 4000

101 1384 3500

105 1120 2000

106 955 1500

• Como debería ser este histograma? Pruébelo!!

3000 Vemos que el histograma se encuentra sesgado

0 50 100 150 200 250

0 50 100 150 200 250 0 50 100 150 200 250

3) Reemplazar las intensidades

0 50 100 150 200 250

También podría gustarte