Documentos de Académico
Documentos de Profesional
Documentos de Cultura
IMGENES BASADA EN EL
HISTOGRAMA
GONZALO LUZARDO M.
gluzardo@espol.edu.ec
gonchalox@gmail.com
1. Introduccin
Este trabajo consiste en tratar de resolver un problema clsico del campo de la visin artificial, que
se denomina segmentacin de imgenes. La segmentacin en visin artificial consiste en identificar
individualmente cada uno de los objetos o elementos presentes en una escena. En nuestro caso en
particular, lo que buscamos es identificar una puerta y discriminarla de los dems objetos que
pudieran estar presentes. Las imgenes que vamos a analizar, las cuales son claros ejemplos de los
cuatro problemas a los que nos podramos enfrentar al momento de tratar de identificar la puerta,
son las siguientes:
CASO 1: CASO 2:
Puerta cerrada vista de frente(imagen1.jpg) Puerta cerrada vista desde un lado
(imagen2.jpg)
CASO 3: CASO 4:
Puerta abierta (imagen3.jpg) Puerta semiabierta (imagen4.jpg)
Para resolver nuestro problema de identificar la puerta en cada una de nuestras imgenes, las
tcnicas de segmentacin que vamos a utilizar sern las siguientes:
4000
6000
3500
5000
3000
4000
2500
3000 2000
1500
2000
1000
1000
500
0 0
0 50 100 150 200 250 0 50 100 150 200 250
CASO 1 CASO 2
3500
4000
3000
3000 2500
2000
2000
1500
1000
1000
500
0 0
0 50 100 150 200 250 0 50 100 150 200 250
CASO 3 CASO 4
Observando los histogramas podemos notar claramente la naturaleza altamente ruidosa de los
mismos. Podemos identificar algunos picos que podran considerarse como objetos identificables
dentro de la imagen, as como una multitud de falsos mnimos y falsos mximos. Esta informacin
obtenida servir para realizar nuestra primera aproximacin de segmentacin para cada una de las
imgenes.
La primera segmentacin que vamos a hacer ser la siguiente: aplicar un filtro de la mediana sobre
el histograma para tratar de eliminar los falsos mximos y falsos mnimos, para luego considerar los
picos (modas) como el nmero de objetos (clases) presentes en nuestra imagen y el umbral de
separacin entre dos clases como la media suma de sus picos.
Utilizando el cdigo MATLAB para segmentar una imagen de la seccin 6.2, para cada caso
obtuvimos los siguientes resultados.
6000
5000
4000
3000
2000
1000
0
0 50 100 150 200 250
*Numero de clases identificadas: 7
*Tamao de la ventana: 11
4000
3500
3000
2500
2000
1500
1000
500
0
0 50 100 150 200 250
*Numero de clases identificadas: 11
*Tamao de la ventana: 11
5000
4500
4000
3500
3000
2500
2000
1500
1000
500
0
0 50 100 150 200 250
*Numero de clases identificadas: 9
*Tamao de la ventana: 11
4000
3500
3000
2500
2000
1500
1000
500
0
0 50 100 150 200 250
*Numero de clases identificadas: 15
*Tamao de la ventana: 11
Los datos que obtuvimos para cada uno de los casos fueron los siguientes:
Podemos notar que esta primera segmentacin que hemos aplicado resulta ser bastante buena,
claramente podemos apreciar como los diferentes elementos presentes en la imagen han sido por
as decirlo identificados. Adicionalmente esta primera segmentacin nos ayuda a poder estimar de
manera heurstica el intervalo en niveles de gris que corresponde a la puerta la cual queremos
identificar, en nuestro caso este intervalo se encuentra cercano a 50. Esta informacin la
utilizaremos para poder etiquetar dentro del histograma a aquellos pixeles que corresponden a la
puerta.
Otra manera de estimar el umbral o fronteras entre dos clases es mediante restitucin sucesiva del
umbral, el cual, dada dos clases con una distribucin normal de los pixeles en cada una, y una misma
varianza entre clases, estima el umbral de manera reiterada a travs de la media suma de sus
medias estimadas utilizando las muestra presentes en la clase hasta que el umbral se estabilice
(Umbralizacin Semi-Bayes).
Lo que vamos hacer es implementar esta tcnica de umbralizacin y comparar con los resultados
obtenidos mediante la umbralizacin a travs de media suma de los picos.
Utilizando el cdigo de MATLAB 6.3 que contiene un algoritmo para de umbralizacin mediante
restituciones sucesivas del umbral, para cada caso obtuvimos los siguientes resultados:
6000
5000
4000
3000
2000
1000
0
0 50 100 150 200 250
*Numero de clases identificadas: 7
*Tamao de la ventana: 11
4000
3500
3000
2500
2000
1500
1000
500
0
0 50 100 150 200 250
*Numero de clases identificadas: 11
*Tamao de la ventana: 11
Histograma con maximos y fronteras (Semi Bayes)
5000
4500
4000
3500
3000
2500
2000
1500
1000
500
0
0 50 100 150 200 250
*Numero de clases identificadas: 9
*Tamao de la ventana: 11
4000
3500
3000
2500
2000
1500
1000
500
0
0 50 100 150 200 250
*Numero de clases identificadas: 15
*Tamao de la ventana: 11
Si observamos los resultados obtenidos notamos que no son muy buenos e incluso son peores a los
que obtuvimos estimando los umbrales como las medias sumas de los picos. Al parecer considerar
que cada una de las clases posee la misma varianza, algo que en realidad claramente no sucede,
ocasiona que las fronteras entre clases se inclinen ms hacia la clase con mayor nmero de
muestras. Una manera de corregir este error sera utilizando una estimacin del umbral con Bayes
completo el cual si considera la varianza en cada una de las clases. El problema de aplicar un Bayes
completo radica en el incremento de la cantidad de clculos que debemos realizar.
En vez de utilizar Bayes-completo, hemos optado por estimar los umbrales de una manera diferente:
el umbral entre dos clases dadas estar ubicado en el valor mnimo presente entre los picos de
ambas clases. Como vemos esta estimacin resulta ser ms sencilla y mucho ms fcil de calcular.
Adicionalmente vamos a etiquetar el histograma utilizando el valor obtenido del nivel de gris donde
puede localizarse la puerta, de tal forma que aquella clase que contenga dentro el valor de gris igual
a 50 corresponder a la puerta.
Utilizando el cdigo de MATLAB 6.4 el cual establece el umbral entre las clases como el valor mnimo
entre sus picos, para cada caso obtuvimos los siguientes resultados:
Histograma con maximos y fronteras
6000
Clase Puerta
5000
4000
3000
2000
1000
0
0 50 100 150 200 250
*Numero de clases identificadas: 7
*Tamao de la ventana: 11
4000
Clase Puerta
3500
3000
2500
2000
1500
1000
500
0
0 50 100 150 200 250
*Numero de clases identificadas: 11
*Tamao de la ventana: 11
5000
4500
4000
3500
3000
2500
2000
Clase Puerta
1500
1000
500
0
0 50 100 150 200 250
*Numero de clases identificadas: 9
*Tamao de la ventana: 11
4000
3500
3000
Clas e Puerta
2500
2000
1500
1000
500
0
0 50 100 150 200 250
*Numero de clases identificadas: 15
*Tamao de la ventana: 11
Analizando los resultados podemos darnos cuenta de algunas mejoras respecto a los resultados
obtenidos anteriormente. Podemos observar que existen regiones de la puerta que en un principio
fueron clasificadas errneamente, esta vez clasificadas de manera correcta; estas regiones
corresponden a las zonas oscuras correspondientes al marco de la puerta. Aun podemos mejorar
nuestros resultados realizando un preprocesamiento sobre la imagen.
Este preprocesamiento consistir en aplicar un filtro gausiano sobre la imagen original. De esta
forma eliminaremos las frecuencias altas presentes en la imagen, y en teora una mejor clasificacin.
Adicionalmente vamos a marcar sobre la imagen slo aquellos pixeles que segn el histograma
corresponden a la puerta. Utilizando el cdigo MATLAB de la seccin 6.5 donde realizamos
preprocesado de imgenes, obtuvimos los siguientes resultados:
6000
Clase Puerta
5000
4000
3000
2000
1000
0
0 50 100 150 200 250
*Numero de clases identificadas: 8
*Tamao de la ventana: 11
3500
3000
2500
2000
1500
1000
500
0
0 50 100 150 200 250
*Numero de clases identificadas: 15
*Tamao de la ventana: 11
5000
4000
3000
2000
Clase Puerta
1000
0
0 50 100 150 200 250
*Numero de clases identificadas: 13
*Tamao de la ventana: 11
Histograma con maximos y fronteras
4000
3500
3000
Clase Puerta
2500
2000
1500
1000
500
0
0 50 100 150 200 250
*Numero de clases identificadas: 13
*Tamao de la ventana: 11
Como vemos tambin existen pixeles o regiones mal clasificadas (regiones que no forman parte de la
puerta marcados como parte de ella), esto se debe a que a que dichos pixeles poseen una intensidad
en niveles de gris igual o similar a aquellos pixeles que si forman parte de la puerta. Para mejorar
an ms nuestra segmentacin podramos optar por:
Una posible desventaja de utilizar algunas de estas mejoras radica en la necesidad de hacer
clculos adicionales a los que hemos hecho hasta el momento, lo que no podra ser un
inconveniente para una aplicacin montada sobre un robot que en tiempo real est
constantemente buscando una puerta para luego dirigirse hacia ella.
Para la deteccin de bordes vamos a utilizar los operadores de derivacin (filtros del gradiente y
laplacianos) los cuales se ha comprobado que dan muy buenos resultados.
La deteccin de bordes puede ser particularmente til en nuestro caso ya que la puerta (con niveles
de intensidad bajos) tiene los bordes muy bien definidos debido a que se encuentra sobre la pared
que tiene un nivel de intensidad mucho ms altos.
Utilizando el cdigo MATLAB de la seccin 6.6 la cual realiza una extraccin de bordes aplicando el
filtro del gradiente de Prewitt, obtuvimos los siguientes resultados:
Si observamos los resultados notamos la eficacia del filtro aplicado. Los bordes de los objetos,
especialmente los de la puerta, han sido identificados muy bien.
Podramos detenernos aqu, pero por cuestiones de curiosidad, aplicaremos un filtro laplaciano para
la extraccin de bordes. Utilizando el cdigo MATLAB de la seccin 6.7 pudimos obtener los
siguientes resultados:
Si observamos los resultados obtenidos al aplicar ambos filtros podemos notar que ambos son igual
de buenos, de tal forma que cualquiera de los dos se los podra considerar como vlido.
Adicionalmente, se investigaron los filtros de Canny para la deteccin de bordes. El filtro de Canny
combina un operador diferencial con un filtro gausiano para la deteccin de bordes. Utilizando el
cdigo MATLAB de la seccin 6.8 pudimos obtener los siguientes resultados:
Podemos observar que el filtro de Canny nos da mejores resultados, esto es, el aplicar un filtro
gausiano antes de la deteccin de bordes nos ayudar a eliminar las altas frecuencias presentes en la
seal y que pueden ser consideradas como falsos bordes, obteniendo al final mejores resultados.
4. Conclusiones
Una vez culminado el presente trabajo podemos sacar las siguientes conclusiones:
5. Referencias
GONZALEZ, WOODS, EDDINS. Digital Image Processing using MATLAB. Prentice Hall. 2004.
MARAVALL DARIO. ``Reconocimiento de formas y visin artificial''. RAMA. 1993.
1
Determina que, entre dos soluciones, es probable que la correcta sea la ms sencilla.
6. Cdigo MATLAB
6.1. Extraccin y Trazado del histograma de una imagen
image_name = 'imagen1.jpg';
img = imread(image_name);
[counts,x]=imhist(img);
maxcounts = max(counts);
h = bar(x,counts);
set(h,'FaceColor',[102/255,153/255,102/255],'EdgeColor',[102/255,153/255,102/255]
);
title 'Histograma Original';
axis([0 255 0 maxcounts+300]);
function[frontier,findex]=FindFrontiers(values,maxindex)
findex = zeros(1,length(maxindex)+1);
frontier = zeros(1,length(maxindex)+1);
findex(1)= 1;
frontier(1)= values(1);
for N=1:length(maxindex)-1
findex(N+1) = round(maxindex(N) + (maxindex(N+1) - maxindex(N))/2);
frontier(N+1) = values(findex(N+1));
end
findex(length(maxindex)+1)= 256; %Maximo valor de un pixel
frontier(length(maxindex)+1) = values(256)
function[hills,xhills,climbs,xclimbs]=FindFrontiersSemiBayes(values,xmodes)
xhills = zeros(1,length(xmodes)+1);
hills = zeros(1,length(xmodes)+1);
xclimbs = xmodes;
climbs = values(xmodes);
xhills(1)= 1;
hills(1)= values(1);
%Inicializacion
for N=1:length(xmodes)-1
xhills(N+1) = round(xmodes(N) + (xmodes(N+1) - xmodes(N))/2);
hills(N+1) = values(xhills(N+1));
end
xhills(length(xmodes)+1)= 256; %Maximo valor de un pixel
hills(length(xmodes)+1) = values(256);
%Comenzamos con cada una de las clases
%Para cada una de las clases
for N=1:length(xmodes)-2
fprintf('Estabilizando clases: %i y %i\n',N,N+1);
min_sec = xhills(N);
uf = xhills(N+1); %la que iremos modificando paulatinamente
fprintf('Frontera inicial: %i\n',uf);
max_sec = xhills(N+2);
stable = 0; %establece si se stabilizo la busqueda
while(stable == 0)
m1 = sum((values(min_sec:uf) .* [min_sec:uf]))/sum(values(min_sec:uf));
m2 = sum((values(uf:max_sec) .* [uf:max_sec]))/sum(values(uf:max_sec));
mc = round((m1+m2)/2);
fprintf('Frontera obtenida: %i\n',mc);
if(mc==uf)
stable = 1;
else
uf = mc;
end
end
xhills(N+1)=uf;
end
6.4. Segmentacin basada en histograma con filtrado de bordes y
estimacin de fronteras mediante la localizacin de los mnimos entre los
picos
%<image_name> es el nombre del a imagen que vamos a procesar
gray_level_element = 50; %nivel de gris de la puerta
image_name = 'imagen1.jpg'; %nombre de la imagen que vamos a tratar
hist_mean_filter = 11; %debe ser impar, filtro de histograma, minimo 1 maximo 256
filter_text = '';
img = imread(image_name);
[m,n] = size(img);
%Convertir a blanco y negro
img = rgb2gray(img);
bar_width = hist_mean_filter;
[shist, err] = sprintf('Tamao de la ventana: %i\n',bar_width);
%Obtenemos el histograma de la imagen original
[counts,x]=imhist(img);
maxcounts = max(counts);
%Aplicamos un filtro de la media sobre el histograma
counts_filtered = smooth(counts,bar_width);
%Buscamos los mayores locales dentro de la imagen
fprintf('Identificando las clases (objetos) en la imagen\n');
[climbs,xclimbs] = FindLocalMax(counts_filtered);
fprintf('Clases (objetos) identificadas');
climbs
clases = length(climbs); %numero de clases
fprintf('Numero de clases identificadas: %i\n',clases);
[sclases, err] = sprintf('*Numero de clases identificadas: %i\n *',clases);
fprintf('Buscando las fronteras como los minimos\n');
[hills,xhills]=FindFrontiersMin(counts_filtered,xclimbs);
fprintf('Fronteras encontradas\n');
tit_s = 'Histograma con maximos y fronteras';
hills
figure
%Dibujamos el histograma
fprintf('Dibujamos el histograma identificando las clases encontradas\n');
color_clases = DrawHistClases(x,counts_filtered,xhills); %Dibujamos el histograma
de clases
title(tit_s);
hold on;
%Dibujamos los maximos en el histograma
h = stem(xclimbs,climbs);
set(h,'Color','r','LineStyle','--
','Marker','s','MarkerEdgeColor','r','MarkerFaceColor','r','MarkerSize',2);
axis([0 255 0 maxcounts+300]);
xlabel(strcat(sclases, shist));
[xpos,yval] = FindPrototype(gray_level_element,xhills,xclimbs,climbs);
text(xpos,yval + 200, 'Clase Puerta',
'HorizontalAlignment','center','BackgroundColor',[.7 .9 .7],'FontSize', 9);
hold off;
figure
%Dibujamos la imagen original;
fprintf('Identificando las clases en la imagen original\n');
img_clases = GetImgClases(img,xhills,color_clases); %imagen en nivel de gris,
fronteras, colores para cada clase
fprintf('Clases identificadas...Dibujando\n');
imshow(img_clases);
title 'Imagen Segmentada';
function[frontier,findex]=FindFrontiersMin(values,maxindex)
findex = zeros(1,length(maxindex)+1);
frontier = zeros(1,length(maxindex)+1);
findex(1)= 1;
frontier(1)= values(1);
for N=1:length(maxindex)-1
fin = maxindex(N+1);
inicio = maxindex(N);
%Obtengo los valores presentes entre los intervalos
reg = values(inicio:fin);
h = min(reg);
p = find(reg == h);
f = round(inicio + p(1));
findex(N+1) = f ;
frontier(N+1) = values(findex(N+1));
end
findex(length(maxindex)+1)= 256; %Maximo valor de un pixel
frontier(length(maxindex)+1) = values(256);
end
end
img_clases = cast(img_clases,'uint8');