Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
Abstract
La cobertura terrestre es un elemento geogrfico que constituye la base de referencia para diversas aplicaciones relacionadas con la planificacin del uso de los recursos naturales,
la biodiversidad y la deforestacin, como indicador del cambio climtico y la desertificacin. Hay diversos mtodos para
clasificar imgenes, pero no todos son aplicables a la clasificacin de la cubierta terrestre. Por tanto, el objetivo de esta
investigacin fue generar y evaluar un modelo de clasificacin
no supervisada aplicable a imgenes de cobertura terrestre en
modelo de color RGB (Red, Green, Blue; o Rojo, Verde, Azul
[RVA]), que clasifique automticamente las diferentes cubiertas y usos del suelo. La metodologa desarrollada corresponde
al grupo de procedimientos de clasificacin no supervisada y
se deriv del criterio de umbralizacin sugerido por el mtodo de Otsu, basado en la varianza entre clases y dentro de clases. Para aplicarla se usaron fotografas areas con resolucin
espacial de 1:19 500, resolucin espectral de tres bandas visibles RVA, y resolucin radiomtrica de 0 a 255 niveles. Los
resultados se compararon con los reportados por un experto
conocedor de la zona de estudio. El aporte principal de esta
investigacin fue generar y evaluar un mtodo de clasificacin de imgenes no supervisado de alta precisin y bajo costo computacional; como es el uso alternativo del mtodo de
Otsu, utilizado en la segmentacin y la clasificacin de imgenes a color. Por tanto, el resultado fue un clasificador por
agrupamiento no supervisado que reconoce y clasifica hasta
95 % de los elementos identificados en campo por el experto.
Introduction
Introduccin
712
Materiales y Mtodos
Pre-procesamiento
Para el pre-procesamiento de las imgenes se utiliz el mtodo Otsu (1979), buscando el umbral ptimo (simple o mltiple)
para cada una de las bandas de la imagen a color, usando el algoritmo descrito en la Figura 2.
{
arg{Max
d
dVar
t
tOtsu arg Min1tL Vardentro
de clase
tOtsu
1tL
t
entre clases
i}
i}
(1)
Los umbrales obtenidos por cada una de las bandas espectrales, rojo, verde y azul, son identificados por tr, tg y tb.
Cada pxel de la imagen se representa por: pi,j (ri,j, gi,j, bi,j)T
siendo (i, j) la coordenada espacial y usando tr, tg, y tb para representar el valor preliminar del umbral de cada dominio de color.
Por tanto, un pxel pi,j=(ri,j, gi,j, bi,j)T puede ser umbralizado como
~
~
pi , j r~i , j , g~i , j , bi , j
MACEDO-CRUZ et al.
713
Imagen a color
i=1
Banda 1
um=1; j=1
Banda 2 Banda 3
Banda=i
Banda<=3
Clculo de distribucin
de probabilidad
f
pi 1
N
i=i+1
Si
No
Se reciben los j
umbrales de cada banda
en (u1, u2, u3)
Si
um==1
No
K=1
d i
' 2
B
K<=um
Si
w k uk2
k1
j>=um
Si
k=k+1
No
Retoma
u(j)=valor_umbrales
u(j)=valor_umbral
j=j+1
Figura 2. Algoritmo de umbralizacin simple y mltiple para imgenes a color (A) y mtodo de Otsu (B).
Figure 2. Simple and multiple thresholding algorithm for color images (A) and Otsu method (B).
r~i , j
R|0 si
||1 si
S2 si
||
|Tn si
g~i , j
714
R|0 si
||1 si
S2 si
||
|Tn si
ri , j t r1
ri , j t r1 y t r 2
ri , j t r 2 y t r 3
ri , j t ri y t tM
g i , j t g 1
g i , j t g 1 y t g 2
g i , j t g 2 y t g 3
g i , j t gi y t gM
{
arg{Max
d
dVar
t
tOtsu arg Min1tL Varwithin
class
tOtsu
1tL
i}
t
between classes
i}
(1)
~
bi , j
R|0 si
||1 si
S2 si
||
|Tn si
bi , j t b1
r~i , j
bi , j t bi y t bM
(2)
~
pi , j c1(n 1)2 c 2 (n 1) c 3
(3)
Considerando la k-esima clase como ck, para denotar el promedio de cada grupo de clase de una imagen RVA se usa la siguiente expresin: mk=(rk, gk, bk)T, cuyos componentes se obtienen
con la Ecuacin 4:
rk
ri , j
ri , j C k
gk
g i, j
g i , j C k
ri , j C k
1
ri , j C k
bi , j C k
1
bi , j C k
(4)
La varianza dentro de clases (sk) proporcionada por el mtodo de Otsu (1979) se calcula para cada clase
la Ecuacin 5:
k
1
Nk
R|
S|
T
r1
i, j
r1
i, j
r2
r2
r3
i, j
ri
tM
g1
i, j
g~i , j
~
bi , j
R|0 si
||1 si
S2 si
||
|Tn si
i, j
g1
i, j
g2
g2
g3
i, j
gi
gM
bi , j t b1
bi , j t b1 y t b 2
bi , j t b 2 y t b 3
bi , j t bi y t bM
i , j C k
LMdr
N
i, j
rk
i d g
2
i, j
gk
FGlC q
H
n13
k k1
i db
2
i, j
bk
IJ
K
por
rk
ri , j
ri , j C k
(3)
gk
g i, j
g i , j C k
ri , j C k
1/2
(5)
(2)
U
i OPQ |V|
W
2
bi , j
bk
R|0 si r t
||1 si r t y t
S2 si r t y t
||
|Tn si r t y t
R|0 si g t
||1 si g t y t
S2 si g t y t
||
|Tn si g t y t
i, j
bi , j t b1 y t b 2
bi , j t b 2 y t b 3
bk
bi , j
bi , j C k
1
ri , j C k
1
bi , j C k
(4)
FGlC q
H
n13
k k1
IJ by Equation 5:
K
MACEDO-CRUZ et al.
715
k , j = (rk r j ) 2 + ( g k g j ) 2 + (bk b j ) 2
1/ 2
(6)
donde, (rk, gk, bk), (rj, gj, bj) son definidos por la Ecuacin 4 y los
promedios espectrales de la clase Ck y Cj corresponden al dominio de color RVA.
Con base en las varianzas obtenidas con las ecuaciones (5) y
(6), se pueden fusionar algunas agrupaciones debido a sus similitudes espectrales. Considerando que las clases Cj y Ck, para kj,
se fusionan si sk skj o sj skj. Esto se debe a que la varianza
entre dos clases skj debe ser superior a la varianza dentro de las
clases individuales sk y sj.
Este proceso de reagrupamiento se repite hasta que todas las
varianzas entre clases sean mayores que sus correspondientes varianzas dentro de clase, en cuyo caso el resultado podra ser no
reclasificar.
Si no hubo reclasificacin y el nmero de clases totales es
igual a (n+1)3, entonces el clasificador repite todo el proceso, y se
incrementa en uno el nmero de umbrales a calcular; de lo contrario, se etiquetan las clases reagrupadas como clases definitivas.
Evaluacin de la precisin
La precisin de un proceso de clasificacin se refiere al grado
de concordancia entre las clases de la imagen y un conjunto de
datos de referencia (Congalton y Green, 1999). Para hacer una
estimacin cuantitativa se construy una matriz de error difusa
(Congalton y Green, 2009; Lunetta y Lyon, 2004), la cual es un
arreglo cuadrado de nmeros ordenados en columnas e hileras.
Las columnas corresponden al conjunto de referencia, y las hileras a las clases generadas en el proceso de clasificacin. Cada celda
contiene dos valores: el primero representa las etiquetas aceptables; el segundo indica las etiquetas inaceptables y la diagonal
principal slo contiene las etiquetas consideradas absolutamente
correctas.
Los valores de la diagonal principal de la matriz de error,
donde coinciden las etiquetas de referencia y clasificacin, corresponden a los aciertos del proceso. La precisin global de la
clasificacin se obtiene dividiendo la suma de los valores de la
diagonal principal entre el tamao de la muestra.
La precisin del usuario es un indicador de errores de omisin y se calcula dividiendo el nmero de aciertos por el total de
muestras en la hilera correspondiente.
La precisin del productor del mapa es un indicador de errores de inclusin y se calcula dividiendo el nmero de aciertos entre el nmero total de muestras en la columna. La matriz de error
difusa cuenta con dos valores por celda: el valor izquierdo significa aceptable (polgonos en los cuales ms del 50 % de los pxeles corresponden a dicha clase); los de la derecha son los pxeles
clasificados como una clase de cobertura a la que no pertenece.
716
1
k
Nk
R|
S|
T
i , j C k
LMdr
N
i, j
rk
i d g
2
i, j
gk
U
i db b i OPQ |V|
W
2
i, j
1/2
(5)
where Nk is the number of pixels of class Ck.
The variance between two classes (), denoted by Ck and Cj,
with k different from j:
k , j = (rk r j ) 2 + ( g k g j ) 2 + (bk b j ) 2
1/ 2
(6
where (rk, gk, bk), (rj, gj, bj) are defined by Equation 4 and the
spectral averages of class Ck and Cj correspond to the RGB color
dominion.
Based on the variances obtained with equations (5) and
(6), some clusters can be fused due to their spectral similarities.
Considering that the classes Cj and Ck for k j, they are fused
if sk skj or sj skj. This is due to the fact that the variance
between two skj classes should be higher than the variance within
the individual classes sk and sj.
This regrouping process is repeated until all of the variances
among classes are higher than their corresponding variances
within class, in which case the result could be to not reclassify.
If there were no reclassification and the total number of
classes is equal to (n + 1)3, then the classifier repeats the entire
process, and increases in one the number of thresholds to calculate;
otherwise the regrouped classes are labeled as definitive classes.
Evaluation of precision
The precision of a classification process refers to the degree of
concordance among the classes of the image and a set of reference
data (Congalton and Green, 1999). To make a quantitative
estimation a diffuse error matrix was constructed (Congalton
and Green, 1999; Lunetta and Lyon, 2004), which is a quadratic
arrangement of numbers ordered in columns and rows. The
columns correspond to the reference set, and the rows to the
classes generated in the classification process. Each cell contains
two values; the first value of the cell represents the acceptable
labels, the second indicates the inacceptable labels, and the
principal diagonal only contains the labels considered absolutely
correct.
The values of the principal diagonal of the error matrix,
where the reference and classification labels coincide, correspond
to the correct results of the process. The global precision of the
classification is obtained by dividing the sum of the values of the
principal diagonal by the size of the sample.
n B i 1 i / bi2
(7)
Resultados y Discusin
Los resultados se relacionan con el pre-procesamiento, clasificacin y evaluacin de la precisin del
clasificador aplicado a las imgenes de la Figura 1.
De acuerdo con la informacin mostrada en la Figura
1 (A) se desarroll el pre-procesamiento de imgenes permitiendo segmentar la informacin de cada
banda en dos grupos (Figura 3), cuyo contenido por
grupo se reporta en el Cuadro 1. De la segmentacin
result una imagen RVA constituida por ocho grupos
de informacin (Figura 4 A), permitiendo continuar
con su clasificacin.
La clasificacin se logr mediante el anlisis exhaustivo de las varianzas entre clases y dentro de clases, para reagrupar y clasificar los objetos presentes.
Con este proceso se obtuvo seis clases de objetos
identificados con distinto color (Figura 4 B), cuyo
porcentaje de cobertura se muestra en el Cuadro 2.
La imagen de la Figura 1(B), con 375 452 pxeles
y mayor diversidad de objetos fue procesada por el
mismo mtodo que la Figura 1 (A), pero en este caso
al no presentarse reagrupacin, el clasificador recurri automticamente a la multi-umbralizacin. Se
obtuvieron dos umbrales por banda lo que genera un
modelo de agrupacin de 33 grupos, los cuales al ser
clasificados se convierten en nueve clases de objetos
(Figura 5 b), cuyo color y porcentaje de cobertura se
muestra en el Cuadro 3.
n B i 1 i / bi2
(7)
MACEDO-CRUZ et al.
717
Figura 3. Imagen umbralizada por el mtodo de Otsu (1979). Banda 1 (A), banda 2 (B), banda 3 (C).
Figure 3. Image thresholded by the Otsu method (1979). Band 1 (A), band 2 (B), band 3 (C).
Banda 1 (Rojo)
Banda 2 (Verde)
Banda 3 (Azul)
718
1
2
3
4
5
6
Vegetacin arbrea
Cuerpos de agua
Pasto cultivado de altura media
Pasto corto poco denso
Pastos cortos
Sin cobertura vegetal y sedimentos
A-Px
Cobertura (%)
752 664
34 346
250 395
18 649
164 539
285 797
50
2
17
1
11
19
Color
Azul
Gris y verde-azul
Rojo
Amarillo
Rosa
Blanco
MACEDO-CRUZ et al.
719
1
2
3
4
5
6
7
8
9
rboles
Montculos de arena hmeda
Pastos de altura media
Cuerpos de agua
Pasto alto
Pastos cortos
Pasto corto poco denso
Pasto seco
Zonas sin cobertura vegetal
A-Px
Cobertura (%)
102 528
22 404
26 564
6 469
12 975
137 392
23 238
14 227
29 655
27
6
7
2
3
37
6
4
8
Color
Azul
Naranja
Rosa
Verde-azul
Rojo
Blanco
Caf
Verde
Azul marino
Cuadro 4. Matriz de error difuso (Fuzzy) de la clasificacin de la de cobertura terrestre, representada en la Figura 1(A).
Table 4. Fuzzy error matrix of the classification of the ground cover, represented in Figure 1 (A).
Referencia
Pasto de
Pasto
Cuerpos altura
rboles de agua media natural
Pastos
cortos
Zonas sin
cobertura
vegetal
Total
Determinista
126
0.3
1.1
0.0
2.0
0.0
126/133
Cuerpos de agua
0.0
0.0
0.0
0.0
0.0
8/8
0.0
3.3
61
1.1
15.14
0.0
0.0
0.0
0.0
Pastos cortos
0.0
0.0
13.2
0.0
0.0
0.0
0.0
0.0
126/126
8/17
61/78
99 %
44 %
126/126
99 %
Clasificacin
rboles
Porciento
Porcentual determinista
Total Fuzzy
Porcentual Fuzzy
100 %
8/8
100 %
61/98
62 %
80/98
82 %
0.0
4/4
100 %
4/4
100 %
18
1.1
18/34
53 %
32/34
94 %
0.0
77
77/77
100 %
77/77
100 %
4/6
18/49
77/78
77 %
67 %
36 %
97 %
11/17
75/78
5/6
35/49
78/78
65 %
96 %
83 %
71 %
100 %
El mtodo de Otsu mejorado y las modificaciones implementadas en esta investigacin permiten obtener el valor de umbral ptimo como
base para segmentar y clasificar imgenes en modelo a color, mediante el mtodo de clasificacin
no supervisada.
Porciento
97 %
Conclusiones
720
Total
94 % 129/133
Fuzzy
Precisin general
Determinista
294/354
83 %
Fuzzy
330/354
93 %
Cuadro 5. Matriz de error difuso (Fuzzy) de la clasificacin de cobertura terrestre, representada en la Figura 1(B).
Table 5. Fuzzy error matrix of the classification of ground cover, represented in Figure 1 (B).
Clasificacin
Referencia
rboles
Pasto seco
Pasto total
Cuerpos de agua
Pasto de altura media
Pastos cortos
Pastos corto poco denso
rboles
Pasto
seco
Pasto de
Pasto Cuerpos altura Pasto
alto de agua media corto
70
0.3
1.1
0.0
2.0
0.0
0.0
0.0
0.0
0.0
11
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
14
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
70
0.0
0.0
0.0
10
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
18
0.0
0.0
2.0
0.0
0.0
0.0
0.0
0.0
0.0
25
Total determinista
70/70
11/13
5/13
7/8
Porcentual determinista
100 %
85 %
38 %
88 %
Determinista
Total
Porciento
Total Fuzzy
70/70
13/13
9/13
Porcentual Fuzzy
100 %
100 %
69 % 100 %
8/8
18/20 25/25
61 %
90 % 100 %
86 %
48 %
Agradecimientos
Los autores agradecen el apoyo de la Fundacin Carolina
(Espaa) y la Secretara de Relaciones Exteriores-(Mxico), por
el co-financiamiento de beca para estudios doctorales en la Universidad Complutense de Madrid, Espaa, as como al Colegio
95 %
20/20 25/25
Total
Porciento
70/73
11/17
5/5
7/9
14/23
70/90
96 %
65 %
100 %
78 %
61 %
78 %
72/73
15/17
5/5
9/9
20/23
83/90
99 %
88 %
100 %
100 %
87 %
92 %
10/10
18/20
25/27
100 %
90 %
93 %
10/10
19/20
27/27
100 %
95 %
100 %
Fuzzy
Precisin general
Determinista
230/274
84 %
Fuzzy
260/274
95 %
76 % 100 % 100 %
Conclusions
The improved Otsu method and the modifications
implemented in this investigation make it possible to
obtain the value of the optimum threshold as base for
segmenting and classifying in color model, by means
of the unsupervised classification method.
Under the principle of variance among classes
and within classes, it is possible to regroup and
automatically fuse different values of the clusterings
obtained from the image in the color domain
Red, Green, Blue. The result of the regrouping
process permits the classifier to extend the simple
thresholding technique to multi-thresholding of
color images.
The images processed in this investigation make
it possible to identify up to nine classes of ground
cover, with a global precision of 95 % calculated
through the fuzzy error matrix. On the other hand,
the methodology evaluated classifies color images
with 5 % uncertainty, with respect to the shallow
bodies of water and the grasses.
MACEDO-CRUZ et al.
721
de Postgraduados por el apoyo brindado a travs del Subprograma de Formacin de Profesores Investigadores; adems al Instituto de Geografa de la Universidad Autnoma de Mxico por
permitir el uso de las fotografas areas. Al Dr. Isidro Villegas
Romero por permitir utilizar sus resultados del muestreo de campo para la validacin del clasificador.
Literatura Citada
Bow, S. T. 2002. Pattern Recognition and Image Preprocessing.
2nd ed. Marcel Dekker. New York, NY, USA. 698 p.
Buxton, B. F., H. Abdallahi, D. Fernandez-Reyes, and W. Jarra.
2007. Development of an extension of the Otsu algorithm
for multidimensional image segmentation of thin-film blood
slides. In: International Conference on Computing: Theory
and Applications (ICCTA07). Washington, DC, USA.
IEEE computer society. pp:552-562.
Chen, D., and D.A. Stow. 2003, Strategies for integrating information from multiple spatial resolutions into land-use/
land-cover classification routines. Photogrammetric Eng.
and Remote Sensing 69:12791287.
Chen, D., D.A. Stow, and P. Gong, P., 2004, Examining the
effect of spatial resolution and texture window size on classification accuracy: an urban environment case. Int. J. Remote
Sensing 25:21772192.
Chen, Q., J. Luo, and C. Zhou. 2003. A geostatistic based segmentation approach for remotely sensed images. In: 24th
Asian Conference on Remote Sensing, Busan, South Korea.
pp:3.
Chen, W., and K. Fang. 2008. Multilevel thresholding algorithm
based on particle swarm optimization for image segmentation. In: Control Conference, 27th Chinese. Kunming, Yunnan, China, pp:348-351.
Congalton, R. G., and K. Green, 1999. Assessing the Accuracy
of Remotely Sensed Data: Principles and Practices. Lewis
Publishers, Boca Raton, FL. 160 p.
Congalton, R. G., and K. Green, 2009. Assessing the Accuracy
of Remotely Sensed Data: Principles and Practices. 2d ed.
CRC/Taylor & Francis, Boca Raton, FL. 178 p.
Chuvieco, E. 2008. Teledeteccin Ambiental. 3a ed. Ariel. Barcelona, Espaa. 592 p.
Du, Q. 2007. Unsupervised real-time constrained linear discriminant analysis to hyperspectral image classification. Pattern
Recognition 40(5):1510-1519.
722
Du, Y., C. I. Chang, and P.D. Thouin. 2004. Unsupervised approach to color video thresholding. Optical Eng.
43(2):282-289.
Duda,R.O., P.E.Hard, and D.G.Stork. 2001. Pattern Classification. 2nd ed. John Wiley. New York, NY, USA. 654 p.
Liao, P.S., T.S. Chen, and P.C. Chung. 2001. A fast algorithm for
multilevel thresholding. J. Comput. Information Sci. Eng.
17:713-727.
Lu, D., and Q. Weng. 2007. A survey of image classification
methods and techniques for improving classification performance. Int. J. Remote Sensing 28(5):823-870.
Lunetta, R. S., and J. G. Lyon. 2004. Remote Sensing and GIS
Accuracy Assessment. Lewis Publishers, Boca Raton, FL.
292 p.
Otsu, N. 1979. A threshold selection method from gray-level histogram. IEEE Trans. on System Man Cybernetics
9(1):62-66.
Pajares, M, G., y M. de la Cruz. 2001. Visin por Computador,
Imgenes Digitales y Aplicaciones. Rama, Madrid, Espaa.
764 p.
Polidrio, A M., F. C. Flores, N. N. Imai, A. M. G. Tommaselli,
and C. Franco. 2003. Automatic shadow segmentation in
aerial color images. Sibgrapi. XVI Brazilian Symposium on
Computer Graphics and Image Processing (SIBGRAPI03).
pp: 270.
Rowe, N. C, and L.L. Grewe. 2001. Change detection for linear features in aerial photographs using edge-finding. IEEE
Trans. Geosci. Remote Sensing 39:16081612.
Saeed, F. 2006. Digital image processing of high resolution aerial
photograph of shallow marine sanctuary. Victoria, Australia.
Advances in Space Technologies, International Conference.
pp:179-184.
Shah, C. A., M. K. Arora, and P. K. Varshney. 2004. Unsupervised classification of hyperspectral data: an ICA mixture
model based approach. Int. J. Remote Sensing 25:481-487.
Tseng, M. H., S. J. Chen, G. H. Hwang, and M. Y. Shen.
2008. A genetic algorithm rule-based approach for landcover classification. J. Photogrammetry and Remote Sensing
63(2):202-212.
Villegas R, I. 2006. Degradacin del suelo por impacto del huracn Paulina, en la cuenca del ro La Sabana, Guerrero. Tesis
doctoral. Colegio de Postgraduados. Mxico. pp:71-96.
Villegas R, I., J. L. Oropeza, M. Martinez, y E. Meja 2009.
Trayectoria y relacin lluvia-escurrimiento causados por el
huracn Paulina en la cuenca del ro La Sabana, Guerrero,
Mxico. Agrociencia 43: 345-356.
Zhu, B., M. Ramsey, and H. Chen. 2000. Creating a large-scale
content-based airphoto image digital library. IEEE Trans
Image Process 9(1):163-167.