Está en la página 1de 8

CURSO

Fundamentos de Procesamiento
Digital de Imágenes
Grupo

PR
Grupo

PR
Percepción Remota y
Aplicaciones Geográficas

Percepción Remota y UNIDAD 4


Aplicaciones Geográficas
Clasificación digital de
imágenes, edición y
presentación de resultados

Tema 1
Clasificación supervisada
de imágenes

BOGOTÁ
CIAF
CIAF
CentrodedeInvestigación
Centro Investigación yy
, D. C.
Desarrolloen
Desarrollo enInformación
Información Geográfic
Geográficaa
Clasificación supervisada de imágenes
1. ¿En qué consiste la clasificación digital supervisada?
La clasificación supervisada requiere de cierto conocimiento previo del terreno y de los tipos de coberturas presentes en el
área de estudio, para lo que se realiza, en el mejor de los casos, una combinación de trabajo de campo, de análisis de foto-
grafías aéreas, mapas e informes técnicos, así como referencias profesionales y locales.

Con base de este conocimiento se definen y se delimitan sobre la imagen las áreas de entrenamiento o áreas piloto. Las ca-
racterísticas espectrales de tales áreas son utilizadas a fin de “entrenar” un algoritmo de clasificación, el cual calcula los pará-
metros estadísticos de cada banda para cada sitio piloto y de esta forma proceder a evaluar cada ND de la imagen, compararlo
y asignarlo a una respectiva clase (ver Figura 1).

Así entonces, la clasificación supervisada intenta definir las clases temáticas que no tengan claro significado espectral, razón
por la que es considerada un método artificial (Posada, 2008).

Figura 1: Esquema de Clasificación digital supervisada

Fuente: Olaya, 2007

2. ¿Cuál es la metodología para implementar una clasificación digital supervisada?


El proceso se puede resumir en las siguientes etapas: análisis visual y estadístico de la imagen y de sus bandas, elaboración
de la leyenda del mapa, selección y delimitación de áreas pilotos, generación y evaluación tanto de sus estadísticas como de
sus reajustes, elección y aplicación del algoritmo de clasificación, reajustes y nueva clasificación, y finalmente, la evaluación
de los resultados y su presentación (Posada, 2008).

2
Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados.
Prohibida su reproducción para fines no académicos o de investigación.
2.1 Análisis estadístico y visual de las bandas

La etapa inicial consiste en realizar una valoración cualitativa y cuantitativa de la calidad de la imagen de modo multibanda
(varias bandas), de su contraste y del comportamiento espectral de distintas cuberturas dentro las bandas espectrales; allí se
evalúa la separabilidad espectral de las bandas en relación con las coberturas. Al final, se obtiene la primera apreciación sobre
el número de posibles clases temáticas a discriminar, las bandas a utilizar, y los posibles procesos adicionales para derivar
nuevas imágenes que podrían ser útiles en la fase de clasificación (Posada, 2008).

Algunas de las ayudas métricas o datos gráficos útiles para el análisis de las bandas son las estadísticas multibanda, la corre-
lación, la varianza y la covarianza, así como los gráficos de dispersión entre bandas, etc.

Igualmente, se seleccionan y se recortan las ventanas de trabajo ya que es más eficiente realizar el procesamiento preliminar
sobre las ventanas experimentales representativas y al final los procesos óptimos se extrapolan sobre la totalidad de la escena
(Posada, 2008).

En general, el análisis se orienta a definir las cuáles bandas de una imagen multiespectral se utilizarán en el proceso de cla-
sificación. La idea se basa en elegir las bandas en las que se presente mayor contraste espectral entre las coberturas objeto
del estudio. Intuitivamente, pareciera que cuando se utiliza un mayor número de bandas en un clasificador, el resultado de la
clasificación es mejor (Posada, 2008).

En general, hay un número óptimo relativamente pequeño de bandas que se utilizan, pues al aumentarse el número de ban-
das, aumenta el tiempo computacional requerido dada la gran cantidad de cálculos involucrados y también porque el contenido
de la información puede estar contaminado por información insignificante en otras bandas. Este problema es particularmente
crítico cuando se utiliza un número grande de bandas espectrales correlacionadas (Posada, 2008).

En algunos casos se ha encontrado que la exactitud del clasificador comienza a decaer cuando se utilizan más de cuatro o
cinco bandas espectrales, de ahí que sea beneficioso considerar un subconjunto de las bandas más representativas.

La decisión sobre cuál de las bandas se debe utilizar se basa en un proceso llamado selección de rasgos o características. En
este proceso se evalúan muchos subconjuntos de bandas para así determinar qué combinación es más útil para discriminar
las categorías de intereses y el análisis de la clasificación se limitará a ese conjunto de bandas (Salvatierra, 2000 y citado por
Posada, 2008).

2.2 Elaboración de la leyenda.

Tomando en cuenta los objetivos del proyecto, el nivel de detalle requerido, la escala de trabajo y el tipo de imagen a utilizar,
se revisan distintas sistemas de clasificación y se establece una leyenda específica (Posada, 2008).

2.3 Selección y delimitación de las áreas de entrenamiento

Es la fase más importante del proceso. Requiere previo conocimiento de las características del área, así como de las catego-
rías que se pretende discriminar. Con base en las experiencias locales y profesionales, el trabajo de campo, uso de fotografías
aéreas y otra información secundaria, se definen y se delimitan las áreas de entrenamiento o áreas piloto representativas de
cada una de las categorías de interés (P osada, 2008).

Esta actividad se basa en los criterios pictórico-morfológicos de la imagen, tales como: tono o color, textura, tamaño, forma,
sitio, etc. (ver Figura 2). La selección errónea de muestras conducirá a resultados erróneos. A partir de estas muestras el al-
goritmo clasificador calcula los ND que definen cada una de las clases y asigna el resto de los píxeles de la imagen a una de
esas categorías.

3
Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados.
Prohibida su reproducción para fines no académicos o de investigación.
Figura 2: Selección y estadísticas de las áreas de entrenamiento

Fuente: elaboración propia

La delimitación se realiza mediante un cursor sobre la pantalla del computador. Se recomienda seleccionar varias muestras
por categoría fin de reflejar adecuadamente la variabilidad de la zona de estudio. Es importante contar con los datos de campo
próximos a la fecha de adquisición de la imagen para garantizar la consistencia entre la realidad y la imagen. Se recomienda
evitar la delimitación de muestras en los sitios de transición entre las dos clases, ya que éstas presentarán confusión espectral.

Las áreas no deben ser muy homogéneas, obviando la variación real de las coberturas temáticas. El tamaño de la muestra,
en teoría, puede ser de nueve píxeles. El número de píxeles recomendable es de 200 como mínimo, distribuidos sobre toda la
imagen en varios campos pequeños y no en una muestra grande, para no subestimar la variabilidad de esa categoría. Deben
tenerse en cuenta las características propias de la imagen intentando abarcar las variaciones que se presentan para cada
clase, su orientación, pendiente, densidad, vigor, contenido de humedad y tipo del suelo (Posada, 2008).

4
Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados.
Prohibida su reproducción para fines no académicos o de investigación.
Otra alternativa es señalar los píxeles puros y a partir de éstos crear regiones de manera automática, lo que garantiza las
aéreas de entrenamiento suficientemente homogéneas, evitando incluir píxeles fronterizas a dos clases. Este método se reco-
mienda para áreas urbanas y cuerpos de agua (Posada, 2008).

2.4 Evaluación estadística de las áreas de entrenamiento

Las estadísticas evalúan el grado de representatividad de las áreas pilotos y dan una idea de la separabilidad espectral de las
clases temáticas, lo que al final garantiza una buena clasificación. Existen métodos gráficos y numéricos para evaluar las es-
tadísticas. Un ejemplo de estadísticas básicas se presenta en la Figura 2. Los más utilizados son los diagramas de signaturas
espectrales y los diagramas de dispersión espectral.

Estos diagramas se basan en el análisis de las medias aritméticas y desviaciones estándar, la primera indica el comportamien-
to espectral medio de los ND, mientras que la segunda indica el grado de heterogeneidad de la muestra.

En un diagrama espectral se plasman las bandas que intervienen en una clasificación en el eje X y las medias de ND de cada
clase; con este gráfico se evalúan las tendencias espectrales de cada clase, resaltándose el compartimiento de las bandas
espectrales en relación con sus vecinas. Las líneas paralelas y cercanas indican una posible confusión espectral y las inter-
secciones entre las líneas, la buena separabilidad entre éstas (Posada, 2008).

Otra forma de representación de los datos de un área de entrenamiento es el gráfico de dispersión espectral, en el que se
plasman la media y la desviación estándar por clase temática y por banda (ver Figura 3). Este gráfico es un diagrama de barras
que recoge en el eje X el rango digital correspondiente a la media y +/-, una o dos desviaciones estándar y en el eje Y los ND.
Así, se visualiza de manera más integrada la situación de cada muestra en cuanto a la separabilidad por banda.

Figura 3: Gráficas de dispersión de áreas de entrenamiento en las bandas TM3, TM4 y TM5

Fuente: elaboración propia

Se puede observar que algunas clases se diferencian en cuanto a su media, pero al final no se garantiza la separabilidad de-
bido al traslape entre sus desviaciones estándar (Posada, 2008).

Dentro los métodos numéricos de evaluación estadística se encuentran los criterios de divergencia trasformada y la distancia
de Bhattacharya, los cuales calculan con base en medias, varianzas y matrices de varianza-covarianza, además del grado de
separabilidad entre las categorías. El mayor valor del criterio indica mayor separabilidad ente éstas. En el caso de la divergen-

5
Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados.
Prohibida su reproducción para fines no académicos o de investigación.
cia transformada, la máxima separabilidad entre las bandas de una imagen se da cuando el valor es de 2000, en el caso del
segundo criterio el valor es de 1414 (Posada, 2008).

Al finalizar el análisis se llega a la conclusión de si las muestras delimitadas son similares estadísticamente, lo que conllevaría
a una confusión entre ellas. Si por el contrario las estadísticas resultan ser diferentes, se indicaría un alto grado de separabi-
lidad. En el primer caso se toman decisiones sobre la necesidad de reajustar las parcelas de entrenamiento o de reajustar y
generalizar la leyenda, de la complementación de la información, del uso de las imágenes de otras fechas, de otras bandas
o de reajustar el método planteado para conseguir los resultados. Una vez se solucionan estas interrogantes se procede a
seleccionar algoritmos de clasificación y a la clasificación propiamente dicha (Posada, 2008).

2.5 Elección y aplicación del algoritmo de clasificación

Con base en las áreas de entrenamiento delimitadas con anterioridad se puede iniciar el proceso de clasificación, que es
automático. El proceso consiste en la agrupación de todos los píxeles de cada banda espectral en una de las clases predeter-
minadas en la etapa anterior. El resultado será una nueva imagen en la que los ND están categorizados en clases temáticas
y ésta se considerará como un mapa digital de formato ráster.

No obstante, antes de correr la clasificación se requiere elegir el criterio o algoritmo de asignación. Los más comunes son de
mínima distancia, de paralelepípedos y de la máxima probabilidad o verosimilitud (Posada, 2008).

2.6 Algoritmo de mínima distancia

Es el más sencillo de este tipo, agrupa los píxeles a una u otra clase, a partir de las distancias mínimas espectrales, calculadas
a partir de los valores de ND de cada píxel en relación con la media muestral. En la Figura 4 se expone el concepto de este
algoritmo.
Figura 4: Principio del algoritmo de mínima distancia

Fuente: Kerle et al., 2004

6
Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados.
Prohibida su reproducción para fines no académicos o de investigación.
La imagen clasificada con este algoritmo no tendrá píxeles sin clasificar, lo que puede conllevar a errores de comisión si las
áreas piloto no son muy bien determinadas. No toma en cuenta la dispersión de los ND alrededor de su media ni la correlación
existen entre las bandas. Se recomienda para imágenes con paisajes sencillos y homogéneos (Posada, 2008).

2.7 Algoritmo de Paralelepípedos

Utilizando este algoritmo, los píxeles de las bandas espectrales se agrupan a una u otra clase con base en un rango determi-
nado a partir de las medias muestrales y el rango de dispersión definido por la desviación estándar de cada banda. La forma
de asignación es de paralelepípedos multidimensionales (Posada, 2008) (ver Figura 5).

Figura 5: Principio del algoritmo de paralelepípedos

Fuente: Kerle et al., 2004

El algoritmo de paralelepípedo tiene una inconveniencia debido a que se pueden presentar situaciones de difícil decisión,
igualmente es posible que se presenten píxeles incluidos en los dominios de dos clases temáticas y otros pueden quedarse
fuera del rango, generándose así las áreas sin clasificar (Posada, 2008).

2.8 Algoritmo de máxima probabilidad

La agrupación de píxeles se realiza a partir de la función de probabilidad. Es un algoritmo más complejo pero mucho más uti-
lizado, ya que garantiza mejores resultados en comparación con los dos anteriores. El proceso consiste en la estimación de la
probabilidad de pertenencia de cada píxel a cada clase temática a partir de la media, la desviación estándar y las matrices de
varianza-covarianza de las muestras, así como para todas las bandas que intervienen en la clasificación.

El píxel se asigna a una clase específica si su probabilidad es mayor que las probabilidades de las otras categorías. Los límites
de las clases temáticas se representan en forma de elipses, encargados de definir el nivel de probabilidad de cada área (ver
Figura 6). Al mayor traslape entre ellas, mayor riesgo de confusión espectral (Posada, 2008).

7
Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados.
Prohibida su reproducción para fines no académicos o de investigación.
Figura 6: Principio del algoritmo de máxima probabilidad

Fuente: Kerle et al., 2004

8
Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados.
Prohibida su reproducción para fines no académicos o de investigación.

También podría gustarte