Está en la página 1de 44

213 Field Guide

Captulo 6 Clasificacin
Introduccin La clasificacin multiespectral es el proceso de ordenar los pxeles en un nmero finito de clases
individuales, o categoras de datos, basados en sus niveles digitales. Si un pxel satisface cierto
conjunto de criterios, el pxel es asignado a la clase que corresponde a ese criterio. Este proceso
tambin se conoce como segmentacin de la imagen.
Dependiendo del tipo de informacin que usted quiera extraer de los datos originales, las clases
pueden asociarse con elementos conocidos del terreno o pueden simplemente representar reas
que se ven diferentes en el computador. Un ejemplo de una imagen clasificada es un mapa de
cobertura terrestre que muestre vegetacin, suelos desnudos, pastos, reas urbanas, etc.
El Proceso de
Clasificacin
Reconocimiento de
Patrones
El reconocimiento de patrones es la ciencia, y arte, de encontrar patrones significativos en los
datos que puedan extraerse a travs de la clasificacin. Mediante los mejoramientos espaciales
y espectrales de las imgenes, se puede realizar reconocimiento visual de patrones; el cerebro
humano clasifica automticamente ciertas texturas y colores en categoras.
En un sistema computacional, el reconocimiento de patrones espectrales puede ser ms
cientfico. Se derivan estadsticas de las caractersticas espectrales de todos los pxeles en una
imagen. Luego, los pxeles se ordenan basados en criterios matemticos. Los procesos de
clasificacin son divididos en dos partes. entrenamiento y clasificacin (usando una regla de
decisin).
Entrenamiento Primero, el sistema computacional debe ser entrenado para reconocer patrones en los datos. El
entrenamiento es el proceso de definir los criterios por los cuales sern reconocidos estos
patrones (Hord 1982). El entrenamiento puede realizarse con un mtodo supervisado o no
supervisado, como se explicar posteriormente.
Entrenamiento Supervisado
El entrenamiento supervisado es controlado estrechamente por el analista. En este proceso, el
usuario selecciona pxeles que representan patrones o rasgos de la cobertura terrestre que l
reconoce, o que l puede identificar con ayuda de otras fuentes, como fotografas areas, datos
de verdad de terreno o mapas. Antes de la clasificacin se requiere conocer los datos y las clases
deseadas.
Mediante la identificacin de patrones, usted puede entrenar el sistema computacional para
identificar pxeles con caractersticas similares. Si la clasificacin es exacta, las clases
resultantes representan las categoras de datos que usted identific originalmente.
C A P T U L O 6
Clasificacin
Clasificacin
214 ERDAS
Entrenamiento No Supervisado
El entrenamiento no supervisado es ms automatizado. Le permite al usuario especificar
algunos parmetros que el computador usa para revelar patrones estadsticos que son inherentes
a los datos. Estos patrones no necesariamente corresponden a las caractersticas directamente
significativas de la escena, como reas contiguas y fcilmente reconocidas de un determinado
tipo de suelo o uso de la tierra. Ellos simplemente son conglomerados de pxeles con
caractersticas espectrales similares. En algunos casos, puede ser ms importante identificar
grupos de pxeles con caractersticas espectrales similares que ordenar los pxeles dentro de
categoras reconocibles.
El entrenamiento no supervisado depende de los datos en s mismos para la definicin de las
clases. Este mtodo normalmente se usa cuando no se conocen muy bien los datos antes de la
clasificacin. Es entonces responsabilidad del analista, despus de la clasificacin, agregar
significado a las clases resultantes (Jensen 1996). La clasificacin no supervisada slo es til si
las clases pueden interpretarse apropiadamente.
Firmas El resultado del entrenamiento es un conjunto de firmas que define una muestra de
entrenamiento o conglomerado. Cada firma corresponde a una clase y se usa con una regla de
decisin (como se explicar posteriormente) para asignar los pxeles del archivo de la imagen a
una clase. En ERDAS IMAGINE las firmas pueden ser paramtricas o no-paramtricas.
Una firma paramtrica est basada en parmetros estadsticos (p.e., media y matriz de
covarianza) de los pxeles que estn en la muestra de entrenamiento o conglomerado. El
entrenamiento supervisado y no supervisado pueden generar firmas paramtricas. Un conjunto
de firmas paramtricas puede usarse para entrenar un clasificador basado en las estadsticas
(p.e., mxima probabilidad) para definir las clases.
Una firma no-paramtrica no est basada en estadsticas, sino en objetos discretos (polgonos o
rectngulos) en el espacio de caractersticas de la imagen. stos objetos del espacio de
caractersticas se usan para definir los lmites para las clases. Un clasificador no-paramtrico
usa un conjunto de firmas no-paramtricas para asignar pxeles a una clase basado en su
localizacin dentro o fuera del rea en la imagen del espacio de caractersticas. El entrenamiento
supervisado se usa para generar firmas no-paramtricas (Kloer 1994).
ERDAS IMAGINE permite al usuario generar estadsticas para firmas no-paramtricas. Esta
funcin permite que un objeto del espacio de caractersticas sea usado para crear una firma
paramtrica de la imagen que se est clasificando. Sin embargo, puesto que un clasificador
paramtrico requiere una distribucin normal de los datos, el nico objeto del espacio de
caractersticas para el que este sera matemticamente vlido sera una elipse (Kloer 1994).
Cuando se usan las firmas paramtricas y las no-paramtricas para clasificar una imagen, el
usuario puede analizar y visualizar mejor las definiciones de las clases que en cualquier tipo de
firma proporcionada independientemente (Kloer 1994).
Ver apndice A "Temas de Matemticas" para informacin sobre las imgenes del
espacio de caractersticas y cmo es su creacin.
Regla de Decisin Despus que las firmas son definidas, se ordenan los pxeles de la imagen en clases basadas en
las firmas para uso de una regla de decisin de clasificacin. La regla de decisin es un
algoritmo matemtico que, usando los datos contenidos en la firma, realiza el ordenamiento real
de los pxeles en distintos valores de clase.
215
Notas sobre Clasificacin
Field Guide
Reglas de Decisin Paramtricas
Una regla de decisin paramtrica est entrenada por las firmas paramtricas. Estas firmas son
definidas por el vector de medias y la matriz de la covarianza para los niveles digitales de los
pxeles en las firmas. Cuando se usa una regla de decisin paramtrica, cada pxel se asigna a
una clase dado que el espacio de decisin paramtrica es continuo (Kloer 1994).
Reglas de Decisin No Paramtricas
Una regla de decisin no-paramtrica no est basado en estadsticas, por consiguiente, es
independiente de las propiedades de los datos. Si un pxel se localiza dentro de las fronteras de
una firma no-paramtrica, entonces esta regla de decisin asigna el pxel a la clase de la firma.
Bsicamente, una regla de decisin no-paramtrica determina si el pxel se localiza dentro o
fuera de la frontera de la firma no-paramtrica.
Notas sobre
Clasificacin
Esquemas de
Clasificacin
Normalmente, la clasificacin se realiza con un conjunto de clases predefinidas en mente. Tal
conjunto es llamado esquema de clasificacin (o sistema de clasificacin). El propsito de este
esquema es proporcionar una estructura para organizar y categorizar la informacin que puede
extraerse de los datos (Jensen 1983). Un esquema de clasificacin apropiado incluye clases que
son importantes en el estudio y adems que son discernibles (diferenciables) en los datos
disponibles. La mayora de los esquemas tienen una estructura jerrquica que puede describir
un rea de estudio en varios niveles de detalle.
Diferentes especialistas han desarrollado varios esquemas de clasificacin para realizar el
inventario de una regin geogrfica. Algunas referencias de estos esquemas profesionales son:
Anderson, J.R., et al 1976. "A Land Use and Land Cover Classification System for Use
with Remote Sensor Data." U.S. Geological Survey Professional Paper 964.
Cowardin, Lewis M., al del et. 1979. Classification of Wetlands and Deepwater Habitats of
the United States. Washington, D.C.. U.S. Fish and Wildlife Service.
Florida Topographic Bureau, Thematic Mapping Section. 1985. Florida Land Use, Cover
and Forms Classification System. Florida Department of Transportation, Procedure No.
550-010-001-a.
Michigan Land Use Classification and Reference Committee. 1975. Michigan Land
Cover/Use Classification System. Lansing, Michigan. State of Michigan Office of Land
Use.
Otros estados o entidades gubernamentales tambin pueden tener estudios especializados de
cobertura / uso de la tierra.
Es recomendable que el proceso de clasificacin se inicie definiendo un esquema de
clasificacin para la aplicacin, usando esquemas previamente desarrollados, como los
anteriores, como un marco de referencia general.
Clasificacin
216 ERDAS
Clasificacin
Iterativa
Un proceso es iterativo cuando repite una accin. El objetivo del sistema ERDAS IMAGINE es
permitir al usuario crear, refinar firmas y clasificar archivos iterativamente hasta llegar a una
clasificacin final deseada. Las utilidades de clasificacin de ERDAS IMAGINE son
herramientas que se usan cuando sea necesario, no una lista numerada de pasos que siempre
deben seguirse en orden.
La clasificacin total puede lograrse con mtodos supervisados o no supervisados o una
combinacin de ambos. Algunos ejemplos son:
Las firmas creadas con los dos entrenamientos, supervisado y no supervisado, pueden
unirse y agregarse unas a otras.
Las herramientas para la evaluacin de firmas se pueden usar para indicar cules firmas son
similares espectralmente. Esto ayudar a determinar cules firmas deben unirse o borrarse.
Estas herramientas tambin ayudan a definir combinaciones ptimas de bandas para la
clasificacin. El uso de la combinacin ptima de bandas puede reducir el tiempo requerido
para realizar un proceso de clasificacin.
Dado que las clasificaciones (supervisadas o no supervisadas) pueden basarse en una rea
de inters particular (definida en una capa raster o en una capa .aoi), pueden generarse
firmas y clasificaciones a partir de los resultados de una clasificacin previa.
Entrenamiento
Supervisado vs. No
Supervisado
En el entrenamiento supervisado, es importante tener el conjunto de clases deseadas en mente
y luego crear las firmas apropiadas de los datos. Usted tambin debe tener alguna forma de
realizar el reconocimiento de pxeles que representen las clases que usted desea extraer.
Normalmente, la clasificacin supervisada es apropiada cuando usted desea identificar pocas
clases, cuando usted ha seleccionado sitios de entrenamiento que pueden verificarse con datos
de verdad de terreno, o cuando usted puede identificar distintas regiones homogneas que
representen a cada clase.
Por otro lado, si usted quiere determinar las clases por diferencias espectrales inherentes a los
datos, de manera que pueda definir las clases despus, entonces en este caso es mejor el
entrenamiento no supervisado. El entrenamiento no supervisado permite definir muchas clases
fcilmente, e identificar clases que no estn en regiones contiguas o en regiones de fcil
reconocimiento.
NOTA: La clasificacin supervisada tambin incluye el uso de un conjunto de clases generadas
por una clasificacin no supervisada. Empleando una combinacin de clasificacin
supervisada y no supervisada pueden obtenerse resultados ptimos, sobre todo en conjuntos de
datos grandes (p.e., mltiples escenas de Landsat). Por ejemplo, la clasificacin no supervisada
puede ser til para generar un conjunto bsico de clases y luego usar la clasificacin
supervisada para definir ms las clases.
Clasificacin de
Datos Realzados
Para muchas aplicaciones especializadas, los datos clasificados que han sido unidos, realzados
o fusionados espectralmentecon componentes principales, lgebra de imgenes u otras
transformacionespuede producir resultados muy especficos y significativos. Sin embargo, si
no existe una buena comprensin de los datos y de los mejoramientos usados, se recomienda
que slo sean clasificados los datos adquiridos remotamente.
Dimensionalidad La dimensionalidad se refiere al nmero de capas que se van a clasificar. Por ejemplo, un
archivo de datos con 3 capas se llama tridimensional, puesto que se plotea un espacio de
caractersticas tridimensionales para analizar los datos.
217
Entrenamiento Supervisado
Field Guide
El espacio de caractersticas y la dimensionalidad se discuten en el apndice A "Temas de
Matemticas".
Adicin de Dimensiones
Usando programas de ERDAS IMAGINE, usted puede adicionar capas a archivos de imgenes
existentes. Por consiguiente, usted puede incorporar otros datos adquiridos remotamente
(llamados datos auxiliares) para la clasificacin. Usar datos auxiliares le permite al usuario
incorporar variables en la clasificacin a partir de, por ejemplo, capas vector, datos previamente
clasificados o datos de elevacin. Los niveles digitales de los datos auxiliares se convierten en
una caracterstica adicional de cada pxel e influyen en la clasificacin (Jensen 1996).
Limitacin de Dimensiones
Aunque ERDAS IMAGINE permite usar un nmero ilimitado de capas de datos para una
clasificacin, es mejor reducir la dimensionalidad de los datos tanto como sea posible. A
menudo, ciertas capas de datos son redundantes o extraas a la tarea de ejecucin. Los datos
innecesarios ocupan espacio en el disco y recargan al sistema computacional con clculos ms
complejos, que reducen la velocidad de procesamiento.
Use Signature Editor para evaluar la separabilidad para calcular el mejor subconjunto
de combinaciones de capas. Use las funciones de Image Interpreter para fusionar o
recortar capas. Use la herramienta Image Information (en la barra de herramientas del
Visor) para borrar una(s) capa(s).
Entrenamiento
Supervisado
El entrenamiento supervisado requiere informacin a priori (ya conocida) sobre los datos,
como:
Qu tipo de clases necesita extraer? Tipo de suelo? Uso de la tierra? Vegetacin?
Qu clases son las que probablemente estn presentes en los datos? Es decir, qu tipos de
cobertura terrestre, suelos o vegetacin (u otra variable) estn representados por los datos?
En el entrenamiento supervisado, usted confa en sus propias habilidades para reconocer
patrones y en un conocimiento a priori de los datos para ayudar al sistema a determinar el
criterio estadstico (firma) para la clasificacin de los datos.
Para seleccionar muestras confiables, usted debera conocer alguna informacinespacial o
espectralacerca de los pxeles que desea clasificar.
La localizacin de una caracterstica especfica, como un tipo de cobertura terrestre, puede
conocerse a travs de la verdad de terreno. La verdad de terreno se refiere a la adquisicin de
conocimiento sobre el rea de estudio con trabajo de campo, anlisis de fotografas areas,
experiencia personal, etc., Se considera que los datos de verdad terreno son los ms exactos
(verdaderos) disponibles sobre el rea de estudio. Ellos deberan obtenerse al mismo tiempo que
los datos adquiridos remotamente, para que los datos se correspondan tanto como sea posible
(Star y Estes 1990). Sin embargo, algunos datos del terreno no pueden ser muy exactos debido
a un gran nmero de errores e inexactitudes.
Clasificacin
218 ERDAS
Muestras de
Entrenamiento y
Objetos del Espacio
de Caractersticas
Las muestras de entrenamiento (tambin llamadas muestras) son conjuntos de pxeles que
representan lo que es reconocido como un patrn discernible o una clase potencial. El sistema
calcula las estadsticas de los pxeles de la muestra para crear una firma paramtrica para la
clase.
Los siguientes trminos a veces se acostumbra a intercambiarlos cuando se hace referencia a
muestras de entrenamiento. Por claridad, ellos son usados en esta documentacin como sigue:
Muestra de entrenamiento, o muestra, es un conjunto de pxeles seleccionado para
representar una clase potencial. Los niveles digitales de estos pxeles se usan para generar
una firma paramtrica.
Campo de entrenamiento o sitio de entrenamiento, es el rea geogrfica de inters (AOI)
en la imagen, representada por los pxeles en una muestra. Normalmente, se identifica
previamente con el uso de datos de verdad de terreno.
Los objetos del espacio de caractersticas son definidos por el usuario como AOI's en la imagen
del espacio de caractersticas. La firma en el espacio de caractersticas se basa en estos objetos.
Seleccin de las
Muestras de
Entrenamiento
Es importante que las muestras de entrenamiento sean representativas de las clases que usted
intenta identificar. Esto no necesariamente significa que ellas deban contener un gran nmero
de pxeles o deban dispersarse a travs de una gran regin de los datos. La seleccin de las
muestras de entrenamiento depende hasta del conocimiento que usted tenga de los datos de
estudio y de la clase que desea extraer.
ERDAS IMAGINE permite identificar muestras de entrenamiento usando uno o ms de los
siguientes mtodos:
usando una capa vectorial
definiendo un polgono en la imagen
identificando una muestra de entrenamiento de pxeles contiguos con caractersticas
espectrales similares
identificando una muestra de entrenamiento de pxeles contiguos dentro de cierta rea, con
o sin caractersticas espectrales similares
usando una clase de capa raster temtica de un archivo de imagen de la misma rea ( es
decir, el resultado de una clasificacin no supervisada)
Polgonos
Digitalizados
Las muestras de entrenamiento pueden identificarse por su localizacin geogrfica (sitios de
entrenamiento, usos de mapas, datos de verdad del terreno). La localizacin de los sitios de
entrenamiento pueden digitalizarse desde un mapa con las herramientas Vector o AOI de
ERDAS IMAGINE. Los polgonos que representan estas reas son almacenados como capas
vectoriales. Estas capas vectoriales pueden usarse como entrada en las herramientas AOI y
como muestras de entrenamiento para crear firmas.
Use las herramientas Vector y AOI para digitalizar muestras de entrenamiento de un
mapa. Use Signature Editor para crear firmas a partir de muestras de entrenamiento que
se han identificado con polgonos digitalizados.
219
Seleccin de las Muestras de Entrenamiento
Field Guide
Polgonos Definidos
por el Usuario
Usando sus habilidades para reconocimiento de patrones (con o sin informacin de verdad del
terreno complementaria), usted puede identificar muestras examinado una imagen desplegada
y dibujando un polgono alrededor del (los) sitio(s) de inters. Por ejemplo, si usted conoce que
los rboles de roble reflejan cierta frecuencias de luz verde e infrarroja, de acuerdo con la verdad
del terreno, usted puede basar su seleccin de la muestra con estos datos (teniendo en cuentra
condiciones atmosfricas, ngulo solar, hora, fecha y otras variables). El rea dentro del (los)
polgono(s) se usara para crear una firma.
Use la herramienta AOI para definir el (los) polgono(s) a ser usados como muestras de
entrenamiento. Use Signature Editor para crear firmas a partir de muestras de
entrenamiento identificadas con los polgonos.
Identificacin de los
Pxeles Semilla
Con el dilogo Seed Properties y las herramientas AOI, el cursor (tijera) puede usarse para
identificar un slo pxel (pxel semilla) que sea representativo de la muestra de entrenamiento.
Este pxel semilla es usado como pxel modelo, con el cual se comparan los pxeles contiguos
basados en los parmetros especificados por usted.
Cunado se acepta uno o ms de los pxeles contiguos, se calcula la media de la muestra con los
pxeles aceptados. Luego, los pxeles contiguos de la muestra se comparan de la misma manera.
Este proceso se repite hasta que ningn pxel contiguo a la muestra satisfaga los parmetros
espectrales. En efecto, la muestra crece hacia afuera del pxel modelo con cada iteracin. Estos
pxeles homogneos se convierten de pxeles raster individuales a un polgono y se usan como
capas AOI.
Seleccione la opcin Seed Properties en el Visor para identificar muestras de
entrenamiento con un pxel semilla.
Mtodo de Pxeles
Semillas con Lmites
Espaciales
Las muestras de entrenamiento identificadas con el mtodo del pxel semilla pueden limitarse a
una regin particular definiendo las distancias y un rea geogrfica.
Las capas vectoriales (polgono o lneas) pueden desplegarse como las capas superiores
en el Visor y sus lmites pueden usarse como AOI para las muestras de entrenamiento
definidas en Seed Properties.
Capas Raster
Temticas
Una muestra de entrenamiento puede ser definida usando valores de clase de una capa raste
temtica (ver Tabla 6-1 en la pgina 220). Los valores en la muestra de entrenamiento son
usados para crear una firma. La muestra de entrenamiento puede ser definida con tantos valores
de clase como se desee.
NOTA: Las capas raster temticas debe tener el mismo sistema de coordenadas que el archivo
de la imagen que se est clasificando.
Clasificacin
220 ERDAS
Evaluacin de la
Muestras de
Entrenamiento
La seleccin de las muestras de entrenamiento es por lo general un proceso iterativo. Para
generar firmas que representan con exactitud las clases a ser identificadas, usted puede tener que
seleccionar muestras de entrenamiento repetidamente, evaluar las firmas que se generan de las
muestras y tomar nuevas muestras o manipular las firmas cuando sea necesario. La
manipulacin de las firmas puede inclur unin, borrado o adicin de un archivo a otro. Tambin
es posible realizar una clasificacin usando firmas conocidas, luego se enmascaran las reas que
no estn clasificadas para usarlas en la recoleccin de firmas adicionales.
Ver "Evaluacin de Firmas" en la pgina 231 para referencia sobre mtodos para
determinar la exactitud de las firmas creadas a partir de sus muestras de entrenamiento.
Seleccin de
Objetos en el
Espacio de
Caractersticas
Las herramientas Feature Space de ERDAS IMAGINE le permite definir interactivamente los
objetos del espacio de caractersticas (AIOs) en la imagen de tal espacio. Una imagen de espacio
de caractersticas es un grfico simple de los niveles digitales de una banda contra los valores
de otra banda (a menudo llamado diagrama de dispersin). En ERDAS IMAGINE, una imagen
del espacio caracterstico tiene la misma estructura de datos que una imagen raster; por
consiguiente, las imgenes de los espacios caractersticos pueden utilizarse con otras utilidades
de ERDAS IMAGINE, incluyendo zoom, segmentacin a nivel de color, desplazamiento
virtual, Spatial Modeler y Map Composer.
Figura 6-1: Ejemplo de una Imagen de Espacio Caracterstico
Tabla 6-1: Comparacin de las Muestras de Entrenamiento
Mtodo Ventajas Desventajas
Polgonos Digitalizados Coordenadas del mapa precisas,
representa informatin del terreno
conocida
Puede sobrestimar la varianza de
la clase, consume tiempo
Polgonos Definidos por el
Usuario
Alto grado de control por parte del
usuario
Puede sobrestimar la varianza de
la clase, consume tiempo
Pixel Semilla Apoyado automticamente, menos
tiempo
Puede sobrestimar la varianza de
la clase, consume tiempo
Capa Raster Temtica Permite una clasificacin
interactiva
Debe haberse definido
previamente la capa temyica
b
a
n
d

2
band 1
221
Seleccin de Objetos en el Espacio de Caractersticas
Field Guide
La transformacin de una imagen raster multicapa en una imagen de espacio caracterstico se
hace transformando los valores de los pxeles de entrada a una posicin en la imagen del espacio
caracterstico. Esta transformada solo define la posicin del pxel en la imagen del espacio
caracterstico. Esta no define el valor del pxel. Los valores del pxel en la imagen del espacio
de caractersticas pueden ser la frecuencia acumulada, que se calcula cuando se define la imagen
del espacio de caractersticas. Los valores del pxel tambin puede ser proporcionados por una
capa raster temtica de la misma geometra que la imagen multicapa fuente. La transformacin
de una capa temtica a una imagen de espacio caracterstico puede ser til para evaluar la
validez de las fronteras de decisin paramtricas y no paramtricas de una clasificacin (Kloer
1994).
Cuando usted despliega el archivo de una imagen del espacio de caractersticas (.fsp.img)
en el visor, los colores reflejan la densidad de puntos para ambas bandas. Los tonos
brillantes reflejan una densidad alta y los tonos oscuros reflejan una densidad baja.
Creacin de Firmas
No Paramtricas
Usted puede definir un objeto en el espacio de caractersticas (AOI) en la imagen del espacio de
caractersticas y usarlo directamente como una firma no paramtrica. Debido a que los visores
para la imagen del espacio caracterstico y la imagen que se est clasificando estn enlazados
con Signature Editor de ERDAS IMAGINE, es posible enmascarar AOIs de la imagen que se
est clasificando a la imagen del espacio caracterstico y viceversa. Usted puede enlazar
directamente el cursor del visor de la imagen con el visor del espacio caracterstico. Esta funcin
le ayuda a determinar una localizacin para el AOI en la imagen del espacio caracterstico.
Para definir una firma puede usarse solo una imagen del espacio caracterstico, pero mltiples
AOIs. Esta firma se toma dentro de la imagen del espacio caracterstico, no de la imagen que se
est clasificando. Los pxeles de la imagen que corresponden a los niveles digitales en la firma
(es decir en el objeto del espacio caracterstico) son asignados a esa clase.
Una diferencia fundamental entre el uso de la imagen del espacio caracterstico para definir una
muestra de entrenamiento y los otros mtodos tradicionales es aquella es una muestra no
paramtrica. Las decisiones que se hacen en el proceso de clasificacin no dependen de las
estadsticas de los pxeles. Esto ayuda a mejorar la exactitud de la clasificacin para clases
anormales especficas, tales como zonas urbanas y roca expuesta (Faust et al 1991).
Vea apndice A "Temas de Matemticas" para informacin sobre imgenes en el espacio
de caractersticas.
Clasificacin
222 ERDAS
Figura 6-2: Proceso Para Definir un Objeto en un Espacio Caracterstico
Evaluacin de
Firmas en el Espacio
de Caractersticas
Usando las herramientas Feature Space, es posible usar una firma del espacio caracterstico para
generar una mscara. Una vez definida como una mscara, se identifican los pxeles bajo la
mscara en la imagen y se resaltan en el Visor. La imagen desplegada en el Visor debe ser la
misma a la que se le cre la imagen de espacio caracterstico. Esta proceso le ayudar a analizar
visualmente las correlaciones entre varias bandas espectrales para determinar cul combinacin
de bandas resalta las caractersticas deseadas en la imagen.
Usted puede tener tantas imgenes del espacio caracterstico con diferentes combinaciones de
bandas como desee. Cualquier polgono o rectngulo en estas imgenes del espacio de
caractersticas puede usarse como una firma no paramtrica. Sin embargo, solo una imagen del
espacio de caractersticas puede usarse por firma. Los polgonos en la imagen del espacio
caracterstico pueden modificarse fcilmente y/o enmascararse hasta que las regiones deseadas
en la imagen se hayan identificado.
Use la herramienta Feature Space en Signature Editor para crear una imagen del espacio
de caractersticas y enmascarar la firma. Use las herramienta AOI para dibujar los
polgonos.
Despliegue el archivo de la imagen que se va a clasificar (layers 3, 2, 1)
Cree la imagen del espacio de caractersticas a partir de la imagen
que se est clasificando (capa 1 vs. capa 2)
Dibuje una AOI (objeto en el espacio de caractersticas que rodea el rea
deseada en la imagen del espacio de caractersticas. Luego que usted
tenga un rea AOI deseada, ella puede usarse como una firma.
Se usa una regla de decisin para analizar cada pixel en el archivo de la
imagen que est clasificando y los pixeles con los niveles digitales
correspondientes son asignados a la clase del espacio caracterstico.
223
Entrenamiento No Supervisado
Field Guide
Entrenamiento
No Supervisado
El entrenamiento no supervisado requiere de usted solo una entrada mnima. Sin embargo, usted
tiene la tarea de interpretar las clases que sean creadas por el algoritmo de entrenamiento no
supervisado.
El entrenamiento no supervisado tambin se llama aglomeracin (clustering), porque est
basado en agrupaciones naturales de pxeles en los datos de la imagen cuando ellos son
graficados en el espacio de caractersticas. De acuerdo con los parmetros especificados, estos
grupos pueden unirse, desagregarse, ser manipulados o usados como base para una firma.
El espacio de caractersticas se explica en el apndice A "Temas de Matemticas".
Conglomerados Los conglomerados son definidos con un algoritmo de aglomeracin, que usa a menudo todos
o muchos de los pxeles de un archivo de datos de entrada para su anlisis. El algoritmo de
conglomerado no considera la contigidad de los pxeles que definen cada conglomerado.
El ISODATA (Iterative Self-Organizing Data Analysis Technique) (Tou and Gonzlez
1974) es un mtodo de aglomeracin que usa las distancias espectrales como en el mtodo
secuencial, pero que interactivamente clasifica los pxeles, redefine el criterio para cada
clase y clasifica nuevamente, hasta que los patrones de distancia espectral de los datos
emergen gradualmente.
El mtodo de aglomeracin RGB es ms especializado que el mtodo ISODATA. Aquel se
aplica a datos de tres bandas y 8-bits. La aglomeracin RGB grafica los pxeles en un
espacio de caractersticas tridimensional y divide ese espacio en secciones que son
empleadas para definir los conglomerados.
Cada uno de estos mtodos se explica luego, junto con sus ventajas y desventajas.
Algunos de los trminos estadsticos usados en esta seccin son explicados en el apndice
A "Temas de Matemticas".
Aglomeracin
ISODATA
El ISODATA es interactivo en el sentido que ejecuta repetidamente una clasificacin completa
(capas raster temticas de salida) y recalcula estadsticas. El trmino auto-organizacin (Self-
Organizing) se refiere a la manera en que localiza los conglomerados con intervencin mnima
del usuario.
Tabla 6-2: Firmas del Espacio de Caractersticas
Ventajas Desventajas
Proporcionan exactitud en la clasificacin de una
clase de distribucin no normal (p.e., residencial y
urbano)
El proceso de decisin en la clasificacin permite
superponer y dejar pixeles sin clasificar.
Ciertas caracteristicas pueden ser identificadas
visualmente en la imagen del espacio de
caracteristicas
L imagen del espacio caracteristico puede ser
dificil de interpretar
El proceso de decisin en la clasificacin es rapido
Clasificacin
224 ERDAS
El mtodo ISODATA usa la mnima distancia espectral para asignar un conglomerado a cada
pxel candidato. El proceso empieza con un nmero especificado de conglomerados arbitrarios
o con los valores medios de las firmas existentes y luego procesa repetidamente, para que estos
promedios se desplacen a los promedios de los conglomerados en los datos.
Como el mtodo ISODATA es interactivo, no est influenciado por los niveles digitales
iniciales, como ocurre en los algoritmos de conglomeracin de un paso.
Use la utilidad Unsupervised Classification en Signature Editor para realizar la
conglomeracin ISODATA.
Parmetros para la Aglomeracin ISODATA
Para realizar el ISODATA, usted especifica:
El nmero de conglomerados N a ser considerados. Como cada conglomerado es la base
para una clase, este nmero se convierte en el mximo nmero de clase a formarse. El
proceso ISODATA comienza determinando N medias (promedios) de conglomerados
arbitrarios. Algunos conglomerados con pocos pxeles pueden eliminarse y pueden
obtenerse menos de N conglomerados.
Un umbral de convergencia T, que es el mximo porcentaje de pxeles cuyos valores de
clase permanecen inalterados entre iteraciones.
El mximo nmero de iteraciones M a realizar.
Medias Iniciales de los Conglomerados
En la primera iteracin del algoritmo ISODATA, las medias de los N conglomerados pueden
determinarse arbitrariamente. Despus de cada iteracin, para cada conglomerado se calcula
una nueva media basado en las posiciones espectrales reales de los pxeles del conglomerado,
en lugar del clculo arbitrario inicial. Luego, estas nuevas medias se usan para la definicin de
los conglomerados en la siguiente iteracin. El proceso contina hasta que el cambio entre
iteraciones sea muy pequeo (Swain 1973).
Las medidas iniciales de los conglomerados son distribuidas en el espacio de caractersticas a
lo largo de un vector que est entre las coordenadas espectrales del punto (
1
-
1
,
2
-
2
,

3
-
3
, ...
n
-
n
) y las coordenadas (
1
+
1
,
2
+
2
,
3
+
3
, ...
n
+
n
). Este vector es
ilustrado en la Figura 6-3 en la pgina 225 para las dos dimensiones. Las medias iniciales de los
conglomerados estn uniformemente distribuidos entre (
A
-
A
,
B
-
B
) y (
A
+
A
,
B
+
B
).
225
Entrenamiento No Supervisado
Field Guide
Figura 6-3: Conglomerados Arbitrarios ISODATA
Anlisis de los Pxeles
Los pxeles son analizados empezando por la esquina superior izquierda de la imagen yendo de
izquierda a derecha, bloque por bloque.
Se calcula la distancia espectral entre el pxel candidato y la media de cada conglomerado. El
pxel asignado al conglomerado cuya media est ms cercana. La funcin ISODATA crea una
imagen de salida con una capa raster temtica y/o un archivo de firmas (.sig) como resultado de
la aglomeracin. Al final de la cada iteracin, existe un archivo de imagen que muestra las
asignaciones de los pxeles a los conglomerados.
Considerando una agrupacin regular y arbitraria de las medias iniciales de los aglomerados, la
primera iteracin del algoritmo ISODATA siempre da resultados similares a los de la
Figura 6-4 en la pgina 225.
Figura 6-4: Primer Paso del ISODATA

A
0
B
5 arbitrary cluster means in two-dimensional spectral space
+

B
-
B
A
-
A

+ 0
Band A
data file values
B
a
n
d

B
d
a
t
a

f
i
l
e

v
a
l
u
e
s

B
A A
B
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Band A
data file values
B
a
n
d

B
d
a
t
a

f
i
l
e

v
a
l
u
e
s
Clasificacin
226 ERDAS
Para la segunda iteracin, las medias de los conglomerados se recalculan, ocasionando
desplazamientos de esos conglomerados en el espacio de caractersticas. Se repite el proceso
completocada pxel candidato es comparado con las nuevas medias de los conglomerados y
es asignado a la media del conglomerado ms cercano.
Figura 6-5: Segundo Paso del ISODATA
Porcentaje Inalterado
Despus de cada iteracin, el porcentaje normalizado de pxeles cuyas asignaciones no se
alteran desde la ltima iteracin es desplegado en el dilogo. Cuando este nmero llegue a T (el
umbral de aglomeracin), el programa termina.
Es posible que el porcentaje de pxeles que no se alteran, nuncan converja o alcance a T (el
umbral de convergencia). Por consiguiente, puede ser beneficioso supervisar el porcentaje o
especificar un nmero mximo razonable de iteraciones, M, para que el programa no corra
indefinidamente.
Band A
data file values
B
a
n
d

B
d
a
t
a

f
i
l
e

v
a
l
u
e
s
227
Entrenamiento No Supervisado
Field Guide
Mtodo de Componentes Principales
Mientras que la conglomeracin crea firmas que dependen de la reflectancia espectral de los
pxeles mediante la adicin de todos los pxeles, el mtodo de componentes principales resta
pxeles. El Anlisis de Componentes Principales (PCA) es un mtodo de compresin de datos.
Con l, usted puede eliminar datos que son redundantes y compactar una imagen en pocas
bandas.
Las bandas resultantes son independientes y no estn correlacionadas. Usted puede encontrar
que estn banfad son ms interpretables que las originales. El PCA que puede realizarse en
ERDAS IMAGINE es de hasta 256 bandas. Como un tipo de mejoramiento espectral, usted
debe especificar el nmero de componentes requeridas como salida a partir de sus datos
originales.
Reglas de Decisin Recomendadas
Aunque el algoritmo ISODATA es el ms parecido a la regla de decisin de la mnima distancia,
las firmas pueden producir buenos resultados con cualquier tipo de clasificacin. As que, no se
recomienda ninguna regla de decisin particular.
En muchos casos, las firmas creadas por ISODATA se unen, se borran o se adicionan a otro
conjuntos de firmas. El archivo de imagen creado por ISODATA es el mismo que el archivo de
imagen creado por la clasificacin de mnima distancia, excepto para los pxeles que no
convergen (100 - T % de los pxeles).
Use la opcin Merge y Delete de Signature Editor para manipular firmas.
Use la utilidad Unsupervised Classification en Signature Editor para realizar la
aglomeracin ISODATA, generar firmas y clasificar las firmas resultantes.
Tabla 6-3: Aglomeracin ISODATA
Ventajas Desventajas
Por ser iterativo, la aglomeracin no se influencia
geogrficamente por los pxeles iniciales o finales
del archivo de datos.
El proceso de aglomeracin puede gastar bastante
tiempo, porque puede repetirse muchas veces.
Este algoritmo es altamente exitoso en el hallazgo
de conglomerados espectrales inherentes en los
datos. No importa donde se localizan las medias
iniciales de los conglomerados, con tal que se
permitan bastantes iteraciones.
No tiene en cuenta la homogeneidad espacial de
los pixeles.
Se crea una capa raster temtica perliminar, que da
resultados similares a los de usar el clasificador de
mnima distancia (como se explica luego) con las
firmas que se crean. Estas capas raster temticas
pueden ser usadas para analizar y manipular las
firmas antes que la clasificacon real se lleve a
cabo.
Clasificacin
228 ERDAS
Aglomeracin
RGB
Las funciones RGB Clustering y Advanced RGB Clustering de Image Interpreter crean
una capa raster temtica. Sin embargo, no se crea ningn archivo de firmas y no se usa
ninguna otra regla de decisin de clasificacin. En la prctica, la aglomeracin RGB
difiere bastante de los otros mtodos de conglomeracin, no obstante ella emplea un
algoritmo de aglomeracin.
La aglomeracin RGB es una tcnica simple de clasificacin y compresin de datos para datos
de tres bandas y de 8 bits. Este es un algoritmo rpido y simple que comprime rpidamente las
tres bandas de la imagen en una sola banda seudo color, sin clasificar necesariamente alguna
caracterstica particular.
El algoritmo grafica todos los pxeles en el espacio de caractersticas tridimensional y luego
divide este espacio en conglomerados, en una grilla. En la versin ms simple de esta funcin,
cada uno de estos conglomerados se vuelve una clase en la capa raster temtica de salida.
La versin ms avanzada requiere de un umbral mnimo para el tamao de los conglomerados,
para que solo los conglomerados que sean por lo menos tans grandes como el umbral se vuelvan
clases de salida. Esto permite una mayor variacin del color en el archivo de salida. Los pxeles
que no entran en cualquiera de los conglomerados restantes sern asignados al conglomerado
con la distancia city-block ms pequea al pxel. En este caso, ese tipo de distancia se calcula
como la suma de las distancias en la direcciones roja, verde y azul en el espacio tridimensional.
A lo largo de cada eje del diagrama de dispersin tridimensional, cada histograma de entrada es
escalado para que las particiones dividan los histogramas entre los lmites especificados - ya sea
un nmero especificado de desviaciones estndar antes y despus de la media, o entre el mnimo
y el mximo de los niveles digitales de cada banda.
Por defecto, el nmero de divisiones por bandas es:
la Roja se divide en 7 secciones (32 para la versin avanzada)
la Verde se divide en 6 secciones (32 para la versin avanzada)
la Azul se divide en 6 secciones (32 para la versin avanzada)
229
Aglomeracin RGB
Field Guide
Figura 6-6: Aglomeracin RGB
Particin de Parmetros
Es necesario especificar el nmero de secciones R, G y B en cada dimensin del diagrama de
dispersin tridimensional. El nmero de secciones debe variar de acuerdo a los histogramas de
cada banda. Los histogramas grandes deben dividirse en ms secciones y los histogramas
estrechos debe dividirse en menos secciones (vea la Figura 6-6 en la pgina 229).
Es posible cambiar interactivamente estos parmetros en la funcin RGB Clustering en
Image Interpreter. El nmero de clases se calcula basado en los parmetros actuales y se
despliega en la pantalla de comandos.
G
B
R
16
1
9
5
3
5
2
5
5
9
8
B
R
G

1
6
16
34
55
35
0
16
35 195 255
98
R
G
B
This cluster contains pixels
between 16 and 34 in RED,
and between 35 and 55 in
GREEN, and between 0 and
16 in BLUE.
f
r
e
q
u
e
n
c
y
0
0
Clasificacin
230 ERDAS
Consejos
Algunos valores iniciales que usualmente producen buenos resultados con la aglomeracin
RGB son:
R = 7
G = 6
B = 6
Que producen 7 6 6 = 252 clases.
Para disminuir el nmero de colores/clases o para obscurecer la salida, disminuya estos valores.
Para la funcin Advanced RGB Clustering, comience con los valores ms altos para R, G y B.
Ajuste aumentando el parmetro del umbral y/o disminuyendo los valores de los parmetros R,
G y B hasta que se obtenga el nmero deseado de clases en la salida.
Archivos de
Firmas
Una firma es un conjunto de datos que define una muestra de entrenamiento, un objeto del
espacio caracterstico (AOI) o un conglomerado. La firma se usa en el proceso de clasificacin.
Cada regla de decisin de la clasificacin (algoritmo) requiere como entrada algunos atributos
de la firma que son almacenados en el archivo de firmas (.sig). En ERDAS IMAGINE las firmas
pueden ser paramtricas y no paramtricas.
Los siguientes atributos son estndar para todas las firmas (paramtricas y no paramtricas):
Nombreidentifica la firma y se usa como nombre de la clase en la capa raster temtica de
salida. El nombre de salida por defecto es Clase <nmero>.
Colorel color para la firma y el color para la clase en la capa raster temtica de salida.
Este color tambin se usa con otras funciones de visualizacin de firmas como alarmas,
mscaras, elipses, etc.
Valorel valor de la clase de salida para la firma. El valor de la clase de salida no
necesariamente debe ser el nmero de la clase de firma. Este valor debe ser un entero
positivo.
Tabla 6-4: Aglomeracin RGB
Ventajas Desventajas
Es el mtodo de clasificacin para proporcionar
una clasificacin rpida y simple para aplicaciones
que no requieren clases especficas.
Para la entrada se necesitan exactamente tres
bandas, lo cual no es conveniente para todas las
aplicaciones.
No se influencia ni por los primeros ni por los
ltimos datos del archivo. El orden de
examinacin de los pxeles no influencia los
resultados.
No simpre crea clases satisfactorias que pueden
analizarse para propsitos de informatin.
(Solo en la versin avanzada) Funcin altamente
interactiva, permite un adjuste interactivo de los
parmetros hasta que el nmero de conglomerados
y los umbrales sean satisfactorios para el anqalisis.
231
Evaluacin de Firmas
Field Guide
Ordenel orden para procesar las firmas en procesos que dependan del orden, tales como
alarmas de firmas y clasificaciones con el mtodo del paraleleppedo.
Lmites de paraleleppedolos lmites que se usan en el mtodo de clasificacin del
paraleleppedo.
Firma Paramtrica Una firma paramtrica est basada en parmetros estadsticos (p.e., media y matriz de
covarianza) de los pxeles que estn en la muestra de entrenamiento o conglomerado. Una firma
paramtrica incluye los siguientes atributos adems de los atributos estndar para las firmas:
el nmero de bandas en la imagen de entrada (como lo procesa el programa de
entrenamiento)
el nivel digital mnimo y mximo de cada banda para cada muestra o conglomerado (vector
mnimo y mximo)
la media de los niveles digitales de cada banda para cada muestra o conglomerado (vector
medio)
la matriz de covarianza para cada muestra o conglomerado
el nmero de pxeles de la muestra o conglomerado
Firmas No
Paramtricas
Una firma no paramtrica est basada en un AIO que usted define en la imagen de espacio
caracterstico para el archivo imagen que est siendo clasificado. Un clasificador no
paramtrico usar un conjunto de firmas no paramtricas para asignar pxeles a una clase
basados en su localizacin, dentro o fuera del rea en la imagen del espacio caracterstico.
El formato del archivo .sig se describe en la ayuda en lnea. La informacin de estadstica
puede encontrarla en el apndice A "Temas de Matemticas".
Evaluacin de
Firmas
Una vez creadas las firmas, estas pueden evaluarse, borrarse, renombrarse y fusionarse con otras
firmas de otros archivos. La fusin de firmas permite realizar clasificaciones complejas con
firmas derivadas con ms de un mtodo de entrenamiento (supervisado y/o no supervisado,
paramtrico y/o no paramtrico).
Use Signature Editor para ver los contenidos de cada firma, para manipularlas y realizar
sus propias pruebas matemticas de las estadsticas.
Uso de los Datos de
Firmas
Se pueden realizar pruebas que le pueden ayudar a determinar si los datos de una firma son una
verdadera representacin de los pxeles a ser clasificados para cada clase. Usted puede evaluar
las firmas que se crearon con entrenamiento supervisado o no supervisado. Los mtodos de
evaluacin de ERDAS IMAGINE incluyen:
Alarmause su propia habilidad de reconocimiento de patrones para ver el rea clasificada
estimada para una firma (usando la regla de decisin del paraleleppedo) en contraste con
la imagen original.
Elipseconsidera diagrama de elipse y diagramas de dispersin de los niveles digitales
para cada par de bandas.
Clasificacin
232 ERDAS
Matriz de contingenciarealiza una clasificacin rpida de los pxeles en un conjunto de
muestras de entrenamiento, para ver que porcentaje de los pxeles de la muestra realmente
est clasificado como se esperaba. Estos porcentajes se presentan en una matriz de
contingencia. Este mtodo es solo para entrenamiento supervisado, porque existen los
polgonos de las muestras de entrenamiento.
Divergenciamide la divergencia (distancia estadstica ) entre las firmas y determina el
subconjuntos de bandas que maximiza la clasificacin.
Estadsticas e histogramasanalice estadsticas e histogramas de las firmas para hacer
evaluaciones y comparaciones.
NOTA: Si la firma es no paramtrica ( p.e., una firma del espacio de caractersticas), usted solo
puede usar el mtodo de evaluacin de alarmas.
Despus de analizar las firmas, sera beneficioso unirlas o borrarlas, eliminar bandas
redundantes, adicionar nuevas bandas o realizar cualquier otra operacin para mejorar la
clasificacin.
Alarma La evaluacin alarma permite comparar una clasificacin estimada de una o ms firmas con
respecto a los datos originales, como aparecen en el Visor. De acuerdo con la regla de decisin
de paraleleppedos, los pxeles que se ajustan al criterio de clasificacin son iluminados en la
imagen desplegada. Usted tiene la opcin de resaltar un traslapo hacindolo aparecer con un
color diferente.
Con esta prueba, usted puede usar sus propias habilidades en el reconocimiento de patrones, o
algunos datos de verdad de terreno, para determinar la exactitud de una firma.
Use la utilidad Signature Alarm de Signature Editor para realizar alarmas de n-
dimensiones en la imagen en el Visor, empleando la regla de decisin del paraleleppedo.
La utilidad de alarma crea una capa funcional y el Visor le permite alternar la capa
imagen y la capa funcional.
Elipse En esta evaluacin, se calculan las elipses de concentracin a partir de las medias y las
desviaciones estndar almacenadas en el archivo de firmas. Tambin es posible generar
rectngulos o paraleleppedos, medias y etiquetas.
En esta evaluacin, se usa la media y la desviacin estndar de cada firma para representar la
elipse en dos dimensiones en el espacio de caractersticas. La elipse es desplegada en una
imagen del espacio caracterstico.
Las elipses son explicadas e ilustradas en el apndice A "Temas de Matemticas" bajo el
tema de diagramas de dispersin.
Cuando las elipses en la imagen del espacio caracterstico muestran un gran traslapo, las
caractersticas espectrales de los pxeles representados por las firmas no pueden ser distinguidas
en las dos bandas que se graficaron. En el mejor de los casos, no hay traslapo. Sin embargo, es
de esperarse algn traslapo.
233
Evaluacin de Firmas
Field Guide
La Figura 6-7 en la pgina 233 muestra como se trazan las elipses y como pueden traslaparse.
El primer grfico muestra como se trazan las elipses en el rango de dos desviaciones estndar
alrededor de la media. Este rango puede variarse, cambiando los grficos de la elipse. El anlisis
de los grficos con diferentes nmeros de desviacin estndar, es til para determinar los lmites
de una clasificacin por paraleleppedos.
Figura 6-7: Evaluacin de Firmas por Elipses
Analizando los grficos de la elipse para todo par de bandas, usted puede determinar cul firma
y cul banda proporcionan resultados exactos en una clasificacin.
Use Signature Editor para crear una imagen del espacio caracterstico y ver una(s)
elipse(s) de los datos de una firma.
Matriz de
Contingencia
NOTA: Esta evaluacin clasifica todos los pxeles en las AIOs seleccionadas y compara los
resultados con los pxeles de una muestra de entrenamiento.
Los pxeles de cada muestra de entrenamiento no siempre son tan homogneos como para que
cada pxel de la muestra se clasifica con su correspondiente clase. Cada pxel de la muestra
solamente da peso a las estadsticas que determinan las clases. Sin embargo, si las estadsticas
de cada muestra son distintas de las otras muestras, entonces un alto porcentaje de los pxeles
de cada muestra ser clasificado como se esperaba.
En esta evaluacin, se realiza una clasificacin rpida de los pxeles de la muestra usando las
reglas de decisin de mnima distancia, mxima probabilidad o distancia de Mahalanobis.
Luego, se presenta una matriz de contingencia que contiene el nmero y el porcentaje de los
pxeles que fueron clasificados como se esperaba.
Use Signature Editor para realizar la evaluacin con la matriz de contingencia.
Signature Overlap
Distinct Signatures
Band A
data file values
d
a
t
a

f
i
l
e

v
a
l
u
e
s

A
2
+2 B2 s
-2 B2

B2
signature 2
signature 1
Band C
data file values
B
a
n
d

D
d
a
t
a

f
i
l
e

v
a
l
u
e
s

C2
D2

signature 2
signature 1
D1

C1
s
-
2
s

A
2

A
2
+
2
s

B2
+2s

B2
-2s

B2

A
2
+
2
s

A
2
-
2
s

A
2

D1

D2

C2

C1
Clasificacin
234 ERDAS
Separabilidad La separabilidad de las firmas es una medida estadstica de distancia entre dos firmas. La
separabilidad puede calcularse para cualquier combinacin de bandas que se usen en la
clasificacin, permitiendo que usted decida cules bandas no son tiles en los resultados de la
clasificacin.
Para evaluar la distancia (Euclidiana), se calcula la distancia espectral entre los vectores media
(promedio) de cada par de firmas. Si la distancia espectral entre dos muestras no es significativa
para cualquier par de bandas, entonces ellas no pueden ser lo suficientemente distintas para
producir una clasificacin exitosa.
La distancia espectral tambin es la base de la clasificacin por mnima distancia (como se
explica posteriormente). Por consiguiente, calcular la distancia entre firmas le ayuda a predecir
los resultados de una clasificacin por mnima distancia.
Use Signature Editor para calcular la separabilidad y la distancia entre firmas y generar
el reporte automticamente.
Las formulas usadas para calcular la separabilidad estn relacionadas con la regla de decisin
de mxima probabilidad. As que, la evaluacin de la separabilidad de las firmas le ayuda a
predecir el resultado de la clasificacin por mxima probabilidad. La regla de mxima
probabilidad se explica posteriormente.
Hay tres opciones para calcular la separabilidad. Todas stas formulas tienen en cuenta las
covarianzas de las firmas de las bandas a compararse, como tambin los vectores de las medias
de las firmas.
Refirase al apndice A "Temas de Matemticas" para informacin sobre el vector media
y la matriz de covarianza.
Divergencia
La frmula para calcular la Divergencia (D
ij
) es :
Donde:
i y j = las dos firmas (clases) que se estn comparando
C
i
= la matriz de covarianza de la firma i

i
= el vector media de la firma i
tr = la funcin traza (lgebra matricial)
T = funcin traspuesta
Fuente: Swain and Davis 1978
D
ij
1
2
---tr C
i
C
j
( ) C
i
1
C
j
1
( ) ( )
1
2
---tr C
i
1
C
j
1
( )
i

j
( )
i

j
( )
T
( ) + =
235
Evaluacin de Firmas
Field Guide
Divergencia Transformada
La frmula para calcular la divergencia transformada (DT) es:
Donde:
i y j = las dos firmas ( clases ) que se compara
C
i
= la matriz de covarianza de la firma i
m
i
= el vector media de la firma i
tr = la funcin traza (lgebra matricial)
T = funcin transpuesta
Fuente: Swain and Davis 1978
Segn Jensen, la divergencia transformada "da un decrecimiento exponencial ponderado con el
incremento de las distancias entre las clases". La escala de los valores de divergencia est en el
rango de 0 a 2,000. Interpretar sus resultados despus de aplicar la divergencia transformada
requiere que usted analice aquellos valores numricos de divergencia. Como regla general, si el
resultado es mayor que 1,900, entonces pueden separarse las clases. Ente 1,700 y 1,900 la
separacin es moderadamente buena. Por debajo de 1,700, la separacin es mala (Jensen 1996).
Distancia Jeffries-Matusita
La frmula para el clculo de la Distancia Jeffries-Matusita (JAM) es la siguiente:
,
Donde:
i y j = las dos firmas (clases) que estn siendo comparadas
C
i
= la matriz de covarianza de la firma i

i
= el vector media de la firma i
ln = la funcin logaritmo natural
|C
i
| = el determinante de C
i
(lgebra matricial)
Fuente: Swain y Davis 1978
Segn Jensen, "La distancia JM tiene un comportamiento de saturacin a medida que aumenta
la separacin entre clases, al estilo de la transformada de divergencia. Sin embargo, esta no es
computacionalmente tan eficiente como la transformada de divergencia" (Jensen 1996).
D
ij
1
2
---tr C
i
C
j
( ) C
i
1
C
j
1
( ) ( )
1
2
---tr C
i
1
C
j
1
( )
i

j
( )
i

j
( )
T
( ) + =

1
8
---
i

j
( )
T
C
i
C
j
+
2
-----------------


1

i

j
( )
1
2
-- -ln
C
i
C
j
+ ( ) 2
C
i
C
j

--------------------------------



+ =
JM
ij
2 1 e

( ) =
Clasificacin
236 ERDAS
Separabilidad
Tanto la transformada de divergencia como la distancia de Jeffries-Matusita poseen lmites
superiores e inferiores. Si la divergencia calculada es igual a la cota superior apropiada, se puede
decir entonces que las firmas son totalmente separables en las bandas en estudio. Si la
divergencia es cero (0) significa que las firmas no se puedan separar.
TD est entre 0 y 2,000
JM est entre 0 y 1,414
Un listado de la separabilidad es un reporte de las divergencias calculadas para cada par de
clases y una combinacin de bandas. El listado contiene cada valor de divergencia para las
bandas estudiadas para todo par posible de firmas.
El listado de separabilidad tambin contiene las divergencias promedio y mnima para el
conjunto de bandas. Estos nmeros pueden ser comparados con otros listados de separabilidad
(para otras combinaciones de bandas), para determinar cul conjunto de bandas es el ms
adecuado para la clasificacin.
Factores de Peso
Al igual que en el clasificador Bayesiano (explicado ms abajo con el de mxima verosimilitud),
los factores de peso pueden especificarse para cada firma. Estos factores de peso estn basados
en probabilidades a priori, en donde un pxel es asignado a cada clase. Por ejemplo, si se sabe
que el doble de los pxeles de la clase B sern asignados a la clase A, entonces la clase A recibir
un factor de peso doble al de la clase B.
NOTA: Los factores de peso no afectan las ecuaciones de divergencia (para TD o JM), pero si
afectan el reporte de separabilidad en el promedio y el mnimo.
Los factores de peso para cada firma se utilizan para calcular una divergencia ponderada con el
siguiente clculo:
Donde:
i y j = las dos firmas (clases) que estn siendo comparadas
U
ij
= la divergencia no ponderada entre i y j
W
ij
= la divergencia ponderada entre i y j
c = el nmero de firmas (clases)
f
i
= el factor de ponderacin (peso) para la firma
W
ij
f
i
f
j
U
ij
j i 1 + =
c





i 1 =
c 1

1
2
--- f
i
i 1 =
c





2
f
i
2
i 1 =
c

---------------------------------------------------- =
237
Reglas de Decisin de Clasificacin
Field Guide
Probabilidad de Error
La distancia de Jeffries-Matusita est relacionada con la probabilidad de error apareada, que es
la probabilidad que un pxel asignado a la clase i est realmente en la clase j. Dentro de un rango,
esta probabilidad puede ser estimada de acuerdo con la siguiente expresin:
Donde:
i y j = las firmas (clases) que estn siendo comparadas
JM
ij
= la distancia JM entre i y j
P
e
= la probabilidad que un pxel est mal clasificado de i a j
Fuente: Swain y Davis 1978
Manejo de Firmas En muchos casos, debe repetirse el entrenamiento varias veces antes de producir las firmas
deseadas. Las firmas pueden obtenerse de diferentes fuentesdiferentes muestras de
entrenamiento, imgenes de espacios de caractersticas y diferentes programas de
agrupamientoutilizando en todas diferentes tcnicas. Despus de evaluar cada archivo de
firmas, uno puede unir, suprimir o crear nuevas firmas. Las firmas deseadas pueden moverse
finalmente a un archivo de firmas para ser usado en la clasificacin.
Las siguientes operaciones sobre firmas y archivos de firmas son posibles con ERDAS
IMAGINE:
Observar los contenidos de las estadsticas de las firmas.
Observar los histogramas de las muestras o de los conglomerados usados para derivar las
firmas.
Suprimir firmas no deseadas.
Unir firmas para que formen una sola clase ms grande en el momento de la clasificacin.
Aadir firmas desde otros archivos. Puede combinar firmas derivadas de diferentes
mtodos de entrenamiento para uso en una clasificacin.
Use Signature Editor para observar las estadsticas y los listados de histogramas, o para
borrar, unir, agregar y renombrar firmas dentro de un archivo de firmas.
Reglas de
Decisin de
Clasificacin
Una vez que un nmero considerable de firmas ha sido creado y evaluado, el siguiente paso es
realizar la clasificacin de los datos. Cada pxel es analizado independientemente. El vector de
medidas para cada pxel es comparado con cada firma, de acuerdo con la regla de decisin o el
algoritmo. Los pxeles que cumplen el criterio establecido por la regla de decisin son asignados
a la clase de la firma. ERDAS IMAGINE permite clasificar los datos ya sea paramtricamente
con representaciones estadsticas o no paramtricamente como objetos en el espacio de
caractersticas. La Figura 6-8 en la pgina 239 muestra el flujo de un pxel en el proceso de
clasificacin de una imagen en ERDAS IMAGINE (Kloer 1994).
1
16
------ 2 JM
ij
2
( )
2
P
e
1
1
2
-- - 1
1
2
---JM
ij
2
+



Clasificacin
238 ERDAS
Si no existe una regla no paramtrica, el pxel es clasificado utilizando nicamente la regla de
decisin paramtrica. Todas las firmas paramtricas son examinadas. Si una regla no
paramtrica est definida, entonces se evalan todas las firmas con las definiciones no
paramtricas. Estas reglas tienen las siguientes condiciones:
Si la evaluacin no paramtrica resulta en una sola clase, el pxel es asignado a dicha clase.
Si la evaluacin no paramtrica resulta en clases cero (0), (es decir, el pxel est por fuera
de todas las reglas de decisin no paramtricas) entonces se aplica la regla sin clasificacin.
Con esta regla, el pxel es clasificado por la regla paramtrica o se queda sin clasificar.
Si el pxel cae en ms de una clase como resultado de la evaluacin no paramtrica, se
aplica la regla de superposicin. Con esta regla, el pxel es clasificado por la regla
paramtrica, el orden del procesamiento o se queda sin clasificar.
Reglas No
Paramtricas
ERDAS IMAGINE ofrece para firmas no paramtricas estas reglas de decisin:
paraleleppedo
espacio de caractersticas
Opcin Sin Clasificar
ERDAS IMAGINE ofrece estas opciones si el pxel no es clasificado por la regla no
paramtrica:
regla paramtrica
sin clasificar
Opcin de Superposicin
ERDAS IMAGINE ofrece estas opciones si el pxel cae en ms de uno de los espacios de
caractersticas:
regla paramtrica
por orden
sin clasificar
Reglas Paramtricas ERDAS IMAGINE facilita:
distancia mnima
distancia Mahalanobis
mxima probabilidad (con variacin Bayesiana)
239
Reglas de Decisin de Clasificacin
Field Guide
Figura 6-8: Diagrama de Flujo para la Clasificacin
Paraleleppedo En la regla de decisin del paraleleppedo los niveles digitales del pxel candidato se comparan
con los lmites superior e inferior. Estos lmites pueden ser:
El mnimo y el mximo valor de los niveles digitales para cada banda en la firma.
La media de cada banda +/- un nmero de desviaciones estndar, o
Cualquier lmite que usted especifique, basado en el conocimiento que tenga de los datos y
firmas. Este conocimiento puede provenir de las tcnicas de evaluacin de firmas
discutidas anteriormente.
Candidate Pixel
No
Yes
Resulting Number of Classes
>1
Unclassified Overlap Options
Parametric Rule
Unclassified
Assignment
Class
Assignment
1
Unclassified
Parametric Unclassified Parametric
By Order
Nonparametric Rule
0
Options
Clasificacin
240 ERDAS
Estos lmites se pueden establecer usando la utilidad Parallelepiped Limits en Signature
Editor.
Hay lmites altos y bajos para cada firma en cada banda. Cuando el nivel digital de un pxel est
entre los lmites de cada banda en una firma, entonces el pxel es asignado a la clase de esa
firma. La Figura 6-9 en la pgina 240 es un ejemplo bidimensional de una clasificacin por el
mtodo del paraleleppedo.
Figura 6-9: Clasificacin por el Mtodo del Paraleleppedo
Los rectngulos de la Figura 6-9 en la pgina 240 son llamados paraleleppedos. Son las
regiones dentro de los lmites de cada firma.
Regin de Superposicin (Traslapo)
En los casos en donde el pxel cae en una regin de traslapo entre dos o ms paraleleppedos,
usted debe definir como va a ser clasificado el pxel:
El pxel puede ser clasificado por el orden de las firmas. Si una de las firmas es la primera
y la otra es la cuarta, el pxel es asignado a la clase de la primera firma. Este orden puede
ser programado desde Signature Editor.
El pxel puede ser clasificado por la regla de decisin paramtrica definida. El pxel es
evaluado nuevamente con las firmas sobrepuestas nicamente. Si ninguna de estas firmas
es paramtrica, el pxel se deja sin clasificar entonces. Si slo una de las firmas es
paramtrica, entonces el pxel es asignado automticamente a la clase de esa firma.
El pxel puede dejarse sin clasificar.

B2
+2s

?
?
?
?
?
? ?
?
?
?
? ?
?
?
? ?
?
? ?
?
?
?
?
?
?
?
?
? ? ?
?
?
?
?
?

class 1
class 2
class 3

B2
-2s

B2

A
2
+
2
s

A
2
-
2
s

A
2
Band A
data file values
B
a
n
d

B
d
a
t
a

f
i
l
e

v
a
l
u
e
s

A2
= mean of Band A,
class 2

B2
= mean of Band B,
class 2
?

= pixels in class 1
= pixels in class 2
= pixels in class 3
= unclassified pixels
241
Reglas de Decisin de Clasificacin
Field Guide
Regin Fuera de las Fronteras
Si el pxel no cae dentro de alguno de los paraleleppedos, entonces usted puede definir como
clasificar el pxel:
El pxel puede ser clasificado por la regla de decisin paramtrica definida. El pxel es
evaluado nuevamente con todas las firmas paramtricas. Si ninguna de las firmas es
paramtrica, el pxel se deja sin clasificar.
El pxel puede dejarse sin clasificar.
Use la utilidad Supervised Classification en Signature Editor para realizar la
clasificacin por el mtodo del Paraleleppedo.
Figura 6-10: Esquinas del Paraleleppedo Comparadas con la Firma Elipse
Tabla 6-5: Regla de Decisin para el mtodo del Paraleleppedo
Ventajas Desventajas
Es rpido y simple, puesto que los niveles digitales
son comparados con los lmites que permanecen
constantes para cada banda en cada firma.
Puesto que los paraleleppedos tienen esquinas,
algunos pxeles que estn bastante lejanos,
espectralmente, de la media de la firma, puede ser
clasificados. Unejemplo de esto se muestra en la
Figura 6-10 en la pgina 241.
til como una clasificacin general, de primer
paso. Esta regla de decisin reduce rpidamente el
nmero de posibles clases a las que cada pxel
puede asignarse, antes de gastar tiempo en
elaborar clculos, ahorrando tiempo de
procesamiento (p.e., mnima distancia, distancia
de Mahalanobis, o mxima probabilidad).
No depende de las distribuciones normales.

B
Signature Ellipse
Parallelepiped
boundary
A
*
candidate pixel
B
a
n
d

B
d
a
t
a

f
i
l
e

v
a
l
u
e
s
Band A
data file values
Clasificacin
242 ERDAS
Espacio de
Caractersticas
El espacio de caractersticas es una regla de decisin que determina si un pxel est o no dentro
de una firma no paramtrica en la imagen del espacio de caractersticas. Cuando los niveles
digitales de los pxeles estn en la firma del espacio de caractersticas, el pxel es asignado a la
clase de esa firma. La Figura 6-11 en la pgina 242 es un ejemplo bidimensional de una
clasificacin por el espacio de caractersticas. Los polgonos en la figura son usados por las
AOIs (reas de Inters) para definir las firmas del espacio de caractersticas.
Figura 6-11: Clasificacin por el Espacio de Caractersticas
Regin de Traslapo
En los casos en donde un pxel cae dentro de una regin de traslapo entre dos o ms AOIs, usted
debe definir como clasificar el pxel.
El pxel puede ser clasificado por el orden de las firmas del espacio de caractersticas. Si
una de las firmas es la primera y la otra es la cuarta, el pxel es asignado a la clase de la
primera firma. Este orden puede ser programado desde el Signature Editor.
El pxel puede ser clasificado por la regla de decisin paramtrica definida. El pxel es
evaluado nuevamente con las firmas traslapadas nicamente. Si ninguna de estas firmas del
espacio de caractersticas es paramtrica, el pxel se deja sin clasificar entonces. Si slo una
de las firmas es paramtrica, entonces el pxel es asignando automticamente a la clase de
esa firma.
El pxel puede dejarse sin clasificar.
Regiones Fuera de la AOIs
Si el pxel no cae dentro de unas de las AOIs para las firmas del espacio de caractersticas,
entonces usted debe definir como clasificar el pxel.
El pxel puede ser clasificado por la regla de decisin paramtrica definida. El pxel es
evaluado de nuevo en todas las firmas paramtricas. Si ninguna de las firmas es
paramtrica, el pxel se deja sin clasificar.
El pxel puede dejarse sin clasificar.

class 1
class 3
Band A
data file values
B
a
n
d

B
d
a
t
a

f
i
l
e

v
a
l
u
e
s
?

= pixels in class 1
= pixels in class 2
= pixels in class 3
= unclassified pixels

class 2
? ?
?
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
?
?
?
?
?
?
243
Reglas de Decisin de Clasificacin
Field Guide
Use la utilidad Decision Rules en Signature Editor para realizar una clasificacin en el
espacio de caractersticas.
Mnima Distancia La regla de decisin de la mnima distancia (tambin llamada distancia espectral) calcula la
distancia espectral entre el vector de medidas del pxel candidato y el vector media de cada
firma.
Figura 6-12: Mnima Distancia Espectral
En la Figura 6-12 en la pgina 243 se ilustra la distancia espectral mediante las lneas desde el
pxel candidato a la media de las 3 firmas. El pxel candidato es asignado a la clase con la media
ms cercana.
La ecuacin para clasificacin por distancia espectral est basada en la distancia Euclidiana:
Tabla 6-6: Regla de Decisin del Espacio de Caractersticas
Ventajas Desventajas
Es til como primer paso, da una clasificacin
muy general.
La regla de decisin del espacio de caractersticas
permite la superposicin y no deja pxeles sin
clasificar.
Proporciona una manera exacta de clasificar una
clase con una distribucin no normal (p.e.,
residencial y urbano).
La imagen del espacio de caractersticas puede ser
dificil de interpretar.
Ciertas caractersticas pueden identificarse ms
visualmente, lo que puede ayudar discriminar
clases que son espectralmente similares y difciles
de diferenciar con informacin paramtrica.
El mtodo del espacio de caractersticas es rpido.

B3

B2

B1

A1

A2

A3

3
Band A
data file values
B
a
n
d

B
d
a
t
a

f
i
l
e

v
a
l
u
e
s
candidate pixel
o
o
Clasificacin
244 ERDAS
Donde:
n = nmero de bandas (dimensiones)
i = una banda particular
c = una clase particular
X
xyi
= nivel digital del pxel x,y en la banda i
ci = media de los niveles digitales en la banda i para la muestra para la clase
SD
xyc
= distancia espectral del pxel x,y a la media de la clase c
Fuente: Swain y Davis 1978
Cuando se calcula la distancia espectral para todos los posibles valores de c (todas las posibles
clases), la clase del pxel candidato se asigna a la clase para la que la SD es menor.
Distancia
Mahalanobis
El algoritmo de la distancia Mahalanobis asume que los histogramas de las bandas tienen
distribuciones normales. Si este no es el caso, usted puede obtener mejores resultados con
las reglas de decisin del paraleleppedo o mnima distancia o mediante la ejecucin de
la clasificacin por paraleleppedo como un primer paso.
SD
xyc

ci
X
xyi
( )
2
i 1 =
n

=
Tabla 6-7: Minimum Distance Decision Rule
Advantages Disadvantages
Since every pixel is spectrally closer to either
one sample mean or another, there are no
unclassified pixels.
Pixels that should be unclassified (i.e., they are not
spectrally close to the mean of any sample, within limits
that are reasonable to you) become classified. However,
this problem is alleviated by thresholding out the pixels
that are farthest from the means of their classes. (See the
discussion of Thresholding on pgina 252.)
The fastest decision rule to compute, except
for parallelepiped.
Does not consider class variability. For example, a class
like an urban land cover class is made up of pixels with
a high variance, which may tend to be farther from the
mean of the signature. Using this decision rule, outlying
urban pixels may be improperly classified. Inversely, a
class with less variance, like water, may tend to
overclassify (that is, classify more pixels than are
appropriate to the class), because the pixels that belong
to the class are usually spectrally closer to their mean
than those of other classes to their means.
245
Reglas de Decisin de Clasificacin
Field Guide
La distancia Mahalanobis es similar a la mnima distancia, excepto que la ecuacin se usa es la
matriz de covarianza. La varianza y covarianza se calculan para que los conglomerados que
varan bastante conduzcan a clases que varan de manera similar y viceversa. Por ejemplo,
cuando se clasifican reas urbanasclase tpica cuyos pxeles varan bastantelos pxeles
correctamente clasificados pueden estar ms lejos de la media que aquellos de una clase para
agua, que usualmente no es una clase que vare mucho (Swain y Davis 1978).
La ecuacin para el clasificador de distancia Mahalanobis es como sigue:
D = (X-M
c
)
T
(Cov
c
-1
) (X-M
c)

Donde:
D = distancia de Mahalanobis
c = una clase particular
X = el vector de medidas del pxel candidato
M
c
= el vector media de la firma de la clase c
Cov
c
= matriz de covarianza de los pxeles en la firma de la clase c
Cov
c
-1
= inversa de la matriz de covarianza
T = funcin traspuesta
El pxel es asignado a la clase c, para la cual D es la ms baja.
Mxima
Probabilidad
/Bayesiano
El algoritmo de mxima probabilidad asume que los histogramas de las bandas tienen
distribuciones normales. Si este no es el caso, usted puede obtener mejores resultados con
las reglas de decisin del paraleleppedo o de la mnima distancia, o clasificando por el
mtodo del paraleleppedo como un primer paso.
Tabla 6-8: Ventajas y Desventajas de la Regla de Decisin Mahalanobis
Advantages Disadvantages
Takes the variability of classes into account,
unlike minimum distance or parallelepiped.
Tends to overclassify signatures with relatively large
values in the covariance matrix. If there is a large
dispersion of the pixels in a cluster or training sample,
then the covariance matrix of that signature contains
large values.
May be more useful than minimum distance
in cases where statistical criteria (as
expressed in the covariance matrix) must be
taken into account, but the weighting factors
that are available with the maximum
likelihood/Bayesian option are not needed.
Slower to compute than parallelepiped or minimum
distance.
Mahalanobis distance is parametric, meaning that it
relies heavily on a normal distribution of the data in
each input band.
Clasificacin
246 ERDAS
La regla de decisin de la mxima probabilidad est basada en la probabilidad que un pxel
pertenezca a una clase particular. La ecuacin bsica asume que estas probabilidades son
iguales para todas las clases y que las bandas de entrada tienen distribuciones normales.
Clasificacin Bayesiano
Si usted tiene un conocimiento a priori que las probabilidades no son iguales para todas las
clases, usted puede especificar factores de peso para clases particulares. Esta variante de la regla
de decisin de la mxima probabilidad se conoce como regla de decisin Bayesiana (Hord
1982). A menos que usted tenga conocimiento a priori de las probabilidades, se recomienda no
especificarlas. En este caso, los pesos predefinidos en la ecuacin son 1.0.
La ecuacin para el clasificador mxima probabilidad/Bayesiano es:
D = ln(a
c
) - [0.5 ln(|Cov
c
|)] - [0.5 (X-M
c
)T (Cov
c
-1) (X-M
c
)]
Donde:
D = distancia ponderada (probabilidad)
c = una clase particular
X = el vector medida del pxel candidato
M
c
= el vector media de la muestra de la clase c
a
c
= porcentaje de probabilidad con que un pxel candidato es miembro de la
clase c (el defecto es 1.0, o es entrado de un conocimiento a priori)
Cov
c
= la matriz de covarianza de los pxeles en la muestra de la clase c
|Cov
c
| = determinante de Cov
c
(lgebra matricial)
Cov
c
-1= inversa de Cov
c
ln = funcin logaritmo natural
T = funcin traspuesta
La inversa y el determinante de una matriz junto con la diferencia y transposicin de vectores,
se explican en un texto de lgebra matricial.
El pxel es asignado a la clase, c, para la que D sea la menor.
Tabla 6-9: Regla de Decisin Mxima Probabilidad/Bayesiana
Ventajas Desventajas
Es el ms exacto do los clasificadores en ERDAS
IMAGINE (si las muestras/conglomerados tienen
una distribucin normal), debido a que toma ms
variables en consideracin.
Es una ecuacin extensa que toma tiempo para
calcular. El tiempo de computacin se incrementa
con el nmero de bandas de entrada
Toma en cuenta la variabilidad de las clases y
emplea la matriz de covarianza, como lo hace la
distancia Mahalanobis.
La mxima probabilidad es paramtrica, lo que
significa que se basa en la distribucin normal de
los datos en cada banda de entrada.
Tiende a sobreclasificar firmas con valores
relativamente altos en la matriz de covarianza. Si
hay gran dispersin en los pxeles de un
conglomerado o en una meustra de entrenamiento,
entonces la matriz de covarianze de la firma
contendr valores altos.
247
Metodologa Fuzzy
Field Guide
Metodologa
Fuzzy
Clasificacin Difusa
(Fuzzy)
El mtodo de la clasificacin Fuzzy tiene en cuenta que hay pxeles entremezclados, esto es, que
un pxel no puede ser definitivamente asignado a una categora. Jensen menciona que,
"Claramente, debe existir una forma para que los algoritmos de clasificacin sean ms
sensitivos a la imprecisin (Fuzzy) de la naturaleza del mundo real" (Jensen 1996).
La clasificacin Fuzzy est diseada para ayudarle a trabajar con datos que no estn en una
categora o en otra exactamente. La clasificacin Fuzzy trabaja utilizando una funcin de
membresa, en donde el valor de un pxel es determinado por su mayor cercana a una clase que
a otra. Una clasificacin fuzzy no tiene lmites definidos y cada pxel puede pertenecer a
diferentes clases (Jensen 1996).
Igual que la clasificacin tradicional, la clasificacin fuzzy usa entrenamiento, pero la mayor
diferencia es que "tambin es posible obtener informacin sobre las diferentes clases
encontradas en un pxel mixto..." (Jensen 1996). Jensen contina explicando que el proceso de
recolectar sitios de entrenamiento en una clasificacin fuzzy no es tan estricto como en la
clasificacin normal. En el mtodo fuzzy, los sitios de entrenamiento no deben tener los mismo
pxeles exactamente.
Una vez se tiene la clasificacin fuzzy, la utilidad Fuzzy Convolution nos permite obtener una
ventana de convolucin mvil en una clasificacin fuzzy con mltiples clases. Usando la
clasificacin multicapas y el archivo de distancia, el computador crea una nica clase de archivo
de salida, calculando un total de distancias ponderadas con las clases en la ventana.
Convolucin Fuzzy La operacin Fuzzy Convolution crea una sola capa de clasificacin calculando la distancia
inversa ponderada de todas clases en la ventana de pxeles. Luego, asigna el pxel central a la
clase con la mayor distancia inversa total sumada sobre todos los conjuntos de capas de
clasificacin fuzzy.
Esto tiene el efecto de crear una clasificacin basada en el contexto con el fin de reducir el
moteado y efecto pimienta en la clasificacin. Las capas con un valor de distancia muy pequeo
no cambian mientras que las clases con mayores valores de distancias pueden cambiar a un valor
cercano siempre y cuando exista un nmero suficiente de pxeles vecinos con valores de clase
y valores de distancia correspondientes. La siguiente ecuacin es utilizada en el clculo:
T k [ ]
w
ij
D
ijl k [ ]
--------------
l 0 =
n

j 0 =
s

i 0 =
s

=
Clasificacin
248 ERDAS
Donde:
i = row index of window
j = column index of window
s = size of window (3, 5, or 7)
l = layer index of fuzzy set
n = number of fuzzy layers used
W = weight table for window
k = class value
D[k] = distance file value for class k
T[k] = total weighted distance of window for class k
El pixel central es asignado a la clase con el mximo T[k].
Clasificacin
Experta
La clasificacin experta puede llevarse a cabo usando Expert Classifier

de IMAGINE. El
software de clasificacin experta proporciona reglas-basadas dirigidas a clasificacin de
imgenes multiespectrales, refinamiento post-clasificatorio y modelamiento SIG. En esencia,
un sistema de clasificacin experta es una jerarqua de reglas, o un rbol de decisin, que
describe las condiciones sobre las que un conjunto de informacin con componente de bajo
nivel se abstrae en un conjunto de clase informacional de alto nivel. La componente de
informacin consiste de variables definidas por el usuario e incluyen imgenes raster,
coberturas vector, modelos espaciales, programas externos y simples escalares.
Una regla es una afirmacin condicional o lista de afirmaciones condicionales, a cerca de los
valores de las variables y los atributos que determinan un componente informacional o
hiptesis. Mltiples reglas e hiptesis pueden estar vinculadas a una jerarqua que en ltimas
describe un conjunto final de clases informacional fuente o hiptesis terminales. Los valores de
confianza asociados con cada condicin son combinados para proporcionar una imagen de
confianza correspondiente a la imagen clasificada de salida final.
El Expert Classifier de IMAGINE esta compuesto de dos partes. El Ingeniero de Conocimiento
y el Clasificador de conocimiento. La Ingeniera de Conocimiento proporciona la interfase para
un experto con conocimiento de primera mano de los datos y la aplicacin para identificar las
variables, reglas y clases de inters de salida y crear el rbol de decisin jerrquico. El
clasificador de conocimiento proporciona una interfase para un no-experto para aplicar el
conocimiento base y crear la clasificacin de salida.
Ingeniera del
Conocimiento
Con la Ingeniera del Conocimiento, usted puede abrir bases de conocimiento, que son
representadas como rboles de decisin en las ventanas de edicin.
249
Clasificacin Experta
Field Guide
Figura 6-13: Ingeniera del Conocimiento en la Ventana de Edicin
En la Figura 6-13 en la pgina 249, la esquina superior de la ventana de edicin es una visin
del rbol de decisin completa con una caja verde indicando la posicin dentro del
conocimiento base de la porcin desplegada del rbol de decisin. Esta caja puede arrastrarse
para cambiar la visin del grfico del rbol de decisin en la ventana desplegada a la derecha.
La rama que contiene la hiptesis seleccionada, la regla o la condicin es iluminada en la vista.
El rbol de decisin crece en profundidad cuando la hiptesis de una regla es referida a una
condicin de otra regla. La hiptesis terminal del rbol de decisin representa las clases de
inters finales. Las hiptesis intermedias tambin pueden ser marcadas siendo una clase de
inters. Esto puede ocurrir cuando hay una asociacin entre clases.
La Figura 6-14 en la pgina 250 representa slo una rama de un rbol de decisin ofreciendo
hiptesis, sus reglas y condiciones.
Clasificacin
250 ERDAS
Figura 6-14: Ejemplo de una Rama de un rbol de Decisin
En este ejemplo, la regla, que es Gentle Southem Slope, determina la hiptesis, Good Location.
La regla tiene cuatro condiciones en el lado derecho, las cuales se deben cumplir para ser
verdaderas.
De todas formas, la regla puede dividirse en Southern Slope o Gentle Slope definiendo la
hiptesis Good Location. Mientras ambas condiciones deben ser verdaderas para disparar una
regla, una sola regla debe ser verdadera para satisfacer la hiptesis.
Figura 6-15: Rama de un rbol de Decisin con Regla Dividida
Editor Variable
La Ingeniera de conocimiento tambin utiliza el Editor Variable al clasificar imgenes. El
Editor Variable ofrece la definicin de los objetos variables para utilizarlos bajo condiciones de
las reglas.
Los dos tipos de variables son raster y escalar. Las variables escalares pueden ser definidas con
un valor explcito o definida como la salida de un modelo o programa externo.
Gentle Southern Slope
Aspect > 135
Aspect <= 225
Slope < 12
Slope > 0
Good Location
Hypothesis
Rule
Conditions
Southern Slope Good Location
Aspect > 135
Aspect <= 225
Slope < 12
Slope > 0
Gentle Slope
251
Evaluacin de la Clasificacin
Field Guide
Evaluacin de la Salida de la Ingeniera del Conocimiento
La tarea de crear una til y bien construida base del conocimiento requiere numerosas
iteraciones de prueba, evaluacin y refinamiento. Para facilitar este proceso, se proporcionan
dos opciones. Primero, puede usar Test Classification para producir una clasificacin de prueba
utilizando la base de conocimiento existente. Segundo, puede utilizar Classification Pathway
Cursor para evaluar los resultados. Esta herramienta permite mover una tijera (crosshair) sobre
la imagen de un Visor para establecer un nivel de confiabilidad de las reas de la imagen.
Clasificador de
Conocimiento
El Clasificador de Conocimiento est compuesto por dos partes: una aplicacin con una
interfase de usuario y una lnea de comandos ejecutables. La aplicacin con interfase de usuario
permite un conjunto limitado de entradas de parmetros para controlar el uso de la base del
conocimiento. La interfase de usuario est diseada como un mago para guiarnos a travs de las
pginas de los parmetros de entrada.
Despus de seleccionar una base de conocimiento, se permite seleccionar las clases. El siguiente
es un ejemplo del dilogo para clases:
Figura 6-16: Clasificador de Conocimiento de las Clases de Inters
Despus de seleccionar los datos de entrada para la clasificacin, las opciones de salida de la
clasificacin, los archivos de salida, las reas de salida, el tamao de las celdas de salida y la
proyeccin del mapa de salida, el proceso del Clasificador de Conocimiento puede comenzar.
Una mquina de inferencia evala todas las hiptesis en cada localizacin (calculando valores
variables si es necesario) y asigna la hiptesis con la ms alta confiabilidad. La salida del
Clasificador de Conocimiento es una imagen temtica y opcionalmente, una imagen de
confiabilidad.
Evaluacin de la
Clasificacin
Despus de realizar una clasificacin, los siguientes mtodos estn disponibles para evaluar la
veracidad de la clasificacin:
Umbralusa un archivo de imagen de probabilidad para descartar pxeles clasificados
incorrectamente.
Evaluacin de la Exactitudcompara la clasificacin con la verdad de terreno u otros
datos.
Clasificacin
252 ERDAS
Umbral Umbral es el proceso de identificacin de los pxeles en una imagen clasificada que son los ms
probables de ser clasificados incorrectamente. Estos pxeles son puestos en otra clase
(usualmente, la clase 0). Estos pxeles son identificados estadsticamente, basados en la
medicin de distancias utilizadas en la regla de decisin de la clasificacin.
Archivos de Distancia
Cuando se realiza una clasificacin con distancia mnima, la distancia Mahalanobis o la de
mxima probabilidad, se produce un archivo de imagen de distancia en edicin a la capa raster
temtica de salida. El archivo de imagen de distancia es una capa raster continua de una banda,
de 32-bits, en donde cada nivel digital representa el resultado de una ecuacin de distancia
espectral, dependiendo de la regla de decisin utilizada:
En una clasificacin de distancia mnima, cada valor de distancia es la distancia espectral
Euclidiana entre el vector de medidas del pxel y el vector de media de una clase.
En la clasificacin por distancia Mahalanobis o por mxima probabilidad, el valor de la
distancia es la distancia Mahalanobis entre el vector de medidas del pxel y el vector media
de la clase del pxel.
Los pxeles ms brillantes (con los mayores valores de distancia) est espectralmente ms lejos
de las medias de las firmas para las clases en las cuales son asignados. Hay ms probabilidad de
estar clasificados incorrectamente.
Los pxeles ms oscuros estn espectralmente ms cercanos y tienen mayor probabilidad de ser
clasificados correctamente. Si fue utilizado el entrenamiento supervisado, los pxeles ms
oscuros son usualmente las muestras de entrenamiento.
Figura 6-17: Histograma de una Imagen de Distancias
La Figura 6-17 en la pgina 252 muestra como aparece el histograma de una imagen de
distancias. Esta distribucin es llamada chi-cuadrado, en oposicin a la distribucin normal, que
es una campana simtrica.
Umbral
Los pxeles con mayor probabilidad de ser clasificados errneamente tienen los mayores valores
de distancia en el archivo en la cola del histograma. En cierto punto que usted defineya sea
matemticamente o visualmentela cola del histograma se corta. El punto de corte es el
umbral.
distance value
n
u
m
b
e
r

o
f

p
i
x
e
l
s
0
0
253
Evaluacin de la Clasificacin
Field Guide
Para determinar el umbral:
Cambie interactivamente el umbral con el ratn, cuando la distancia del histograma est
desplegada mientras utiliza la funcin umbral. Esta opcin permite seleccionar un valor
chi-cuadrado seleccionando el valor de corte en el histograma.
Entre un parmetro chi-cuadrado o una medida de distancia, para que sea posible calcular
estadsticamente el umbral.
En ambos casos, el umbral tiene el efecto de cortar la cola del histograma del archivo de imagen
de distancias, representando los pxeles con los valores de distancia ms altos.
Figura 6-18: Tipos de Umbral Interactivos
La Figura 6-18 en la pgina 253 muestra histogramas de distancias. Cada ejemplo est
acompaado de una explicacin de lo que significa la curva y como establecer el umbral.
Forma chi-cuadrado suaveintente encontrar el punto de
quiebre donde las curv se vuelve ms horizontal y elimine
la cola.
Los valores de moda menores (picos) de la curva indican probablemente
que la clase agreg otros elementos que no estn representados
en la firma. Usted tal vez desea definir un umbral para retirar
esos elementos.
No es una buena clase. La firma para esta clase representa
probablement una distribucin polimodal (mltiples picos).
El pico de la curva est desplazado de 0. Indica que la media de la
firma est descentrada respecto a los pixeles que representa. Usted
puede necesitar adquirir otra firma y relcasificar.
Clasificacin
254 ERDAS
Estadsticas Chi-Cuadrado
Si se usa el clasificador de distancia mnima, el umbral es simplemente una distancia espectral.
Sin embargo, si se usan Mahalanobis o la Mxima Probabilidad, se emplean las estadsticas Chi-
cuadrado para comparar probabilidades (Swain y Davis 1978).
Cuando las estadsticas se utilizan para calcular el umbral, este es ms claramente definido
como sigue:
T es el valor de la distancia en donde el C% de los pxeles en una clase tienen un valor de
distancia mayor o igual a T:
Donde:
T = el umbral para una clase
C% = el porcentaje de pxeles que se cree estarn mal clasificados, se conoce
como nivel de confianza
T est relacionado con los valores de distancia por medio de estadsticas chi-cuadrado. El valor
X
2
es usado en la ecuacin. X
2
es funcin de:
el nmero de bandas de los datos utilizadosconocidas en las estadsticas chi-cuadrado
como los grados de libertad
el nivel de confianza
Cuando se clasifica una imagen en ERDAS IMAGINE, la imagen clasificada automticamente
tiene los grados de libertad (es decir, el nmero de bandas) usados para la clasificacin. La tabla
chi-cuadrados es construida en la aplicacin del umbral.
NOTA: En esta aplicacin de estadsticas chi-cuadrado, el valor de X
2
es una aproximacin.
Este tipo de estadsticas generalmente se aplica a variables independientes (que no tienen
covarianza), lo cual no es usualmente cierto para los datos de una imagen.
Una discusin acerca de las estadsticas chi-cuadrado puede encontrarse en un texto de
estadstica.
Use la utilidad Classification Threshold para realizar el umbral.
Evaluacin de la
Exactitud
La evaluacin de la exactitud es un trmino general para comparar la clasificacin con
informacin geogrfica que se asume verdadera, con el fin de determinar la veracidad del
proceso de clasificacin. Generalmente, la informacin que se asume verdadera se deriva de
informacin real de campo.
255
Evaluacin de la Clasificacin
Field Guide
No resulta prctico realizar el reconocimiento de campo o la prueba de cada uno de los pxeles
de una imagen clasificada. Por consiguiente, se utiliza un conjunto de pxeles de referencia. Los
pxeles de referencia son puntos de la imagen clasificada para los cuales los datos reales son (o
sern) conocidos. Los pxeles de referencia son seleccionados al azar (Congalton 1991).
NOTA: Usted puede utilizar la utilidad Accuracy Assessment de ERDAS IMAGINE para
realizar una evaluacin de la exactitud de una capa temtica. Esta capa puede no haber sido
clasificada por ERDAS IMAGINE (p.e., usted puede ejecutar una evaluacin de la exactitud
sobre una capa temtica que haya sido clasificada con ERDAS versin 7.5 e importada a
ERDAS IMAGINE).
Pxeles de Referencia al Azar
Cuando los pxeles de referencia son seleccionados por el analista, es una tentacin elegir para
las pruebas de la clasificacin los mismos pixeles que fueron usados como muestras de
entrenamiento. Esto perjudica el examen, ya que las muestras de entrenamiento son la base de
la clasificacin. Al permitir que los pxeles referencia sean seleccionados al azar, la posibilidad
de perjudicar el proceso se reduce o se elimina por completo (Congalton 1991).
El nmero de pxeles de referencia es un factor importante para determinar la exactitud de la
clasificacin. Se ha demostrado que ms de 250 pxeles de referencia son necesarios para
estimar la media de una clase con un error de ms o menos cinco por ciento (Congalton 1991).
ERDAS IMAGINE utiliza una ventana cuadrada para seleccionar los pxeles de referencia. El
tamao de la ventana lo puede definir usted. Se ofrecen tres tipos de distribucin para
seleccionar los pxeles al azar:
Al azarno se usa ninguna regla.
Al azar estratificadoel nmero de puntos es estratificado a la distribucin de las clases en
la capa temtica.
Al azar ecualizadocada clase tiene el mismo nmero de puntos al azar.
Utilice la utilidad Accuracy Assesment para generar puntos de referencia al azar.
Evaluacin de la Matriz de Exactitud
Se crea para comparar la imagen clasificada con los datos de referencia. Esta matriz (CellArray)
es simplemente una lista de valores de clase para los pxeles en el archivo de la imagen
clasificada y los valores de clase para los correspondientes pxeles de referencia. Los valores de
clase para los pxeles de referencia son ingresados por usted. Los datos residen en un archivo de
imagen.
Use Accuracy Assesment CellArray para ingresar los pxeles de referencia para los
valores de clase.
Reportes de Error
De la matriz de evaluacin de la exactitud pueden derivarse dos clases de reportes:
Clasificacin
256 ERDAS
La matriz de error simplemente compara los puntos de referencia con los puntos
clasificados en una matriz c c, donde c es el nmero de clases (incluyendo la clase 0).
El reporte de exactitud calcula las estadsticas de los porcentajes de precisin, basados
sobre los resultados de la matriz de error.
Al interpretar los reportes, es importante observar el porcentaje de pxeles clasificados
correctamente y determinar la naturaleza de los errores del productor y los suyos.
Use la utilidad Accuracy Assesment para generar la matriz de error y los reportes de
exactitud.
Coeficiente Kappa
El coeficiente Kappa expresa la reduccin proporcional en el error generada por un proceso de
clasificacin comparado con el error de una clasificacin completamente al azar. Por ejemplo,
un valor de 0.82 implica que el proceso de clasificacin est evitando 82 por ciento de los
errores que genera una clasificacin completamente al azar (Congalton 1991).
Para ms informacin sobre el coeficiente Kappa, vea un manual de estadstica.
Archivo de
Salida
Cuando se clasifica un archivo imagen, el archivo de salida es un archivo imagen con una capa
raster temtica. Este archivo automticamente contiene los siguientes valores:
valores de las clases
nombres de las clases
tablas de color
estadsticas
histogramas
El archivo imagen contiene adems cualquier atributo de la firma que fue seleccionada con la
utilidad Supervised Classification de ERDAS IMAGINE.
Los nombres de las clases, valores y colores pueden definirse con Signature Editor o con
Raster Attribute Editor.

También podría gustarte