Está en la página 1de 25

47

CAPÍTULO 3

ANÁLISIS DE IMÁGENES SATELITALES

3.1 Introducción al análisis de imágenes multiespectrales

La interpretación de imágenes satelitales puede hacerse a través del análisis visual o


del tratamiento digital.
El primer caso es semejante a la fotointerpretación tradicional y significa adquirir la
imagen en película negativo, en película positivo o en papel -productos fotográficos-, para
analizar las distintas cubiertas en base a tonalidad, textura y estructura. Así, los tonos oscuros
indican bajos niveles de radiancia y los tonos claros, valores altos, según el comportamiento
que presenta cada cubierta en la banda espectral que se estudia.
Por otra parte, la combinación de tres bandas del espectro con asignación de uno de los
tres colores básicos a cada banda, permite disponer de imágenes en color, similares a la
realidad cuando las bandas corresponden a las regiones azul, verde y rojo del espectro y los
colores se han asignado en ese orden, o en falso color cuando responden a un orden distinto,
ya sea de bandas o de colores.
La textura, referida a la suavidad o rugosidad que presenta una región de la imagen,
significa la agrupación de elementos que, aunque no pueden distinguirse individualmente, se
pueden discriminar en función de la disposición que evidencian, según una textura gruesa,
media o fina. De modo similar, las estructuras repetitivas dentro de la imagen, como algunas
plantaciones de arbolado, brindan elementos que, independientemente del color y la tonalidad,
permiten determinar características distintivas de la superficie terrestre.
En realidad, el tratamiento digital no es incompatible con el análisis visual, pues la
interpretación visual de algunos fenómenos reviste gran importancia en el apoyo y asistencia
del tratamiento digital, especialmente cuando es necesario recurrir a criterios abstractos que,
hasta ahora, sólo la inteligencia humana puede resolver.
La imagen considerada como matriz numérica, es decir, adquirida como archivo de
información digital, presenta la enorme ventaja de permitir la ejecución de operaciones
comunes del cálculo matricial, como restar, sumar, dividir, o multiplicar, permitiendo también
48

desde la estadística, determinar medidas de posición, calcular desviaciones, obtener


histogramas de distribución de frecuencias de niveles de radiancia, o diagramas de dispersión
entre bandas con sus correspondientes coeficientes de correlación, entre otros.
Como puede advertirse, las operaciones que se realizan con las imágenes satelitales
deben atender siempre a la consideración de niveles digitales, cuyo valor numérico consiste
en la traducción de una señal energética, por lo que dependiendo de las características de cada
aplicación, sólo tendrá sentido la ejecución de determinadas operaciones.
El tratamiento digital de imágenes requiere, entonces, operar con grandes volúmenes
de información, ya que por ejemplo, una sola banda espectral de imagen Landsat TM implica
disponer de valores digitales para 36 millones de píxeles, cuyo tratamiento explica la
necesidad de contar con asistencia de computadoras.
La visualización misma de las imágenes digitales se realiza a través del monitor de una
computadora, la que convierte los valores numéricos en tonos de gris por medio de su
convertidor digital analógico y en el que la calidad de la imagen depende de la memoria
gráfica disponible.
El tratamiento digital de imágenes satelitales incluye, en general, operaciones de
visualización, determinación de estadísticas elementales a los fines de obtener información de
interés para su interpretación, permitiendo además, abordar operaciones de realce o
transformación adecuadas a las características de la aplicación que se persigue, combinación
entre distintas bandas espectrales -denominadas composiciones en color-, corrección de
anomalías que afectan la localización de los píxeles y sus valores digitales, para finalmente
llegar a la clasificación como fase culminante del tratamiento digital.
El resultado de la clasificación digital consiste en la representación cartográfica e
inventario superficial de las categorías objeto de estudio, confirmando que la interpretación de
los niveles digitales adquiridos por el sensor posibilita un mejor conocimiento de los recursos
naturales del territorio.

3.2 Selección y adquisición de imágenes satelitales en Argentina

La adquisición de imágenes satelitales en territorio de la República Argentina, se


realiza a través de la Comisión Nacional de Actividades Espaciales (CONAE), que ha sido
creada por Decreto Nº 995 del año 1991 y ratificada por el artículo 23 de la Ley 24.061.
Coexisten, claro está, empresas comerciales que asimismo son proveedoras de imágenes
satelitales.
La CONAE tiene la exclusividad y el control de la actividad espacial nacional, y tiene
a su cargo la captación y comercialización de datos satelitales a través de la Estación Terrena
Córdoba que está ubicada en el Centro Espacial Teófilo Tabanera de Ruta Provincial C-45,
Km 8, Falda del Carmen, Provincia de Córdoba.
49

La Estación Terrena de Falda del Carmen tiene capacidad para recibir, almacenar,
catalogar, preprocesar imágenes con correcciones radiométricas, geométricas y
georreferenciaciones con puntos de control, como así también, distribuir imágenes de alta
resolución procedentes de distintos sistemas, entre los que se destacan los sistemas Landsat,
Spot y SAC-C. La comercialización de imágenes Landsat, por ejemplo, se ha iniciado en
Marzo de 1997, no obstante es posible conseguir imágenes adquiridas por el sistema a partir
de Enero del mismo año.
Como puede suponerse, el tipo de imagen a adquirir depende de los objetivos de
cada trabajo, por lo que resulta imprescindible considerar los requerimientos de la aplicación
a los fines de lograr un equilibrio en el análisis costos-beneficios.
Las imágenes pueden adquirirse según distinta resolución o capacidad de discriminar
información de detalle, lo que condiciona la elección del sistema sensor e influye
directamente en el costo de adquisición, ya que el precio de las imágenes depende
fundamentalmente de la resolución espacial y espectral que se pretende.
De acuerdo con Chuvieco (1998)1, el concepto de resolución involucra no sólo la
consideración espacial y espectral, sino también consideraciones radiométricas y temporales.
Teniendo en cuenta que los principales sistemas de teledetección aplicados a la
exploración de recursos terrestres coinciden en registros de 256 niveles de radiancia, la
resolución radiométrica no constituye un aspecto que condicione -al menos por ahora- la
elección de imágenes satelitales a los fines de la evaluación de recursos naturales.
La frecuencia temporal con la que es posible obtener imágenes, en cambio, adquiere
particular importancia en estudios de fenómenos dinámicos como el seguimiento de
inundaciones, incendios forestales, plagas que afectan cultivos, y otros fenómenos que
necesitan de observaciones casi continuas y en plazos relativamente breves, por lo que puede
constituir un aspecto condicionante en función de determinados objetivos de trabajo.
La resolución espacial, referida a la capacidad de un sensor para discriminar objetos de
cierto tamaño, se mide en unidades de longitud en relación a la mínima separación que puede
existir entre dos objetos para que puedan ser distinguidos, es decir, corresponde al tamaño de
píxel como mínima unidad de información, y en consecuencia, cuanto más alta es la
resolución, implica menor dimensión de píxel y mayor posibilidad de distinguir objetos más
pequeños.
La resolución espectral, por su parte, se refiere al número de bandas espectrales que
puede discriminar el sensor y a la amplitud que posee cada banda, significando que una mayor
resolución espectral se traduce en mejor discriminación de cubiertas por el distinto
comportamiento que las mismas presentan en cada banda del espectro.

1
- CHUVIECO, Emilio: Fundamentos de Teledetección Espacial. Editorial Rialp.
Madrid. 1998.
50

Las amplitudes de bandas resultan trascendentes para la discriminación de


determinadas cubiertas, ya que bandas muy anchas registran valores promedios que implican
pérdida de información sobre regiones específicas del espectro.
Los programas Landsat y Spot ofrecen grillas de localización de las imágenes para
facilitar la búsqueda y selección de escenas y subescenas que recubren zonas de interés,
permitiendo observar si el área de estudio se incluye íntegramente en una única imagen o si se
descompone en más de una.
Es necesario tener en cuenta que por efecto de la inclinación de las órbitas de satélites
y del movimiento de rotación terrestre, resultan imágenes romboidales orientadas en dirección
NE-SO. Para Landsat 5, por ejemplo, con período de revolución de 98,9 minutos y tamaño de
escena de 185 km x 185 km, el tiempo aproximado que emplea el satélite para recorrer la
escena es:

98,9 minutos · 185 km · 60 segundos = 27 segundos


40.000 km 1 minuto

Como la Tierra gira 360° en 24 horas, en 27” girará unos 405", es decir, 6' 45". Así,
entre la primera fila de píxeles y la última, se observará un desplazamiento importante. Para
calcular dicho desplazamiento, se recordará que la circunferencia terrestre en los planos
paralelos, decrece según el coseno de la latitud, desde los 40.000 km que aproximadamente
mide el Ecuador, hasta cero en los Polos.
En consecuencia, para la ciudad de Catamarca, por ejemplo, ubicada a unos 28° de
latitud Sur, el desplazamiento será:

Desplazamiento = 0° 06’ 45” ≅ 11 km

40.000 km · 0º 06' 45" · cos 28º ≅11 km


360°

Figura 3.1: Desplazamiento en escena completa de Landsat TM – Banda 5 – para latitud de 28° S
51

Las grillas de localización de escenas, cuadrantes de subescenas, fechas de


adquisición, número de bandas, así como toda información de interés, puede consultarse en la
página web de CONAE: www.conae.gov.ar

Figura 3.2: Grilla de selección de imágenes Landsat correspondiente a la Provincia de Catamarca (Argentina)

El análisis de resolución espectral implica considerar qué bandas resultan útiles para la
tarea que se propone, y en líneas generales se sostenía que Landsat 5 posibilitaba mejor
discriminación de cubiertas que Spot 4, al registrar niveles de radiancia en mayor número de
porciones del espectro. Distintos autores han señalado que, en realidad, aún no ha sido posible
evaluar de qué manera incide la mejor resolución espacial de Spot frente a su menor
resolución espectral para distinguir cubiertas, y en la práctica, algunos trabajos han requerido
combinar imágenes Spot con Landsat TM para complementar las mejores resoluciones que
ofrecen ambos programas. En la actualidad, las imágenes proporcionadas por Landsat 7
ETM+ y Spot 5 permiten soluciones más que adecuadas.
52

Otro aspecto importante a considerar, es la fecha de adquisición de la imagen,


particularmente cuando se dispone de un presupuesto reducido y se hace necesario seleccionar
una sola imagen. Para clasificaciones basadas en vegetación se prefiere siempre el verano,
estación en la que coincide el mayor vigor de biomasa con el mayor ángulo de elevación
solar, implicando una máxima radiancia.

3.3 Equipamiento requerido para el tratamiento digital

El tratamiento digital de imágenes satelitales requiere dispositivos de entrada de datos,


equipos de procesamiento y dispositivos de salida.
El periférico de entrada más común para grandes volúmenes de datos es el lector de
CD-ROM, y las imágenes se adquirieren en disco compacto con las ventajas de fácil
transporte y fácil lectura. Otros elementos utilizados con frecuencia -además, obviamente, del
teclado y el mouse o ratón electrónico-, son las mesas digitalizadoras y los scanners.
La unidad de proceso o computadora propiamente dicha, requiere cierta capacidad de
cálculo, resultando adecuado un procesador Pentium de última generación, o aún mejor, una
estación de trabajo si las posibilidades económicas lo permiten. Como señalara Chuvieco
(1995)2, con aspiraciones modestas y presupuestos reducidos, es posible abordar el
tratamiento digital de imágenes satelitales a través de procesadores de bajo costo, teniendo en
cuenta que la mayor o menor potencia de la computadora se traduce en el tiempo de proceso.
La capacidad de almacenamiento del disco rígido debe ser suficiente, no sólo para el
volumen de datos a leer, sino para las nuevas imágenes que se generan a través de las distintas
operaciones. Debe considerarse que cada banda en una imagen Landsat ocupa 36 Megabytes,
por lo que 7 bandas requieren 242 Mb de almacenamiento antes de iniciar el tratamiento
digital.
Es importante disponer de periféricos de salida de calidad, ya que el resultado del
trabajo se aprecia, en realidad, tanto a través del monitor, como a través de la impresora, de un
plotter o de una filmadora analógica de diapositivas. La capacidad de visualización de
imágenes, por ejemplo, es función de la memoria gráfica, por lo que se requiere una plaqueta
gráfica potente y pantalla superior a la común de 15".
La calidad de los periféricos que producen resultados en papel o en diapositivas,
depende de las exigencias del trabajo que se propone, justificándose las inversiones más
elevadas sólo cuando se persigue una producción cartográfica continua que pudiera
amortizarlos.

2
CHUVIECO, Emilio: Teledetección y S. I. G. para la conservación del medio
ambiente. Universidad Nacional de Cuyo. Mendoza. Argentina. 1995.
53

3.4 Almacenamiento de la imagen

El soporte físico de la imagen proporcionada por CONAE es el disco compacto (CD),


y la forma en que se organizan los datos en el soporte para su posterior lectura, es decir, el
almacenamiento, puede obedecer a distintos sistemas que se individualizan como diferentes
formatos de archivo, identificados por la extensión añadida al nombre de archivo, como por
ejemplo, “.TXT”, “.DOC”, “.BMP”, “.TIF”, etc.
Es común la creación de formatos de archivo para ser usados por una aplicación en
particular, y en consecuencia, distintas aplicaciones requieren diferentes formatos. Así por
ejemplo, las imágenes creadas en CorelDRAW se almacenan como archivos “.CDR”, las
imágenes visualizadas por Idrisi1 o Idrisi2 se almacenan como archivos “.IMG”, mientras las
imágenes en formato raster de Idrisi32 y Kilimanjaro se almacenan con extensión “.rst”.
Debe advertirse aquí, que la forma raster hace referencia a la manera en que se
representa la información gráfica. Raster implica subdivisión del espacio geográfico en
elementos discretos a través de una malla de filas y columnas regularmente espaciadas. Las
celdas que quedan definidas entre cada fila y columna se denominan precisamente píxel
(picture x element), y su tamaño con respecto al mundo real determina la resolución del
sistema. Otra forma de representar la información gráfica, se denomina vectorial, y consiste
en una representación continua del espacio, basada en la utilización de entidades gráficas
como puntos, líneas y áreas, definidas por sus coordenadas x e y, requiriendo en general,
menor información almacenada para su representación espacial.
Una imagen Landsat TM completa, proporcionada por CONAE en CD, consta de siete
archivos cuya extensión es, en general, “.TIF” -uno por cada banda-, más un archivo con
extensión “.DAT” denominado HEADER, que suministra la información de cabecera o
referencia. La información de cabecera resulta imprescindible para visualizar las imágenes, ya
que contiene la cantidad de filas y columnas que configuran las mismas, tamaño de píxel,
factor de bloque, fecha de adquisición y demás datos en relación con el tipo de producto y
proyección utilizada, como puede observarse en el ejemplo de la página siguiente.
El factor de bloque indica si los archivos de imagen se han grabado en formato
comprimido, procedimiento utilizado con frecuencia para ahorrar espacio en disco. Debe
tenerse en cuenta que, un archivo en formato de 1 bit admite sólo 2 colores (blanco y negro),
de 2 bits admite 4 colores, de 4 bits admite 16 colores, de 8 bits admite 256 colores y de 24
bits admite 16 millones de colores. En consecuencia, a mayor número de colores, mayor es el
espacio en disco que ocupa el archivo.
Los archivos de imágenes de satélite se han grabado tradicionalmente en formatos
BSQ (Band Sequential), BIL (Band Interleaved by Line), o BIP (Band Interleaved by Pixel),
implicando diferentes modos de organización de los datos que componen la imagen. Así, en la
bibliografía referida a teledetección espacial, siempre se mencionan dichos formatos.
54

INFORMACION DE CABECERA (Header)

PRODUCT =97295000171 WRS =230/080F ACQUISITION DATE =1997-07-16

SATELLITE =L5 INSTRUMENT =TM10 PRODUCT TYPE =ORBIT ORIENTED

PRODUCT SIZE =FULL SCENE TYPE OF GEODETIC PROCESSING =SYSTEMATIC

RESAMPLING =NN RAD GAINS/BIASES = +0.7314/-1.5000 +1.3533/-3.1000 +0.9714/-2.7000

+1.0686/-2.5000 +0.1429/-0.4500 +0.0000/+0.0000 +0.0757/-0.3000

TAPE SPANNING FLAG=1/1 START LINE #= 1 LINES PER VOL= 5760

ORIENTATION = -9.44 PROJECTION =UTM USGS PROJECTION # =GRS 80

USGS MAP ZONE = 20 USGS PROJECTION PARAMETERS = 0.000000000000000

0.000000000000000 0.000000000000000 0.000000000000000 0.000000000000000


0.000000000000000 0.000000000000000 0.000000000000000 0.000000000000000
0.000000000000000 0.000000000000000 0.000000000000000
EARTH ELLIPSOID =GRS80 SEMI-MAJOR AXIS =6378137.000

SEMI-MINOR AXIS =6356752.300 PIXEL SIZE =30.00 PIXELS PER LINE= 6920

LINES PER IMAGE= 5760 UL 0653519.0001W 275832.0001S 245360.391 6902955.500

UR 0635752.0000W 281445.0000S 405378.969 6875354.250 LR 0641833.0002W

294552.0001S 373407.469 6706760.250 LL 0655600.0002W 292940.0000S 215568.453

6733822.250 BANDS PRESENT =1234567 BLOCKING FACTOR = 1

RECORD LENGTH = 6920 SUN ELEVATION =26 SUN AZIMUTH = 42

CENTER 0645656.0001W 285213.0000S 309901.219 6804994.000 0 0 2880 OFFSET= REVB

El formato BSQ significa un almacenamiento de valores de píxel, fila por fila


correspondientes a la banda 1, luego, los valores fila por fila correspondientes a la banda 2, y
así sucesivamente hasta completar la última banda. En el formato BIL, en cambio, los valores
de píxel se almacenan entrelazados por banda: primero la fila 1 de la banda 1, a continuación
la fila 1 de la banda 2, luego la fila 1 de la banda 3, y así hasta terminar. El formato BIP, por
su parte, es el modo de almacenamiento en el que se alternan valores de píxel, píxel a píxel y
banda a banda, por lo que se graba en primer lugar el píxel 1 de la banda 1, luego el píxel 1 de
la banda 2, a continuación el píxel 1 de la banda 3, continuando en este orden hasta completar
la imagen.

Debe advertirse, no obstante, que los formatos BSQ, BIL y BIP se han diseñado
cuando apenas se iniciaba el procesamiento de imágenes por computadora. Así, el formato
55

BIP se ha utilizado con las primeras computadoras personales, caracterizadas por severas
limitaciones de memoria y por imponer una fuerte necesidad de ahorro de tiempo de proceso
en la búsqueda de sub-imágenes dentro de la imagen completa. Del mismo modo, el formato
BSQ ha respondido al almacenamiento en cinta, dispositivo que posibilitaba la grabación de
la información de cabecera seguida de cada una de las bandas en la forma ya descripta.
El notable desarrollo de la informática, con potentes computadoras personales y
mayores capacidades de almacenamiento de datos, tanto en discos rígidos como en los
dispositivos de CD-ROM, ha simplificado el empleo de formatos, con lo que la imagen que se
adquiere en formato “.TIF” corresponde en realidad a un formato BSQ en el que cada banda
se registra separadamente, en su propio archivo, con extensión que ahora no se denomina
BSQ para diferenciar los archivos actuales de aquellos que se grababan secuencialmente en
cinta.

3.5 Visualización de imágenes satelitales

El primer proceso a realizar para el tratamiento digital de imágenes, consiste en la


lectura de los datos originales. Para ello, Idrisi1 o Idrisi2, requieren archivos con extensión
“.IMG” asociados a archivos de documentación con extensión “.DOC”, imprescindibles para
recrear correctamente las imágenes a los fines de su visualización y análisis. En Idrisi32 y en
Kilimanjaro, como se señalara, se requiere la extensión “.rst”.
La estructura real de una imagen, como verdaderamente se graba, está dada por una
simple secuencia de números, mientras la estructura lógica, en cambio, es una matriz, cuyas
filas y columnas se numeran en Idrisi a partir de cero, correspondiendo el elemento 0,0 a la
esquina superior izquierda y numerándose a partir de éste, las filas de arriba hacia abajo y las
columnas de izquierda a derecha.
La estructura matricial, denominada también estructura grilla-celda, se reconstruye en
Idrisi1 o Idrisi2 a partir del archivo de documentación, requiriendo renombrar el archivo de
extensión original “.TIF” en la extensión “.IMG”, y crear con el módulo DOCUMENT su
archivo de documentación en el que se transcribe la información de cabecera proporcionada
por HEADER.DAT, referente a tamaño y condiciones de la imagen. En Idrisi32 y en
Kilimanjaro, en cambio, se utiliza el comando TIFIDRIS de importación de archivos (File –
Import – Desktop Publishing Formats) y se ingresan los datos solicitados -a partir de la
información de cabecera- para completar la documentación de la imagen.
El archivo de documentación para Idrisi, comprende campos analíticos y campos con
propósito de información, y en relación con ellos, el sistema sugiere ingresar todos los datos
disponibles, no sólo en lo que hace a información vital para reconstruir la imagen, sino
también la que puede resultar útil para una mejor identificación. En Idrisi32 y en Kilimanjaro,
el mismo software toma la información necesaria del archivo HEADER.DAT.
56

Entre los datos que deben ingresarse al archivo de documentación, se destaca el tipo
de dato numérico que contiene el archivo de imagen, ya sea entero, byte o real. La imagen
Landsat proporcionada por CONAE, por ejemplo, tiene valores en bytes, es decir, números
enteros positivos en el intervalo 0-255 que requieren 8 bits de memoria para almacenamiento
-esto es, 1 byte-, y constituye el tipo de dato de uso más generalizado en GIS al facilitar el
rango adecuado para la información proveniente de sensores remotos.
También debe especificarse el formato de archivo de imagen, ya sea binario, ASCII, o
binario empaquetado, información que como se señalara, surge del archivo de cabecera. Los
archivos de documentación, por ejemplo, se almacenan siempre en formato ASCII y referidos
como archivos de texto que pueden accederse a través de distintos editores –por ejemplo,
Word, entre otros. El módulo CONVERT de Idrisi, permite convertir un formato en
cualquiera de los restantes, ya que trabaja con 7 formas distintas de datos: ASCII entero,
ASCII real, byte binario, binario entero, binario real, byte binario empaquetado y binario
entero empaquetado. A manera de ejemplo, el archivo de documentación para la banda 5 de
la imagen Landsat TM provista por CONAE, puede verse como sigue:

file title: CATAMARCA: Dpto. El Alto - Landsat TM 230/80 Banda 5 - Julio, 1997
data type : byte
file type : binary
columns : 6920
rows : 5760
ref. system : plane
ref. units :m
unit dist. : 1
min. X :0
max. X : 207600
min. Y :0
max. Y : 172800
pos'n error : unknown
resolution : 30
min. value :0
max. value : 255
value units : niveles digitales
value error : unknown
flag value : none
flag def'n : none
legend cats :

Significa que la imagen está en formato byte, almacenada como un archivo binario, y
contiene 5.760 filas y 6.920 columnas, que totalizan 39.859.200 valores. La imagen está
georreferenciada con un sistema arbitrario de coordenadas planas en el que cada unidad de
coordenadas representa 1 metro. Los valores mínimos y máximos de coordenadas X e Y
proporcionan las coordenadas del sistema de referencia de los extremos izquierdo, derecho,
superior e inferior.
57

La referencia al error de posición se consigna a los fines de completar la información -


el campo no es analítico- y se señala aquí como desconocido. La resolución, en cambio, es un
campo analítico referido a la resolución espacial, que como se ha señalado, es de 30 metros
para Landsat TM.
Los campos valor mínimo y valor máximo registran el rango de valores
correspondientes a la resolución radiométrica, por lo que corresponde consignar 0 y 255,
respectivamente. El valor de error se refiere al error en los niveles digitales de píxeles,
señalándose aquí como desconocido.
Finalmente, los campos valor de señal y definición de señal se utilizan para indicar el
significado especial que puede adjudicarse a determinados valores de píxel, mientras las
categorías de leyenda registran el número y especificación de categorías cuando los valores
mínimo y máximo se refieren a datos cualitativos -clasificaciones de cubiertas, entre otras-.
Una vez creado el archivo de documentación, es posible visualizar la imagen con el
módulo DISPLAY LAUNCHER de Idrisi, que ofrece opciones de selección de paleta, factor
de expansión y auto escalado.
La paleta indica la naturaleza gráfica de hasta 256 colores diferentes y referenciados
según un índice numérico, así por ejemplo, un índice 10 en una paleta indicará una mezcla
particular de rojo, verde y azul (RGB) que se aplica cuando el píxel tiene un nivel digital 10.
Idrisi posee un conjunto estándar de paletas y permite modificar las mismas o crear otras
nuevas. Al visualizar una sola banda, es común que se despliegue en el monitor una imagen
en tonos de gris, significando que a cada nivel digital o valor de píxel se le asigna la misma
proporción de los tres colores elementales -rojo, verde y azul-, y cuyo aspecto resulta similar a
una fotografía aérea convencional.
El auto escalado, por su parte, implica la relación existente entre los valores de píxel y
los valores índices de la paleta, asumiendo por defecto una relación directa entre ambos, de
modo que un píxel de nivel digital 23, por ejemplo, se traduce en el color definido por el
índice 23 de la paleta. No obstante, el rango de auto escalado puede modificarse al limitar el
rango de índices de la paleta, de manera que en distribuciones de niveles digitales que
demuestran concentración en intervalos menores a 0-255, puede ajustarse el auto escalado al
rango deseado para mejorar el contraste.
El factor de expansión, la restante opción de visualización de imágenes, determina el
tamaño en el que la imagen puede ser observada en el monitor. Así, para la visualización
completa de cualquiera de las 7 bandas de la escena completa de Landsat, el sistema fija un
factor de expansión -13 que significa una reducción de su dimensión a partir de un muestreo
sistemático por el que se exhibe una columna y fila de cada 13. El factor puede modificarse a
efectos de examinar la imagen en mayor detalle, resultando una visualización parcial de
determinado sector de la imagen que es necesario desplazar para observar un sector distinto.
58

3.6 Análisis estadístico de las imágenes

En general, todos los softwares de tratamiento digital de imágenes incluyen el cálculo


de estadísticas elementales, ya que el análisis estadístico sustenta las consideraciones básicas
para la interpretación de imágenes y ayuda a seleccionar los procedimientos más adecuados
para el tratamiento digital. En este sentido, Idrisi dispone de un módulo específico -
STATISTICS- para obtener, entre otros, histogramas de frecuencias y diagramas de
dispersión.
Puesto que el rango 0-255 de las diferentes bandas se traduce en histogramas de
determinadas características, los histogramas de frecuencias permiten determinar la capacidad
que tiene cada banda de discriminar las distintas cubiertas y asociar los valores pico a las
categorías de interés. Así, las distribuciones más anchas evidencian mayor sensibilidad de
discriminación, lo que en términos numéricos se mide con la dispersión.
Idrisi proporciona histogramas de frecuencias gráficos y numéricos, con especificación
de valores máximos y mínimos, media y desviación estándar.

Figura 3.3: Histograma de frecuencias de una escena completa de Landsat TM

A los fines de precisar qué valor de media calcula Idrisi, debe considerarse que la
media aritmética es una medida de posición, conocida comúnmente como promedio, y
consiste en la suma de todos los valores de nivel digital de píxeles de la imagen, dividida en el
número total de píxeles.
En el caso de variables discretas agrupadas en una tabla de frecuencias, la media "x" se
conoce como media aritmética ponderada -corresponde a la que proporciona Idrisi-, siendo
igual a:
59

Donde xi representa los distintos valores que toma la variable, y "n" su


correspondiente frecuencia absoluta.
La desviación estándar, definida como la raíz cuadrada positiva de la sumatoria del
cuadrado de las desviaciones con respecto a la media aritmética dividida por el número de
observaciones:

proporciona otra medida de comparación entre las distintas distribuciones. Si las posiciones
son las mismas, ellas pueden diferir en su variabilidad, o por el contrario, pueden tener la
misma variabilidad y diferir en sus localizaciones. En otras palabras, distribuciones que
presentan una desviación estándar pequeña indican que los valores digitales de los distintos
píxeles que componen la imagen ocupan una pequeña parte del rango 0-255, y para visualizar
la imagen en detalle, es preciso definir paletas ajustadas a intervalos menores. Si en cambio,
la desviación estándar es muy grande, es posible que indique niveles digitales que asumen
valores muy altos y valores muy bajos, con pocos valores en la franja media del intervalo.
Cuando dos conjuntos de datos presentan distintos promedios, la comparación de las
variabilidades se realiza a través del cociente de variación, que está dado por:

El cociente de variación CV, se utiliza para comparar la homogeneidad de distintas


series de datos, puesto que una mayor concentración de valores alrededor del promedio
implica menor CV y mayor homogeneidad, debiéndose tener en cuenta que, en el análisis de
imágenes satelitales, la mejor discriminación de cubiertas obedece a la homogeneidad menor.
Sistemas más potentes que Idrisi, como ERDAS (Chuvieco, 1995), permiten obtener
otras medidas centrales con sus dispersiones, resultando de gran utilidad cuando las
distribuciones son asimétricas, en cuyo caso la media pierde representatividad por la presencia
de valores atípicos que la distorsionan. La mediana, definida como el nivel digital que divide
el conjunto de píxeles en dos subconjuntos que contienen la misma cantidad de datos, o la
moda, definida como el nivel digital que ocurre con mayor frecuencia, ofrecen medidas de
posición aplicables en distribuciones que no son simétricas. Se recordará que en el caso de
distribuciones simétricas, coinciden media, mediana y moda. En las distribuciones bimodales,
en cambio, ninguna medida de posición provee información útil.
La correlación entre bandas constituye otro aspecto interesante que es posible analizar
a partir del módulo STATITICS de Idrisi. Un gran número de autores de tratados sobre
teledetección -Bosque Sendra, Chuvieco y Pinilla, entre otros-, señalan la existencia de fuertes
correlaciones entre algunas bandas, significando que la información facilitada por una banda
del espectro resulta muy similar a la ofrecida por otra. Para comprobar este hecho, puede
abordarse un análisis de regresión entre bandas a través del comando REGRESS, que
60

proporciona la nube de puntos y la recta ajustada con los valores del coeficiente de
correlación.
El coeficiente de correlación lineal "r", indica el grado de intensidad de la relación
entre dos bandas, denominándose lineal porque la forma de relación que liga ambas bandas
corresponde a la ecuación de una recta. El coeficiente varía entre 1 y -1, según sea la
correlación positiva o negativa, y cuando se acerca al valor cero, significa que no están
correlacionadas.

Figura 3.4: Correlación entre bandas

A partir de la aplicación del comando REGRESS, se obtiene no sólo la representación


gráfica de la regresión y el coeficiente de correlación lineal, sino también, los valores
correspondientes a los estimadores de la relación funcional, el coeficiente de determinación,
las desviaciones estándar de cada banda, y los errores estándar del estimador de la ordenada al
origen y del estimador b (pendiente de la recta).
En Matemática, la relación funcional implica que, dado un valor de x, se asigna un
valor a la variable y, puesto que ambas variables están relacionadas por una fórmula exacta.
Desde un enfoque estadístico, en cambio, debe tenerse en cuenta que algunos o ninguno de los
niveles digitales puede que caigan exactamente sobre la recta: la aleatoriedad de los valores
hace imposible una relación perfecta, aunque exista una relación funcional entre las dos
bandas. Precisamente, el coeficiente de determinación r2 -que varía entre cero y uno, y puede
expresarse en tanto por ciento-, mide la bondad del ajuste de los puntos a la recta de regresión,
acercándose a cero cuando el ajuste es peor, y acercándose a 1 (o al 100 %) cuando es mejor.
61

En definitiva, los diagramas de dispersión permiten determinar qué bandas son más
convenientes, ya que en el caso de dos bandas altamente correlacionadas, la que aporta mayor
información será la que presenta mayor varianza. Por otra parte, la identificación de
categorías resulta complicada a partir del histograma de una sola banda, pero se simplifica a
partir de los diagramas de dispersión, puesto que pueden considerarse como histogramas
bivariados -histogramas de las dos bandas, relacionados entre sí-.
A los fines de analizar los coeficientes de determinación obtenidos para cada par de
bandas, resulta conveniente elaborar tablas como la Tabla 3.1 en la que se han consignado los
valores resultantes de la aplicación del comando REGRESS de Idrisi, para las bandas
correspondientes al visible y al infrarrojo de una imagen Landsat TM.

Tabla 3.1: Correlaciones entre bandas de una imagen Landsat TM

Correlaciones
TM1 TM2 TM3 TM4 TM5 TM7
TM1 1 0,85 0,86 0,56 0,71 0,74
TM2 1 0,92 0,65 0,75 0,77
TM3 1 0,58 0,83 0,85
TM4 1 0,46 0,43
TM5 1 0,93
TM7 1

En el trabajo con diagramas de dispersión de niveles digitales, es necesario tener en


cuenta que cada banda de la imagen se representa como un eje del diagrama. Así, cada píxel
de la imagen ocupa un punto en el diagrama de dispersión, cuya coordenada en el eje
correspondiente resulta igual al valor que tiene el píxel (nivel digital) en dicha banda. De esta
manera, a un píxel de la imagen le corresponde sólo un punto del diagrama, mientras un punto
del diagrama puede corresponder a múltiples píxeles de la imagen.
Como los diagramas de dispersión en dos dimensiones utilizan sólo dos bandas,
resultan relativamente sencillos de visualizar. No obstante, el concepto puede extenderse a
más de dos dimensiones, y si por ejemplo se cuenta con seis bandas, teóricamente puede
construirse un diagrama de dispersión de 6 dimensiones. Se ha señalado3 que los aspectos a
analizar en los diagramas de dispersión de niveles digitales incluyen: forma de la nube de
puntos, posición de cada píxel, tamaño de la nube de puntos y densidad de algunas
ubicaciones de interés dentro de la nube de puntos.
La forma de la nube de puntos está dada por la signatura espectral de los materiales de
la escena. En consecuencia, si se sustituyeran materiales o incorporaran materiales a la

3
- Research Systems, Inc. – Hyperspectral Image Analysis en ENVI. Washington DC.
2002.
62

escena, cambiaría la forma del diagrama. La posición de un píxel dentro de la nube de puntos
está dada por los materiales correspondientes al píxel, los que determinan la reflectancia en
cada una de las bandas.
El tamaño de la nube de puntos está dado por el rango de reflectancia de los materiales
de la escena. Esto es, escenas que incluyen tanto niveles digitales altos como bajos se
traducen en nubes de puntos más largas que las nubes de puntos de escenas con materiales de
similares niveles digitales.
La densidad de la nube de puntos está dada por cuán comunes o variados son los
materiales en la escena, puesto que si un material se presenta repetidamente en la escena, la
nube de puntos tendrá muchos píxeles que se grafican en la misma región del diagrama de
dispersión.
La publicación citada en ( 3 ), proporciona el siguiente ejemplo que resulta de gran
utilidad a los fines de analizar distintas cubiertas dentro de una imagen, a partir del diagrama
de dispersión:
• Si se grafican los niveles digitales de tres materiales distintos (vegetación, roca y
agua), el diagrama de dispersión podrá verse como el de la Figura 3.5.
• Si se considera un píxel que contiene 50% de vegetación y 50% de roca, éste
puede graficarse en la mitad entre vegetación y roca, a lo largo de la línea que
conecta estos dos puntos.
Figura 3.5: Un diagrama de dispersión que muestra el comportamiento espectral
de tres elementos y sus mezclas

255

Roca
+
1
Banda Y 2 + Vegetación
+
+
+ Agua
0 255
Banda X
1 - Mezcla 50/50
2 - Mezcla de 3 elementos

Fuente: Research Systems, Inc. – Hyperspectral Image Analysis en ENVI (2002)

• Si un píxel tiene partes iguales de los tres elementos, entonces puede graficarse en
el centro del triángulo definido por los puntos correspondientes a vegetación, roca
y agua. Si el píxel tiene 80% de agua y sólo 10% de vegetación y 10% de roca,
entonces el píxel se graficará mucho más cerca del punto que corresponde a un
63

píxel puro de agua, aunque aún permanecerá dentro del triángulo definido por los
tres puntos.
• Si este análisis se extiende, se verá que los píxeles puros siempre se graficarán en
las esquinas de una nube de puntos, mientras que los píxeles mezcla siempre se
graficarán en el interior de la nube.
• El valor espectral que define las esquinas de una nube de puntos para una imagen,
en general se denomina “endmember” (miembro extremo) de la imagen. Dichos
valores espectrales representan ejemplos puros de los diferentes materiales que
existen dentro de la imagen.

3.7 Realces y mejoras de la imagen

Al comparar el aspecto que presenta la visualización en monitor de la imagen tomada


como ejemplo, en las bandas 3 y 4 que corresponden al rojo y al infrarrojo cercano, se hace
evidente el tono más oscuro de la banda 3, ya que el valor medio de sus niveles digitales
resulta menor, y cuanto mayor es el nivel digital, más claro aparece el píxel en la
visualización de la imagen.

Figura 3.6: Tonalidades en banda 3 (sup. izquierda) y banda 4 (inf. derecha) de Landsat TM
64

Tomando una ventana de la escena completa, correspondiente a dichas bandas, se


pueden comparar las distintas tonalidades en la Figura 3.6.
La desviación estándar y la varianza hacen explícita la idea de uniformidad de los
valores que componen cada banda y el rango de contraste que existe entre ellos. La razón
física del comportamiento diferente de los niveles digitales en las dos bandas, radica en la
distinta respuesta que ofrece la vegetación en cada una de ellas: la reflectividad es mayor en el
infrarrojo cercano.
Es necesario recordar que los sensores TM están diseñados con una resolución
radiométrica de 256 niveles digitales para abarcar la gama de reflectancia de todas las
cubiertas terrestres, desde la mínima reflectividad del agua hasta la máxima reflectividad de la
nieve o de la arena, y por lo común, las imágenes ocupan sólo una parte del intervalo 0-255,
traduciéndose en general, en imágenes poco contrastadas, cuyos histogramas no recogen toda
la variación posible de tonos. Así, el rango de niveles digitales en la banda 3, por ejemplo,
indica la necesidad de ajuste de contraste para ocupar el rango completo de visualización y
diferenciar mejor sus distintas tonalidades.
A los fines de mejorar el contraste, es posible realizar distintas operaciones,
señalándose como técnicas más habituales las que consisten en expansión del contraste, ya sea
lineal simple -entre los niveles digitales máximo y mínimo de la imagen original-, lineal con
saturación -con saturación basada en la función de distribución-, de ecualización de
histograma, y expansiones especiales.

Figura 3.7: Relación entre niveles digitales de una imagen (ND) y niveles de visualización (NV)

La expansión lineal del contraste requiere asociar el nivel digital mínimo y el nivel
digital máximo de la imagen, a los niveles de visualización 0 y 255, respectivamente.
Para ello, se introduce una función lineal que sustituya NV = ND. La función lineal
resulta del tipo:
65

Obteniendo:
Figura 3.8: Expansión lineal del contraste

Es posible también, cambiar los umbrales mínimo y máximo, por dos desviaciones
estándar que se restan o suman, respectivamente, al valor de la media:

Umbral Mínimo = x - 2 D(x) Umbral Máximo = x + 2 D(x)


Figura 3.9: Gráfico de expansión del contraste por ecualización de histograma
y resultados obtenidos en banda 3 de Landsat TM
66

La aplicación del procedimiento de ecualización de histograma, en cambio, implica


asignar mayor rango de nivel digital a los niveles digitales más frecuentes de la imagen
original. Resulta entonces, una imagen con mejor separación de valores entre niveles
digitales, que responde a la forma de distribución de frecuencias de los valores primitivos,
obteniéndose un realce más detallado.
La expansión especial del contraste, por su parte, tiene por objeto restringir el
contraste a un rango específico de niveles digitales en el que se manifiesta una determinada
cubierta de interés. Puede realizarse por el método lineal, según umbrales mínimos y máximos
de los niveles digitales correspondientes a la cubierta elegida, o también por ecualización de
histograma cuando se limita a una ventana que contiene dicha cubierta. No obstante, para
aislar componentes de interés, es más usual aplicar filtros digitales, ya sea para realzar rasgos
lineales (filtros de paso alto) o para suavizar contrastes (filtros de paso bajo).
Idrisi posibilita la ejecución de mejoras en el contraste de imágenes a través de la
aplicación de estos procedimientos generalizados, los que por otra parte, constituyen
operaciones particularmente importantes para la visualización de composiciones entre bandas.

Figura 3.10: Expansión lineal con saturación del contraste de banda 3 de Landsat TM

3.8 Composición entre bandas

El hecho de visualizar imágenes en color, significa agregar un potente descriptor de las


diferentes cubiertas, ya que el ojo humano aprecia mejor el contraste entre colores que el
contraste entre grises.
La visualización de imágenes en color se obtiene a partir de la combinación de tres
bandas, mediante la asignación de cada uno de los colores elementales, es decir, azul, verde y
67

rojo a cada banda. De esta manera, se facilita notablemente el análisis de la imagen, ya que
implica tomar simultáneamente la información proporcionada por distintas bandas espectrales
que componen la imagen, y además, implica incorporar el color como elemento fundamental
de la interpretación visual.
La generación de composiciones en color se asienta en el principio de la percepción
visual humana, por el cual, todo color que aprecian nuestros ojos, es el resultado de la
combinación de azul, verde y rojo -colores denominados primarios-, correspondientes a las
tres bandas espectrales básicas del espectro visible. Como se sabe, el color resultante depende
de cómo reflejan los distintos objetos la energía incidente en esas tres bandas.
Distintos autores han demostrado que el color verde de la vegetación obedece al
reflejo de las hojas de una energía mayor en las longitudes de onda de esa banda -0,5 a 0,6
µm- que en las correspondientes al azul y rojo, en donde la absorción de los pigmentos es más
intensa, y que naturalmente, la gradación entre colores se debe a que la reflectividad de las
distintas cubiertas no se ajusta a valores de una banda, sino que presenta multitud de matices.
El color de visualización de cada píxel, depende del nivel digital que el píxel tiene en
cada banda, y en consecuencia, la cantidad de azul, verde y rojo que asume el píxel en una
composición, depende del nivel digital que el mismo tiene en las tres bandas. Así, la
asignación de la mínima intensidad del color seleccionado para una banda, corresponderá a un
nivel digital cero en dicha banda, mientras la máxima intensidad de color, corresponderá al
nivel digital 255.
El número de composiciones en color que es posible generar, es proporcional a la
resolución espectral del sensor, y los colores resultantes dependen de las bandas que se
combinan y del color asignado a cada una. Las composiciones de uso más generalizado en
teledetección, son las denominadas Falso Color y Color Verdadero.
La composición en falso color se obtiene desplazando el rango espectral del color
natural hacia longitudes de ondas más largas, es decir, asignando el color azul a la banda 2 -
banda verde del espectro-, el verde a la banda 3 -banda roja- y el rojo a la banda 4 -infrarrojo
cercano-. En esta composición se destacan los distintos grados de cobertura vegetal que
quedan expresados por la intensidad de rojo que puede presentarse en cada píxel.

Figura 3.11: Composición entre bandas 2-3-4 de Landsat TM


68

En realidad, a excepción de la composición entre bandas 1-2-3, todas las


composiciones resultan en falso color.
La composición entre las bandas 2, 3 y 4 se caracteriza por la diversidad de tonos rojos
que identifica las cubiertas vegetales -rojo más intenso a lo largo de ríos, debido al mayor
vigor vegetal-, tonos negros que identifican las superficies de agua, y tonos azulados que en
general identifican las densidades urbanas.
La composición en color verdadero se obtiene con las bandas 1, 2 y 3,
correspondientes a los tres colores primarios que distingue el ojo humano. En consecuencia, la
asignación de cada una de estas bandas a su color correspondiente -banda 1 al azul, banda 2 al
verde y banda 3 al rojo- produce una imagen similar a la que ofrecería el terreno si se
observara desde la altura orbital del satélite.

Figura 3.12: Composición entre bandas 1-2-3 de Landsat TM

En Idrisi, las composiciones entre bandas se obtienen por aplicación del comando
COMPOSIT, dentro de las distintas opciones que proporciona Display Launcher desde el
menú principal. Idrisi32 y Kilimanjaro, incluyen la selección de expansión del contraste para
la imagen resultante, ya sea lineal simple, lineal con puntos de saturación o por ecualización
de histograma.
Como se ha señalado, el color resultante de cada píxel depende de cómo se asignan los
colores a las tres bandas y del nivel digital que posee el píxel en cada banda seleccionada. Así,
cuando el nivel digital del píxel es el mismo en las tres bandas, se obtiene un color que
corresponde a la gama de grises.
La tabla siguiente, proporciona una referencia sobre el color de visualización para
distintos niveles digitales de píxel, constituyendo una guía en relación con el color resultante
que es posible obtener en las diferentes composiciones entre bandas según cómo se aplique
cada cañón de color:
69

Tabla 3.2: Color de visualización para distintos valores de píxel

AZUL VERDE ROJO COLOR RESULTANTE


0 255 0 Verde
0 0 255 Rojo
255 0 0 Azul
255 255 255 Blanco
0 0 0 Negro
255 255 0 Amarillo
255 0 255 Magenta
0 255 255 Cian
100 200 50 Verde amarillento

El número de composiciones que es posible realizar, depende de la cantidad de bandas


disponibles: con 6 bandas de Landsat TM, por ejemplo, se pueden obtener 20 combinaciones
distintas, puesto que del análisis combinatorio, se tiene:

Es decir, la cantidad de composiciones posibles está dado por el número de


combinaciones de “m” bandas, tomadas de a 3 (esto es, n = 3).
A los fines de establecer qué composiciones resultan más convenientes por su mayor
contenido informativo, en general se aplica el Índice de Factor Óptimo (O.I.F.), que está dado
por:

Donde:
Sk = desviación estándar de cada banda que interviene en la composición,
rj = coeficiente de correlación (en valor absoluto) entre cada par de esas mismas bandas.

De todos modos, la selección de determinadas combinaciones debe atender a los


aspectos que desean realzarse, por lo que en todo estudio de las cubiertas vegetales, por
ejemplo, el infrarrojo próximo constituye una banda insustituible, mientras el rojo y el
infrarrojo medio se señalan de gran utilidad para destacar distintos tipos de suelo.

3.9 Índice de vegetación

En el estudio de las cubiertas vegetales interesa determinar los contrastes de


reflectividad, Así, como la vegetación sana presenta baja reflectividad en la porción del
espectro correspondiente al rojo (banda 3 de Landsat TM) y alta reflectividad en el infrarrojo
70

cercano (banda 4 de Landsat TM), resulta un claro contraste entre ambas bandas. La
vegetación enferma o sometida a estrés hídrico, en cambio, aumenta su reflectividad en el rojo
y disminuye la reflectividad en el infrarrojo cercano, resultando un contraste menor. El suelo
desnudo, sin vegetación, presenta reflectividad similar en ambas porciones del espectro, con
lo que el contraste entre ambas bandas es muy pobre.
El Índice de Vegetación de Diferencia Normalizada (NDVI), se define como:

Donde ρIR es la reflectividad en el infrarrojo cercano y ρR es la reflectividad en el rojo,


respectivamente. El índice propiamente dicho, se calcula en función de la reflectividad y no
sobre la base de niveles digitales, pero a los fines de la evaluación relativa de cubiertas
vegetales resulta ampliamente aceptable utilizar las bandas correspondientes a dichas
porciones del espectro.
Como resultado del cociente se obtiene una imagen en paleta de grises, con valores
que varían entre 1 y –1, donde los tonos claros permiten localizar la vegetación sana (niveles
digitales altos), los tonos oscuros indican presencia de vegetación enferma o rala (niveles
digitales bajos), y los tonos intermedios ayudan a localizar los cultivos y la vegetación
natural.
Figura 3.13: Resultado de aplicación de NVDI sobre imagen Landsat TM

En Idrisi, es posible aplicar el comando OVERLAY del Submenú Mathematical


Operators -en “GIS Analysis” del menú principal- para obtener imágenes de Índices de
Vegetación de Diferencia Normalizada (NDVI), como la que se muestra en la figura 3.13. Por
71

otra parte, el mismo comando incluye la posibilidad de realizar otras operaciones aritméticas
entre bandas.

También podría gustarte