Está en la página 1de 179

Desarrollo de una metodología para

estimación de la deforestación
mediante el análisis multitemporal de
imágenes multiespectrales en un
entorno de análisis basado en
objetos geográficos (GEOBIA).

Autor:
Oscar Javier Espejo Valero

Universidad Distrital Francisco José De Caldas


Facultad De Ingeniería
Maestría en Ciencias de la Información y las Telecomunicaciones
Énfasis: Geomática
Bogotá D.C
Junio 2016
Desarrollo de una metodología para
estimación de la deforestación
mediante el análisis multitemporal de
imágenes multiespectrales en un
entorno de análisis basado en
objetos geográficos (GEOBIA).

Autor:
Oscar Javier Espejo Valero

Presentado para optar por el título de: Magíster en Ciencias de la Información y las
Telecomunicaciones

Director
Prof. MsC. Ing. William Barragan
Co-Director:
Prof. Ph.D Ing. Iván Lizarazo

Universidad Distrital Francisco José De Caldas


Facultad De Ingeniería
Maestría en Ciencias de la Información y las Telecomunicaciones
Énfasis: Geomática
Bogotá D.C
Junio 2016
Gracias Inmensas a:
Mi esposa, mi madre,
Mis hijos, mis hermanas,
Mis estudiantes y profesores.
2

AGRADECIMIENTOS

Este proceso de investigación no hubiese podido ser posible sin el apoyo del Sistema de
Monitoreo de Bosques y Carbono del IDEAM, pues me facilitaron el acceso a los recursos
de software y de manera abierta y transparente publican los datos de sus resultados del
monitoreo de la deforestación para consulta del público, especialmente agradecer a
Gustavo Galindo, Coordinador del componente de Procesamiento Digital de Imágenes, y
al Ingeniero Edersson Cabrera Coordinador del proyecto. A los docentes de la Maestría en
Ciencias de La información y las Telecomunicaciones del énfasis en Geomatica por su
orientación, especialmente al Profesor Ivan Lizarazo por sus ideas y aportes en el tema de
análisis de objetos y validación, así como en la estructura del presente documento. Al
profesor William Barragán por su apoyo en la finalización del proceso. Al Ingeniero y
Magister Salomón Ramírez por sus aportes y el desarrollo del pluggin de QuickSTEP en
QGIS, y a los revisores y jurados por sus aportes constructivos a este documento.
3

RESUMEN

Durante los últimos 30 años para la generación de datos sobre las dinámicas
espaciotemporales de las coberturas de la tierra se han implementado procesos de análisis
multitemporal mediante la superposición de mapas temáticos de coberturas. Dichos mapas
se han generado mediante metodologías de clasificación basada en píxeles, es decir que
los análisis de cambio temporal se basan en la determinación de la variación temática en
dos periodos de tiempo de un mismo píxel (Weng, 2011), por lo que carecen de un análisis
contextual, espacial y temporal de las variaciones espectrales de las coberturas
analizadas.

La presente propuesta de investigación desarrolla una metodología, completamente


implementada en un entorno orientado a objetos geográficos (GEOBIA), para la estimación
y cuantificación de las dinámicas espaciotemporales de la cobertura Bosque (pérdida o
deforestación), mediante el análisis de una serie de tiempo de imágenes multiespectrales
de media resolución espacial (Landsat). Se formularon los procesos para la adecuada
estructuración de los datos y construcción de la serie de tiempo, se determinaron a partir
de los datos históricos de los mapas de Bosque y No Bosque (IDEAM) los parámetros para
optimización y definición del espacio de características que permitieron la segmentación,
entrenamiento y clasificación de la serie de tiempo de objetos a partir de 4 algoritmos de
aprendizaje de máquina (Machine Learning): Maquinas de soporte vectorial (SVM), árboles
de decisión (DT), Bosques Aleatorios (RF) y K-nearest neigbor (KNN). Se formuló un marco
metodológico, a partir del concepto de Link entre objetos temporales, para la generación
de Objetos de deforestación mediante el análisis espacio temporal de los objetos de
Bosque y No Bosque clasificados en cada momento de la serie de tiempo; y a los objetos
generados se aplicó una metodología de evaluación de exactitud integral orientada a
objetos, Matriz STEP, pues se consideran los aspectos geométricos y temáticos de los
objetos generados en comparación al mapa de referencia.

Los resultados obtenidos permiten concluir que una metodología de detección de cambios
completamente orientada a objetos facilita el modelamiento de las características
temáticas, geométricas y temporales para el análisis de cambios en las coberturas de la
tierra y que los conceptos de análisis y modelamiento espacial de procesos cartograficos
pueden implementarse en el mismo proceso de clasificación de la serie de tiempo.

Palabras clave: GEOBIA, Análisis multitemporal, Objetos de Deforestación,


Deforestación, Series de Tiempo, Cobertura de la tierra.
4

ACRÓNIMOS

ALOS: Advanced Land Observation Satellite


ANN: Artificial Neural Networks
ASTER: Advanced Spaceborne Thermal Emission and Reflection Radiometer
CD: Change Detection
CNL: Cognition Thecnology Languaje
CORINE LAND COVER: Coordination of Information on the Environment
DT: Decission Tress
ETM+: Enhanced Thematic Mapper Plus
GEOBIA: Geographic Object-Based Image Analysis
GIS: Geographic Information System
IDEAM: Instituto de Hidrología, Meteorología y Estudios Ambientales de Colombia
IGAC: Instituto Geográfico Agustín Codazzi
Knn: K-nearest neighbor
Landsat: Satelite de monitoreo de recursos terrestres
LC: Land Cover
LU: Land Use
MODIS: Moderate Resolution Imaging Spectroradiometer
OLI: Operational Land Imager
RF: Random Forest
SMBYC: Sistema de Monitoreo de Bosques y Carbono
SPOT: Satélite Para la Observación de la Tierra
STEP: Shape similarity (S); Theme similarity (T); Edge similarity (E); y Position similarity (P)
SVM: Supporting Vector Machine
SIG-OT: Sistema de información geográfica para la planeación y el ordenamiento territorial.
UNODC: Naciones Unidas Oficina contra la Droga y el Delito
UAESPNN: Unidad Administrativa Especial del Sistema de Parques Nacionales Naturales
5

Tabla de Contenido
AGRADECIMIENTOS 2
RESUMEN 3
ACRÓNIMOS 4
TABLA DE CONTENIDO 5
ÍNDICE DE ILUSTRACIONES 9
ÍNDICE DE TABLAS 14
ÍNDICE DE MAPAS 21

CAPITULO 1. OBJETIVOS DEL ESTUDIO 22

1.1. INTRODUCCIÓN 23

1.2. Planteamiento del problema 26

1.3. Hipótesis de la investigación 28

1.4. Objetivos de la Investigación. 29


1.4.1. Objetivo Principal. 29
1.4.2. Objetivos específicos 29

1.5. Preguntas de Investigación 30

1.6. Delimitación del Alcance 31

1.7. Justificación 32

CAPITULO 2. MARCO DE REFERENCIA 33

2.1. MARCO TEÓRICO 34


2.1.1. Bosque, No Bosque y Deforestación. 34
2.1.2. Insumo fundamental: Imágenes de Satélite Multiespectrales. 36
2.1.3. Métodos de clasificación temáticos: Datos espectrales a Información temática. 38
2.1.3.1. Reconocimiento de patrones. 39
2.1.3.2. Algoritmos Machine Learning. 40
2.1.3.2.1. Máquinas de Soporte Vectorial (Suporting Vector Machine SVM) 40
2.1.3.2.2. Árboles de Decisión (Decision Tree - DT) 42
2.1.3.2.3. Bosques Aleatorios (Ramdon Forest RF) 42
2.1.3.2.4. K-Vecinos mas Cercanos (K-Nearest Neighbors – Knn) 43
2.1.4. La imagen concebida más allá del píxel: GEOBIA, análisis orientado a objetos. 43
2.1.4.1. Generación de objetos en una imagen 44
2.1.4.2. Implementación del proceso de segmentación 44
6

2.1.4.2.1. Parámetro de Homogeneidad 45

2.2. Sobre los métodos de detección de cambios: Datos temporales a Información Multitemporal. 48

2.3. Métodos de evaluación temática: Exactitud de los mapas obtenidos. 51


2.3.1. Evaluación de la exactitud basada en objetos geográficos. 53
2.3.1.1. Similitud en Forma 53
2.3.1.2. Similitud Temática 53
2.3.1.3. Similitud en Borde 54
2.3.1.4. Similitud en posición 54
2.3.1.5. Matriz STEP 54
2.3.1.6. Aplicación e interpretación de los datos de la Matriz STEP 54

2.4. Sobre los avances en la estimación de la deforestación. 57


2.4.1. Global Forest Change 58
2.4.2. PRODES 58
2.4.3. Terra-i 59
2.4.4. Sistema de Monitoreo de Bosques y Carbono IDEAM 60

CAPITULO 3. DATOS Y MÉTODOS 62

3.1. ZONA DE ESTUDIO 63


3.1.1. Parque Nacional Natural Sierra de La Macarena 64

3.2. Materiales: Imágenes Satelitales 68

3.3. Información Secundaria 73


3.3.1. Datos para el entrenamiento y la validación: Mapas de Bosque y No Bosque. IDEAM. 74
3.3.2. Mapas de cobertura Fraccional. CLASlite 76
3.3.3. Mapas de Perdida de Bosque. Global Forest Cover y Terra-i. 77

3.4. Métodos 78

3.5. Aproximación Metodológica 79


3.5.1. Descripción general del proceso realizado 79
3.5.2. Descripción Detallada de los Procesos. 83
3.5.2.1. Fase 1. Estructuración de la Serie de Tiempo 83
3.5.2.2. Fase 2. Proceso de muestreo y entrenamiento 85
3.5.2.3. Fase 3. Optimización del espacio de características. 87
3.5.2.4. Fase 4. Clasificación de la serie de tiempo Bosque – No Bosque 87
3.5.2.5. Fase 5. Análisis espaciotemporal de la serie de tiempo para la detección de cambios 88
3.5.2.5.1. Definición de los objetos de Deforestación 88
3.5.2.5.2. Modelamiento GEOBIA en una serie de tiempo para la generación de los objetos de
Deforestación. 89
3.5.2.6. Fase 6. Validación temática de los resultados 94
7

CAPITULO 4. PRESENTACIÓN Y ANÁLISIS DE LOS RESULTADOS 95

4.1. Resultados Fase 1. Estructuración de la serie de tiempo en eCognition (Ingesta de los datos). 96
4.1.1. Preparación de los datos. 99
4.1.1.1. Cálculo de los índices y transformaciones. 99
4.1.1.2. Incorporación de los datos CFMASK. 100
4.1.1.3. Segmentación de la Serie de Tiempo. 102

4.2. Resultados Fase 2. Proceso de muestreo y entrenamiento. 103

4.3. Resultados Fase 3. Optimización del espacio de características. 105


4.3.1. Determinación del Clasificador y espacio de características óptimo. 105
4.3.2. Determinación a partir del muestreo GEOBIA del espacio de características optimo 106

4.4. Resultados Fase 4. Clasificación de la serie de tiempo Bosque – No Bosque 107

4.5. Resultados Fase 5. Análisis espaciotemporal de la serie de tiempo para la detección de cambios.
111

4.6. Resultados Fase 6. Validación temática de los resultados 115


4.6.1. Matrices STEP de Error Ponderadas. 117

4.7. RESULTADOS DE LAS CLASIFICACIONES 127

4.8. Algoritmo GEOBIA para detección de la deforestación en una serie de tiempo. 130

CAPITULO 5. RECOMENDACIONES 135


Sobre el desarrollo metodológico. 136
Sobre la definición de los Objetos de deforestación. 136
Sobre los resultados Obtenidos (áreas, exactitud temática). 136
Sobre la aplicación práctica de los resultados y la metodología. 136

CAPITULO 6. CONCLUSIONES 137


Sobre el desarrollo metodológico. 138
Sobre la definición de los Objetos de deforestación. 138
Sobre los resultados Obtenidos (áreas, exactitud temática). 139
Sobre la aplicación práctica de los resultados y la metodología. 140

BIBLIOGRAFÍA 141

ANEXO 1. 148
Estructura en XML para la importación (ingesta) de los datos de la serie de tiempo en eCognition. 148
8

ANEXO 2. 150
Determinación del espacio de características más adecuado para la clasificación de Bosque y No Bosque
empleando 3 clasificadores Machine Learning. 150

ANEXO 3. 154
Matrices STEP de los resultados de la evaluación de los métodos DT, RF, SVM y Knn a partir de los datos
de referencia IDEAM y Global Forest Cnange. 154
Sector #1. Método RF. Validación IDEAM. 154
Sector #1. Método DT. Validación IDEAM. 155
Sector #1. Método KNN. Validación IDEAM. 156
Sector #1. Método SVM. Validación IDEAM. 157
Sector #1. Método RF. Validación GLOBAL FOREST CHANGE. 158
Sector #1. Método DT. Validación GLOBAL FOREST CHANGE. 159
Sector #1. Método KNN. Validación GLOBAL FOREST CHANGE. 160
Sector #1. Método SVM. Validación GLOBAL FOREST CHANGE. 161
Sector #2. Método RF. Validación IDEAM. 162
Sector #2. Método DT. Validación IDEAM. 163
Sector #2. Método KNN. Validación IDEAM. 164
Sector #2. Método SVM. Validación IDEAM. 165
Sector #2. Método RF. Validación GLOBAL FOREST CHANGE. 166
Sector #2. Método DT. Validación GLOBAL FOREST CHANGE. 167
Sector #2. Método KNN. Validación GLOBAL FOREST CHANGE. 168
Sector #2. Método SVM. Validación GLOBAL FOREST CHANGE. 169
Sector #3. Método RF. Validación IDEAM. 170
Sector #3. Método DT. Validación IDEAM. 171
Sector #3. Método KNN. Validación IDEAM. 172
Sector #3. Método SVM. Validación IDEAM. 173
Sector #3. Método RF. Validación GLOBAL FOREST CHANGE. 174
Sector #3. Método DT. Validación GLOBAL FOREST CHANGE. 175
Sector #3. Método KNN. Validación GLOBAL FOREST CHANGE. 176
Sector #3. Método SVM. Validación GLOBAL FOREST CHANGE. 177
9

Índice de Ilustraciones
Ilustración 1. Patrón de deforestación en la Amazonia Colombiana. (Proyecto SIMCI, 2009). .......................35
Ilustración 2 Delimitación de bosque fragmentado en zona de bosque denso. (IDEAM, 2012). ....................35
Ilustración 3 Principios y procesos del método de la teledetección. (Jensen, 2009a).....................................37
Ilustración 4. Terminología y dimensiones de una imagen digital. (Jensen, 2009a) .......................................37
Ilustración 5. Esquema de una clasificación basada en píxeles. (Jensen, 2009b) ............................................38
Ilustración 6 Construcción de los hiperplanos de separación para un conjunto de dos muestras. Tomado de
http://samuelabad1991.blogspot.com.co/2014/02/analisis-con-maquinas-de-vectores.html .............41
Ilustración 7 Comparación de los resultados de una clasificación con una función SVM Kernel Gaussiano
Base Radial para dos clases verde y rojo, con cada punto como muestra (A) C: 0.05 y Sigma: 1.0, (B) C:
0.05 y Sigma: 2.5, (C) C: 1.5 y Sigma: 1.0 y (D) C: 1.5 y Sigma: 2.5. .........................................................41
Ilustración 8 Árbol de decisión a partir de datos multiespectrales para la clasificación de áreas de Bosque y
No Bosque. IRC (Banda Espectral del Infrarrojo Cercano) A_1 (banda espectral del azul). Fuente: Autor.
................................................................................................................................................................42
Ilustración 9. Simplificación ilustrada del concepto de Bosques Aleatorios (Random Forest). (Breiman, 2001)
................................................................................................................................................................42
Ilustración 10. Principio del algortimo Knn ......................................................................................................43
Ilustración 11. Diferentes tipos de objetos generados sobre (A) una imagen multiespectral
RGB(IRC,IRM,ROJO),un objeto puede ser un píxel (B), pero son más significativos los objetos que
definen regiones espectralmente homogéneas (C). Fuente: Autor. .......................................................44
Ilustración 12.Ponderaciones más adecuadas para el parámetro de homogeneidad en proceso de
segmentación de imágenes Landsat para coberturas vegetales. (Ardila & Espejo, 2005) .....................47
Ilustración 13. Izquierda, Objetos de referencia. Derecha, Objetos clasificados. (Lizarazo, 2014a) ...............55
Ilustración 14 Detalle de los resultados de los indicadores STEP por cada objeto en el ejemplo dado por
(Lizarazo, 2014a) .....................................................................................................................................55
Ilustración 15 Sitio Web de Global Forest Change, Universidad de Maryland. Presentando los datos de
Perdida de bosque entre 2000 y 2013 para el norte de Sur América. Consultado el 20 de Marzo de
2015. .......................................................................................................................................................58
Ilustración 16 Plataforma de acceso y consulta de los datos del proyecto PRODES. Consultado el 20 de
Marzo de 2015. .......................................................................................................................................59
Ilustración 17 Plataforma web de consulta de los datos de Terra-i. ...............................................................60
Ilustración 18 Mapa de Cambio de Bosques Colombia 2012-2013. IDEAM. ...................................................61
Ilustración 19 Dinámica de cultivos de usos ilícito en el PNN Sierra de la Macarena. (UNODC & Parques
Nacionales Naturales de Colombia, 2004) ..............................................................................................65
Ilustración 20 Comparación de las escalas de las detecciones de los sistemas Terra-i CIAT (Rojo) y Global
Forest Change (Amarillo). Elaboración Propia ........................................................................................78
Ilustración 21. Metodología General Propuesta. Elaboración propia. ............................................................82
Ilustración 22 Concepto de la estructura de una imagen multiespectral estructurada como una serie de
tiempo. (eCognition Developer, 2009)....................................................................................................83
Ilustración 23 Esquema del resultado del corregistro de todas las imágenes dela serie de tiempo a la matriz
de la primera imagen Landsat 8 de la serie. Elaboración propia. ...........................................................84
Ilustración 24 Ejemplo de la definición de un proceso de importación. Los parámetros para importar cada
archivo, o cadenas de búsquedas están delimitados por { }. ..................................................................85
10

Ilustración 25 Detalle del proceso de importación. La asignación de nombres estándar, Alias, a cada una de
las bandas, Channel, de las imágenes espectral a ser importada. ..........................................................85
Ilustración 26 Proceso de construcción de links, flechas amarillas, entre un objeto, círculo rojo, en los
diferentes momentos de una serie de tiempo, T. (eCognition Developer, 2009) ..................................88
Ilustración 27 Construcción de los links entre objetos en dos momentos diferentes de la serie de tiempo,
para la definición de una clase asociada al cambio correspondiente. Elaboración Propia.....................89
Ilustración 28 Esquema de modelamiento de los objetos de deforestación validos a partir de los Links entre
objetos en diferentes Frames de la serie de tiempo. Elaboración Propia. .............................................90
Ilustración 29 Esquema de modelamiento de los objetos de deforestación validos e inválidos a partir de los
Links entre objetos en diferentes Frames de la serie de tiempo. Elaboración Propia. ...........................90
Ilustración 30 Esquema de modelamiento de los objetos de deforestación válidos y acumulados a partir de
los Links entre objetos en diferentes Frames de la serie de tiempo. Elaboración Propia. .....................91
Ilustración 31 Esquema de modelamiento de los ajustes a las objetos de Bosque y No Bosque a partir de los
Links entre objetos de deforestación no validos en los diferentes Frames de la serie de tiempo.
Elaboración Propia. .................................................................................................................................92
Ilustración 32. Ejemplo de la definición de los objetos de deforestación A y B en una serie de 3 frames.
Elaboración Propia. .................................................................................................................................93
Ilustración 33 Ejemplo de la definición y validación de los objetos de deforestación A y B en una serie de 4
frames. Elaboración Propia. ....................................................................................................................93
Ilustración 34. Pluging STEP implementado en QGIS para el cálculo de la matriz STEP. (Ramirez & Lizarazo,
2016). ......................................................................................................................................................94
Ilustración 35 Detalle de la estructura XML para definir el proceso de importación y estructuración de las
imágenes y demás datos secundarios a la serie de tiempo ....................................................................96
Ilustración 36 Detalle del resultado de la segmentación, límite de los objetos en azul, sobre los momentos
T0 (A), T1 (B), T2 (C) y T5 (D) de la serie de tiempo en una combinación de color RGB(Inf Medio, Inf
Cercano, Rojo). Elaboración propia. .......................................................................................................98
Ilustración 37 Detalle del algoritmo en lenguaje CNL para el cálculo de los índices NDVI, ARVI, NBR, y los
componentes de la transformación Tasseled Cap. Elaboración propia. .................................................99
Ilustración 38. Resultado del cálculo de las variables espectrales de (A) NDVI, (B) NBR, (C) ARVI y (D)
RGB(Brillo, Verdor, Humedad) para el frame T0. ....................................................................................99
Ilustración 39 Ejemplo del proceso de incorporación de los datos de CFMASK para la imagen T1. (A)
Mascara CFMASK, (B) Imagen analizada en una combinación de color RGB(Inf Medio, Inf Cercano,
Rojo), (C) Delimitación de la máscara CFMASK sobre la imagen y (D) Segmentación de la imagen en
zona de Nubes y No Nubes. Elaboración propia ...................................................................................100
Ilustración 40 Ejemplo del proceso de ajuste de la máscara inicial CFMASK para la imagen T1. La máscara
inicial (A) subestima las áreas de nubes, así que mediante el proceso de ajuste propuesto se expanden
(B), filtran (C) y consolida (D) la máscara final. Elaboración propia. .....................................................101
Ilustración 41. Función “Nubes” en CNL, para el ajuste de la máscara CFMASK ...........................................102
Ilustración 42 Parámetros de la segmentación multisescala realizada en eCognition y que aplicados a la
serie de tiempo generan los objetos a ser clasificados. Elaboración propia. ......................................102
Ilustración 43 Detalle del resultado de la segmentación aplicada a cada uno de los frames de la serie de
tiempo. (A) T0, (B) T2, (C) T4 y (D) T5....................................................................................................103
Ilustración 44 Proceso de creación de los objetos de muestreo en el Frame Ti, a partir de la relación
topológica del objeto y el punto de muestreo. Elaboración Propia .....................................................104
11

Ilustración 45 Detalle en el mismo sector para los frames (A) T0 (B) T7 y (C) T4 de los objetos definidos
como muestras a las clases Bosque y No Bosque en cada uno de los frames de la serie de tiempo.
Elaboración Propia ................................................................................................................................104
Ilustración 46 Detalle del proceso de generación del muestreo, y creación de los objetos de entrenamiento.
..............................................................................................................................................................105
Ilustración 47 Separabilidad estadística de los datos de las muestra. Tomado de (eCognition Developer,
2009) .....................................................................................................................................................106
Ilustración 48 Detalle de los resultados para la optimización y selección de la mejor combinación de
variables (dimensiones) para la clasificación de los objetos de la imagen a partir de los objetos
segmentados. Tomado de (eCognition Developer, 2009) ....................................................................106
Ilustración 49. Detalle del proceso de Entrenamiento y Ejecución del clasificador DT. Elaboración propia. 109
Ilustración 50 Clasificación final para el T0. Algoritmos (A) DT, (B) Knn, (C) Rf y (D) SVM. ...........................109
Ilustración 51 La sobrestimación de las áreas de No Bosque en zonas de presencia de nubes es mayor en
algoritmos como DT (A), que en algoritmos como Knn (B). La línea roja representa el límite de la
máscara CFMASK ..................................................................................................................................110
Ilustración 52 El ajuste de la máscara CFMASK, áreas naranja en (B), puede llevar a una sobrestimación de
las áreas de Nubes en zonas de presencia de Bosque, como puede verse en (A) son zonas de
vegetación boscosa con fenología y reflectancia variable que se enmascaran de forma incorrecta. ..110
Ilustración 53 Proceso de construcción de los links entre los objetos de Bosque en el T0 (A) y los objetos de
NO Bosque en el T1 (B). Los objetos conectados topológicamente (link espaciotemporal) se resaltan
en ambas imágenes. .............................................................................................................................113
Ilustración 54 Resultados del proceso de ajuste de las áreas sin información a partir de la clasificación de los
frames previos de la serie de tiempo. En zonas con varios periodos de tiempo sin información se
pueden generar asignaciones erróneas. ...............................................................................................113
Ilustración 55 Comparación temática de la detección por deforestación para el Sector #1. Los cambios por
deforestación se resaltan entre cada frame en flechas amarillas. Se presentan los agregados para cada
uno de los métodos y el mapa de referencia elaborado por IDEAM y Global Forest Change.
Elaboración propia. ...............................................................................................................................115
Ilustración 56 Comparación temática de la detección por deforestación para el Sector #2. Se presentan los
agregados para cada uno de los métodos y el mapa de referencia elaborado por IDEAM y Global
Forest Change. Elaboración propia. .....................................................................................................116
Ilustración 57 Comparación temática de la detección por deforestación para el Sector #3. Se presentan los
agregados para cada uno de los métodos y el mapa de referencia elaborado por IDEAM y Global
Forest Change. Elaboración propia. .....................................................................................................116
Ilustración 58 Resultados comparativos para el Sector #1, a partir de los datos de validación IDEAM
(polígonos rojos) y cada uno de los métodos empleados (polígonos purpura). Como referencia se
presentan las imágenes del primer frame T0 (A) y ultimo frame T5 (B). ..............................................121
Ilustración 59 Gráficos radiales comparando las estadísticas de exactitud Promedio para todas las clases (A)
y la Exactitud del Usuario (B) y Productor (C) para la clase deforestación en el Sector #1 a partir de los
datos de validación de IDEAM. .............................................................................................................122
Ilustración 60 Resultados comparativos para el Sector #1, a partir de los datos de validación Global Forest
Change (polígonos rojos) y cada uno de los métodos empleados (polígonos purpura). Como referencia
se presentan las imágenes del primer frame T0 (A) y ultimo frame T5 (B). .........................................122
12

Ilustración 61 Gráficos radiales comparando las estadísticas de exactitud Promedio para todas las clases (A)
y la Exactitud del Usuario (B) y Productor (C) para la clase deforestación en el Sector #1 a partir de los
datos de validación de Global Forest Change. ......................................................................................122
Ilustración 62 Resultados comparativos para el Sector #2, a partir de los datos de validación IDEAM
(polígonos rojos) y cada uno de los métodos empleados (polígonos purpura). Como referencia se
presentan las imágenes del primer frame T0 (A) y ultimo frame T5 (B). ..............................................124
Ilustración 63 Gráficos radiales comparando las estadísticas de exactitud Promedio para todas las clases (A)
y la Exactitud del Usuario (B) y Productor (C) para la clase deforestación en el Sector #2 a partir de los
datos de validación de IDEAM. .............................................................................................................124
Ilustración 64 Resultados comparativos para el Sector #2, a partir de los datos de validación Global Forest
Change (polígonos rojos) y cada uno de los métodos empleados (polígonos purpura). Como referencia
se presentan las imágenes del primer frame T0 (A) y último frame T5 (B). .........................................124
Ilustración 65 Gráficos radiales comparando las estadísticas de exactitud Promedio para todas las clases (A)
y la Exactitud del Usuario (B) y Productor (C) para la clase deforestación en el Sector #2 a partir de los
datos de validación de Global Forest Change. ......................................................................................125
Ilustración 66 Resultados comparativos para el Sector #3, a partir de los datos de validación IDEAM
(polígonos rojos) y cada uno de los métodos empleados (polígonos purpura). Como referencia se
presentan las imágenes del primer frame T0 (A) y ultimo frame T5 (B). ..............................................126
Ilustración 67 Gráficos radiales comparando las estadísticas de exactitud Promedio para todas las clases (A)
y la Exactitud del Usuario (B) y Productor (C) para la clase deforestación en el Sector #3 a partir de los
datos de validación de IDEAM. .............................................................................................................126
Ilustración 68 Resultados comparativos para el Sector #3, a partir de los datos de validación Global Forest
Change (polígonos rojos) y cada uno de los métodos empleados (polígonos purpura). Como se
referencia se presentan las imágenes del primer frame T0 (A) y ultimo frame T5 (B). ........................126
Ilustración 69 Gráficos radiales comparando las estadísticas de exactitud Promedio para todas las clases (A)
y la Exactitud del Usuario (B) y Productor (C) para la clase deforestación en el Sector #3 a partir de los
datos de validación de Global Forest Change. ......................................................................................127
Ilustración 70 Comparación del número de objetos de deforestación generados por cada algoritmo y los
datos de referencia IDEAM y Global Forest Change. Los datos corresponden al agregado del frame T4,
que correspondería al reporte de deforestación para 2014. ................................................................127
Ilustración 71 Comparación de los resultados de la detección de áreas deforestada por cada Frame
analizado de la serie de tiempo para el periodo de análisis 2013 (Frames T1 a T5) .............................128
Ilustración 72 Comparación de los resultados de la detección acumulada de áreas deforestada en cada
Frame de la serie de tiempo para el periodo de análisis 2013 (Frames T1 a T5) ..................................128
Ilustración 73 Comparación de los resultados de la detección total del área deforestada (área deforestada
acumulada para el Frame T5) para el periodo de análisis 2013 ...........................................................129
Ilustración 74 Comparación de los resultados para las clases estables, Bosque y No Bosque, para cada
método de clasificación en el frame T5. ...............................................................................................130
Ilustración 75 Esquema de procesos del algoritmo CNL para la detección de objetos de deforestación en un
entorno GEOBIA ....................................................................................................................................130
Ilustración 76. Primeras 3 partes del Algoritmo GEOBIA desarrollado para la detección de la deforestación
en una serie de tiempo. Preparación de datos, Segmentación y Generación del Muestreo................131
13

Ilustración 77 Cuarta parte del Algoritmo GEOBIA desarrollado para la detección de la deforestación en una
serie de tiempo. Entrenamiento y clasificación de cada Frame de la Serie de tiempo por cada método
definido. ................................................................................................................................................132
Ilustración 78 Quinta parte del Algoritmo GEOBIA desarrollado para la detección de la deforestación en una
serie de tiempo. Determinación de los cambios y depuración de las áreas de deforestación. ............133
Ilustración 79 Proceso para la determinación de las áreas de deforestación entre Frames consecutivos de la
Serie de tiempo. Elaboración Propia. ....................................................................................................133
Ilustración 80 Proceso de ajuste de las detecciones de deforestación a partir de la evaluación mediante
procesos iterativos entre las coberturas Bosque, No Bosque y Deforestación. ...................................134
Ilustración 81 Sexta y última parte del Algoritmo GEOBIA desarrollado para la detección de la deforestación
en una serie de tiempo. Exportación de los datos para la presentación y análisis. ..............................134
14

Índice de Tablas
Tabla 1 Resumen de las metodologías de detección de cambios en imágenes satelitales. Adaptada de
(Hussain et al., 2013). 49
Tabla 2. Matriz STEP por agregada por clase a partir de los objetos de referencia. (Lizarazo, 2014a) 55
Tabla 3 Matriz de error ponderado para la métrica de Forma (shape). (Lizarazo, 2014a) 56
Tabla 4 Exactitud geométrica y temática promedio y sus intervalos de confianza. (Lizarazo, 2014a) 56
Tabla 5 Proporción de áreas administrativas en la zona de estudio. Elaboración propia. 64
Tabla 6 Resumen de las imágenes satelitales a emplear. Elaboración Propia. 68
Tabla 7 Variable y datos auxiliarles a ser empleado en el desarrollo de la propuesta 73
Tabla 8 Procesos y herramientas propuestas para el desarrollo de la metodología propuesta. Elaboración
propia. 79
Tabla 9 Propuesta de nomenclatura para los archivos a ser incorporados a la serie de tiempo. Elaboración
propia 84
Tabla 10 Serie de tiempo de datos espectrales y datos temáticos empleados en el presente estudio.
Elaboración Propia 97
Tabla 11. Relación entre los Frames (Ti) y las fechas de las imágenes en la serie de tiempo. Elaboración
Propia. 98
Tabla 12 Comparación de resultados de la clasificación de Bosque y No Bosque para cada uno de los frames
de la serie de tiempo por medio de los algoritmos de aprendizaje de maquina aplicados. Elaboración
propia. 108
Tabla 13 Comparación de los resultados de la detección de áreas deforestadas por la metodología entre
cada uno de los momentos, frames, de la serie de tiempo. Elaboración Propia 112
Tabla 14. Comparación de los resultados de la detección acumulada de áreas deforestadas entre el primer
frame y cada nuevo momento de la serie de tiempo. Elaboración Propia 114
Tabla 15 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el Sector
#1 a partir de los datos IDEAM. 117
Tabla 16 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para el
Sector #1 a partir de los datos IDEAM. 117
Tabla 17 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el Sector
#1 a partir de los datos IDEAM. 117
Tabla 18 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF para el
Sector #1 a partir de los datos IDEAM. 118
Tabla 19 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para el
Sector #1 a partir de los datos IDEAM. 118
Tabla 20 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos aplicados
al Sector #1 a partir de los datos IDEAM. El código de Color indica los valores más bajos (amarillo) a los
más altos (verde) 119
15

Tabla 21 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos aplicados
al Sector #2 a partir de los datos IDEAM. El código de Color indica los valores más bajos (amarillo) a los
más altos (verde) 119
Tabla 22 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos aplicados
al Sector #3 a partir de los datos IDEAM. El código de Color indica los valores más bajos (amarillo) a los
más altos (verde) 119
Tabla 23 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos aplicados
al Sector #1 a partir de los datos Global Forest Change. El código de Color indica los valores más bajos
(amarillo) a los más altos (verde) 119
Tabla 24 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos aplicados
al Sector #2 a partir de los datos Global Forest Change. El código de Color indica los valores más bajos
(amarillo) a los más altos (verde) 120
Tabla 25 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos aplicados
al Sector #3 a partir de los datos Global Forest Change. El código de Color indica los valores más bajos
(amarillo) a los más altos (verde) 120
Tabla 23. Coordenadas que delimitan la muestra de la imagen para la optimización de SVM 150
Tabla 24. Resumen de resultados del Indicador de exactitud promedio para cada clasificador en los 3
ejercicios. 151
Tabla 25. Resumen de resultados del índice kappa para cada clasificador en los 3 ejercicios. 151
Tabla 26. Intervalos de confianza al 95% para kappa. 152
Tabla 27 Resumen de las comparaciones entre clasificaciones a partir de la desviación normal estándar de
kappa. 153
Tabla 28 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el Sector
#1 a partir de los datos IDEAM. 154
Tabla 29 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para el
Sector #1 a partir de los datos IDEAM. 154
Tabla 30 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el Sector
#1 a partir de los datos IDEAM. 154
Tabla 31 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF para el
Sector #1 a partir de los datos IDEAM. 154
Tabla 32 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para el
Sector #1 a partir de los datos IDEAM. 154
Tabla 33 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el Sector
#1 a partir de los datos IDEAM. 155
Tabla 34 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT para el
Sector #1 a partir de los datos IDEAM. 155
Tabla 35 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el Sector
#1 a partir de los datos IDEAM. 155
Tabla 36 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT para el
Sector #1 a partir de los datos IDEAM. 155
Tabla 37 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT para el
Sector #1 a partir de los datos IDEAM. 155
Tabla 38 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el Sector
#1 a partir de los datos IDEAM. 156
16

Tabla 39 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN para el
Sector #1 a partir de los datos IDEAM. 156
Tabla 40 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el Sector
#1 a partir de los datos IDEAM. 156
Tabla 41 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN para el
Sector #1 a partir de los datos IDEAM. 156
Tabla 42 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN para el
Sector #1 a partir de los datos IDEAM. 156
Tabla 43 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el Sector
#1 a partir de los datos IDEAM. 157
Tabla 44 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM para el
Sector #1 a partir de los datos IDEAM. 157
Tabla 45 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el Sector
#1 a partir de los datos IDEAM. 157
Tabla 46 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM para el
Sector #1 a partir de los datos IDEAM. 157
Tabla 47 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM para el
Sector #1 a partir de los datos IDEAM. 157
Tabla 48 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el Sector
#1 a partir de los datos GLOBAL FOREST CHANGE. 158
Tabla 49 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 158
Tabla 50 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el Sector
#1 a partir de los datos GLOBAL FOREST CHANGE. 158
Tabla 51 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 158
Tabla 52 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 158
Tabla 53 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el Sector
#1 a partir de los datos GLOBAL FOREST CHANGE. 159
Tabla 54 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 159
Tabla 55 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el Sector
#1 a partir de los datos GLOBAL FOREST CHANGE. 159
Tabla 56 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 159
Tabla 57 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 159
Tabla 58 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el Sector
#1 a partir de los datos GLOBAL FOREST CHANGE. 160
Tabla 59 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 160
Tabla 60 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el Sector
#1 a partir de los datos GLOBAL FOREST CHANGE. 160
17

Tabla 61 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 160
Tabla 62 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 160
Tabla 63 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el Sector
#1 a partir de los datos GLOBAL FOREST CHANGE. 161
Tabla 64 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 161
Tabla 65 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el Sector
#1 a partir de los datos GLOBAL FOREST CHANGE. 161
Tabla 66 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 161
Tabla 67 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE. 161
Tabla 68 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el Sector
#2 a partir de los datos IDEAM. 162
Tabla 69 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para el
Sector #2 a partir de los datos IDEAM. 162
Tabla 70 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el Sector
#2 a partir de los datos IDEAM. 162
Tabla 71 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF para el
Sector #2 a partir de los datos IDEAM. 162
Tabla 72 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para el
Sector #2 a partir de los datos IDEAM. 162
Tabla 73 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el Sector
#2 a partir de los datos IDEAM. 163
Tabla 74 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT para el
Sector #2 a partir de los datos IDEAM. 163
Tabla 75 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el Sector
#2 a partir de los datos IDEAM. 163
Tabla 76 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT para el
Sector #2 a partir de los datos IDEAM. 163
Tabla 77 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT para el
Sector #2 a partir de los datos IDEAM. 163
Tabla 78 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el Sector
#2 a partir de los datos IDEAM. 164
Tabla 79 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN para el
Sector #2 a partir de los datos IDEAM. 164
Tabla 80 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el Sector
#2 a partir de los datos IDEAM. 164
Tabla 81 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN para el
Sector #2 a partir de los datos IDEAM. 164
Tabla 82 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN para el
Sector 1 a partir de los datos IDEAM. 164
18

Tabla 83 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el Sector
#2 a partir de los datos IDEAM. 165
Tabla 84 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM para el
Sector #2 a partir de los datos IDEAM. 165
Tabla 85 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el Sector
#2 a partir de los datos IDEAM. 165
Tabla 86 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM para el
Sector #2 a partir de los datos IDEAM. 165
Tabla 87 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM para el
Sector #2 a partir de los datos IDEAM. 165
Tabla 88 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el Sector
#2 a partir de los datos GLOBAL FOREST CHANGE. 166
Tabla 89 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 166
Tabla 90 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el Sector
#2 a partir de los datos GLOBAL FOREST CHANGE. 166
Tabla 91 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 166
Tabla 92 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 166
Tabla 93 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el Sector
#2 a partir de los datos GLOBAL FOREST CHANGE. 167
Tabla 94 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 167
Tabla 95 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el Sector
#2 a partir de los datos GLOBAL FOREST CHANGE. 167
Tabla 96 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 167
Tabla 97 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 167
Tabla 98 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el Sector
#2 a partir de los datos GLOBAL FOREST CHANGE. 168
Tabla 99 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 168
Tabla 100 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 168
Tabla 101 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 168
Tabla 102 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 168
Tabla 103 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 169
Tabla 104 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 169
19

Tabla 105 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 169
Tabla 106 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 169
Tabla 107 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE. 169
Tabla 108 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el Sector
#3 a partir de los datos IDEAM. 170
Tabla 109 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para el
Sector #3 a partir de los datos IDEAM. 170
Tabla 110 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el Sector
#3 a partir de los datos IDEAM. 170
Tabla 111 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF para el
Sector #3 a partir de los datos IDEAM. 170
Tabla 112 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para el
Sector #3 a partir de los datos IDEAM. 170
Tabla 113 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el Sector
#3 a partir de los datos IDEAM. 171
Tabla 114 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT para el
Sector #3 a partir de los datos IDEAM. 171
Tabla 115 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el Sector
#3 a partir de los datos IDEAM. 171
Tabla 116 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT para el
Sector #3 a partir de los datos IDEAM. 171
Tabla 117 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT para el
Sector #3 a partir de los datos IDEAM. 171
Tabla 118 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el
Sector #3 a partir de los datos IDEAM. 172
Tabla 119 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN para el
Sector #3 a partir de los datos IDEAM. 172
Tabla 120 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el
Sector #3 a partir de los datos IDEAM. 172
Tabla 121 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN para el
Sector #3 a partir de los datos IDEAM. 172
Tabla 122 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN para el
Sector 1 a partir de los datos IDEAM. 172
Tabla 123 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el
Sector #3 a partir de los datos IDEAM. 173
Tabla 124 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM para el
Sector #3 a partir de los datos IDEAM. 173
Tabla 125 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el
Sector #3 a partir de los datos IDEAM. 173
Tabla 126 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM para el
Sector #3 a partir de los datos IDEAM. 173
20

Tabla 127 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM para el
Sector #3 a partir de los datos IDEAM. 173
Tabla 128 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el Sector
#3 a partir de los datos GLOBAL FOREST CHANGE. 174
Tabla 129 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 174
Tabla 130 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el Sector
#3 a partir de los datos GLOBAL FOREST CHANGE. 174
Tabla 131 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 174
Tabla 132 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 174
Tabla 133 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el Sector
#3 a partir de los datos GLOBAL FOREST CHANGE. 175
Tabla 134 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 175
Tabla 135 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el Sector
#3 a partir de los datos GLOBAL FOREST CHANGE. 175
Tabla 136 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 175
Tabla 137 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 175
Tabla 138 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 176
Tabla 139 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 176
Tabla 140 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 176
Tabla 141 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 176
Tabla 142 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 176
Tabla 143 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 177
Tabla 144 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 177
Tabla 145 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 177
Tabla 146 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 177
Tabla 147 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE. 177
21

Índice de Mapas
Mapa 1 Localización General del Parque Nacional Natural Sierra de la Macarena. Elaboración propia. 63
Mapa 2. Perspectiva del Parque Nacional Natural Sierra de La Macarena y cultivos de coca 2005. (UNODC &
Parques Nacionales Naturales de Colombia, 2004) 66
Mapa 3. Dinámica del territorio afectado por cultivos de coca en el departamento del Meta. 2001-2012.
(UNODC, 2014a) 67
Mapa 4 Mapa Imagen Landsat 8 2014-01-10. RGB(IRC,IRM,ROJO). Elaboración propia. 69
Mapa 5 Mapa Imagen Landsat 8 2014-01-26. RGB(IRC,IRM,ROJO). Elaboración propia. 69
Mapa 6 Mapa Imagen Landsat 8 2014-03-31. RGB(IRC,IRM,ROJO). Elaboración propia. 70
Mapa 7 Mapa Imagen Landsat 8 2014-08-22. RGB(IRC,IRM,ROJO). Elaboración propia. 70
Mapa 8 Mapa Imagen Landsat 8 2014-09-23. RGB(IRC,IRM,ROJO). Elaboración propia. 71
Mapa 9 Mapa Imagen Landsat 7 2014-12-20. RGB(IRC,IRM,ROJO). Elaboración propia. 71
Mapa 10 Mapa Imagen Landsat 7 2015-01-05. RGB(IRC,IRM,ROJO). Elaboración propia. 72
Mapa 11 Mapa Imagen Landsat 7 2015-01-29. RGB(IRC,IRM,ROJO). Elaboración propia. 72
Mapa 12 Mapa de Bosque - No Bosque 1990. IDEAM. Elaboración propia. 74
Mapa 13 Mapa de Bosque - No Bosque 2010. IDEAM. Elaboración propia. 75
Mapa 14 Mapa de Bosque - No Bosque 2013. IDEAM. Elaboración propia. 75
Mapa 15 Mapa de cobertura fraccional de la vegetación 2014-03-31. CLASlite. Elaboración propia. 76
Mapa 16 Mapa de la pérdida anual de bosques 2002-2015 para la zona de interés. Global Forest Change
(Matthew C. Hansen et al., 2013). Elaboración propia. 77
Mapa 17 Mapa de las perdidas diarias en la vegetación en 2013 para la zona de interés. Terra-i CIAT.
Elaboración propia. 77
Mapa 18 Áreas de Bosque y No Bosque estables en el periodo 1990-2013, a partir de los datos de Bosque y
No Bosque del IDEAM. Elaboración propia. 86
Mapa 19 Puntos de muestreo aleatorio sobre los datos de Bosque y No Bosque Estables en el periodo
1990-2013, a partir de los datos de Bosque y No Bosque del IDEAM. 86
Mapa 20 Localización General de los puntos de entrenamiento y validación para la optimización de los
parámetros de los calificadores no paramétricos SVM, DT, RF y Knn. 151
22

CAPITULO 1. OBJETIVOS DEL ESTUDIO


23

1.1. INTRODUCCIÓN
Los cambios en la cobertura terrestre, generan diversos impactos en una amplia variedad
de propiedades y procesos del sistema ambiental, los efectos de dichos cambios se
perciben en un amplio espectro de subsistemas ambientales. La deforestación actúa como
una fuente emisora de carbono hacia la atmósfera, provocando una mayor erosión del
suelo, reduciendo la extensión del hábitat, así como la disminución de las especies y
contribuyendo al desplazamiento de los asentamientos humanos (Olofsson et al., 2014).
Dada la importancia de los efectos causados por el cambio en la cobertura terrestre para
el bienestar social, ha aumentado a nivel internacional el interés tanto científico como
político en cualificar y cuantificar dichos cambios (Achard & Hansen, 2012a; Phillips et al.,
2011a).

En el análisis de las dinámicas de uso y cobertura de la tierra el análisis multitemporal


juega un papel crucial en las ciencias de la tierra. La generación de estadísticas y datos
sobre las áreas con altas dinámicas espaciotemporales en las coberturas vegetales son
fundamentales para la determinación de escenarios de cambio y referencia en la
formulación de políticas ambientales (Armenteras, Rudas, Rodriguez, Sua, & Romero,
2006; Dávalos et al., 2011; Etter, McAlpine, Phinn, Pullar, & Possingham, 2006; Etter,
McAlpine, Wilson, Phinn, & Possingham, 2006). En el caso de la deforestación las
dinámicas de pérdida, ganancia y degradación de las áreas boscosas andinas, tropicales
y amazónicas son parte fundamental del sistema ambiental colombiano y son generadas
por diversos institutos ambientales a nivel nacional (Cabrera et al., 2011a; García, García,
Rondón, & Castellanos, 2011; IDEAM & CORMAGDALENA, 2008; Wilches & Ch, 2005).

Los métodos para la determinación de la extensión de los bosques parten de los principios
de la cartografía mediante técnicas de teledetección de las características espetarles de
los diferentes tipos de coberturas (Achard & Hansen, 2012a). Los datos base son imágenes
satelitales multiespetrales de media y baja resolución espacial y temporal: Landsat,
ASTER, ALOS, SPOT y MODIS (Cabrera et al., 2011a; Galindo, Espejo, Cabrera, &
Rubiano, 2015; Hussain, Chen, Cheng, Wei, & Stanley, 2013). Los análisis realizados
sobre estas imágenes parten en su mayoría del análisis de correspondencia individual de
cada uno de los píxeles a unos patrones determinados de interés: Bosque, Agua, Suelo,
etc. Este proceso está enmarcado entonces en el análisis basado en píxeles individuales
(Lu & Weng, 2007; Salinero, 2002a; Shekhar & Xiong, 2008; Tso & Mather, 2009; Weng,
2011; Yang & Li, 2012).

Los principales problemas de los métodos basados en píxeles son: su falta de análisis de
las características contextuales y los largos tiempos requeridos en los procesos de edición
y postclasificación (T. Blaschke, 2005, 2010; Thomas Blaschke & Hay, 2001; Thomas
Blaschke & Strobl, 2001; Galindo et al., 2015). Esta inconsistencia es además la base en
la definición de un método de caracterización de cambios a nivel espectral, espacial y
24

temporal, se extiende dicho principio al análisis y comparación de múltiples periodos de


monitoreo (T. Blaschke, 2005; Bontemps, Bogaert, Titeux, & Defourny, 2008; Formaggio,
Vieira, & Renno, 2012; Hussain et al., 2013). La realización de un análisis multitemporal
parte de una superposición de dos mapas elaborados de forma independiente, y de
acuerdo a lo anteriormente mencionado, se incrementaría por ende la incertidumbre de los
resultados obtenidos reduciendo la capacidad de análisis de las dinámicas espaciales de
las coberturas de interés.

Se ha documentado (T. Blaschke, 2005; Hussain et al., 2013; Jensen, 2009a) que en
procesos cartográficos a escala local, a partir de imágenes de alta resolución espacial
como WorldView o RapidEye, los métodos orientados a objetos permiten reducir la
variabilidad espectral de dentro de la misma cobertura, mientras que en estudios de escala
regional, empleando imágenes de media resolución espacial como SPOT y Landsat, son
más empleados los métodos basados en píxeles y a una escala global imágenes de
resolución espacial baja como MODIS técnicas de detección de cambios basadas en el
análisis Píxel y/o Sub-píxel son las que proporcionan un mejor resultado en monitoreo de
coberturas. Más sin embargo, en la práctica, son las técnicas basadas en píxeles las más
empleada para la detección de cambios en todas las escalas, dado que aun la mayoría de
técnicas y algoritmos de procesamiento y clasificación de imágenes están fundamentadas
en el análisis de píxeles individuales (Weng, 2011).

Múltiples aproximaciones basadas en el análisis de píxeles se han desarrollado para


incrementar las potencialidades de los métodos de clasificación, clasificadores apoyados
en información temática, árboles de decisión, así como la implementación de redes
neuronales y métodos de análisis basados en máquinas de soporte vectorial y cadenas de
Markov buscan aumentar la exactitud en la clasificación de una píxel a una determinada
cobertura; Si bien los niveles de exactitud han aumentado (Hussain et al., 2013; Salinero,
2002a; Shekhar & Xiong, 2008; Yang & Li, 2012), los procesos aún están limitados por el
análisis píxel a píxel.

El paradigma del análisis de imágenes en un entorno basado1 en objetos geográficos


(Geographic Object Based Imagen Analysis GEOBIA) (Cheng & Han, 2016; G. J. Hay &
Castilla, 2008; Geoffrey J. Hay & Blaschke, 2009) se ha posicionado como una solución
óptima ante las falencias en el análisis y soporte de características contextuales en los
métodos de clasificación de imágenes satelitales basados en píxeles. Múltiples estudios y
técnicas a nivel nacional e internacional validan las capacidades de los métodos basados
en objetos, GEOBIA, sobre los métodos de clasificación basados en píxel para la
cartografía temática de la superficie terrestre (Ardila López & Espejo Valero, 2005; Thomas
Blaschke & Hay, 2001; K. Johansen, Bartolo, & Phinn, 2010).

1
Durante el desarrollo y fundamentación de este nuevo campo se emplearon indistintamente los conceptos: “Basado en
objetos” u “Orientado a objetos”. Sin embargo se ha consolidado entre la mayoría de los autores el uso del concepto “Basado”
sobre el término “Orientado” dado que este último está más relacionado con el paradigma de la programación orientada a
objetos (Weng, 2011).
25

Pero aun la implementación de una metodología de análisis y cuantificación


espaciotemporales en un entorno orientado a objetos implementa los métodos detección
de cambios basados en una superposición y comparación de dos imágenes en periodos
de observación diferentes (Hall & Hay, 2003; Hussain et al., 2013; Platt & Rapoza, 2008;
Zhou, Troy, & Grove, 2008). Se cuenta entonces con mapas temáticos generados con una
mayor exactitud temática, menor tiempo de procesamiento y edición postclasificación, pero
se continúan realizando el análisis multitemporal con los principios del paradigma píxel.

Este estudio propone una metodología de análisis de cambios en objetos geográficos


generados a partir de la segmentación y clasificación de las imágenes multiespectrales, en
múltiples fechas y la determinación de sus variaciones temáticas a través del tiempo
asociadas con la perdida de Bosque, estos objetos de estudio se denominaran Objetos
de Deforestación. Se espera que las métricas de exactitud temática de los mapas
elaborados sean superiores a los obtenidos por análisis basados en píxel (Congalton,
1991; Hall & Hay, 2003; Li, Huo, & Fang, 2012; Liu, Frazier, & Kumar, 2007; Möller,
Lymburner, & Volk, 2007). Se implementara además una evaluación temática no basada
en píxeles (Ardila López & Espejo Valero, 2005; Congalton, 1991; Olofsson et al., 2014)
sino en objetos a partir de la matriz STEP (Lizarazo, 2014a) que ofrece una adecuada
estimación integral de la exactitud temática a nivel de exactitud de forma, categoría,
posición de los objetos clasificados.

El presente estudio se desarrolló en Parque Nacional Natural La Macarena, localizado al


noroccidente de la Amazonia Colombiana en un área de 9.200 km2, en el Sur del
Departamento del Meta y norte del departamento del Guaviare, y que comprende el área
del Parque Nacional Natural Sierra de La Macarena, en la jurisdicción de 8 municipios: La
Macarena, Mesetas, Puerto Concordia, Puerto Rico, San José del Guaviare, San Juan de
Arama, La Uribe y Vistahermosa. Donde se ha reportado que la alta dinámica asociada a
los procesos de transformación del uso y cobertura del suelo, asociados a la deforestación
es altamente significativa (Cabrera et al., 2011b; Latorre & Corredor, 2011; UNODC &
Parques Nacionales Naturales de Colombia, 2004). Se desarrollara un proceso de
determinación de la cobertura boscosa y los procesos para determinar y cuantificar las
dinámicas asociadas a deforestación del bosque natural en dicha área de la Amazonia
Colombiana. Dichos procesos ocurren en áreas que se han documentado son superiores
a 0,5 hectáreas, por lo que un análisis de imagines basado en objetos, y no en píxeles, es
adecuado.
26

1.2. Planteamiento del problema


Actualmente y en su mayoría los procesos de monitoreo de la cobertura boscosa se basan
en la detección de cambios temáticos nivel de píxeles provenientes de imágenes satelitales
de resolución espacial media (Achard & Hansen, 2012a; Cabrera et al., 2011b; Matthew C.
Hansen et al., 2016; Kylie Johansen & Johansen, 2011; Reymondin et al., 2012a). Los
procesos de detección requieren algún nivel de supervisión de un intérprete experto para
la clasificación, verificación y edición de los resultados generados por la superposición
píxel a píxel de los mapas de dos fechas diferentes (Cabrera et al., 2011b; Valeriano et al.,
2004). Y no hay un proceso de análisis espacial, espectral o temporal orientado a objetos
integrado en el proceso de generación de los datos de cambio; obviándose entonces una
de las metodologías, que se han documentado (Ardila, Espejo, & Herrera, 2004), ofrecen
una mejora en la exactitud temática de los productos generados y por ende proveerían de
una mayor confiabilidad los reportes de áreas y de cambios de áreas requeridos para la
determinación de programas de manejo y gestión de recursos naturales (Phillips et al.,
2011a).

En Colombia el monitoreo de coberturas vegetales en periodos continuos de tiempo a


partir de datos satelitales multiespectrales la asumen institutos como el IDEAM a partir de
la Cartografía del uso y Cobertura en el marco del Proyecto CORINE LAND COVER
(IDEAM, 2010; Wilches & Ch, 2005), también el IDEAM reporta las cifras oficiales sobre
deforestación y superficie boscosa a nivel nacional (Cabrera et al., 2011b; Galindo et al.,
2015), e institutos de estudios regionales como el SINCHI (García et al., 2011), entidades
como Parques Nacionales (Latorre & Corredor, 2011) y organizaciones no
gubernamentales como la Organización de las Naciones Unidas Contra la Droga y el Delito
UNODC con el monitoreo de los cultivos ilícitos (Proyecto SIMCI, 2009), publican sendos
reportes asociados a problemáticas especificas o regionales. Los reportes de dichas
entidades buscan dar una perspectiva regional con un enfoque especifico de las dinámicas
de las coberturas, usos y la cobertura Boscosa, entendida como Deforestación y
Regeneración, pero difieren significativamente en los periodos de tiempo analizados, las
metodologías de interpretación y actualización (Novoa & Aguilar, 2012), leyendas de
coberturas, definición de bosque y de los proceso de cambio evaluados, lo que dificulta la
interoperabilidad de los datos y el análisis integrado de los resultados.

Existe la creciente demanda por una mayor capacidad técnica en el análisis de grandes
volúmenes de datos multiespectrales que permitan generar mapas temáticos cada vez más
exactos y oportunos sobre cambios en la cobertura boscosa, con la menor perdida de
información y la mayor cobertura tanto espacial como temporal (M. C. Hansen et al., 2013),
y dada la alta dinámica en la perdida de coberturas boscosas en nuestro país (Cabrera
et al., 2011b) y la mayor disponibilidad y capacidad en el análisis de este tipo de datos
existe, entonces la oportunidad de desarrollar una propuesta metodológica para la
definición de un análisis basado en objetos geográficos, GEOBIA, a partir de múltiples
27

imágenes satelitales multiespectrales que se espera permita una rápida, eficiente y más
exacta cuantificación de la extensión de la cobertura boscosa y la definición de las áreas
deforestadas.

Existen múltiples trabajos a nivel internacional que abordan el uso de GEOBIA como una
técnica adecuada para la identificación y cuantificación de cambios (Bontemps et al., 2008;
Hussain et al., 2013; Zhou et al., 2008), y se ha documentado el uso de series de tiempo
para la detección de procesos de cambio (Hamunyela, Verbesselt, & Herold, 2016; Hostert,
Griffiths, van der Linden, & Pflugmacher, 2015; Olofsson, Holden, Bullock, & Woodcock,
2016) pero estos son procesos enfocados al análisis de cambios a nivel de píxel; si bien
ya se han desarrollado procesos para formular métodos de detección de cambios por
deforestación a nivel de objetos geográficos (Formaggio et al., 2012; Kylie Johansen &
Johansen, 2011), aun no se han documentado procesos en los que la detección de
cambios se realice a nivel de objetos mediante el análisis de series de tiempo de imágenes
satelitales y aun los resultados de los procesos de detección de cambios antes
mencionados son validados bajo esquemas de cuantificación de la exactitud temática a
nivel de pixel (Olofsson et al., 2014).

La problemática sobre la que se plantean la implementación de la metodología propuesta


es la identificación de objetos que permitan la cuantificación de los procesos de
deforestación, cambios o perdidas en la cobertura Boscosa, en la Amazonia Colombiana
mediante un enfoque orientado a objetos que permita mejorar la exactitud en los procesos
de detección (Cambio Si/No), delimitación (Forma) y determinación dichos cambios
(Deforestación/No Deforestación) en áreas, más que en píxeles.
28

1.3. Hipótesis de la investigación


La presente investigación plantea la siguiente hipótesis sobre la problemática en la
formulación de una metodología de cuantificación de cambios por deforestación en la
coberturas boscosa a partir del análisis de una serie de tiempo de imágenes satelitales en
un entorno orientado a objetos GEOBIA:

Los resultados de la cuantificación de la deforestación en la amazonia


colombiana a partir del análisis de una serie de tiempo de imágenes
de satélite en un entorno orientado a objetos GEOBIA son
comparables a los procesos de cuantificación de la deforestación
actualmente realizados a nivel nacional e internacional bajo
metodologías multitemporales de análisis píxel a píxel.
29

1.4. Objetivos de la Investigación.


Para soportar la hipótesis planteada se ha definido que el objetivo principal del diseño
experimental implementado:

1.4.1. Objetivo Principal.


Desarrollar una metodología de análisis y clasificación multitemporal de imágenes
multiespectrales completamente implementada en un entorno orientado a objetos,
GEOBIA, para la cuantificación de la deforestación. Caso de Estudio: PNN Sierra de La
Macarena, Colombia.

1.4.2. Objetivos específicos


Se han definido que durante las diferentes etapas del proceso de investigación formulada
y para dar alcance al objetivo general, deben cumplirse los siguientes objetivos
secundarios:

1. Definir los procesos para la estructuración, clasificación y análisis de la serie de


tiempo de imágenes satelitales en un entorno orientado a objetos GEOBIA.

2. Determinar los criterios de análisis espaciotemporal y espectral para la


determinación de los objetos de deforestación, que representan las dinámicas de
cambio en la cobertura boscosa, en un entorno orientado a objetos geográficos,
caso de estudio Parque Nacional Natural Sierra de La Macarena, Colombia.

3. Implementar un algoritmo en lenguaje CNL de eCognition para el análisis,


clasificación y generación de los objetos de deforestación a partir de la serie de
tiempo de imágenes satelitales.

4. Evaluar la exactitud temática de los objetos de deforestación generados a partir de


una metodología orientada a objetos Matriz STEP mediante la validación con datos
oficiales IDEAM y datos de Global Forest Change de Universidad de Maryland.
30

1.5. Preguntas de Investigación

El presente proyecto de investigación busca responder a las siguientes preguntas:

¿Puede implementarse completamente un proceso de análisis multitemporal para


estimación de la deforestación mediante imágenes multiespectrales en un entorno de
análisis orientado a objetos geográficos, GEOBIA?

¿Los Objetos de Deforestación generados mediante una metodología de análisis


GEOBIA poseen una mayor exactitud temática que los generados por técnicas basadas
en píxeles?
31

1.6. Delimitación del Alcance


La calidad de los resultados a partir de las series de tiempo de imágenes dependen del
modelos de calibración radiometría y atmosférica de estas. En Colombia los modelos de
corrección atmosférica no se han validado y por los tanto los resultados estarán ligados al
modelo elegido por su disponibilidad, costo y calidad de los resultados.

Las imágenes empeladas fueron procesadas por el Servicio Geológico de los Estados
Unidos (USGS), para determinar los valores de reflectancia de Superficie (Surface
Reflectance) en cada píxel, sin embargo dichos algoritmos de calibración así como los
datos empelados para los ajustes atmosféricos y de terreno2, los datos empleados aquí
corresponden a los disponibles para Diciembre de 20143.

El análisis de una región como la Amazonía supone bajas condiciones de nubosidad y


relieves ligeramente ondulados. Para la aplicación del análisis a zonas montañosas y con
limitaciones de nubosidad u otro tipo de vegetación se requerirán desarrollar procesos de
corrección topográfica y ajustes posteriores a los análisis propuestos.

Debido a problemas generados en el sensor ETM+ desde mayo de 2003, el análisis con
datos de este sensor entregaran datos con aun mayor pérdida de información, no se
realizarán procesos de interpolación o ajustes sobre dichos datos.

Los datos de entrenamiento se basan en la cobertura oficial de Bosque y No Bosque para


Colombia (Cabrera et al., 2011b; Galindo et al., 2015). Se asume, para los propósitos de
validación del estudio, que los datos allí presentados están libres de error. Para consultar
los estándares de calidad de dicho mapa referirse a (Ramirez, Galindo, & Espejo, 2014).

Para la presente investigación se formuló un marco de detección espaciotemporal para la


generación de objetos de deforestación, que representan la pérdida de cobertura boscosa
en un intervalo de un año (2013). La detección del proceso opuesto, regeneración, no fue
contemplado en la presente metodología, pues se requiere considerar un análisis de series
de tiempo mayores a 10 años.

2
Se publican constantemente los procesos de ajuste en: http://landsat.usgs.gov/CDR_LSR.php, fecha de consulta Mayo de
2016
3
Los datos satelitales pueden ser procesados por e USGS y ser publicados bajo una nueva versión.
32

1.7. Justificación
Los requerimientos de información espacial de gran calidad, representan una de las
necesidades más comunes en todas las actividades humanas, pues es cada día más
necesario y relevante conocer con mayor exactitud y velocidad los cambios sobre la
superficie terrestre. Existe una gran demanda de información espacial consistente de alto
nivel sobre las características y cambios de la cobertura vegetal, demanda que es cubierta
en su mayor grado por la información extraída de datos en imágenes satelitales.

Establecer una metodología de análisis multitemporal de imágenes satelitales más allá del
paradigma píxel y a partir del análisis de objetos geográficos permitiría establecer mejores
herramientas de análisis así como una mayor coherencia en los reportes generados sobre
las dinámicas de cambio de las coberturas boscosas, lo que permitiría un mejor análisis y
predicción de los cambios en la extensión y delimitación de un determinado fenómeno
continuo en el espacio y no restringido por el píxel (Thomas Blaschke & Strobl, 2001;
Geoffrey J. Hay & Blaschke, 2009). Y una mejor herramienta para la definición de
escenarios de referencia y cambio para el análisis y formulación de políticas ambientales
(Armenteras et al., 2006; Dávalos et al., 2011).

La problemática sobre la que se plantean la implementación de la metodología propuesta


es la cuantificación de las dinámicas de la cobertura Boscosa en la Amazonia Colombiana.
La necesidad de establecer un sistema de monitoreo continuo de las coberturas vegetales
a partir de datos satelitales multiespectrales la asumen a nivel nacional institutos como el
IDEAM (Cabrera et al., 2011b; IDEAM, 2010), SINCHI (García et al., 2011) y UNODC
(Proyecto SIMCI, 2009). Por lo que se busca ofrecer una propuesta base para la definición
de un objeto de estudio común, los Objetos de Deforestación, que permitan facilitar la
cuantificación de la extensión de los cambios en la cobertura boscosa, permitiendo asi
fortalecer las tareas de monitoreo y alerta temprana sobre los cambios asociados a las
dinámicas de las coberturas presentes en la zona, para diferentes propósitos y escalas.
33

CAPITULO 2. MARCO DE REFERENCIA


34

2.1. MARCO TEÓRICO


La presente investigación propone un proceso de análisis multitemporal de imágenes
multiespectrales completamente integrado en un entorno basado en el análisis de objetos
geográficos (GEOBIA) para la cuantificación de la deforestación mediante la generación
de Objetos de Deforestación, se hace necesario presentar los conceptos fundamentales
asociados a las técnicas, procesos y conceptos sobre: Datos satelitales multiespectrales,
algoritmos de clasificación temática, generación de objetos geográficos, métodos para la
detección de cambios y los métodos de evaluación de la exactitud temática de los
resultados del proceso de clasificación.

Las Imágenes satelitales multiespectrales son el insumo fundamental del presente estudio,
pues suministran los datos, como patrones espectrales, para la generación de los objetos
geográficos mediante el proceso de segmentación. Estos objetos serán clasificados
mediante diferente técnicas estadísticas y de aprendizaje de máquina para determinar las
áreas de cambio (perdida) en la cobertura boscosa, generando así un mapa temático sobre
la localización de las áreas deforestadas, que será evaluado y comparado con los
resultados oficiales, Mapa de Cambio de Bosque del IDEAM (Cabrera et al., 2011a),
mediante metodologías de evaluación orientadas a objetos.
.

2.1.1. Bosque, No Bosque y Deforestación.


La definición de la leyenda de coberturas para a presente propuesta se basa en las
coberturas de Bosque y No Bosque, y los cambios de Bosque a No Bosque permiten definir
la cobertura deforestación, ver Ilustración 1. De acuerdo con el Sistema de Monitoreo de
Bosques y Carbono de IDEAM (Cabrera et al., 2011b), quien reportan la cifra oficial de
extensión de Bosque y el área deforestada, Bosque se define como:

“Tierra ocupada principalmente por árboles que puede contener arbustos,


palmas, guaduas, hierbas y lianas, en la que predomina la cobertura arbórea
con una densidad mínima del dosel de 30%, una altura mínima del dosel (in
situ) de 5 m al momento de su identificación, y un área mínima de 1,0 ha. Se
excluyen las coberturas arbóreas de plantaciones forestales comerciales,
cultivos de palma, y árboles sembrados para la producción agropecuaria. Esta
definición es consecuente con los criterios definidos por la CMNUCC en su
decisión 11/COP.7, con la definición adoptada por Colombia ante el Protocolo
de Kyoto, así como con la definición de la cobertura de Bosque natural incluida
en la adaptación para Colombia de la leyenda de la metodología CORINE Land
Cover -CLC Colombia-.”
35

Ilustración 1. Patrón de deforestación en la Amazonia Colombiana. (Proyecto SIMCI, 2009).

La definición de la cobertura de bosque si bien en los lineamientos nacionales CORINE


LAND COVER se desagrega en bosques densos, abiertos y fragmentados (IDEAM, 2010),
para este caso se empleará la definición general usada por el SMBYC (sin incluir os
bosques fragmentados). Esto debido a que el proceso de interpretación de CORINE LAND
COVER sigue un proceso de delimitación visual que generalmente usa criterios, más allá
de los espectrales, tales como: estructura, mezclas, áreas intervenidas4, y aún más
restrictivo la unidad mínima cartografiables es de 25 Hectáreas, ver Ilustración 2.

Ilustración 2 Delimitación de bosque fragmentado en zona de bosque denso. (IDEAM, 2012).

4
Pueden referirse para ello las fichas de patrones definidas para CORINE LAND COVER disponibles en
http://www.ideam.gov.co/documents/11769/153716/Catalogo+Coberturas+Tierra.pdf/f2eafe32-f300-4ae7-9ab7-
f90a8670d75e. Consultado el 1 Marzo de 2015.
36

El análisis de cambios para este tipo datos no facilita una determinación adecuada de
fenómeno de la deforestación, pues los requerimientos de agregación y áreas solo
permiten llegar a reportes de cambios a nivel temático (tablas) pero no especificar
claramente la delimitación más precisa de los polígonos de cambio Ver por ejemplo:
Monitoreo de los bosques y otras coberturas de la Amazonia Colombiana, a escala
1:100.000 Cambios multitemporales en el período 2002 al 2007 (García et al., 2011).

Por ende la definición de deforestación para el presente documento se ciñe a la aplicada


por el SMBYC-IDEAM:

La conversión directa y/o inducida de la cobertura de Bosque a otro tipo de cobertura de


la Tierra en un periodo de tiempo determinado (GOFC-GOLD, 2010). Por su parte la
regeneración se define como: La recuperación de la cobertura de Bosque de zonas donde
no estaba presente en fechas anteriores5.

Por lo anterior se determina que para a presente propuesta el análisis de las series de
tiempo se centrara en los cambios de Bosque a No Bosque mientras que las series sean
en periodos inferiores a los 5 años. En periodos de tiempo más largos, los procesos de
regeneración deberán ser tenidos en cuenta en el modelamiento de la metodología
GEOBIA, la presente propuesta debe servir de base a la generación de la estimación de
dichas áreas.

2.1.2. Insumo fundamental: Imágenes de Satélite


Multiespectrales.
La teledetección es la ciencia, arte y tecnología empleada para la obtención de información
confiable sobre las características, coberturas y fenómenos sobre la superficie terrestre a
partir del proceso de medición, almacenamiento e interpretación de representaciones
digitales de los patrones de energía derivados de sistemas sensores que no están en
contacto con los elementos de estudio (Janssen, 2000; Jensen, 2009a; Longley,
Goodchild, Maguire, & Rhind, 2005; Salinero, 2002a). El proceso de la teledetección, ver

5
El tiempo de regeneración de un bosque no está claramente definido, un cronograma aproximado de formación de un
bosque por regeneración natural en zonas altas (más de 2000 m sobre el nivel del mar) partiendo de tierra desnuda, en
suelos relativamente fértiles:
Etapa 1: 0 años – Tierra desnuda
Etapa 2: 0.5 años – Flores silvestres
Etapa 3: 1 a 5 años – Pasto alto
Etapa 4: 5 a 20 años – Arbustos: surgen por encima del pasto los juveniles de los primeros arbustos y árboles pioneros; se
consolidan los primeros matorrales cerrados.
Etapa 5: 20 a 40 años – Matorral o bosque joven: la vegetación va ganando altura con los años; aparecen bromeliáceas y
orquídeas.
Etapa 6: 100 años en adelante – Bosque alto: la vegetación va adquiriendo rasgos de bosque maduro (troncos muy gruesos,
árboles de semillas grandes, jardines de plantas epífitas).
Consultado el 20 de Mayo de 2016 en: http://biodiversidadyconservacion.blogspot.com.co/2012/08/como-se-restaura-un-
bosque-la.html.
37

Ilustración 3, parte de la generación de datos (imágenes) mediante un sistema sensor a


los que se les realiza un análisis, apoyado en observaciones en terreno, para la generación
de información, mapas temáticos, sobre los fenómenos de tipo espacial que serán
organizados y analizados junto a otros tipos de datos, en una base de datos espacial, y
que permitirán así soportar los procesos de toma de decisión sobre la planificación y
gestión del territorio.

Ilustración 3 Principios y procesos del método de la teledetección. (Jensen, 2009a).

Un sensor remoto es un sistema óptico-electrónico que “observa” o escanea6 la superficie


de interés y donde la radiancia recibida por los componentes ópticos se descompone en
varias longitudes de onda, cada una de ellas se envía a un conjunto de detectores
sensibles a esa región del espectro que la amplifican y la convierten en señal eléctrica y
finalmente en un valor numérico conocido como Nivel Digital (ND) (Sarría, 2006). Las
imágenes digitales, como representaciones del paisaje observado, se obtienen en formato
raster o matricial, ver Ilustración 4, donde el valor de cada píxel o mínima unidad espacial
detectada por el sensor corresponde a su nivel digital el cual se encuentra estrechamente
relacionado con los valores de reflectancia espectral propios de la superficie cubierta por
dicho píxel y el rango del espectro electromagnético en el cual captura información el
sensor (Jensen, 2009a). La imagen así dispuesta constituye una herramienta bastante útil
para reconocer un área y realizar una evaluación visual del espacio geográfico presente.

Ilustración 4. Terminología y dimensiones de una imagen digital. (Jensen, 2009a)

6
El término “escanea” es una definición conceptual más precisa del proceso de observación y medición llevado a cabo por
el sistema sensor. El escaneo es el proceso mediante el cual un sensor realiza un proceso de medición punto por punto
(equivalente a pequeñas áreas dentro de la escena) a lo largo de sucesivas líneas durante un tiempo finito (Jensen, 2009a).
38

2.1.3. Métodos de clasificación temáticos: Datos


espectrales a Información temática.
La clasificación temática buscar generar y e identificar agrupaciones o clústeres de píxeles
en un espacio multidimensional de atributos, estos grupos corresponden a respuestas o
patrones espectrales7 definidos y se espera que correspondan a coberturas sobre la
superficie terrestre8. Aplicamos procesos de clasificación para darle sentido y orden al
ambiente que nos rodea buscando reducir la multiplicidad de un fenómeno a un relativo
pequeño número de clases generales (Tso & Mather, 2009). La clasificación seria la fase
culminante del procesamiento digital de imágenes, e implica el desarrollo y aplicación de
diferentes criterios de decisión que permiten desarrollar una generalización temática, que
mediante la categorización convierte la información cuantitativa de una imagen en
información cualitativa : MAPA TEMÁTICO (Salinero, 2002a).

Para generar información temática, un mapa de cobertura o de cambio de las coberturas,


los píxeles individuales que conforman la imagen deben ser discretizados o agrupados en
categorías de interés que son definidas por el intérprete de acuerdo a sus objetivos y
necesidades. Este agrupamiento de píxeles se realiza de forma tradicional mediante un
proceso de agrupamiento de datos estadístico (clustering) en el que cada píxel es asignado
a un grupo o categoría de acuerdo a su correspondientes niveles digitales, ver Ilustración
5, es decir se realiza una clasificación basada en el patrón o respuesta espectral de píxeles
individuales (Salinero, 2002a).

Ilustración 5. Esquema de una clasificación basada en píxeles. (Jensen, 2009b)

7
El termino patrón espectral se refiere a un conjunto de observaciones de la radiancia de un mismo píxel obtenidas en
diferentes longitudes de onda (Yang & Li, 2012).
8
Cobertura hace referencia a al tipo de característica presente en la superficie terrestre: Vegetación, suelo, roca y agua son
ejemplo de coberturas. Uso hace referencia a la actividad humana o función económica asociada con una porción del
territorio. Idealmente Cobertura y uso se presentan en mapas temáticos independientes.(Lillesand, Kiefer, & Chipman, 2004)
39

El anterior enfoque de clasificación basado en píxel, respuesta espectral o reconocimiento


de patrones espectrales (Lillesand, Kiefer, & Chipman, 2004) corresponde a la forma
tradicional de extracción de información temática en imágenes satelitales y se emplea de
forma generalizada en todo tipo de proyectos desde los inicios de la interpretación de
imágenes asistida por computador en la década de los setenta (Jensen, 2009a; Salinero,
2002a).

Existen igualmente métodos alternativos de clasificación (Hussain et al., 2013; Jensen,


2009a; Salinero, 2002a; Tso & Mather, 2009; Weng, 2011; Yang & Li, 2012), los cuales
son el resultado de investigaciones académicas involucradas en el campo del
procesamiento. Dichos procedimientos buscan la implementación de métodos de
clasificación que involucren técnicas alternativas de asignación de píxeles a la tradicional
basada en respuesta espectral. Resultado de estas son métodos de clasificación como
los clasificadores difusos, clasificadores subpíxel, la aplicación de redes neuronales o los
clasificadores de contexto orientados al reconocimiento de patrones espaciales donde se
consideran aspectos como la textura, proximidad, forma entre otros, buscando replicar el
tipo de proceso de síntesis realizado en un proceso de interpretación visual. Si bien dichos
experimentos de clasificación muestran algunas veces resultados prometedores en
aplicaciones puntuales no existe una metodología alternativa, general, oportuna y eficaz
de clasificación que sea reconocida, aceptada e implementada satisfactoriamente en los
trabajos de procesamiento de imágenes (Thomas Blaschke & Strobl, 2001).

2.1.3.1. Reconocimiento de patrones.


El objetivo de los métodos de reconocimiento de patrones es determinar qué
características describen las categorías temáticas presentes en la imagen. Un patrón es
un conjunto de medidas realizadas de un objeto, que puede ser descrito matemáticamente
como un vector de medidas. Los métodos de reconocimiento de patrones buscan
determinar un conjunto de métricas que permitan establecer por comparación a datos de
referencia (métodos supervisados) o similitud entre los patrones en la imagen (métodos no
supervisados) las reglas o límites de decisión que delimitan los grupos espectrales de
interés a los vectores de medida en una imagen multiespetral: los píxeles representados
por un vector que consiste en un vector de medidas, una por cada banda, así como otras
medidas como texturas (Tso & Mather, 2009).

Los procesos de reconocimiento de patrones mediante aprendizaje de máquina (Machine


Learning) buscan convertir los datos en información mediante la extracción de reglas o
patrones a partir de esos datos. A partir de un conjunto de datos se pueden utilizar técnicas
de aprendizaje automático para construir un modelo que describa dichos datos. Si nuestro
interés fuera ver como los datos se agrupan entorno a ciertos valores un algoritmo de
agrupamiento (clustering) sería la opción adecuada, pero si se quiere aprender a predecir
el valor de un parámetro en función de otro, un algoritmo clasificador sería apropiado. Es
40

por ello que los algoritmos de aprendizaje automático analizan las características de los
datos y a continuación ajustan los pesos, umbrales y otros parámetros para maximizar el
rendimiento, exactitud del clasificador, de acuerdo a los requerimientos. Este proceso de
ajuste de parámetros para cumplir un objetivo es lo que se denomina aprendizaje (Kaehler
& Bradski, 2014).

2.1.3.2. Algoritmos Machine Learning.


Los algoritmos de Machine Learning mas empleados según (Kaehler & Bradski, 2014; Tso
& Mather, 2009) son: Maquinas de soporte vectorial (SVM), Árboles de decisión (DT),
Bosques Aleatorios (RF) y, K-Vecinos más Cercanos (Knn). Cada uno de estos
clasificadores no paramétricos de aprendizaje cuentan con diferentes conjuntos de
características o parámetros, como la capacidad para gestionar las mediciones faltantes o
variables de entrada categóricas. Sin embargo no hay un "mejor" clasificador, pues
promediando sobre todos los posibles tipos de distribuciones de datos, todos los
clasificadores generarían el mismo resultado (Kaehler & Bradski, 2014). A este problema
de optimización en técnicas de Machine Learning se le denomina el teorema de “No hay
Almuerzo Gratis” ("No Free Lunch Theorems for Optimization") (Wolpert & Macready,
1997).

Con cualquier distribución de datos dada o conjunto de distribuciones de datos hay


generalmente un mejor clasificador que otro. Clasificadores diferentes tienen diferentes
propiedades a lo largo de las diferentes dimensiones de la implementación del problema.
No se puede elegir entre dos algoritmos sólo basándose en lo bien que trabajaron con
anterioridad y sin conocer nada sobre el dominio del problema. Por ello es importante tener
conocimiento del tipo de problema, antes de aplicarle un algoritmo.

2.1.3.2.1. Máquinas de Soporte Vectorial (Suporting Vector


Machine SVM)
El algoritmo SVM es una alternativa de clasificación de imágenes, que permite obtener
clasificaciones exactas a partir de un conjunto de muestras de entrenamiento reducidas
(Addesso, Conte, Longo, Restaino, & Vivone, 2012; Lizarazo, 2008). El principal atractivo
de SVM es su capacidad de minimizar los errores de clasificación, creando un hiperplano
entre cada par de clases, ver Ilustración 6, de tal manera que maximiza la distancia entre
los vectores de soporte de cada clase (Buddhiraju & Rizvi, 2010; Chethan, Kumar, &
Raghavendra, 2009; Tso & Mather, 2009). Si no es posible construir ese hiperplano en el
espacio espectral original, la separación se realiza en un espacio espectral de dimensión
más alta (Addesso et al., 2012).
41

Ilustración 6 Construcción de los hiperplanos de separación para un conjunto de dos muestras.


Tomado de http://samuelabad1991.blogspot.com.co/2014/02/analisis-con-maquinas-de-vectores.html

Para efectos prácticos se acostumbra a emplea una función de mapeo no lineal


denominada kernel, seleccionada entre las Funciones Polinomiales, las Funciones de
Base Radial, las Funciones de Bases Radial Gausianas y las Funciones Sigmoidales,
donde las funciones gaussianas son las más empleadas dados sus mejores resultados
frente a otro tipo de funciones en la solución de problemas no lineales. Sin embargo se
requiere la definición adecuada de parámetros C, el parámetro que controla la influencia
de cada vector de soporte individual, y Sigma, que es el parámetro libre de la función de
base radial gaussiana y que está asociada a la varianza o influencia de cada vector de
soporte, lo que finalmente determina el sesgo y varianza del modelo (Tso & Mather, 2009).
No existe una forma única de definir o establecer estos parámetros, por lo que su definición
requiere de procesos de optimización iterativos, ver Ilustración 7, donde el usuario puede
determinar a conveniencia su aplicacion.

A B Ilustración 7 Comparación de los resultados de una clasificación con una función SVM
Kernel Gaussiano Base Radial para dos clases verde y rojo, con cada punto como
muestra (A) C: 0.05 y Sigma: 1.0, (B) C: 0.05 y Sigma: 2.5, (C) C: 1.5 y Sigma: 1.0 y (D)
C D C: 1.5 y Sigma: 2.5.
Tomado de: http://cs.stanford.edu/people/karpathy/svmjs/demo/
42

2.1.3.2.2. Árboles de Decisión (Decision Tree - DT)


El algoritmo DT es una técnica que construye una serie de reglas basadas en los valores
de los atributos de una muestra de entrenamiento, para asignar una clase a cada uno de
los objetos de interés mediante una función objetivo, ver Ilustración 8, la cual es conocida
informalmente como un modelo de clasificación (Tan, 2007). Este modelo sirve como
herramienta explicativa para distinguir entre objetos de diferentes clases.

Ilustración 8 Árbol de decisión a partir de datos multiespectrales para la clasificación de áreas de


Bosque y No Bosque. IRC (Banda Espectral del Infrarrojo Cercano) A_1 (banda espectral del azul).
Fuente: Autor.

2.1.3.2.3. Bosques Aleatorios (Ramdon Forest RF)


El algoritmo RF es una técnica de clasificación que se basa en la agregación de un gran
número de árboles de decisión (Boulesteix, Janitza, Kruppa, & König, 2012), bajo la
premisa de que la combinación de muchos árboles es a menudo más exacta que depender
de tan solo un árbol (Lizarazo, 2010). Al igual que DT, RF emplea Gini como medida de
impureza para seleccionar el corte de decisión con la impureza más baja en cada nodo,
cada árbol emplea un conjunto diferente de m atributos para construir las reglas de
partición, ver Ilustración 9, y una agregación de las predicciones de cada árbol se utiliza
como la predicción final. (Khalilia, Chakraborty, & Popescu, 2011).

Ilustración 9. Simplificación ilustrada del concepto de Bosques Aleatorios (Random Forest).


(Breiman, 2001)
43

2.1.3.2.4. K-Vecinos mas Cercanos (K-Nearest Neighbors – Knn)


Es el clasificador discriminativo más simple. Los datos de entrenamiento se almacenan
simplemente con etiquetas, a partir de allí el elemento se asigna a clase temática de
acuerdo con el voto de la mayoría de otros puntos de muestra más cercanos k (empleado
una distancia euclidiana). Este es probablemente el procedimiento más simple de
clasificación que puede realizar. Es un método eficaz, pero es lento y requiere mucha
memoria (Kaehler & Bradski, 2014). En el caso de la Ilustración 10 el cuadrado verde
representa la muestra a clasificar y debe ser clasificado en estrella roja o triángulo azul. Es
obvio que se clasifica en triángulo azul mientras k se fija en 5, ya que la probabilidad de
clasificarlo en triángulo azul es 60%, una probabilidad mayor que clasificarlo como una
estrella roja 40%. Mientras que si k se fija a 10, el cuadrado verde se clasifica en estrella
roja, pues esta probabilidad es de 60%, mientras que la probabilidad de clasificarlo en
triángulo azul es de 40% (Wu, Cui, Sheng, Shi, & Zhao, 2014).

Ilustración 10. Principio del algortimo Knn

2.1.4. La imagen concebida más allá del píxel:


GEOBIA, análisis orientado a objetos.
El proceso cognitivo del mundo exterior o de una imagen a pesar de ser complejo puede
ser idealizado o modelado mediante la identificación de regiones, o áreas significativas
dentro de la información percibida. El cambio de paradigma en el cual las unidades básicas
de información no corresponden ya a píxeles aislados sino a regiones homogéneas y
significativas capaces de presentar de forma resumida y eficiente las entidades y
relaciones presentes en la imagen, los objetos, corresponden en mayor grado con la
realidad espacial y geográfica capturada en una imagen satelital (Thomas Blaschke & Hay,
2001). El objeto generado en una imagen corresponde entonces a una estructura con
atributos propios obtenido mediante el agrupamiento de píxeles con cierta homogeneidad
de acuerdo a parámetros definidos, el resultado, unidades que se aproximan en mayor
medida a los elementos del mundo real representados en la imagen.
44

2.1.4.1. Generación de objetos en una imagen


Una imagen se dispone en su forma elemental de un arreglo matricial de píxeles con
valores digitales que desplegados de forma adecuada transmiten información capturada.
Para poder trabajar con objetos sobre la imagen es necesario realizar un proceso de
generación de regiones en el que de acuerdo a ciertos parámetros se obtenga información
lo más resumida pero simultáneamente lo más significativa posible. Dicho proceso se
conoce en el procesamiento de imágenes como segmentación; la segmentación se define
como el proceso por el cual se extrae información de una imagen a partir de su división en
diferentes regiones homogéneas, ver Ilustración 11, las cuales corresponden de forma
aproximada con zonas de interés en la misma (eCognition Developer, 2009)9.

Ilustración 11. Diferentes tipos de objetos generados sobre (A) una imagen
A B C multiespectral RGB(IRC,IRM,ROJO),un objeto puede ser un píxel (B), pero son más
significativos los objetos que definen regiones espectralmente homogéneas (C).
Fuente: Autor.

La segmentación de imágenes no es un concepto nuevo, existen varios desarrollos e


investigaciones en cuanto a técnicas de segmentación, ya que como se puede esperar no
existe una única forma de generar objetos en una imagen, siempre es posible variar los
parámetros de generación de regiones y por supuesto los resultados obtenidos. En todo
caso la pertinencia de un método de clasificación se juzga en función de la información
extraída de la imagen, y si los objetos generados representan o no información significativa
y acorde con el propósito de estudio de la imagen (T. Blaschke, 2005; K. Johansen et al.,
2010; Weng, 2011).

2.1.4.2. Implementación del proceso de segmentación


El algoritmo de segmentación empleado en la presente investigación genera regiones no
determinísticas y de acuerdo a parámetros de escala y homogeneidad definidos por el
intérprete, lo cual brinda al método una alta flexibilidad en cuanto es posible sobre una
misma imagen generar objetos de diferente tamaño y con una diferente configuración de
los parámetros empleados. La técnica de segmentación aplicada fue desarrollada por
(Baatz & Schäpe, 2000) y parte del concepto general de un crecimiento de regiones bottom
up, en el que inicialmente se tiene un píxel semilla que a través de sucesivas iteraciones y

9
http://www.ecognition.com/training. Consultado el 5 de Mayo de 2015.
45

evaluaciones realiza una agregación de píxeles adyacentes hasta que se supera un umbral
o límite establecido de heterogeneidad y se denomina Segmentación en Múltiples
Resoluciones.

En una primera aproximación denominada como métodos de crecimiento de regiones


bottom – up, a partir de un determinado punto definido por los criterios de clasificación
establecidos por el usuario, y mediante un determinado valor de tolerancia en las
variaciones de color y forma que una región presenta, se desarrolla un proceso iterativo de
crecimiento, donde a un único píxel inicialmente identificado se agregan de forma
controlada nuevos píxeles hasta que el criterio de homogeneidad es sobrepasado, punto
en el que el proceso se detiene. El resultado es un conjunto finito de objetos primitivos,
que carecen aún de significado, pero que se constituyen en los bloques de información
primaria para un posterior proceso de clasificación (Baatz & Schäpe, 2000).

2.1.4.2.1. Parámetro de Homogeneidad


La definición de la homogeneidad (ψ) de acuerdo con (Baatz & Schäpe, 2000) se relaciona
generalmente con el tamaño de los objetos obtenidos, ya que una menor tolerancia de
heterogeneidad permitida redunda en objetos con una mínima variabilidad que agrupan
píxeles de diferentes valores digitales altamente correlacionados y viceversa. La variación
máxima permitida en la heterogeneidad de un objeto al adicionarse nuevos píxeles u
objetos se evalúa de dos formas: una variabilidad permitida en el color o variabilidad
espectral y una variabilidad permitida en la forma, dichas variabilidades son posteriormente
ponderadas y evaluadas de acuerdo a la expresión:
f  w  hcolor  1  w  h forma
Ecuación 1. Definición de la homogeneidad espectral de un objeto. (Baatz & Schäpe, 2000)

Donde f es el valor de fusión, w el peso o ponderación para la variabilidad en color, h color,


será la variabilidad permitida en color y hforma la variabilidad permitida en forma. La variación
permitida en color se obtiene a partir de la siguiente expresión:

 
hcolor   wc n f   cf  nobj1   cobj1  nobj2   cobj2 
c
Ecuación 2 Variación permitida en las características espectrales (Color) del objeto. (Baatz & Schäpe,
2000)

Donde wc es el peso o ponderación de la banda c, nf es el número de píxeles del objeto


resultante de la fusión de los objetos 1 y 2, σfc es la desviación estándar del objeto
resultante en la banda c, σobj1 y σobj2 son las desviación estándar de los objetos 1 y 2 en
la banda c, nobj1 y nobj2 son los números de píxeles de los objetos 1 y 2. Dicha variabilidad
en color busca minimizar la heterogeneidad espectral del objeto a generar. Como se
observa esta definición permite ponderar la información de cada una de las bandas
espectrales que componen la imagen satelital y a partir de las variaciones de los píxeles
que componen los objetos a evaluar, representada esta por la desviación estándar y
46

ponderadas además por sus tamaños de acuerdo al número de píxeles que los componen,
se hace una evaluación simétrica de la variación de heterogeneidad en el objeto resultante.
La variabilidad permitida en forma se define matemáticamente a partir del resultado del
cálculo de dos criterios complementarios: Variabilidad en Lisura de bordes y Variabilidad
en Compactación. La variabilidad permitida en forma es definida de acuerdo a:

h forma  wcompact  hcompact  1  wcompact  hlisura


Ecuación 3 Variabilidad permitida en Forma del objeto a ser creado. (Baatz & Schäpe, 2000)

En la que W compact es el peso o ponderación dada al parámetro de compactación y es


complementario a 1 del peso del parámetro de lisura. La variabilidad permitida en la
compactación del objeto resultante se define como la desviación que presenta el objeto
con la adición de un nuevo píxel u objeto de tener una forma compacta y se calcula como
la razón entre el perímetro del objeto (l) y la raíz cuadrada del número de píxeles (n) que
forman los objetos en cuestión. La expresión utilizada pondera el valor por compactación
para los objetos constituyentes así como para el objeto resultante por su tamaño en
píxeles, para así comparar adecuadamente la situación antes y después de la fusión. La
definición de este parámetro entonces se realiza a partir de la siguiente expresión:

lf  lobj1 lobj2 
hcompact  n f    nobj1   nobj2  
n f  nobj1 nobj2 

Ecuación 4 Evaluación de la variabilidad en la compactación del objeto a ser creado. (Baatz & Schäpe,
2000)

La variabilidad permitida en la Lisura de Bordes (hlisura) se define como la desviación que


presentan los bordes del objeto resultante, de un criterio de regularidad que puede definirse
como la relación entre el perímetro del objeto (l) y la menor longitud del borde de la caja
que lo inscribe (b), es decir cuál es la relación entre el exceso en longitud en el perímetro
del objeto con relación al perímetro regular definido dicho rectángulo, dicho valor es
ponderado para cada objeto por su correspondiente tamaño en píxeles para comparar
adecuadamente la situación antes y después de la fusión. La definición de este parámetro
entonces se realiza a partir de la siguiente expresión:

lf  l l 
hlisura  n f    nobj1  obj1  nobj2  obj2 
b f  bobj1 bobj2 
Ecuación 5 Evaluación de la variabilidad en la lisura de los bordes del objeto a ser creado. (Baatz &
Schäpe, 2000)

La variabilidad en heterogeneidad, Ecuación 1, para el objeto resultante se define


finalmente como la suma de la heterogeneidad en color, Ecuación 2, y la heterogeneidad
en la forma, Ecuación 3, del objeto multiplicado por sus pesos respectivos, estos pesos
son seleccionados por el usuario y deben sumar 1. El valor final de fusión f obtenido de la
evaluación de cada uno de los parámetros anteriormente mostrados, corresponde a la
evaluación de la variabilidad general del objeto resultante. Dicho valor es comparado con
47

el parámetro de homogeneidad y por medio del siguiente criterio de decisión se evalúa la


pertinencia en la adición de cada píxel a un objeto ya existente de acuerdo al criterio de
homogeneidad establecido:

𝑆𝑖 Ψ > 𝑓
Entonces adicione el píxel u objeto al objeto n
𝑆𝑖 < 𝑓
Entonces detenga el crecimiento del objeto n, no adicione el píxel u objeto en cuestión

La combinación de parámetros no es única, de forma general y para estudios de


coberturas vegetales a diferentes escalas, se ha concluido que es necesario mantener una
mayor valor del parámetro de color sobre la forma, y una mayor ponderación al parámetro
de lisura en el componente de forma (Ardila et al., 2004), algunas combinaciones de
parámetros adecuadas se presentan en la Ilustración 12.

Ilustración 12.Ponderaciones más adecuadas para el parámetro de homogeneidad en proceso de


segmentación de imágenes Landsat para coberturas vegetales. (Ardila & Espejo, 2005)
48

2.2. Sobre los métodos de detección de


cambios: Datos temporales a Información
Multitemporal.
En sensores remotos los cambios se consideran como alteraciones de los componentes
de la superficie a diferentes tasas. La información sobre el cambio de la cobertura terrestre
(LC) y uso del suelo (LU) son importantes por sus aplicaciones prácticas en diversas
aplicaciones, como la deforestación, evaluación de los daños, monitoreo desastres, la
expansión urbana, la planificación y gestión del territorio (Li et al., 2012; van Oort, 2007).
La detección de cambios (CD) se define como ''el proceso de identificación de las
diferencias en el estado de un objeto o fenómeno mediante la observación en diferentes
momentos''. La detección de cambios utiliza datos multitemporales para establecer y
analizar cualitativamente los efectos temporales de los fenómenos y cuantificar los
cambios. Los datos obtenidos mediante teledetección se han convertido en una fuente
importante para los estudios de CD debido a su alta frecuencia temporal, visión sinóptica
y más amplia capacidad espaciales y espectrales (Thomas Blaschke & Hay, 2001; Zhou
et al., 2008). El objetivo general de del análisis de cambios incluyen la identificación de la
ubicación geográfica y el tipo de cambio, la cuantificación de los cambios, y la evaluación
de la exactitud de los resultados.

El desarrollo de métodos de análisis de cambio es un problema de investigación siempre


activo. El principio en la utilización de datos provenientes de sensores remotos es que los
cambios en el objeto de interés van a alterar el comportamiento espectral (valor de
reflectancia o la textura local) y estos se pueden separar de los cambios causados por
otros factores (condiciones atmosfericas, iluminación y ángulos de visión, y humedad del
suelo) (Hussain et al., 2013). En el análisis de cambios los datos se ven afectados por
diversos elementos, entre ellos las limitaciones espaciales, espectrales, temáticas y
temporales, la resolución radiométrica, condiciones atmosféricas, y las condiciones de
humedad del suelo. Diferentes técnicas de análisis de cambios se han desarrollado en el
pasado, dependiendo de los requisitos y condiciones. Sin embargo, la selección del
método más adecuado o algoritmo para la detección de cambio no es fácil en la práctica,
se han hecho grandes esfuerzos en el desarrollo de diferentes metodologías de detección
de cambios, incluyendo los tradicionales basadas en píxeles y, más recientemente
basados en objetos (Aguirre-Gutiérrez, Seijmonsbergen, & Duivenvoorden, 2012; T.
Blaschke, 2005; Bontemps et al., 2008, 2008; Desclée, Bogaert, & Defourny, 2006; Hall &
Hay, 2003; J. Im, Jensen, & Tullis, 2008; Jungho Im & Jensen, 2005).

En la Tabla 1 se presenta una revisión de los métodos de análisis de cambios que se


aplican actualmente en el monitoreo de los cambios de coberturas. Se detallan las
ventajas, desventajas y características de cada uno de los modelos. La tabla fue tomada y
adaptada de (Hussain et al., 2013).
TECNICA SUBCLASE APROXIMACIÓN VENTAJAS LIMITACIONES
-No hay matrices de cambio de información óptima selección del
umbral
-Simple
Diferencia de imágenes -El valor de la diferencia es absoluta. Por ello mismo valor puede
-Resultados de fácil interpretación.
tener un significado diferente en función de la clase de inicio.
-Cambios binarios (cambio vs sin cambios)
Comparación Maneja mejor los errores por calibración de los datos (incluyendo -No hay matrices completas de información de cambio
directa Cociente entre Imágenes ángulo de elevación solar, sombras y el impacto topografía) -Los resultados binarios no se distribuyen normalmente.
errores (Rignot y van Zyl 1993) -Cambios Binarios (cambio vs sin cambios)
-Es realizado mediante la diferencia en la media y la varianza entre -Necesita regresiones precisas para las bandas seleccionadas
los valores de píxeles para diferentes fechas por lo tanto reduce -Método más apropiado para la medición de la conversión de un tipo
Análisis de regresión
los efectos adversos de las condiciones atmosféricas y ángulos de a otro y poco adecuado para detección de cambios sutiles (Coppin et
toma (Singh, 1989) al. 2004)
Vegetación diferenciación -Aleatorio o ruido coherente
-Reduce el impacto de los efectos topográficos y de iluminación
índice -Cambios binarios (cambio vs sin cambios)
-Permite procesar cualquier número de bandas espectrales
deseadas
-Produce información detallada detección de cambios
-Es difícil identificar las trayectorias de cambio de cobertura
Análisis de Cambio -Adecuado cuando: (a) ya sea el cambio de interés o su
-Estrictamente requieré los datos obtenidos por teledetección
Vectorial (CVA) manifestación espectral no son bien conocidos (b) el cambio de
adquiridos en el mismo período fenológico (Chen et al. 2003)
interés se conoce o tiene una alta variabilidad espectral y (c)
aunque los cambios, tanto en tipo de cobertura terrestre y la
condición puede ser de interés (Johnson y Kasischke 1998)
-Dependiente de la escena por lo que es difícil de interpretar y
Transformación / Análisis de componentes Reducción de la redundancia de datos. determinar una clasificación para diferentes fechas
de Imagen principales (PCA) Destaca una información diferente en los componentes derivados -No distingue entre tipos de cambio, sino que se informa sobre las
Basada en
zonas que han cambiado (cambio binario)
píxeles
Reducción de la redundancia de datos.
Independiente de la Escena
Transformación Tasseled -Difícil de interpretar y modificar la calse de asignación
Produce componentes espectrales estables que permitan el
Cap (KT) -No hay matrices completas de cambio
desarrollo del análisis de la información espectral de referencia
para estudios a largo plazo
Explicación estadística de la distribución espacial de los píxeles de
la imagen
Análisis de texturas -Las áreas estables tienen un mayor valor de la textura en -Dependiente del tamaño de la ventana
comparación con las áreas de cambio
-Medir la frecuencia relativa de la proximidad espacial
-Reducción del impacto ambiental
-Exige un conjunto de datos precisos y completos
Comparación -Matrices completas de cambio
Detección de -La exactitud depende de la precisión de clasificación de imagen
postclasificación -También minimiza el impacto del uso de imágenes de sensores
cambios basado individual
múltiples
en clasificación
Comparación directa -Dificultad para marcar el cambio de clases
No es necesario corrección atmosférica de los atmosférica
Multifecha -No proporciona matriz de cambios completo (Jensen 2005)
-Los principales problemas con ANN incluyen: (a) la capa oculta en
Redes Neuronales ANN no se conoce bien, (b) la cantidad de datos de entrenamiento
Estimación no paramétrica basado en datos de entrenamiento
Artificiales ANN es importante en la enseñanza de la red, y (c) las funciones ANN no
son comunes en el software de procesamiento de imágenes
Aprendizaje
-No-paramétrico y ninguna suposición sobre la distribución de los -Dificultad en la elección de la mejor función del núcleo
Automático
datos -El tiempo de cálculo para la clasificación y la optimización de
Máquinas de Soporte
-Capaz de manejar pequeños conjuntos de datos de alcanzar durante la fase de aprendizaje aumenta exponencialmente
Vectorial SVM
entrenamiento y con frecuencia produce una mayor precisión de con el aumento de la dimensionalidad de los datos (Habib et al.
clasificación que los métodos tradicionales (Mantero et al. 2005) 2009)

Tabla 1 Resumen de las metodologías de detección de cambios en imágenes satelitales. Adaptada de (Hussain et al., 2013).
50

-Teóricamente puede manejar grandes conjuntos de datos de


mayor dimensión y se utiliza sobre todo para la clasificación de
imágenes hiperespectrales (Melgani y Bruzzone 2004)
Sensible a la calidad de los datos de entrenamiento y el número de
muestras de entrenamiento por clase y pueden ser sobre-entrenado
-No-paramétrico y ninguna suposición sobre la distribución de los
de tal manera que el modelo no es aplicable a las bases de datos de
datos
Árbol de decisiones DT otras zonas o períodos de tiempo (Lippitt et al. 2008)
-Puede proporcionar el conjunto de reglas para el cambio y las
-No busca un ajuste óptimo
clases de no-cambio
-Puede crecer mucho más en tamaño y hacer que sea difícil de
interpretar
-Permite acceder a los datos complementarios de los SIG para
Calidad de datos de diferentes fuentes, diferentes precisiones
GIS Integración GIS ayudar a la interpretación de imágenes y análisis de actualización
geométricas
de base de datos GIS
-Identifica muestras adecuadas
-Define umbrales adecuados para cada uno de cobertura de suelo
-Los resultados son estables precisos y repetibles
Análisis de mezcla espectral -Método complejo y altos tiempos de ejecución
-Capaz de recuperar las señales de cambio en los ecosistemas
naturales en escalas de eventos mucho más finas por ejemplo,
degradación de los ecosistemas forestales (Coppin et al. 2004)
Métodos -Define umbrales objetivamente
Avanzados Detección difusa de -Permitir una pertenencia de clase probabilística puede -Asignación de cambio entre una matriz de muchas clases de
cambios proporcionar una representación más adecuada que un superposición puede ser difícil o no informativa (Kennedy et al. 2009)
clasificador convencional
-Permite tomar ventaja de los diferentes sensores para detectar
Fusión de datos multi-
diferentes objetos -Diferente resolución espacial y espectral necesitan estrategias de
sensor para la detección de
-En el análisis de series de tiempo útil cuando uno de los sensores fusión
cambios
no esta disponibles
-Método sencillo de comparación de objetos
-Los objetos tienen las mismas propiedades geométricas en dos -Depende de la precisión de la segmentación
Objetos extraídos de una
Comparación de momentos -Dificultad en la búsqueda de objetos espacialmente
imagen, son comparados
Objeto Directo -Cambios en las propiedades geométricas (es decir, los correspondientes en imágenes multitemporales -selección del umbral
con los objetos de la
base parámetros de la forma del tamaño longitud frontera) -Poco apropiada cuando se comparan los objetos basándose en
segunda imagen
-Cambio de características espectrales (textura) tanto la geometría y las características espectrales
-Fácil integración con GIS
-La diferencia en tamaño y la correspondencia de los objetos de
imagen a partir de imágenes multitemporales debido a la
-Todos los objetos disponibles se utilizan para el cambio basado
Basada en segmentación
Comparación de la Dos segmentaciones en objetos detectados
Objetos -Durante la búsqueda de objetos extraídos de una imagen en una
clasificación de creadas por separado -Permite cuantificar el cambio geométrico y topológico
segunda imagen el error de localización puede causar cambios
objetos comparadas -Cambio basado en la clasificación de comparación de matriz de
incorrectos en los resultados
cambio completa (Chen et al. 2012a)
-Depende de la exactitud de la segmentación
-Matriz de cambio completa
-Una sola segmentación de todas las imágenes
-Los resultados pueden ser artefactos que puedan resultar de errores
Detección de -Los objetos tienen las mismas propiedades geométricas en dos
Imágenes Bi-temporales de registro y las diferencias en las sombras entre las fechas
cambio de objeto momentos
apiladas -No proporciona nuevos/diferentes objetos que puedan ser creados
multitemporal -Aprovechar las características espectrales y derivados
en diferentes momentos debido al cambio
geométricas para crear trayectorias de cambio
-Permite buscar en grandes conjuntos de datos
Minería de Minería de datos -Difícil curva de aprendizaje
-Búsqueda espaciotemporal de patrones de extracción y las
Datos de imágenes de -No permite la integración directa en las principales herramientas de
relaciones que proveen
Espaciales teledetección procesamiento de imágenes y las herramientas de minería de datos
-Agrupamiento avanzado y algoritmos de clasificación
(continuación de Tabla 1) Resumen de las metodologías de detección de cambios en imágenes satelitales. Adaptada de (Hussain et al., 2013).
2.3. Métodos de evaluación temática:
Exactitud de los mapas obtenidos.
Una aproximación tradicional bien conocida y frecuentemente usada para realizar la
evaluación de calidad temática de los mapas derivados de procesos de clasificación
automática, es estimar su exactitud directamente a partir de la proporción de
observaciones clasificadas correctamente, mediante un recuento aciertos/desaciertos de
las clases en una matriz de error (Congalton & Green, 2008a; Jensen, 2009b; Salinero,
2002b). El principal beneficio de usar esta aproximación como medida de fiabilidad es su
simplicidad, siendo fácil de calcular, fácil de entender y útil para interpretar (Pontius &
Millones, 2011).

La exactitud temática se define como el grado de acuerdo entre el mapa producido y


clasificación de referencia. Las medidas más utilizadas de precisión son los siguientes
(véase (Liu et al., 2007) para una revisión exhaustiva de otras medidas de exactitud):

1. La exactitud global es simplemente la proporción de la superficie asignada


correctamente. Se proporciona al usuario del mapa con la probabilidad que se
clasifico correctamente una ubicación seleccionada aleatoriamente en el mapa.
2. La exactitud del usuario es la proporción de la superficie asignada como una
categoría en particular que en realidad es que la categoría "sobre el terreno", donde
la clasificación de referencia es la mejor evaluación de la condición del suelo. Si un
"usuario" emplea el mapa de cambio definitivo para la localización un área particular
de cambio de la tierra, la exactitud del usuario da la probabilidad condicional de que
el mapa de ubicación de hecho haber cambiado. Exactitud del usuario es el
complemento de la probabilidad de error de comisión.
3. La exactitud del productor es la proporción de la superficie que es una categoría en
particular en el terreno que se también fue clasificada como esa categoría. La
exactitud del productor ofrece el "productor" del mapa final cambio de la tierra con
la probabilidad condicional de un lugar determinado de cambio real de la tierra
aparece como el cambio de la tierra en el mapa. La precisión del Productor es el
complemento de la probabilidad de error por omisión.
4. El coeficiente kappa de concordancia se utiliza a menudo como una medida general
de la precisión. Kappa incorpora supuestamente un ajuste por "acuerdo de
asignación al azar", pero la validez de dicho ajuste es discutible y numerosos
artículos han cuestionado el uso de kappa (Pontius & Millones, 2011). Ajustando
por acuerdo de asignación al azar no tiene relevancia para la estimación de área
por lo que el siguiente análisis y discusión no incluirán kappa. Se recomienda que
kappa no debe utilizarse en la evaluación de la precisión de los mapas de cambio
de la tierra.
52

Debido a que las medidas de precisión se calculan típicamente de una muestra, estas
estimaciones están sujetas a incertidumbre. La incertidumbre de una estimación se puede
representar mediante el cálculo de su error estándar o mediante la presentación de
informes un intervalo de confianza. Un intervalo de confianza proporciona un rango de
valores para un parámetro teniendo en cuenta la incertidumbre de la estimación basada
en la muestra. La manera en que se aborda la incertidumbre depende del marco inferencia
empleado.

La exactitud global de un mapa de cambio construido mediante la superposición de dos


clasificaciones de cobertura del suelo es el producto de las exactitudes generales de los
mapas pre-comparación si los errores de clasificación son independientes (Fuller, Smith,
& Devereux, 2003; van Oort, 2007). Sin embargo, la presunción de errores independientes
en general, sería insostenible porque lugares que son difíciles de clasificar correctamente
a una fecha probablemente serían difíciles de clasificar correctamente en otra fecha
(Congalton & Green, 2008a). Por lo tanto la presentación de informes de exactitud global
para ambas fechas no es adecuada para el reporte de la exactitud global del mapa de
cambio obtenido mediante post-clasificación.

Varios estudios sobre cambios en las coberturas de la tierra además han mostrado que es
incorrecto estimar directamente la exactitud de un mapa final de cambio, a partir del
recuento de observaciones mediante una matriz de error (Abdulaziz, Hurtado, & Al-Douri,
2009; Jeon, Olofsson, & Woodcock, 2014; Olofsson et al., 2010; Seto et al., 2002). Por lo
tanto, los estudios de cambio de coberturas de la tierra habitualmente fallan al evaluar la
exactitud de los mapas finales de cambio (Olofsson et al., 2014).

Para superar las limitaciones impuestas por el enfoque tradicional de evaluación exactitud
temática de mapas de cambio de coberturas de la tierra, investigadores de la Universidad
de Boston (Olofsson et al., 2014; Olofsson, Foody, Stehman, & Woodcock, 2013) proponen
seguir una serie de recomendaciones y consideraciones, que han sido aceptadas por la
comunidad de sensores remotos como buenas practicas. De acuerdo con estas, una
persona o institución independiente al productor debe verificar la exactitud temática de los
productos que se generen en la elaboración de mapas de Bosque/No Bosque y del mapa
de Cambio de Bosque, abordando principalmente tres componentes: (i) un diseño de
muestreo probabilístico; (ii) un diseño de la respuesta que sea coherente con la información
de referencia a usar; y (iii) un análisis para estimar la exactitud, a partir una matriz de error
construida mediante estimadores insesgados.
53

2.3.1. Evaluación de la exactitud basada en


objetos geográficos.
Como lo indica (Lizarazo, 2014a) las técnicas de análisis de imagen basado en objetos
están mejorando a un ritmo rápido. Si bien este avance es notable, varios problemas
pueden obstaculizar las posibles aplicaciones de la teledetección en diferentes campos y
complican la integración entre análisis de imágenes basados en objetos geográficos
(GEOBIA) y los conjuntos de datos geográficos existentes. Una de las mayores
preocupaciones es cómo desarrollar técnicas apropiadas para la evaluación de la exactitud
de las clasificaciones de cobertura del suelo basados en objetos. En los últimos años, se
han propuesto varias métricas basadas en objetos para superar las limitaciones de la
matriz de error tradicional (véase, por ejemplo Persello y Bruzone (2010); Hernando et al
(2012) . Möller et al (2013)). A pesar de que estas propuestas parecen estar bien
fundadas, la mayoría de ellos suelen evaluar la precisión separando el componente
geométrico del. Es necesario un enfoque de evaluación simple e integrado basado en el
objeto. Y por ello se formula la matriz STEP10, una matriz de similaridad basada en objetos
para evaluar tanto la precisión geométrica y temática de la clasificación de imágenes.

2.3.1.1. Similitud en Forma


La forma describe la geometría de cada uno de los objetos espaciales, esta se caracteriza
generalmente con un indicador de la compactación que describe como la forma del objeto
como se aleja o varia de una geometría base (Lizarazo, 2014a). La forma de evaluar esta
similitud se realiza mediante un índice normalizado, [0,1], de forma que compara el NPI
(Índice Normalizado de Perímetro), del objeto de referencia y el objeto clasificado.

𝑝𝑒𝑎𝑐
𝑁𝑃𝐼 =
𝑝𝑜𝑏𝑗
Ecuación 6 Índice de perímetro normalizado (Lizarazo, 2014a)

𝑆 = 𝑟𝑛𝑝𝑖𝑘
Ecuación 7 Cálculo de la similaridad de Forma para la matriz STEP (Lizarazo, 2014a)

2.3.1.2. Similitud Temática


Se evalúa en este caso que tan bien clasificado está el objeto con respecto al objeto de
referencia. Y se calcula mediante la proporción, intersección, del área correctamente
clasificada Aint con respecto al área total del objeto de referencia Aref. El rango de este
indicador es (0,1].
𝐴𝑖𝑛𝑡
𝑇=
𝐴𝑟𝑒𝑓
Ecuación 8 Evaluación de la similitud temática en la matriz STEP (Lizarazo, 2014a)

10
Shape (Forma), Thematic (Categoría temática), Edge (borde), Posición (Pocision)
54

2.3.1.3. Similitud en Borde


Se evalúa la similitud en borde determinando la proporción del segmento de borde del
objeto de referencia, Pref, que condice con el objeto clasificado, lint, en una banda de
tolerancia o incertidumbre, épsilon, para la determinación de la coincidencia espacial del
borde de los objetos a comparar.
𝑘
𝑙𝑖𝑛𝑡
𝐸=( )
𝑝𝑟𝑒𝑓
Ecuación 9 Cálculo de la similaridad de Borde en la matriz STEP (Lizarazo, 2014a)

2.3.1.4. Similitud en posición


Este indicador compara la diferencia en el centroide de los dos objetos a comparar. Se
emplea una medida de distancia euclideana entre los centroides de la figura geométrica
de cada objeto, dcent referencia y clasificado, y se normaliza por el diámetro de área
combinada, dcent, de los dos objetos en comparación.

𝑑𝑐𝑒𝑛𝑡
𝑃=1−
𝑑𝑐𝑎𝑐
Ecuación 10 Cálculo de la similaridad en posición en la matriz STEP (Lizarazo, 2014a)

2.3.1.5. Matriz STEP


La matriz STEP pude presentarse evaluando cada una de los indicadores para cada objeto
de la muestra, y también consolidarse ponderada de acuerdo al área de la muestra que
representa cada objeto. Los indicadores de exactitud del productor y exactitud del usuario
y promedio de la clasificación pueden ser calculados una vez se han realizado los cálculos
de agregación y ponderación de las áreas de cada categoría resultante (Lizarazo, 2014a).

2.3.1.6. Aplicación e interpretación de los datos de la


Matriz STEP
De acuerdo con (Lizarazo, 2014b) para el caso de un set de elementos clasificados y su
respectiva base de comparación, los resultados de la matriz STEP se consolidan por
Objeto (ver Ilustración 14), Métrica y una agregación a nivel de geometría y valor temático
con sus respectivos intervalos de confianza y productor del productor (ver Tabla 2).
55

Ilustración 13. Izquierda, Objetos de referencia. Derecha, Objetos clasificados. (Lizarazo, 2014a)

Ilustración 14 Detalle de los resultados de los indicadores STEP por cada objeto en el ejemplo dado
por (Lizarazo, 2014a)

Tabla 2. Matriz STEP por agregada por clase a partir de los objetos de referencia11. (Lizarazo, 2014a)

11
Los valores en orden Z representan las métricas de similaridad de Forma (Shape), similaridad de Categoria (Theme),
similaridad de Borde (Edge) y similaridad de posición (Position).
56

Tabla 3 Matriz de error ponderado para la métrica de Forma (shape)12. (Lizarazo, 2014a)

Tabla 4 Exactitud geométrica y temática promedio y sus intervalos de confianza. (Lizarazo, 2014a)

En el caso ilustrado como ejemplo13 en (Lizarazo, 2014a) donde se comparan los objetos
clasificados en un sector de la ciudad de Nueva York y los objetos de referencia tomados
de la cartografía oficial de la zona, ver Ilustración 13, el resultado de la evaluación
desagregado en las 4 métricas por cada clase, ver Tabla 2, nos muestra que por ejemplo
la clase Agua tiene un indicador de forma de 0,74, temático de 0,96, Borde 0,18 y posición
de 0,94. Esto indicaría una adecuada clasificación temática de los elementos (temático,
posición) pero algunas diferencias en las características geométricas de los mismos (forma
y borde). Cada métrica se presenta de forma agreda y ponderada por las áreas de traslape
de los objetos de referencia y clasificados para poder determinar los valores de exactitud
del productor y el usuario, ver Tabla 3. Los análisis a nivel de objeto, ver Ilustración 14,
pueden llevarse a cabo para determinar con mayor exactitud las discrepancias a nivel
puntual. Finalmente los valores agregados promedio de cada métrica y su correspondiente
intervalo de confianza se determinan para todo el conjunto de muestras, ver Tabla 4.

12
El valor en cada celda en la representa la ponderación del área de traslape entre los objetos clasificados y de referencia,
agregados por clase y multiplicado por el valor de la similaridad de cada métrica.
13
Los datos compartidos por el autor se pueden encontrar en https://goo.gl/Gso2B3. Consultado el 2 de Mayo de 2015
57

2.4. Sobre los avances en la estimación


de la deforestación.
La importancia del monitoreo de la extensión y cambio de las áreas de bosque14 radica en
la importancia de estos ecosistemas en términos de servicios que proveen para la
humanidad, tanto en bienes tangibles como maderas y recreación, servicios ecosistémicos
intangibles como regulación climática, biodiversidad y protección y regulación del ciclo del
agua. En diferentes latitudes los diferentes tipos de bosques se ven sometidos a fuertes
presiones de agentes económicos como de factores biofísicos que alteran su extensión y
capacidad (Achard & Hansen, 2012b).

Son los factores asociados al cambio climático los que mayor urgencia han requerido el
diseño e implementación de sistemas de monitoreo de los bosques a nivel global. La
deforestación y la degradación de los bosques son procesos que se asocian directamente
al aumento de las emisiones de CO2 y de allí parten la necesidad por implementar
diferentes sistemas de monitoreo (inventarios forestales, monitoreó de cambios de
coberturas) de los cambios en la superficie de las áreas de bosque y su estimación en las
potenciales emisiones de CO2 asociadas a dichos cambios de cobertura (Achard &
Hansen, 2012b; Asner, Knapp, Balaji, & Páez-Acosta, 2009; Cabrera et al., 2011a; Phillips
et al., 2011b).

La cuantificación de la deforestación a nivel global, regional y local se ha desarrollado y


potencializado gracias a la cada vez mayor disponibilidad de datos satelitales y de políticas
de datos abiertos para uso civil (Matthew C. Hansen & Loveland, 2012; Wulder, Masek,
Cohen, Loveland, & Woodcock, 2012) dado que estos permiten reducir los tiempos y
costos en la generación de mapas de superficie de bosque a escala moderadas (10 m a
250 m) y bajas (100 m a 1 km). Los procesos más empleados en monitoreo de superficie
de áreas boscosas y sus cambios se pueden catalogar en 3 tipos: (i) Identificación de Hot
Spots de deforestación a partir de datos satélites de baja resolución como MODIS, (ii) el
uso simultaneo de datos de media y baja resolución (MODIS y Landsat) para la detección
de áreas de deforestación y la posterior cuantificación detallada de la misma y (iii) un
análisis del territorio completo (Wall to Wall) a partir de datos de media resolución espacial
(Landsat, SPOT, Rapideye etc) (Achard & Hansen, 2012b). A continuación un resumen de
las más importantes iniciativas y sistemas de monitoreo de la deforestación.

14
Para propósitos del presente estudio se entiende como bosque, la tierra ocupada principalmente por árboles que puede
contener arbustos, palmas, guaduas, hierbas y lianas, en la que predomina la cobertura arbórea con una densidad mínima
del dosel de 30%, una altura mínima del dosel (in situ) de 5 metros al momento de su identificación y un área mínima de 1
ha. Se excluyen las coberturas arbóreas de plantaciones forestales comerciales (coníferas y/o latifoliadas), cultivos de palma
y arboles sembrados para producción agropecuaria (Cabrera et al., 2011a).
58

2.4.1. Global Forest Change


La universidad de Maryland ha desarrollado el sistema Global Forest Change, empleando
datos de satélites de observación de la Tierra (MODIS y Landsat) y se ha estimado una
pérdida mundial de bosques (2,3 millones de kilómetros cuadrados) y una ganancia (0,8
millones de kilómetros cuadrados) en el periodo 2000-2012 con una resolución espacial de
30 metros y a partir de proceso de integración y análisis de series de tiempo basada en
píxeles (Matthew C. Hansen et al., 2013). Los datos se actualizan anualmente y brindan
una caracterización de las áreas de ganancia/perdida de la cobertura boscosa, varias
opciones de acceso y procesamiento pueden realizarse desde el portal del proyecto15.

Ilustración 15 Sitio Web de Global Forest Change, Universidad de Maryland. Presentando los datos de
Perdida de bosque entre 2000 y 2013 para el norte de Sur América. Consultado el 20 de Marzo de 2015.
http://earthenginepartners.appspot.com/science-2013-global-forest

2.4.2. PRODES
En Brasil el Proyecto PRODES realiza el monitoreo por satélites la deforestación en la
Amazonía y calcula, desde 1988, las tasas anuales de deforestación que son utilizados por
el gobierno brasileño para el establecimiento de políticas públicas. Las tasas anuales se
estiman a partir de los cambios de la deforestación identificadas mediante interpretación
visualmente en cada imagen de satélite Landsat, históricamente las más utilizadas,
además de imágenes CCD del CBERS-2 y CBERS-2B, programa de monitoreo satelital
chino-brasileño, se utiliza también imágenes LISS-3 imágenes, las ResourceSat-1 satélite
de la India y de Inglés satélite UK-DMC2. Con estas imágenes, el área mínima asignada
por PRODES es 6,25 hectáreas (Achard & Hansen, 2012b; Prodes, 2013). PRODES utiliza
proceso el sistema de información geográfica llamada TerraAmazon que permite un
entorno de colaboración para el desarrollo de múltiples tareas de interpretación y gestión
de la información sobre deforestación y otros cambios de coberturas (Ribeiro, de Freitas,
de Queiroz, Petinatti, & Abreu, 2007). Los datos consolidados y los datos base empleados
pueden consultarse en la plataforma del proyecto PRODES16.

15
http://earthenginepartners.appspot.com/science-2013-global-forest. Revisado el 9 de mayo de 2015.
16
http://www.dpi.inpe.br/prodesdigital/prodes.php. Consultado el 9 de Mayo de 2015
59

Ilustración 16 Plataforma de acceso y consulta de los datos del proyecto PRODES. Consultado el 20
de Marzo de 2015.
http://www.dpi.inpe.br/prodesdigital/prodes.php

2.4.3. Terra-i
El proyecto Terra-i detecta los cambios de cobertura vegetal con una periodicidad de 16
días y una resolución espacial de 250 metros, empleando datos de MODIS y TRMM. En la
actualidad este sistema monitorea únicamente América Latina. Terra-i es una colaboración
entre el Centro Internacional de Agricultura Tropical (CIAT - DAPA, con sede en Colombia),
The Nature Conservancy (TNC), la Escuela de Negocios e Ingeniería (HEIG-VD, con sede
en Suiza) y el Kings College London (KCL, con sede en el Reino Unido). El sistema emplea
algoritmos de redes neuronales para detectar los cambios en el verdor de la vegetación,
incorporando a demás los datos sobre precipitación y ciclos fenológicos (Reymondin et al.,
2012b). Por lo tanto en el sistema se detectan no solo los cambios asociados a
deforestación, sino además a procesos naturales y agrícolas. Los datos base y reportes
consolidados pueden consultarse desde la plataforma del proyecto17.

17
http://www.terra-i.org/es/terra-i/data/data-statistics.html. Revisado el 5 de Mayo de 2015.
60

Ilustración 17 Plataforma web de consulta de los datos de Terra-i.


http://www.terra-i.org/terra-i/data/data-downloads.html. Consultado el 20 de Marzo de 2015.

2.4.4. Sistema de Monitoreo de Bosques y


Carbono IDEAM
En Colombia el IDEAM ejecuto el Proyecto “Capacidad institucional técnica y científica
para apoyar proyectos de Reducción de emisiones por Deforestación y Degradación -
REDD- en Colombia” que evaluó diversas metodologías de procesamiento digital de
imágenes de sensores remotos para la determinación de la deforestación y la estimación
del almacenamiento de carbono en los bosques. Este procesos llevo a la creación del
sistema de monitoreo de la cobertura forestal. Se generan dos datos a nivel nacional, uno
a escala gruesa (compatible con 1:500000) y el otro a escala semidetallada (compatible
con 1:100000) que generan información histórica de deforestación para todo el territorio
continental. Para el ejercicio nacional de monitoreo de la cobertura de los bosques y la
detección de las zonas de deforestación activa a escala gruesa se han seleccionado
imágenes del sistema MODIS, con una resolución espacial de 250m y una resolución
espectral de 7 bandas, el proceso de detección de cambios se basa en un proceso de
análisis de cambios a nivel del valor de reflectancia de cada píxel. Para la cuantificación
de la deforestación a escala fina se han seleccionado principalmente imágenes del sistema
LANDSAT, con una resolución espacial de aproximadamente 30m y una resolución
espectral de 7 bandas y un periodo de revisita de dieciséis días, el procesamiento digital
de las imágenes se basa en un proceso semiautomatizado para la clasificación de
coberturas (Bosque y No Bosque) y a verificación visual de los cambios mediante la
comparación de dos mapas en periodos diferentes (Cabrera et al., 2011a). También se
han implementado procesos para la detección directa del cambio de imágenes a partir del
uso de series de tiempo y análisis de compuestos temporales de imágenes (Galindo et al.,
2015).
61

Ilustración 18 Mapa de Cambio de Bosques Colombia 2012-2013. IDEAM18.

18
Tomado de
http://capacitacion.siac.ideam.gov.co/SIAC/home/img/pdfTemporalSMBYC/Cambio/DCCB_SMBYC_CBBQ_V5_2012_201
3.pdf Consultado el 20 de Julio de 2016
62

CAPITULO 3. DATOS Y MÉTODOS


63

3.1. ZONA DE ESTUDIO


La presente propuesta de investigación se desarrollara en un área delimitada por el área
de influencia de 5 km al Límite oficial del Parque Nacional Natural Sierra de la Macarena19
(ver Mapa 1 ).

Mapa 1 Localización General del Parque Nacional Natural Sierra de la Macarena. Elaboración propia.

El área del parque nacional es de 6056 km2. El área empleada para el presente estudio, y
que comprende al Parque Nacional, comprende un total de 9242.4 km2. Y se extiende
sobre 2 departamentos, Meta y Guaviare, y 8 municipios: La Macarena, Mesetas, Puerto
Concordia, Puerto Rico, San José del Guaviare, San Juan de Arama, La Uribe y
Vistahermosa. Un resumen de las áreas de cada entidad administrativa que se encuentra
dentro del área de estudio se presenta a continuación:

19
Delimitación oficial por parte de la UESPNN. Obtenida el 10 de noviembre de 2014 en el sitio web SIG-OT del IGAC.
64

MUNICIPIO DEPARTAMENTO
Área Área de Porcentaje Área de Porcentaje
Departamento Municipio Total Estudio del Área Estudio del Área
(km2) (Km2) de Estudio (Km2) de Estudio
San José Del
GUAVIARE 16794,1 668,0 7,2% 668,0 7,2%
Guaviare
La Macarena 10835,5 1.848,2 20,0%
Mesetas 2277,2 1.223,9 13,2%
Puerto
1254,3 115,7 1,3%
Concordia
META Puerto Rico 3379,1 1.797,3 19,4% 8574,4 92,8%
San Juan De
1179,5 303,2 3,3%
Arama
Uribe 6432,7 188,9 2,0%
Vistahermosa 4835,8 3.097,1 33,5%
TOTAL 46988,2 9.242,5 100,0% 9.242,5 100,0%
Tabla 5 Proporción de áreas administrativas en la zona de estudio20. Elaboración propia.

3.1.1. Parque Nacional Natural Sierra de La


Macarena
De acuerdo con la información oficial de la UAESPNN21 el Parque Sierra de La Macarena
es una isla de gran importancia biológica y geológica, hecho que se puede evidenciar en
los grupos de plantas y animales que se han encontrado, donde algunas de las primeras
han sido coleccionadas en África y muchos de los segundos son de procedencia marina.
La Macarena ha sido catalogada como un lugar excepcional para el desarrollo y la
evolución de la vegetación y la fauna de origen guyanense, amazónico, andino y
orinocense. En consecuencia es un ecosistema estratégico prioritario en razón a que es
depositaria del patrimonio natural más representativo de la biodiversidad colombiana,
siendo refugio biológico.

El parque fue creado por decreto ley 1989 de 1989, cuenta con una extensión de 605.600
hectáreas y se encuentra ubicado en el departamento del Meta en jurisdicción de los
municipios de La Macarena, Mesetas, Vistahermosa, San Juan de Arama, y Puerto Rico.
Dentro del mosaico formado por los distintos ecosistemas se puede observar selvas
húmedas, bosques y matorrales tanto densos como claros y vegetación herbácea de
sabana amazónica. Se encuentran las formas de vida de cuatro grandes regiones
naturales como son la Orinoquia, la Amazonia, los Andes y la Guayana (Parques
Nacionales Naturales de Colombia, s. f.).

20
Datos administrativos en proyección MAGNA-SIRGAS tomados del SIG-OT IGAC. Consultad el 10 de Junio de 2014
21
Tomado de http://www.parquesnacionales.gov.co/portal/es/ecoturismo/region-amazonia-y-orinoquia/parque-nacional-
natural-sierra-de-la-macarena/. Consultado el 15 de Febrero de 2014.
65

El interés de realizar el análisis planteado en la presente investigación radica no solo en la


importancia biológica del Parque Natural, sino por la fuerte presión y dinámica a la
cobertura boscosa por diversos factores. De acuerdo a los diferentes estudios consultados
y generados por entidades oficiales se puede resaltar:

1. En 2005 la UAESPNN realizo un estudio específico sobre la perdida de bosques


dentro del área del Parque asociada directamente a cultivos ilícitos. El estudio
analizo la dinámica del cultivo de coca (con datos de UNODC) y la perdida de
bosques (Datos de UNODC y UAESPNN) y concluyo que la de las 2700 hectáreas
deforestadas entre 2001 y 2004, 1852 hectáreas se asociaban directamente a
cultivo de hoja de coca, es decir un 68%. Siendo la mayor área sembrada en el
sector Oriental del parque en el departamento del Meta, ver Ilustración 19. En
conclusión este parque era junto al PNN Nukak el más afectado en el país durante
el periodo de análisis (UNODC & Parques Nacionales Naturales de Colombia,
2004).

Ilustración 19 Dinámica de cultivos de usos ilícito en el PNN Sierra de la Macarena. (UNODC &
Parques Nacionales Naturales de Colombia, 2004)

2. En un análisis sobre el cambio de las coberturas resultado del análisis


multitemporal de coberturas a escala 1:100.000, se analizaron las variaciones y
los escenarios de cambio en relación a la línea base 2000-2002 con respecto al
periodo 2005-2007, para las áreas que conforman los Parques Nacionales
Naturales, utilizando para ello la metodología y leyenda: Corine Land Cover,
adaptada para Colombia, a partir de la retrointerpretación visual de imágenes
Landsat (TM y ETM+), Spot y Aster. Se concluye que para el periodo analizado el
71,5% de la cobertura de todos los parques naturales del país corresponde a
Bosques (9’147.439 hectáreas). El análisis concluye que el 3,6% del área del PNN
Sierra de la Macarena, 21.995 has, está sometido a un estado de presión, 800
has, un 0,13% del área del parque, presenta un estado de recuperación, y un
2,73% del área del parque, 16.523 has, estaban sometidas a un proceso de
transformación. Siendo estas de las más altas tasas en los Parques nacionales
66

naturales. Los resultados de cambios de coberturas muestran una disminución de


17.372 has de bosques, un aumento de 16.262 has de los territorios artificializados
siendo la variación más alta entre los parques naciones del país (Latorre &
Corredor, 2011).
3. En el último análisis anual realizado en 2013 sobre la siembra de cultivos de uso
ilícito Naciones Unidas ha determinado que el área cultivada con coca en Parques
Nacionales Naturales es de 3.791 has. lo que representa el 0,026% del área total
cubierta por los Parques Nacionales Naturales y el 8% del área total de los cultivos
de coca en este año. El cultivo de coca en los Parques aumentó en 12%. Este
aumento está concentrado en cuatro parques: Nukak, Sierra de la Macarena,
Catatumbo Barí y La Paya; en los cuales se encuentra el 86% de los cultivos de
coca en Parques Nacionales Naturales. El área sembrada con cultivos de uso ilícito
en el PNN Sierra de La Macarena presento un incremento del 70% desde 2011,
ver Mapa 3 (UNODC, 2014b).

Mapa 2. Perspectiva del Parque Nacional Natural Sierra de La Macarena y cultivos de coca 2005.
(UNODC & Parques Nacionales Naturales de Colombia, 2004)

4. En un análisis sobre las dinámicas municipales y departamentales en el Meta los


datos históricos de cultivos de coca muestran alta dinámica, por esta razón no se
encuentra coca en el mismo sitio durante el periodo de estudio; El 5 % se encuentra
en los mimos sitios de manera intermitente, principalmente al nor-oriente de la
Macarena, al sur de Vista Hermosa y Puerto Rico, y al oriente de Mapiripán; el 4,3
% de la coca es reciente en los últimos tres años, se ubican al sur de Puerto Gaitán
y muy cerca de los principales núcleos de cultivos de coca que se encuentran en
el departamento; y el 90,8 % de la coca no se encontró en los últimos tres años
del periodo de estudio, la ubicación está principalmente al occidente del
departamento, en los municipios de: La Macarena, La Uribe, Mesetas, Puerto
Lleras, Puerto Concordia, Vista Hermosa, Puerto Rico y al occidente de Mapiripán,
ver Mapa 3 (UNODC, 2014a).
67

Mapa 3. Dinámica del territorio afectado por cultivos de coca en el departamento del Meta. 2001-2012.
(UNODC, 2014a)
5. En un análisis conjunto entre los sistemas de monitoreo de cultivos ilícitos –SIMCI-
y el sistema de monitoreo de bosques y carbono del IDEAM se estableció que Para
el período 2010 - 2012, IDEAM reporta una deforestación de 113.220 hectáreas,
mientras que SIMCI determinó que en los departamentos amazónicos se
establecieron 20.971 hectáreas nuevas de coca, de las cuales un 8% (1.666 ha)
causaron una deforestación directa de bosque primario. Teniendo en cuenta la
cifra de deforestación presentada por el IDEAM y los datos de SIMCI se puede
concluir que el 1,2% de la deforestación total del periodo fue causada por el
establecimiento directo de cultivos de coca (Cabrera, Galindo, Espejo, Gualdron,
& Vargas, 2013).

6. De acuerdo con las cifras oficiales sobre deforestación entregadas por IDEAM en
el periodo 1990-2012 el área de bosque paso de 572.368 has a 535.115 has, lo
que representa una disminución de un 6.5%. Y se determinó que la deforestación
anual en el último periodo 2012-2013 fue de 1.444 has anuales (Cabrera et al.,
2011b).
68

3.2. Materiales: Imágenes Satelitales


Para el desarrollo de la metodología propuesta se empleara un conjunto de 8 imágenes
satelitales del programa Landsat que fueron tomadas durante el año 2014 y que permitirán
analizar la evolución y dinámica de los cambios de la cobertura boscosa en el área de
estudio. Las imágenes corresponden al Path 8 y Row 57. Las imágenes son descargadas
sin costo de los servidores del Servicio geológico de los Estados Unidos 22. El nivel de
procesamiento de las imágenes es Surface Reflectance (SR) lo que significa que los datos
se encuentran georeferenciados, en valores de reflectancia ajustada a la superficie (ángulo
de observación, BDRF, corrección atmosférica, etc.). A continuación el resumen de las
imágenes a emplear:

Imagen Sensor Fecha FIlas Columnas ULX ULY LRX LRY


1 OLI 2014-01-10 7751 7581 582600 435600 810000 203100
2 OLI 2014-01-26 7751 7581 582000 435600 809400 203100
3 OLI 2014-03-31 7751 7581 583200 435600 810600 203100
4 OLI 2014-08-22 7751 7581 582900 435600 810300 203100
5 OLI 2014-09-23 7581 7751 585600 435600 813000 203100
6 ETM+ SLC-off23 2014-12-20 6961 8021 575100 425400 815700 216600
7 ETM+ SLC-off 2015-01-05 6931 8031 575385 424515 816315 216585
8 OLI 2015-01-29 7581 7751 582885 435615 810315 203085
Tabla 6 Resumen de las imágenes satelitales a emplear. Elaboración Propia.

A continuación un detalle de las imágenes a ser empleadas en la presente propuesta. Las


imágenes se presentan en una combinación de falso color, RGB(4,5,3) en ETM+ y OLI24,
empleando las bandas del Infrarrojo cercano, infrarrojo medio y el rojo. Los tonos rojos
corresponden a vegetación densa bosques, cultivos, etc, los tonos azul-verdosos y cian a
coberturas como pastos, herbazales y suelos, los tonos azules a cuerpos de agua, y los
colores blancos a nubes.

22
La búsqueda y descarga se realiza desde el servicio: http://earthexplorer.usgs.gov/
23
El 31 de mayo de 2003 el Scan Line Corrector (SLC), que compensa el movimiento de escaneo comenzó a fallar, lo que
genera que la cámara Enhanced Thematic Mapper Plus (ETM +) presente una toma discontinua de datos en patrón de zig-
zag sobre la imagen. Para más información: http://landsat.usgs.gov/products_slcoffbackground.php.
24
En el presente estudio se prescindió del uso de las bandas 1 (blue coastal) y 9 (cirrus) de OLI para el proceso de detección
de cambios, por ser bandas empleadas en los proceso de corrección atmosférica y no en los procesos de cartografía.
69

Mapa 4 Mapa Imagen Landsat 8 2014-01-10. RGB(IRC,IRM,ROJO). Elaboración propia.

Mapa 5 Mapa Imagen Landsat 8 2014-01-26. RGB(IRC,IRM,ROJO). Elaboración propia.


70

Mapa 6 Mapa Imagen Landsat 8 2014-03-31. RGB(IRC,IRM,ROJO). Elaboración propia.

Mapa 7 Mapa Imagen Landsat 8 2014-08-22. RGB(IRC,IRM,ROJO). Elaboración propia.


71

Mapa 8 Mapa Imagen Landsat 8 2014-09-23. RGB(IRC,IRM,ROJO). Elaboración propia.

Mapa 9 Mapa Imagen Landsat 7 2014-12-20. RGB(IRC,IRM,ROJO). Elaboración propia.


72

Mapa 10 Mapa Imagen Landsat 7 2015-01-05. RGB(IRC,IRM,ROJO). Elaboración propia.

Mapa 11 Mapa Imagen Landsat 7 2015-01-29. RGB(IRC,IRM,ROJO). Elaboración propia.


73

3.3. Información Secundaria


Los diferentes conjuntos de datos que se han consolidado inicialmente y se espera
permitan definir o determinar las características de la variable a estudiar, así como servir
de base para la validación de los resultados se presentan a continuación:
Dato Fuente Tipo Propósito
Mapas base para el
entrenamiento del
Serie Histórica
algoritmo de
Bosque – No
Sistema de Monitoreo clasificación y
Bosque y Raster
de Bosques (IDEAM) Validación de los
Deforestación 1990-
resultados obtenidos.
2014
Ver Mapa 12, Mapa
13, Mapa 14
Variables derivadas
de las imágenes de
Datos de Cobertura satélite para la
Fraccional de la CLASlite25 Raster determinación de los
Vegetación cambios en la
cobertura boscosa.
Ver Mapa 15.
Delimitación del uso y
Mapas de
cobertura en la zona
Coberturas IDEAM - UAESPNN Vector
de interés Corine
2000-2010
Land Cover
Áreas de nubes
Mascara de Nubes
USGS Raster estimada a partir del
CFMASK
método CFMASK26
Deforestación 2000- Universidad de Comparación y
Raster
2014 Maryland validacion
Tabla 7 Variable y datos auxiliarles a ser empleado en el desarrollo de la propuesta

25
Es un paquete de análisis de imágenes desarrollado por el Instituto Carnegie para identificar automáticamente la tala de
árboles y/o la degradación del bosque a partir de métodos analíticos sobre datos multiespectrales (Asner, Knapp, Balaji, &
Páez-Acosta, 2009). Para más información referirse al sitio web del proyecto: http://claslite.carnegiescience.edu/en/
26
CFmask es una versión en lenguaje C del algoritmo nube FMASK desarrollado por la Universidad de Boston (Zhu, Wang,
& Woodcock, 2015; Zhu & Woodcock, 2012), para la detección automática de áreas agua, nube, sombra de nubes y nieve
a partir de imágenes Landsat. Los datos de la máscara CFMASK son ahora disponibles para cada escena Landsat procesada
por el USGS. Para más información referirse a : http://landsat.usgs.gov/about_LU_Vol_9_Issue_1.php
74

3.3.1. Datos para el entrenamiento y la validación:


Mapas de Bosque y No Bosque. IDEAM.
Los datos sobre la cobertura de bosque son generados por el IDEAM a una escala
1:100.000 como resultado del procesamiento de imágenes Landsat, media resolución
espacial (píxel 30m). IDEAM realiza el procesamiento de forma semiautomatizada de cada
escena Landsat, en un enfoque basado en píxeles, y orientados tanto a la identificación de
la cobertura boscosa para permitir un posterior proceso de cuantificación de la
deforestación (Cabrera et al., 2011b). Se debe mencionar que para el presente estudio los
datos de bosque de IDEAM se consideraran el mapa de referencia tanto para el
entrenamiento y la validación de los resultados, de acuerdo con los reportes entregados la
validación de exactitud temática de los datos IDEAM es adecuado a una escala 1:100.000
(Ramirez et al., 2014).

Se han generado mapas de cambio de la cobertura boscosa a nivel nacional para los
periodos: 1990, 2000, 2005, 2010, 2012 y 2013. Para el presente proyecto se han facilitado
los datos de los mapas de bosque y No Bosque para los periodos 1990, 2010 y 201327, ver
Mapa 12, Mapa 13 y Mapa 14. Estos mapas se encuentran en una estructura RASTER,
son de tipo temático y la leyenda de coberturas corresponde a (1) Bosque, (2) No Bosque
y (3) Áreas sin información. Los datos se encuentran en un sistema de proyección UTM
Zona 18 N basado en WGS84. A continuación se presentan los mapas empleados

Mapa 12 Mapa de Bosque - No Bosque 1990. IDEAM. Elaboración propia.

27
Se descargaron los mapas de Bosque y No Bosque desde el SIAC: http://www.siac.gov.co/Catalogo_mapas.html#
75

Mapa 13 Mapa de Bosque - No Bosque 2010. IDEAM. Elaboración propia.

Mapa 14 Mapa de Bosque - No Bosque 2013. IDEAM. Elaboración propia.


76

3.3.2. Mapas de cobertura Fraccional. CLASlite


El uso de los datos de cobertura fraccional tiene como propósito potencializar la adecuada
segmentación y delimitación de las áreas de cobertura boscosa y las zonas de suelo o
zonas sin vegetación. Estos datos son generados empleando la herramienta CLASlite y se
obtienen mediante una descomposición de los píxeles de la imagen en coberturas
fraccionales a nivel de subpíxel de la vegetación fotosintética (VF), vegetación no-
fotosintética o senescente (VNF) y las superficies descubiertas (S). CLASlite® cuenta con
tres librerías espectrales para convertir los niveles de reflectancia por píxel de las
coberturas captadas por el sensor en información ecológicamente relevante que
represente la variación general de las propiedades del dosel de la vegetación y el suelo.
De igual forma, el aplicativo incluye un submodelo central denominado Automated Monte
Carlo Unmixing –AutoMCU el cual permite realizar un análisis cuantitativo de la cobertura
fraccional (0-100%) de la VF, VNF y S contenida en cada píxel de la imagen analizada
(Asner et al., 2009). La imágen presentadas a continuación, ver Mapa 15, es una
composición en falso color RGB(S,VF,VNF) donde las zonas verdes corresponde a
vegetación densa, las zonas azules a zonas sin vegetación, y los tonos purpuras a zonas
de diferentes niveles de densidad de la vegetación.

Mapa 15 Mapa de cobertura fraccional de la vegetación 2014-03-31. CLASlite. Elaboración propia.


77

3.3.3. Mapas de Perdida de Bosque. Global Forest


Cover y Terra-i.
Como datos de apoyo en la comparación y validación fueron además utilizados las
detecciones de perdida de cobertura boscosa anual suministradas por Global Forest Cover
de la Universidad de Maryland (M. C. Hansen et al., 2013), ver Mapa 16, así como los
datos de cambios de vegetación diarios reportados por Terra-i (Reymondin et al., 2012b),
ver Mapa 17.

Mapa 16 Mapa de la pérdida anual de bosques 2002-2015 para la zona de interés. Global Forest
Change (Matthew C. Hansen et al., 2013). Elaboración propia.

Mapa 17 Mapa de las perdidas diarias en la vegetación en 2013 para la zona de interés. Terra-i CIAT.
Elaboración propia.
78

Una vez descargados y consolidados los datos de cada uno de estos sistemas de reporte
no oficiales se evidencio que las detecciones de Terra-I para la zona de interés (i) se
encontraban limitadas al sector nororiental del PNN Serranía de la Macarena, ver Mapa
17, (ii) dadas las condiciones topográficas y atmosféricas de la zonas las estas detecciones
serian debido a variaciones de iluminación y no a cambios de la cobertura boscosa (Panel
A de la Ilustración 20), (iii) y ya que los datos de Terra-i son detecciones basadas en
cambios de las seres de tiempo de NDVI de MODIS en pixeles de 250 mts, la escala de
estos datos solo permitirían usar estos datos para ejercicios de comparación general mas
no para los ejercicios de validación propuestos en esta metodología.

Por lo tanto y ya que los datos de las detecciones entregadas anualmente por Global Forest
Change (i) presentan un mayor nivel de detalle, al ser detecciones basadas en cambios
espectrales a nivel de pixeles de las imágenes LandSat, a 30 mts, ver panel B de la
Ilustración 20, y (ii) si bien no cuentan con el nivel de resolución temporal diaria de los
datos de Terra-i, para el presente estudio se considera más adecuado este conjunto de
datos para los procesos de validación y comparación propuestos por la presente
metodología.

A B Ilustración 20 Comparación de las escalas de las detecciones de los sistemas


Terra-i CIAT (Rojo) y Global Forest Change (Amarillo). Elaboración Propia

3.4. Métodos
Los procesos propuestos en la metodología ser desarrollados se enmarcan en el área de
las Ciencias de la Información Geográfica (GISc) (Longley et al., 2005), se emplearan
proceso de análisis espacio-temporal de imágenes obtenidas mediante técnicas de
teledetección, procesamiento digital de datos multiespectrales, elaboración de productos y
reportes cartográficos, así como la elaboración y análisis de datos estadísticos. A
continuación un esquema general de los procesos y herramientas a ser empleadas en el
desarrollo de la metodología propuesta.
79

Proceso Herramienta Licencia


Calibración atmosférica de las imágenes ESPA/USGS Datos Libres.
Personal bajo permiso
Generación de datos de cobertura fraccional CLASlite
de Instituto Carnegie
Desarrollo de los procesos GEOBIA para la
Trimble.
detección de cambio en la serie multitemporal de eCognition
IDEAM - SMBYC
imágenes
ERDAS, PCI, Licencia demo.
Generación de índices y transformaciones
R Software Libre
Análisis estadístico R Software libre
Análisis espacial y Generación de salidas QGIS, Licencia demo.
cartográficas ArcGIS Software Libre
Tabla 8 Procesos y herramientas propuestas para el desarrollo de la metodología propuesta.
Elaboración propia.

3.5. Aproximación Metodológica


Como alternativa al enfoque de clasificación de coberturas de la tierra basada en píxeles,
el análisis de imágenes basado en objetos geográficos (GEOBIA) es la mejor alternativa
para las aplicaciones cartográficas en imágenes de alta resolución espacial. Aunque
GEOBIA integra técnicas de mapeo que han demostrado ser útiles para lograr mayores
niveles de exactitud temática, aún se aplican técnicas tradicionales de muestreo a nivel de
píxeles, tanto para el entrenamiento de los algoritmos de clasificación, análisis de series
de tiempo, clasificación y detección de cambios y en los procesos de evaluación de la
exactitud. Por ello se deben realizar un conjunto de pruebas, implementaciones y
desarrollos para la implementación completa de la metodología propuesta.

3.5.1. Descripción general del proceso realizado


En concordancia con los objetivos planteados se desarrolló e implemento un método
completamente basado en GEOBIA que utilizo objetos geográficos para cada paso del
procesamiento de imágenes realizando la generación de un mapa de cobertura de la tierra
(Bosque y No Bosque) en cada momento de tiempo (para cada imagen de satélite
trabajada) a partir de algoritmos de aprendizaje de máquina, luego se procedió a modelar
y la determinar cuáles de los cambios temáticos que se dieron en cada objeto representaba
una deforestación, esta fue la base y definición del objeto de estudio del presente trabajo:
Los objetos de Deforestación, que finalmente fueron evaluados temáticamente. Se
propone desarrollar un proceso en seis fases, ver Ilustración 21:

Fase 1: Determinar el proceso de construcción, generación y análisis de la serie temporal


de imágenes a ser analizada en un entorno orientado a objetos.
 En esta primera fase se determinó como estructurar una serie de tiempo en el
entorno de trabajo. Se definió en eCognition el proceso de estructuración de la serie
80

de tiempo que permitió el manejo de los datos multiespectrales, fraccionales, así


como las variables temáticas y de base para el muestreo.
a. Producto Esperado: Definición y recomendaciones para llevar a cabo el
proceso de estructuración de la serie de tiempo de imágenes a ser
analizadas en eCognition.

Fase 2: Desarrollar un proceso de muestreo basado en objetos, para el entrenamiento de


los algoritmos de clasificación y la validación temática.
 En la fase del diseño del proceso de muestreo se definió el proceso que permitió
cada periodo o momento de la serie de tiempo sea adecuadamente entrenado, es
decir que las muestras tomadas sobre los objetos segmentados correspondían con
la cobertura adecuada.
a. Producto Esperado: Modelamiento del proceso para la construcción del
muestreo de las coberturas Bosque y No Bosque en los diferentes
momentos de la serie de tiempo.

Fase 3: Optimización el espacio de características, a partir de índices, transformaciones o


valores de cambios de cobertura fraccional para la mejor determinación de las áreas de
Bosque y No Bosque.
 Con el conjunto de muestras definidas se procedió al cálculo y definición de la
configuración más adecuada de las variables asociadas o derivadas de las
imágenes multitemporales, espacio de características, para la determinación de
la clasificación de las coberturas Bosque y No Bosque. Se realizaron análisis en los
valores intrínsecos de los objetos (índices, cobertura fraccional y mediante la matriz
de distancia normalizada y se determinó la mejor combinación de bandas que
maximizaron la distancia de las muestras.
a. Producto Esperado: Parámetros de clasificación del espacio de
características para el entrenamiento del algoritmo.

Fase 4: Determinación del algoritmo más adecuado para la clasificación de coberturas de


Bosque y No Bosque.
 Empelando los métodos de Machine Learnig los algoritmos de aprendizaje de
maquina (Maquinas de soporte vectorial, Árboles de decisión, Bosques aleatorios
y K-Vecinos más cercanos), se determinó cual ofrece una más exacta identificación
de las coberturas Bosque y No Bosque, y por ende una adecuada detección de los
cambios en estas coberturas a lo largo de la serie de tiempo que permitio
posteriormente identificar las áreas de cambio
a. Producto Esperado: Mapa de clasificación de Bosque, No Bosque y Áreas
sin información (Nubes y sombras) para cada momento de la serie de
tiempo.

Fase 5: Determinación del método de análisis temporal para la identificación de los


proceso de deforestación, y generación de los objetos de deforestación.
81

 Se determinó el proceso de análisis de las variaciones temáticas durante los


momentos de la serie de tiempo y determinar como el objeto será clasificado como
deforestación (Bosque a No Bosque).
a. Producto Esperado: Algoritmo de análisis GEOBIA de la evolución
temporal de los objetos a partir de la detección de los cambios identificados
en las clases de Bosque y No Bosque. Definición de la metodología para
construir los Objetos de Deforestación.

Fase 6: Realizar la validación temática en un entorno orientado a objetos (Matriz STEP).


 En comparación con los proceso de evaluación temática aplicados regularmente
en la literatura, análisis basados en punto o píxeles, se llevó a cabo la
implementación de una metodología de evaluación basada en la forma, posición y
características geométricas de los objetos detectados mediante la matriz STEP
(Lizarazo, 2014a).
a. Producto Esperado: Matrices de evaluación STEP para los mapas de
cambios generados en cada método.

Cada una de las fases aporta al cumplimento de los objetivos secundarios definidos, a
saber:
 Las fases 1, 2 y 3 permiten alcanzar el Objetivo Especifico 1 (Estructuración,
clasificación y análisis de la serie de tiempo).
 La fase 4 y 5 permiten cumplir con lo propuesto en el Objetivo Especifico 2
(Criterios de análisis espaciotemporal y espectral para la definición de los objetos
de deforestación).
 Los procesos de modelamiento de las fases 2, 3, 4 y 5 dan como resultado el
cumplimiento del Objetivo Especifico 3 (Implementación de un algoritmo para la
generación y clasificación de los objetos de deforestación).
 Finalmente la fase 6 permitió el cumplimiento del Objetivo Especifico 4 (Evaluar
la exactitud temática de los objetos de deforestación).

A continuación, Ilustración 21, el diagrama metodológico ilustrado.


82

Ilustración 21. Metodología General Propuesta. Elaboración propia.


83

3.5.2. Descripción Detallada de los Procesos.


A partir de la metodología general se desarrolló e implemento cada una de las 6 etapas
planteadas, que permitieron generar los resultados base para el análisis del cumplimiento
del objetivo propuesto. La implementación de los procesos, exceptuando la estructuración
e importación de las imágenes a la serie de tiempo y la validación mediante la matriz STEP,
da como resultado en un algoritmo GEOBIA desarrollado como un flujo de proceso en
eCognition. A continuación la descripción metodológica de cada uno de los procesos
desarrollados.

3.5.2.1. Fase 1. Estructuración de la Serie de Tiempo


Para el uso de la información de múltiples imágenes en momentos diferentes de tiempo se
plantea el uso de una estructura multidimensional de datos raster, ver Ilustración 22. Esta
estructura cuenta con las dimensiones básicas de una imagen en formato raster, fila,
columna y ND, (x,y,z) pero se incorporó además el concepto de Tiempo (t) a partir del
concepto de Frame. Por lo tanto cada elemento en la imagen quedara definido en un
espacio multidimensional (x,y,z,t).

Ilustración 22 Concepto de la estructura de una imagen multiespectral estructurada como una serie
de tiempo. (eCognition Developer, 2009)

La construcción de la serie de tiempo dentro de la herramienta eCognition 9 se configuro


a partir de la organización y lectura de los datos multiespectrales (bandas espectrales SR),
así como los datos temáticos (CFMASK, Muestreo), que se encuentran almacenados en
los directorios locales. Se definieron entonces los siguientes requerimientos y procesos
para la adecuada estructuración de los datos a ser analizados:

1. Corregistro de los datos: Durante el desarrollo del proceso de estructuración de


las imágenes, se hizo evidente las diferencias entre los tamaños de las diferentes
escenas, ver Tabla 6. Si bien las imágenes del programa Landsat cuentan con un
sistema estandarizado de nomenclatura para cada escena, WRS-228, el tamaño de
cada imagen en cada fecha varía de acuerdo al tipo de sensor y al centro de toma
de la imagen, así como otros factores.

28
Para mayor detalle ver: http://landsat.gsfc.nasa.gov/?p=3231. Consultado el 3 de Agosto de 2015.
84

Se encontró que una práctica adecuada para la carga y manejo de los datos en la
herramienta eCognttion es:
1. Asegurar el corregistro, mediante reproyeccion, de los datos a una matriz
de datos común, ver Ilustración 23. Para el presente trabajo se definió el
tamaño estándar, filas, columnas y esquinas georreferenciadas de la
primera imagen Landsat 8 de la serie a ser analizada. Esto dado que las
imágenes de este sensor cuentan con una mayor área de cubrimiento tanto
horizontal como vertical. Este proceso se lleva a cabo mediante la
herramienta Data Merge de PCI Geomatica.
2. Esto permitió estructurar una sola imagen multiespectral para cada Frame
de análisis, con los datos de Muestreo, CFMASK y Vegetación Fraccional.
Si bien y como se indicó anteriormente los datos pueden estar almacenados
en carpetas diferentes.

Ilustración 23 Esquema del resultado del corregistro de todas las imágenes dela serie de tiempo a la
matriz de la primera imagen Landsat 8 de la serie. Elaboración propia.

2. Nombre de los productos: se estandarizo el nombre de cada uno los productos


usados en el proceso, se propone para ello el siguiente esquema:

Producto _ Escena _ Frame Formato


2014-01-10
2014-01-26 .IMG
2014-03-31
SR _ 007058 _
2014-08-22
2014-09-23 .TIFF
2014-12-20
Tabla 9 Propuesta de nomenclatura para los archivos a ser incorporados a la serie de tiempo.
Elaboración propia
85

Los datos pueden almacenarse en una misma carpeta o carpetas diferentes, ya que para
el proceso de importación la definición de la “cadena de búsqueda”, mediante bloques
delimitadores, definidos en eCognition como {}, ver Ilustración 24, permiten definir qué
parte del nombre del archivo identifica a que parte de la serie o qué tipo de dato se está
importando.

Ilustración 24 Ejemplo de la definición de un proceso de importación. Los parámetros para importar


cada archivo, o cadenas de búsquedas están delimitados por { }.

Este proceso también permite estandarizar el nombre que identificara a cada banda o capa
de la imagen multiespectral, ver Ilustración 25. Esto facilita los procesos de identificación
y modelamiento de datos dentro de eCogntion.

Ilustración 25 Detalle del proceso de importación. La asignación de nombres estándar, Alias, a cada
una de las bandas, Channel, de las imágenes espectral a ser importada.

3.5.2.2. Fase 2. Proceso de muestreo y entrenamiento


Para la determinación de los puntos de entrenamiento de la serie de tiempo se propone
emplear un conjunto de muestras extraídas de las regiones de Bosque y No Bosque
estables en el periodo de análisis, es decir puntos de Bosque y No Bosque inalterables en
su clasificación en los mapas oficiales del IDEAM entre 1990 y 2013, ver Mapa 18. Este
método emplea las fortalezas del sistema de monitoreo de bosques del IDEAM quienes
han consolidado una base nacional temporalmente coherente durante los últimos años
sobre la extensión del área de bosque y así se aprovecha este insumo como base de
referencia para una adecuada selección de áreas de entrenamiento y permitir una mejor
integración de la presente propuesta a los sistemas de monitoreo ya existentes. Este
esquema de clasificación se ha empleado con éxito en proceso tanto de cartografía de uso
como de cobertura, para apoyar los proceso de actualización de cartografía temática
(Colditz, Schmidt, Ressl, Hansen, & Dech, 2008; Gebhardt et al., 2014). Se procede a la
consolidación del mapa de áreas estable de Bosque y No Bosque en el periodo 1990-2013.
Y posteriormente a la selección aleatoria estratificada de 2288 puntos de Bosque y 258
puntos de No Bosque, ver Mapa 19Mapa 20.
86

Mapa 18 Áreas de Bosque y No Bosque estables en el periodo 1990-2013, a partir de los datos de
Bosque y No Bosque del IDEAM. Elaboración propia.

Mapa 19 Puntos de muestreo aleatorio sobre los datos de Bosque y No Bosque Estables en el periodo
1990-2013, a partir de los datos de Bosque y No Bosque del IDEAM.
87

3.5.2.3. Fase 3. Optimización del espacio de


características.
La optimización del espacio de características permitió la selección de las varíales
espectrales (índices, bandas, transformaciones, etc) que a partir de los valores estadísticos
de los objetos definidos como muestras permitieron maximizar la separabilidad entre las
clases de Bosque y No Bosque en un espacio de características multidimensional. La
selección del espacio de características más adecuado se analizó de dos formas:

1. Al comienzo de la investigación se estableció un análisis comparativo de la


exactitud temática, basado en matriz de confusión (Congalton & Green, 2008a), de
cada uno de los algoritmos de Machine Learning en diferentes combinaciones de
los datos espectrales de entrada (bandas espetarles, índices NDVI y NBR,
Tasseled cap, cobertura fraccional), con el fin de determinar cuál sería el mejor
clasificador a ser usado durante el resto de la investigación.
a. Se realizó la evaluación y comparación de la exactitud temática a partir de
7000 puntos, píxeles, de validación sobre un sector del área estudio.
b. Se implementó la clasificación de las clases de Bosque y No Bosque
empleando 3 diferentes clasificadores: Árboles de Decisión (DT), Maquinas
de Soporte Vectorial (SVM) y Random Forest (RF), en tres diferentes
configuraciones del espacio de características:
i. Utilizado únicamente las bandas espectrales.
ii. Empleado únicamente datos de cobertura fraccional.
iii. Empleando datos de las bandas espectrales, índices de vegetación,
así como trasformaciones espectrales.
c. Se evaluaron los indicadores de exactitud temática promedio, el indicador
kappa, y los intervalos de confianza del indicador Kappa, para buscar
establecer cual algoritmo y con qué variables ofrecía la mayor exactitud en
la clasificación de las coberturas de interés.
2. Posteriormente en una segunda prueba, una vez se realizó el proceso de muestreo
en un entorno orientado a objetos, se analizaron los estadísticos de separabilidad
para las clases de Bosque y No Bosque para la determinación de las variables que
mayor diferenciación permitieron generar.

3.5.2.4. Fase 4. Clasificación de la serie de tiempo


Bosque – No Bosque
Para la clasificación de los datos de cada uno de los frames, en las clases Bosque y No
Bosque, de la serie de tiempo se emplearan 4 métodos no paramétricos de aprendizaje de
maquina (Machine Learning), Maquinas de soporte vectorial (SVM), árboles de decisión
(DT) y Bosques Aleatorios (RF) y K-nearest neigborh (KNN). Se realizaron diferentes
procesos de evaluación, ajuste y selección de parámetros que permitirán la adecuada
clasificación de los datos multiespectrales.
88

3.5.2.5. Fase 5. Análisis espaciotemporal de la serie de


tiempo para la detección de cambios
En esta etapa del proceso una vez definidos los procesos de segmentación (generación
de los objetos) así como de su clasificación en las Clases Bosque y No Bosque, se procede
a definir el marco conceptual de análisis espaciotemporal para la generación de los objetos
de deforestación. Se propone usar como herramienta de análisis y modelado de los
procesos de cambio entre objetos el proceso de conexión entre objetos, Links29,
espaciotemporales para la determinación de los cambios en la cobertura de un polígono
en un frame o momento de la serie de tiempo y un objeto en su misma posición geográfica
en el momento siguiente, ver Ilustración 26.

Ilustración 26 Proceso de construcción de links, flechas amarillas, entre un objeto, círculo rojo, en los
diferentes momentos de una serie de tiempo, T. (eCognition Developer, 2009)

3.5.2.5.1. Definición de los objetos de Deforestación


El fenómeno de interés para cuantificar mediante la presente metodología GEOBIA es la
deforestación (transformación de áreas de Bosque a No Bosque), la definición de un objeto
de deforestación debe presentar las siguientes características:

1. Áreas transformadas de Bosque a No Bosque


a. Implica que un objeto de deforestación es todo objeto que representa el
cambio de un objeto Bosque que presento un cambio a un objeto de No
Bosque en un momento, Frame, de la serie de tiempo.
b. Estos cambios (temáticos) serán cuantificados a nivel espacial (forma),
una vez se determinen la consistencia temporal, es decir el cambio a un
objeto de No Bosque debe ser “permanente”.
2. Las áreas deforestadas deben presentar una área de por lo menos una hectárea.
Para la cuantificación de la deforestación la presente propuesta se construye en el
seguimiento de los cambios a nivel espacial y temático de los objetos de Bosque y No
Bosque extraídos a partir de la segmentación de cada uno de los Frames de la serie de
tiempo y su clasificación como un objeto de Bosque o No Bosque. La delimitación de los
objetos de deforestación parten de la generación de un marco de análisis basado en las
relaciones espaciotemporales de los objetos en la serie de tiempo, dichas relaciones se

29
Este proceso permite realizar una asociación temporal entre objetos, a partir de una relación topológica, que puede luego
ser analizada para definir o determinar la clasificación a una determinada cobertura. El proceso de conexión entre objetos
se basa en el proceso de rastreo o seguimiento y es empleado en proceso de análisis de imágenes médicas y biológicas,
cuando se requiere detectar como un objeto cambia de posición en el tiempo (eCognition Developer, 2009).
89

construyeron a partir de las conexiones temporales (links) modeladas entre objetos de la


serie de tiempo en la herramienta eCognition.

Los links son construidos entre los diferentes momentos de la serie de tiempo, ver
Ilustración 27, bien puede ser hacia adelante (in), por ejemplo T0 a T1, o hacia atrás (out),
T2 a T1. También se deben definir cuáles son las coberturas a conectar del primer
momento al último, y si se desea definir un umbral mínimo de traslape que se debe
considerar para que un link sea válido al momento de clasificar un objeto. Como se muestra
a continuación los links en esta propuesta para la definición de los objetos de Deforestación
se evalúan como links entre objetos Bosque (out) y a objetos No Bosque (in).

Ilustración 27 Construcción de los links entre objetos en dos momentos diferentes de la serie de
tiempo, para la definición de una clase asociada al cambio correspondiente. Elaboración Propia.

3.5.2.5.2. Modelamiento GEOBIA en una serie de tiempo para la


generación de los objetos de Deforestación.
En un caso inicial, ver Ilustración 28, el cambio de un objeto de Bosque en el Frame 1 a
un objeto de No Bosque en el Frame 2 generaría, mediante el link A1, un objeto de
deforestación para el momento de comparación Δt1->2. Sin embargo deben validarse todos
los demás links (A2,A3…., An) entre el nuevo objeto de deforestación y los objetos de No
Bosque en el resto de la serie de tiempo (Frames 3 a n), pues de esta forma se está
validando temáticamente el significado de la deforestación: una transformación
(permanente) de un área de Bosque a un área de No Bosque.

La deforestación valida en el momento Δtn->n+1 es aquella asociada a objetos de Bosque


en el Frame n cuyos Link(out) sean a objetos de No Bosque en el Frame n+1 y
permanecieron durante el resto de la serie de tiempo (Frames n+2 hasta n+x) como objetos
de No Bosque.
90

Ilustración 28 Esquema de modelamiento de los objetos de deforestación validos a partir de los Links
entre objetos en diferentes Frames de la serie de tiempo. Elaboración Propia.

Se define como objetos de deforestación inválidos, como se muestra en Ilustración 29,


aquellos objetos asociados al cambio de un objeto de Bosque a uno de No Bosque en dos
momentos, Frames, consecutivos, pero que en los momentos, Frames, subsiguientes el
objeto es clasificado como Bosque. Es decir no hay una permanencia del objeto No Bosque
que asegure la permanencia espaciotemporal del proceso de deforestación30.

Ilustración 29 Esquema de modelamiento de los objetos de deforestación validos e inválidos a partir


de los Links entre objetos en diferentes Frames de la serie de tiempo. Elaboración Propia.

30
Si bien algunos de estos cambios podrían catalogarse como Regeneración, No Bosque a Bosque, se debe tener en que
esta caracterización requiere modelar, como se indicó en la sección 2.1.1, el tiempo definido entre los cambios (fechas de
las imágenes). Estos procesos deberán ser revisados en desarrollos metodológicos futuros.
91

Finalmente se debe definir que la deforestación valida acumulada en cada momento,


Frame, Δtx→(x+1) se constituye por la agregación topológica de todos los objetos de
deforestación válida hasta el momento de interés, Frame n+1. La deforestación final
acumulada será entonces la agregación topológica de todos los objetos de deforestación
válida hasta el último momento de la serie de tiempo, Frame n. Como se representa en el
esquema siguiente, ver Ilustración 30.

Ilustración 30 Esquema de modelamiento de los objetos de deforestación válidos y acumulados a


partir de los Links entre objetos en diferentes Frames de la serie de tiempo. Elaboración Propia.

Se debe considerar que para la presente propuesta:


1. Solo se generaran resultados sobre los objetos de deforestación valida. Se
reportaran los resultados de las detecciones en cada Frame y la detección
acumulada para cada Frame.
2. Los objetos de deforestación no validos en un determinado Frame de análisis
permiten ajustar los datos de Bosque o No Bosque para dicho momento. Ejemplo:
un objeto de deforestación no válido para el Frame Δt2→3, como el mostrado en la
Ilustración 29, será ajustado en su clasificación a Bosque. Pues el valor del Link(in)
C1 es de un objeto Bosque, y del igual forma el valor del Link(out) C2 y C3 son a
objetos Bosque, ver Ilustración 31.
92

Ilustración 31 Esquema de modelamiento de los ajustes a las objetos de Bosque y No


Bosque a partir de los Links entre objetos de deforestación no validos en los diferentes
Frames de la serie de tiempo. Elaboración Propia.

3. Dado que la consistencia de los resultados finales consolidados dependen de la


validación entre los últimos dos frames de la serie de tiempo, se debe considerar:
a. Ingresar a la serie de tiempo una o dos imágenes adicionales posteriores al
último momento de interés. Por ejemplo si se requieren los resultados entre
Enero 2014 a Diciembre 2014, la última imagen de la serie debería ser una
imagen de Enero de 2015.
b. Tomar como los resultados finales no los del Frame n, sino el Frame n-1,
ya que este cuenta con el ajuste de los datos de deforestaciones no
validados realizados a partir de los Frames anteriores y el último frame de
la serie.
c. Como se presenta en la Ilustración 32, la definición del objeto de
deforestación A, se realiza entre el primer y segundo Frame de la serie de
tiempo (Link A1) y se valida que es un objeto de deforestación pues
permanece como un objeto de No Bosque en el segundo frame (Link A2).
Sin embargo para el objeto B definido como objeto de deforestación entre
el segundo y tercer frame de la serie, por el Link B1, no es posible validar su
permanencia como un objeto de No Bosque. De allí la incertidumbre
asociada a las detecciones del último frame.
93

Ilustración 32. Ejemplo de la definición de los objetos de deforestación A y B en una serie de 3


frames. Elaboración Propia.

Ilustración 33 Ejemplo de la definición y validación de los objetos de deforestación A y B en una serie


de 4 frames. Elaboración Propia.
94

d. Con una serie adicional de observaciones, ver Ilustración 33, en este


ejemplo un frame más, la definición del objeto de deforestación A es
definitiva, pues el nuevo Link, A3, relaciona espaciotemporalmente la
primera detección con un objeto de No Bosque en el nuevo frame. Y para
el objeto B se confirma que este es un objeto de deforestación pues el nuevo
link, B2, que se genera es hacia un objeto de Bosque. Detecciones erróneas
de este tipo pueden darse por incertidumbres en el proceso de
enmascaramiento (bordes de nube, brumas, etc.), áreas de inundación o
errores en el clasificador para ese frame, generando así áreas de cambios
de bosque a no bosque solo en un frame, mas no representan cambios
permanentes en la serie de tiempo.

3.5.2.6. Fase 6. Validación temática de los resultados


La validación temática se realiza aplicando la matriz STEP (Lizarazo, 2014a) sobre la
totalidad de las áreas detectadas como deforestación (deforestación valida acumulada del
penúltimo Frame), Bosque y No Bosque del penúltimo Frame de la serie de tiempo y
empleando como datos de referencia el mapa de cambio del mismo periodo generado por
IDEAM (Galindo et al., 2015). Se presentaran los resultados de la matriz STEP con los
indicadores de Forma, Tema, Límite y Posición. Los valores varían de 0 a 1, e indican la
correspondencia o similitud de todos los objetos de la muestra de cada clase en el mapa
clasificación y los objetos de la muestra. La implementación se realizara empleando el
plugin Quick STEP (Ramirez & Lizarazo, 2016) en QGIS31.

Ilustración 34. Pluging STEP implementado en QGIS para el cálculo de la matriz STEP. (Ramirez &
Lizarazo, 2016).

31
Se usa la versión 0.1 disponible en https://plugins.qgis.org/plugins/QuickSTEP/
95

CAPITULO 4. PRESENTACIÓN Y
ANÁLISIS DE LOS RESULTADOS
96

A continuación se presentan y analizan los resultados de la implementación de la


metodología propuesta en el Capitulo 3, a partir de los proceso de estructuración,
segmentación, clasificación, detección de cambios en las áreas de Bosque a No Bosque
(deforestación) en una serie de tiempo y la validación de estos resultados a nivel temático
y geométrico, matriz STEP, en un enfoque completamente basado en objetos GEOBIA. La
implementación de los procesos fue realizada en su mayoría en la herramienta eCognition
(eCognition Developer, 2009), desde los procesos de estructuración de la serie de tiempo
(Fase 1) hasta la generación de los mapas de cambio (Fase 5), es por ello que a medida
que se presentan los resultados obtenidos se realiza la descripción del Algoritmo, flujo de
procesos en lenguaje CNL, en eCogntion.

4.1. Resultados Fase 1. Estructuración de


la serie de tiempo en eCognition (Ingesta
de los datos).
El proceso de importación de los datos y su estructuración como una serie de tiempo se
definió como una estructura XML, que se configura y almacena como un proceso de
“Importación Personalizada”, ver Ilustración 35. Por lo tanto esta estructura se puede
modificar, compartir y distribuir o emplear en proceso automatizados posteriores. El archivo
XML se presenta en detalle en el Anexo 1.

Ilustración 35 Detalle de la estructura XML para definir el proceso de importación y estructuración de


las imágenes y demás datos secundarios a la serie de tiempo

El resultado es una estructura de imagen multidimensional, donde tanto la dimensión


espacial (coordenadas), espectral (bandas espectrales) y temporal (frames) se integran en
una única “Imagen”. Los datos que se importan son las bandas espectrales del programa
Landsat, así como las máscaras de Nubes (CFMask). A continuación el detalle de las
estructura de la serie de tiempo generada para el presente estudio.
97

Banda 10/01/2014 26/01/2014 31/03/2014 22/08/2014 23/09/2014 20/12/2014

AZUL

VERDE

ROJO

IRC

IRM

IRL

CFMASK

Tabla 10 Serie de tiempo de datos espectrales y datos temáticos empleados en el presente estudio.
Elaboración Propia
98

La estructura multidimensional (serie de tiempo multiespectral) permite ahora la aplicación


de los proceso de segmentación, entrenamiento, detección de cambios y clasificación
sobre cada uno de los momentos (frames) de la serie de tiempo. La referencia ahora para
cada uno de los frames es mediante la notación Ti, en la Tabla 11, se presenta la relación
entre los nombres de las frames y las fechas de la imagen.

Frame T0 T1 T2 T3 T4 T5 T6 T7
Imagen 10/01/2014 26/01/2014 31/03/2014 22/08/2014 23/09/2014 20/12/2014 05/01/2015 29/01/2015
Tabla 11. Relación entre los Frames (Ti) y las fechas de las imágenes en la serie de tiempo.
Elaboración Propia.

Una de las ventajas de esta estructura es que cualquier proceso tanto de visualización y/o
análisis se aplica simultáneamente a cada uno de los Frames de la serie de tiempo. Por
ejemplo, al aplicar un proceso de ajuste visual o un proceso más complejo como una
segmentación multiescala, solo se hace necesario realizar una vez el proceso, pues este
es aplicado a cada frame de la serie. El resultado, como se muestra a continuación en la
Ilustración 36, es un proceso homogéneo aplicado simultáneamente a las T imágenes de
la serie de tiempo en un solo proceso.

A B Ilustración 36 Detalle del resultado de la segmentación, límite de los objetos en azul,


sobre los momentos T0 (A), T1 (B), T2 (C) y T5 (D) de la serie de tiempo en una
C D combinación de color RGB(Inf Medio, Inf Cercano, Rojo). Elaboración propia.
99

4.1.1. Preparación de los datos.


Una vez estructurada la serie de tiempo se procede a la generación de las capas o bandas
derivadas de las bandas espectrales ingresadas: índices, transformaciones espectrales,
con las que se procede luego a la generación de los objetos y la determinación de las áreas
de nubes y sombras a partir de la máscara CFMASK en cada uno de los frames de la serie
de tiempo.

4.1.1.1. Cálculo de los índices y transformaciones.


Se derivan a partir de los datos de cada imagen los índices NDVI, ARVI y NBR a partir de
la formulación de la operación entre las bandas (layer arithmetics) de cada imagen de la
serie de tiempo, ver un detalle de la implementación en CNL en la Ilustración 37, así como
los componentes de Brillo, verdor y humedad de la transformación Tasseled Cap, ver un
detalle de los resultados en la Ilustración 38. Estas nuevas bandas se almacenan como
datos temporales durante la ejecución del proceso de segmentación y clasificación.

Ilustración 37 Detalle del algoritmo en lenguaje CNL para el cálculo de los índices NDVI, ARVI, NBR, y
los componentes de la transformación Tasseled Cap. Elaboración propia.

A B Ilustración 38. Resultado del cálculo de las variables espectrales de (A) NDVI, (B) NBR,
(C) ARVI y (D) RGB(Brillo, Verdor, Humedad) para el frame T0.
C D
100

4.1.1.2. Incorporación de los datos CFMASK.


Los datos de la máscara de nubes CFMASK suministrada por el USGS junto a las
imágenes de reflectancia de superficie (SR), permitieron definir las áreas de Nubes,
sombras y SLC-Off a excluir de los procesos de muestreo y clasificación. Inicialmente los
datos de la máscara de nubes se incorporaron a la clasificación de la serie de tiempo
mediante un proceso de segmentación y clasificación únicamente de la capa CFMASK de
cada Frame. En la Ilustración 39 se muestra como a partir de los datos de la máscara
CFMASK (A) la segmentación obtenida (C) se clasifica a la clase Nubes (D).

Ilustración 39 Ejemplo del proceso de incorporación de los datos de CFMASK para la


A B imagen T1. (A) Mascara CFMASK, (B) Imagen analizada en una combinación de color
RGB(Inf Medio, Inf Cercano, Rojo), (C) Delimitación de la máscara CFMASK sobre la
C D imagen y (D) Segmentación de la imagen en zona de Nubes y No Nubes. Elaboración
propia

Como se observa, la máscara CKMASK subestima las áreas de nubes y sombras, por lo
que se diseña e implementa un proceso de ajuste a las zonas de nubes. Para ello se
procede segmentar las áreas adyacentes empleando únicamente los datos de las bandas
del visible (Azul y verde). La función generada en CNL, Nubes, se presenta en la Ilustración
41. Los resultados de esta función dentro del algoritmo general se presentan en la
Ilustración 40Ilustración 41.
101

A B Ilustración 40 Ejemplo del proceso de ajuste de la máscara inicial CFMASK para la


imagen T1. La máscara inicial (A) subestima las áreas de nubes, así que mediante el
C D proceso de ajuste propuesto se expanden (B), filtran (C) y consolida (D) la máscara
final. Elaboración propia.

En la Ilustración 40 se puede ver un ejemplo del proceso de ajuste a la máscara inicial que
subestima la cobertura de nubes (A), es mediante un proceso de crecimiento de regiones
segmentadas a partir de los índices NBR y NDVI que se expande inicialmente la máscara
CFMASK (B), y con un proceso adicional de segmentación a nivel de píxeles
espectralmente similares, a partir de las estadísticas de la máscara ajustada, proceso
Optimizar en la Ilustración 41, la máscara se ajusta mediante una última expansión (C).
La máscara es finalmente depurada y consolidada en un único objeto clasificado como
Nube (D), proceso Depurar, en la Ilustración 41. Durante el proceso no se procede a la
detección de zonas de nubes no identificadas por CFMASK, de igual forma el proceso
puede sobreestimar en algunos casos la extensión de la cobertura de nubes.
102

Ilustración 41. Función “Nubes” en CNL, para el ajuste de la máscara CFMASK

4.1.1.3. Segmentación de la Serie de Tiempo.


Los parámetros de la segmentación, ver Ilustración 42, de la serie de tiempo se definieron
por procesos de ajuste y variación de múltiples ponderaciones a las bandas e índices, así
como a los factores de escala y forma (Ardila & Espejo, 2005). Es de anotar que esta alta
variabilidad y poca estandarización del proceso de segmentación sigue siendo una
desventaja de los métodos orientados a objetos. Los parámetros utilizados se presentan a
continuación:

Pesos a las bandas,


índices y
transformaciones

Composición del
parámetro de
Homogeneidad

Ilustración 42 Parámetros de la segmentación multisescala realizada en eCognition y que aplicados a


la serie de tiempo generan los objetos a ser clasificados. Elaboración propia.
103

Se da una mayor ponderación a los índices ARVI, NDVI y NBR sobre las bandas
espectrales de mayor longitud de onda (IRC a IRL), ya que estos facilitan la separación de
coberturas vegetales de suelo, cuerpos de agua y nubes. Las bandas del visible no se
usaron en la segmentación dada su alta correlación y a la alta presencia de fenómenos
atmosféricos en las imágenes que afectan significativamente a las longitudes de onda más
cortas. Mientras que los mayores pesos se asignaron a los componentes de la
transformación Tasseled Cap, por permitir esta una mejor definición de las coberturas
vegetales y sus variaciones. Un detalle de los resultados de la segmentación se presentan
en la Ilustración 43, los límites de los objetos se ajustan adecuadamente a las coberturas
de interés.

A B Ilustración 43 Detalle del resultado de la segmentación aplicada a cada uno de los


C D frames de la serie de tiempo. (A) T0, (B) T2, (C) T4 y (D) T5.

4.2. Resultados Fase 2. Proceso de


muestreo y entrenamiento.
Al emplearse un proceso de muestreo sobre las clases estables en el periodo 1990-2013,
la definición de un objeto segmentado en cada frame de la serie de tiempo, busca que este
represente adecuadamente a un objeto de Bosque o No Bosque. La asignación del objeto
segmentado, como un objeto de muestra del entrenamiento para los algoritmos de
aprendizaje de maquina a emplearse consiste en una relación topológica de contenencia,
ver Ilustración 44.

“Si un objeto segmentado, contienen un punto de muestreo a partir de los datos de


Bosque o No Bosque Estable IDEAM 1990-2013, este objeto será asignado como una
muestra de dicha clase”
104

Ilustración 44 Proceso de creación de los objetos de muestreo en el Frame Ti, a partir de la relación
topológica del objeto y el punto de muestreo. Elaboración Propia

Este proceso genera un número equivalente de muestras en cada uno de los Frames de
la serie de tiempo. Este proceso permitirá además generar una asignación siempre
coherente e independiente del tipo de dato o imagen que se emplee hasta el momento el
que se encuentre disponibles datos históricos de Bosque y No Bosque, como se muestra
a continuación en la Ilustración 45.

Ilustración 45 Detalle en el mismo sector para los frames (A) T0 (B) T7 y (C) T4 de
A B C los objetos definidos como muestras a las clases Bosque y No Bosque en cada
uno de los frames de la serie de tiempo. Elaboración Propia

Para la selección de los objetos muestra, las zonas que no fueron clasificadas como nubes
son segmentadas. Esto para generar objetos que delimiten de la mejor forma las zonas de
vegetación y no vegetación. Cuando un objeto generado coincide espacialmente con un
punto de muestreo este será entonces definido como una muestra para el posterior
proceso de clasificación. A continuación en la Ilustración 46 se presenta el detalle del
algoritmo en CNL para la generación del muestreo a partir de las áreas que no son Nubes.
105

Ilustración 46 Detalle del proceso de generación del muestreo, y creación de los objetos de
entrenamiento.

4.3. Resultados Fase 3. Optimización del


espacio de características.
La optimización del espacio de características permite la selección de los valores
estadísticos de los objetos definidos como muestras y que permitan la máxima
separabilidad en un espacio euclidiano multidimensional de cada clase temática.

4.3.1. Determinación del Clasificador y espacio de


características óptimo.
Inicialmente se realizó la evaluación y comparación de la exactitud temática a partir de
7000 puntos de validación sobre un sector del área estudio. Se implementó la clasificación,
mediante 3000 puntos de entrenamiento, de las clases de Bosque y No Bosque empleando
3 diferentes clasificadores: Árboles de Decisión (DT), Maquinas de Soporte Vectorial
(SVM) y Random Forest (RF), en tres diferentes configuraciones del espacio de
características empelando diferentes conjuntos de datos: Únicamente datos espectrales
(XS), la combinación de Índices y cobertura Fraccional (IND+FRACC), y el uso simultaneo
de las bandas espectrales, índices y cobertura fraccional (XS+IND+FRACC). Se evaluaron
los datos a nivel de matriz de confusión, exactitud promedio, índice Kappa y los valores del
test de independencia para comparar dos matrices de confusión, el proceso completo
puede encontrarse en el Anexo 2.

De acuerdo a los resultados del análisis, para todas las combinaciones de clasificadores
los métodos en los que se ha empleado únicamente los datos espectrales o su
combinación con los datos de cobertura fraccional, son significativamente diferentes, y de
acuerdo al valor de kappa, de una mayor exactitud temática que empleando únicamente
los datos de cobertura fraccional e índices. No es posible determinar a un nivel de
confianza del 95% y/o 99% una diferencia significativa de un método, bien sea SVM, DT o
RF sobre otro. Por ende el desarrollo de los procesos para la clasificación de la cobertura
bosque y no bosque se realizara siempre la comparación y generación de los datos por
106

todos los métodos definidos a partir de los datos espectrales y de índices y


transformaciones, y no se preferirá en la metodología un método sobre otro, hasta no
realizar la evaluación final.

4.3.2. Determinación a partir del muestreo


GEOBIA del espacio de características optimo
Empleando los 17723 objetos de muestra de Bosque y los 13439 objetos de muestra de
No Bosque, la matriz de separabilidad construida por eCognition 9 se calcula a partir de la
maximización de la separabilidad euclidiana de todos los atributos disponibles para
determinar en cada caso posible la mayor diferenciación entre dichas clases. Los
resultados mostraron que como atributos (dimensiones del espacio de características) para
lograr una máxima separabilidad entre las clases de Bosque y No Bosque 8 variables: 2
bandas espectrales (IRM, e IRL), 3 índices de vegetación (NDVI, ARVI y NBR) y dos
componentes de la transformación TC (Humedad y Verdor) son las más adecuadas. La
estimación de separabilidad de las muestras indica que estas sin el uso de la banda azul
y de los datos fraccionales de vegetación son más que adecuados para la separabilidad
de las áreas de Bosque y No Bosque. Como se observa en la Ilustración 47 la máxima
separabilidad se obtiene al usar 8 variables, el valor de la máxima separabilidad usando
uno, dos y ocho atributos se presentan en la Ilustración 48.

Ilustración 47 Separabilidad estadística de los datos de las muestra. Tomado de (eCognition


Developer, 2009)

Ilustración 48 Detalle de los resultados para la optimización y selección de la mejor combinación de


variables (dimensiones) para la clasificación de los objetos de la imagen a partir de los objetos
segmentados. Tomado de (eCognition Developer, 2009)
4.4. Resultados Fase 4. Clasificación de la serie de tiempo
Bosque – No Bosque
Para la clasificación de los datos de cada uno de los frames, en las clases Bosque y No Bosque, de la serie de tiempo se emplearon
los algoritmos de aprendizaje de máquina y reconocimiento de patrones: Maquinas de soporte vectorial (SVM), árboles de decisión
(DT), Bosques Aleatorios (RF) y K-nearest neigborh (KNN). A continuación un detalle de cada uno de los resultados para los rimeros
6 frames de la serie de tiempo, correspondientes al periodo de interés.

10/01/2014 26/01/2014 31/03/2014 22/08/2014 23/09/2014 20/12/201432


Imagen

A
DT

32
Como se indicaba en la sección 3.5.2.5.2 para el modelamiento de la detección de cambios los resultados de los últimos dos frames de la serie de tiempo T6 05/01/2015 y T7
05/01/2015 sirven para la reducción de la incertidumbre en la detección de cambios de la serie, pero no para una cuantificación de la deforestación en estos frames. Por lo tanto los
resultados presentados de aquí en adelante en el documento no detallan en estos resultaos, aunque los mapas obtenidos y estadísticas fueron generaos y almacenados.
108

SVM

A
RF

A
KNN

Tabla 12 Comparación de resultados de la clasificación de Bosque y No Bosque para cada uno de los frames de la serie de tiempo por medio de los
algoritmos de aprendizaje de maquina aplicados. Elaboración propia.

Cada algoritmo presenta múltiples potencialidades y de igual forma muchas limitaciones al realizar una revisión visual de los resultados
de la clasificación. Algunas de las principales anotaciones en este momento serian la dificultad de la delimitación de drenajes con
ancho inferior a los 450 mts, ver por ejemplo en el recuadro A las clasificaciones para el frame T2 26/01/2014. También se presentan
variaciones en la clasificación de áreas de vegetación leñosa no boscosa, tales como arbustales, y es en estas áreas donde se
presenta la mayor variabilidad en la clasificación entre momento y momento de la serie.

Cada algoritmo se implementa en dos etapas, en la Ilustración 49, inicialmente se realiza la etapa de entrenamiento y definición de
los parámetros de los clasificadores, para posteriormente aplicar a la totalidad de la serie de tiempo el algoritmo determinado.
Ilustración 49. Detalle del proceso de Entrenamiento y Ejecución del clasificador DT. Elaboración
propia.

Se generaron las clasificaciones de Bosque y No Bosque por cada método y para cada
periodo de tiempo, es decir 32 mapas de Bosque y No Bosque, para un ejemplo ver
Ilustración 50. Si bien el propósito del presente estudio no era realizar una validación
comparativa de los 4 algoritmos de aprendizaje de maquina empleados, si es posible
mediante el proceso realizado llegar a resultados que pueden dar elementos de análisis
inicial que pueden ser reafirmados o refutados por investigaciones definitivas en otros
estudios posteriores.

A B Ilustración 50 Clasificación final para el T0. Algoritmos (A) DT, (B) Knn, (C) Rf y (D)
C D SVM.

En la implementación de los cuatro algoritmos de machine learning para la clasificación de


la serie de tiempo se evidenciaron algunas diferencias en la delimitación de las coberturas
entre cada uno de estos. Aspectos como presencia de nubes, sombras o efectos
atmosféricos como brumas, ver Ilustración 51, llevan a que en algunos casos clasificadores
como DT y Knn estimen áreas de bosque como áreas de No Bosque.
110

Ilustración 51 La sobrestimación de las áreas de No Bosque en zonas de presencia de


A B nubes es mayor en algoritmos como DT (A), que en algoritmos como Knn (B). La línea
roja representa el límite de la máscara CFMASK

La implementación del proceso de ajuste de CFMASK mejora en algunos casos dicha


problemática, pero se observó también una sobrestimación del ajuste en áreas de nubes
en zonas de Bosque, ver Ilustración 52. Si bien en términos generales las clasificaciones
son muy estables, las variaciones en áreas de vegetación densa en zonas de bosque o no
bosque entre un periodo u otro llevan a falsas detecciones de deforestación o a una mayor
tarea de ajuste y modelamiento. Por ello esta parte del modelo es opcional y se pueden
ajustar mejores parámetros para la determinación del ajuste de nubes a los aquí
propuestos.

Ilustración 52 El ajuste de la máscara CFMASK, áreas naranja en (B), puede llevar a


A B una sobrestimación de las áreas de Nubes en zonas de presencia de Bosque, como
puede verse en (A) son zonas de vegetación boscosa con fenología y reflectancia
variable que se enmascaran de forma incorrecta.
4.5. Resultados Fase 5. Análisis espaciotemporal de la serie
de tiempo para la detección de cambios.
La implementación del proceso de análisis de mediante conexión entre objetos, Links espaciotemporales, se realizó mediante el
modelamiento de los cambios en la cobertura de Bosque, un polígono de bosque en un frame o momento de la serie de tiempo y un
objeto No Bosque en su misma posición en los siguientes momentos, Frames. Este proceso permite realizar una asociación temporal
entre objetos, a partir de una relación topológica, que se analizó para definir, determinar o ajustar la clasificación a una determinada
cobertura. El proceso de conexión entre objetos se basa en el proceso de rastreo o seguimiento y es empleado en proceso de análisis
de imágenes médicas y biológicas, cuando se requiere detectar como un objeto cambia de posición en el tiempo (eCognition
Developer, 2009).

Mapa de Cambio Mapa de Cambio Mapa de Cambio Mapa de Cambio Mapa de Cambio
10/01/2014 - 26/01/2014 - 31/03/2014 - 22/08/2014 - 23/09/2014 -
26/01/2014 31/03/2014 22/08/2014 23/09/2014 20/12/2014
DT

A
SVM

A
112

RF

A
KNN

Tabla 13 Comparación de los resultados de la detección de áreas deforestadas por la metodología entre cada uno de los momentos, frames, de la serie
de tiempo. Elaboración Propia

Como se puede observar en Tabla 13 la evolución del proceso de deforestación para el establecimiento de un camino o vía, recuadro
A, entre dos puntos diferentes se da en los dos primeros frames de la serie. Todos los métodos detectan el cambio producido por la
pérdida de bosque entre la imagen del 10/01/2014 y la imagen 31/03/2014, es decir en menos de 40 días un sector lineal de casi 900
metros fue deforestado.

La implementación metodológica de un análisis espaciotemporal de los objetos de Bosque y No Bosque para definir Objetos de
Deforestación, mediante el uso del concepto de Link entre objetos de diferentes Frames pues permitió:
 La definición del concepto de Objeto de Deforestación como el área de traslape entre objetos de Bosque en el Frame n
conectado a objetos de No Bosque en el Frame n+1 por una relación Link(out), ver Ilustración 53.
 Se valida además la permanencia temporal de este cambio en toda la serie de tiempo, para evitar así las falsas detecciones
debidas a nubes, sombras u otros artefactos no enmascarados correctamente.
 Es decir el Objeto deforestación debe ser un Objeto asociado a un cambio permanente de un objeto Bosque en el Frame n a
todos los objetos no Bosque de los frames n+1 hasta el último frame.
La definición de este marco metodólogo para la detección de la deforestación a partir de
los mapas de Bosque y No Bosque, se implementó y modelo completamente en un entorno
GEOBIA, permitiendo así involucrar los conceptos de análisis especial en el análisis
espectral de cambios las características del proceso de detección de la deforestación.

Ilustración 53 Proceso de construcción de los links entre los objetos de Bosque en el


A B T0 (A) y los objetos de NO Bosque en el T1 (B). Los objetos conectados
topológicamente (link espaciotemporal) se resaltan en ambas imágenes.

La metodología también permitió implementar el ajuste de las áreas inconsistentes y sin


información, lo que facilita además la generación de mapas sin áreas de Nubes. Este
parámetro también es opcional pues se observan algunas asignaciones erróneas cuando
hay múltiples periodos de tiempo con nubes en las mismas posiciones, ver Ilustración 54,
como líneas o artefactos lineales de bosque o no bosque en zonas de límites de los Gaps
en imágenes Landsat 7 ETM+ SLC-off.

Ilustración 54 Resultados del proceso de ajuste de las áreas sin información a partir
A B de la clasificación de los frames previos de la serie de tiempo. En zonas con varios
periodos de tiempo sin información se pueden generar asignaciones erróneas.

Para cada uno de los métodos se generan además de los mapas de detección entre cada
uno de los momentos, frames, el mapa agregado de la detección hasta el último frame
como se indicaba en la sección 3.5.2, que para el año 2014 correspondería al T5, ver la
Tabla 14. Las detecciones de los frames T6 y T7 no se analizaran en este caso, pues
corresponden a detecciones en el periodo 2015 y requieren de más observaciones en ese
mismo año para ser consolidadas y validadas. Por lo tanto la detección acumulada en T5
sería la detección acumulada anual para dicha zona, ver Ilustración 30.
Mapa de Cambio Mapa de Cambio Mapa de Cambio Mapa de Cambio Mapa de Cambio
Agregado 10/01/2014 Agregado 10/01/2014 Agregado 10/01/2014 Agregado 10/01/2014- Agregado 10/01/2014-
- 26/01/2014 -31/03/2014 - 22/08/2014 23/09/2014 20/12/2014
DT
SVM
RF
KNN

Tabla 14. Comparación de los resultados de la detección acumulada de áreas deforestadas entre el primer frame y cada nuevo momento de la serie de
tiempo. Elaboración Propia
115

4.6. Resultados Fase 6. Validación


temática de los resultados
Para un mejor entendimiento de la exactitud de los resultados a nivel geométrico y temático
de los objetos de deforestación detectados la validación temática se realiza aplicando la
matriz STEP (Lizarazo, 2014a) sobre 3 diferentes áreas para la detección agregada final
de todos los clasificadores. El autor sugiere aplicar una validación por “segmentos” o “Tiles”
pues los tiempos de procesamiento son muy altos en áreas tan extensas y con tantos
objetos de muestra y referencia. Lo aconsejable son áreas de no más de 10 o 15 objetos.

La validación será realizada a partir de la comparación mediante la matriz STEP de los


datos resultantes de cada uno de los métodos aplicados y dos datos de referencia: Los
datos oficiales de deforestación para Colombia generados por el IDEAM (Cabrera et al.,
2011a), y los datos generados por el sistema de detección de cambios a nivel global de la
Universidad de Maryland: Global Forest Change (Achard & Hansen, 2012a). EL propósito
es determinar una base de referencia de como los resultados a partir de un modelamiento
espaciotemporal basado en objetos son correspondientes a dos sistemas de monitoreo de
la deforestación a partir de la detección de cambios pixel a pixel.

El primer sector seleccionado corresponde a un área ya intervenida anteriormente para el


establecimiento de espacios para pastos y ganadería, ver Ilustración 55, donde se
expanden las áreas deforestadas (entre el primer y segundo frame) y se observan cambios
de vegetación arbustivas (entre el 4 y 5 frame). La deforestación de acuerdo al mapa de
referencia IDEAM se produce en dos lugares. La deforestación de acuerdo a Global Forest
Change se produce en una sola área irregular.

Ilustración 55 Comparación temática de la detección por deforestación para el Sector #1. Los cambios
por deforestación se resaltan entre cada frame en flechas amarillas. Se presentan los agregados para
cada uno de los métodos y el mapa de referencia elaborado por IDEAM y Global Forest Change.
Elaboración propia.
116

El segundo sector corresponde al área de deforestación para el establecimiento de un


camino de conexión entre dos áreas previamente deforestadas, ver Ilustración 56, la zona
se podría considera de baja intervención hasta el segundo y tercer Frame, cuando se
genera la “vía”. La deforestación de acuerdo al mapa de referencia IDEAM se produce
como un solo polígono con un grosor de aproximadamente 120 metros. La deforestación
de acuerdo a Global Forest Change con un grosor máximo de 90 metros y no conecta por
completo las dos áreas.

Ilustración 56 Comparación temática de la detección por deforestación para el Sector #2. Se


presentan los agregados para cada uno de los métodos y el mapa de referencia elaborado por IDEAM
y Global Forest Change. Elaboración propia.
.
El tercer y último sector corresponde a un área considerable de deforestación de acuerdo
a IDEAM y Global Forest Change, en una zona sin intervención previa, pero con presencia
de nubes en el T1, ver Ilustración 57. El cambio a zona sin vegetación se da entre el T1 y
el T2 para luego pasar a ser nuevamente una zona de recuperación vegetal. La
deforestación de acuerdo al mapa de referencia IDEAM y Global Forest Change se
produce como un solo polígono.

Ilustración 57 Comparación temática de la detección por deforestación para el Sector #3. Se


presentan los agregados para cada uno de los métodos y el mapa de referencia elaborado por IDEAM
y Global Forest Change. Elaboración propia.
117

4.6.1. Matrices STEP de Error Ponderadas.


Las métricas STEP son ponderadas en función de las áreas de los objetos comparados
para obtener así una estimación de los errores de Comisión, Omisión y la Exactitud
Promedio para cada clase y cada métrica33, ver tablas 18 a 21. Y finalmente se agregan y
reportan las exactitudes promedio y se indican sus respectivos intervalos de confianza, ver
Tabla 22 (Lizarazo, 2014a). A continuación y a modo de ejemplo los resultados para el
método RF en el Sector #1 a partir de los datos de referencia del IDEAM. Los resultados
completos para todos los sectores y todos los métodos a partir de la comparación con los
datos de IDEAM y Global Forest Change se presentan en el anexo 3.

Exactitud
SHAPE Bosque Deforestación No Bosque Total Productor (%)

Bosque 90,830 4,839 1,637 97,305 93%


Deforestación 6,292 13,916 1,164 21,371 65%
No Bosque 8,636 12,517 53,341 74,494 72%
Total 105,758 31,272 56,142 193,171 100%
Exactitud Usuario (%) 86% 44% 95% 100% 82%
Tabla 15 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el
Sector #1 a partir de los datos IDEAM.

Exactitud
THEME Bosque Deforestación No Bosque Total Productor (%)

Bosque 106,611 6,583 2,223 115,417 92%


Deforestación 7,398 15,636 1,387 24,421 64%
No Bosque 11,582 21,396 71,718 104,696 69%
Total 125,591 43,616 75,328 244,535 100%
Exactitud Usuario (%) 85% 36% 95% 100% 79%
Tabla 16 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para
el Sector #1 a partir de los datos IDEAM.

Exactitud
EDGE Bosque Deforestación No Bosque Total Productor (%)

Bosque 103,396 132 480 104,008 99%


Deforestación 1,030 3,440 459 4,928 70%
No Bosque 3,928 445 44,640 49,013 91%
Total 108,354 4,017 45,578 157,949 100%
Exactitud Usuario (%) 95% 86% 98% 100% 96%
Tabla 17 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el
Sector #1 a partir de los datos IDEAM.

33
El valor de cada celda representa área superpuesta ponderada, acumulada por categoría temática clasificada, entre los
objetos de referencia y los correspondientes objetos clasificados, multiplicado por la correspondiente métrica evaluada
(Lizarazo, 2014a).
118

Exactitud
POSITION Bosque Deforestación No Bosque Total Productor (%)

Bosque 105,464 3,028 619 109,112 97%


Deforestación 3,265 11,101 1,375 15,741 71%
No Bosque 7,466 19,133 51,117 77,717 66%
Total 116,195 33,263 53,111 202,569 100%
Exactitud Usuario (%) 91% 33% 96% 100% 83%
Tabla 18 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF
para el Sector #1 a partir de los datos IDEAM.

Exactitud Promedio por Lim Inf IC Lim Sup IC


Componente 95% 95%
Shape 82% 60.0% 100.0%
Theme 79% 56.7% 100.0%
Edge 96% 81.1% 100.0%
Position 83% 61.2% 100.0%
Tabla 19 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para
el Sector #1 a partir de los datos IDEAM.

Si se observa en este caso particular del algoritmo RF en el sector 1, los más altos
indicadores de exactitud, tanto del usuario como del productor, los presenta la clase de
Bosque. La clase deforestación y No Bosque presentan en todas las métricas indicadores
no mayores al 86% tanto en la exactitud del productor como del usuario. Es de anotar los
bajos valores de exactitud en el indicador de forma, ver Tabla 19, para la clase
deforestación, no hay correspondencia geométrica adecuada entre los objetos de
deforestación generados y los datos de referencia del IDEAM. En términos generales el
consolidado STEP, ver Tabla 19, presenta una adecuada correspondencia geométrica y
temática de todas las clases (Bosque, No Bosque y Deforestación) por el método RF en el
Sector #2 a partir de la validación respecto a los datos oficiales del IDEAM.

Para tener un panorama más claro sobre el comportamiento de cada uno de los métodos
en todas las clases, a partir de los datos de validación IDEAM, se procede a agregar las
métricas en una tabla consolidada por sector y método de clasificación. En el caso del
Sector #2, ver Tabla 20, el método DT ofrece una ligera y mayor exactitud en forma, tema
y limite que los otros tres clasificadores. Mientras que la métrica de exactitud temática es
baja, menor al 80%, en los métodos RF y SVM. Sin embargo todos los métodos presentan
un muy alto indicador de exactitud, por arriba del 95%, para el indicador de Borde. Para el
sector #2 y #3, ver Tabla 21 y Tabla 22, todos los métodos presentan estadísticas similares
y significativamente altas para todas las clases en todas las métricas STEP.
119

Sector #1 RF DT Knn SVM


Shape 82% 86% 84% 81%
Theme 79% 87% 82% 76%
Edge 96% 94% 96% 96%
Position 83% 91% 86% 80%
Tabla 20 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos
aplicados al Sector #1 a partir de los datos IDEAM. El código de Color indica los valores más bajos
(amarillo) a los más altos (verde)

Sector #2 RF DT Knn SVM


Shape 92% 91% 90% 91%
Theme 91% 89% 88% 89%
Edge 98% 98% 98% 98%
Position 92% 91% 91% 91%
Tabla 21 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos
aplicados al Sector #2 a partir de los datos IDEAM. El código de Color indica los valores más bajos
(amarillo) a los más altos (verde)

Sector #3 RF DT Knn SVM


Shape 94% 95% 94% 92%
Theme 93% 94% 94% 93%
Edge 96% 96% 97% 97%
Position 94% 94% 94% 93%
Tabla 22 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos
aplicados al Sector #3 a partir de los datos IDEAM. El código de Color indica los valores más bajos
(amarillo) a los más altos (verde)

Para los resultados de la validación de todas las clases en los tres sectores a partir de los
datos de validación de Global Forest Change, a modo de resumen, se presentan
igualmente los resultados agregados de las métricas STEP para todas las clases, ver Tabla
23 a Tabla 25. Las matrices por métricas se encuentran en el anexo 3. Es de notar lo
relativamente bajo, entre 58% a 72%, de los indicadores agregados para el sector #1,
excepto el indicador de Borde que es además el que mayor valor presenta para todos los
métodos. En todos los sectores y para todos los métodos el indicador de exactitud en
posición es el indicador con menor valor. En todos los sectores los resultados de los 4
métodos son bastante similares.

Sector #1 RF DT Knn SVM


Shape 70% 66% 71% 72%
Theme 70% 68% 70% 71%
Edge 89% 85% 92% 90%
Position 60% 58% 62% 64%
Tabla 23 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos
aplicados al Sector #1 a partir de los datos Global Forest Change. El código de Color indica los
valores más bajos (amarillo) a los más altos (verde)
120

Sector #2 RF DT Knn SVM


Shape 94% 93% 93% 93%
Theme 91% 90% 90% 90%
Edge 99% 98% 98% 98%
Position 86% 85% 86% 84%
Tabla 24 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos
aplicados al Sector #2 a partir de los datos Global Forest Change. El código de Color indica los
valores más bajos (amarillo) a los más altos (verde)

Sector #3 RF DT Knn SVM


Shape 95% 94% 94% 94%
Theme 92% 94% 94% 93%
Edge 98% 98% 99% 98%
Position 85% 85% 84% 85%
Tabla 25 Resumen de los indicadores promedio por métricas de la matriz STEP para los 4 métodos
aplicados al Sector #3 a partir de los datos Global Forest Change. El código de Color indica los
valores más bajos (amarillo) a los más altos (verde)

Finalmente y para presentar un consolidado final de todos los métodos, en todos los
sectores y a partir de la validación de los datos IDEAM y Global Forest Change, se
consolidan los siguientes reportes gráficos de tipo radial sobre los indicadores de exactitud
Promedio (Todas las clases) y las exactitudes Usuario y Productor (Deforestación), pues
son los objetos de interés para el presente estudio.

Para el Sector #1 son evidentes los contraste en los resultados de la detección al


compararlos entre los datos de validación de IDEAM (Ilustración 58 A y B) y los datos de
deforestación de Global Forest Change (Ilustración 70 A y B), pues el área de este última
sobrestimada los cambios por deforestación observados en la imagen. Los resultados del
proceso propuesto (Ilustración 58 e Ilustración 70 C a F) al compararlo con ambos datos
de validación subestiman el área deforestada reportada. Pero los resultados presentan una
mejor coherencia con las detecciones reportadas con IDEAM en este Sector, siendo el
método de Knn el más exacto en la detección, pues identifica las mismas 2 áreas
deforestadas reportadas (Ilustración 58 E). Sin embargo debe anotarse que las
detecciones de los métodos RF y SVM señalan un cambio por deforestación en una zona
donde IDEAM no lo identifica adecuadamente, ver Ilustración 58 paneles C y D, lo que
sería un error por comisión, aunque no identifican al mismo el polígono en la parte superior
del sector, que corresponde efectivamente a una deforestación, y esto reduce sus
indicadores de exactitud del usuario (errores por omisión).

Los indicadores de exactitud temática promedio son mayores, entre 75% a 100% para
IDEAM y entre 55% a 90% para Global Forest Change a partir de los datos de validación
para todas las clases en todas las métricas. Caso particular es el método DT a partir de la
validación con IDEAM (Ilustración 59 A) donde reporta el mayor indicador de exactitud
promedio para todas las clases, pero como se evidencia los indicadores de exactitud del
121

productor (Ilustración 59 B) y usuario (Ilustración 59 C) son 0% para este mismo método,


pues no hay ninguna coincidencia a nivel espacial de las detecciones por este método con
ninguna de las áreas de validación IDEAM o Global Forest Change (Ilustración 58 e
Ilustración 70 C a F).

En términos generales la métrica con mayores porcentajes de exactitud, en todas las


clases y en deforestación específicamente, es Borde (Edge), mientras que caso contario
la métrica de Forma (Shape) presenta los indicadores más bajos de exactitud, tanto para
todas las clases como para deforestación bien sea a partir de los datos de validación
IDEAM o Global Forest Change. Lo que indica esto que las detecciones de los objetos de
deforestación difieren de las formas reportadas por los dos set de evaluaciones trabajados,
pero conservan similitud en forma y características en su geometría.

Los objetos de deforestación generados por el método de Knn (Ilustración 58 E) presentan


una mejor probabilidad (exactitud del usuario) de representar las áreas deforestadas, y una
mayor correspondencia con los datos de evaluación (exactitud del productor) de acuerdo
a los datos del IDEAM, Ilustración 59. Sin embargo al comparar con los datos de Global
Forest Change los objetos de deforestación generados presentan una considerable
diferencia en el área reportada y por ende la exactitud del usuario es considerablemente
baja, aunque las exactitudes del productor (correspondencia del detectado y el mapa de
referencia) son bastante altas, ver Ilustración 71 C, pues la mayoría de las áreas de los
objetos de deforestación detectados corresponden espacialmente a la detección reportada
por Global Forest Change.

Ilustración 58 Resultados comparativos para el Sector #1, a partir de los


A B C D E F datos de validación IDEAM (polígonos rojos) y cada uno de los métodos
empleados (polígonos purpura). Como referencia se presentan las imágenes
del primer frame T0 (A) y ultimo frame T5 (B).
122

Ilustración 59 Gráficos radiales comparando las estadísticas de exactitud Promedio


A B C para todas las clases (A) y la Exactitud del Usuario (B) y Productor (C) para la clase
deforestación en el Sector #1 a partir de los datos de validación de IDEAM.

Ilustración 60 Resultados comparativos para el Sector #1, a partir de los


A B C D E F datos de validación Global Forest Change (polígonos rojos) y cada uno de
los métodos empleados (polígonos purpura). Como referencia se presentan
las imágenes del primer frame T0 (A) y ultimo frame T5 (B).

Ilustración 61 Gráficos radiales comparando las estadísticas de exactitud Promedio


A B C para todas las clases (A) y la Exactitud del Usuario (B) y Productor (C) para la clase
deforestación en el Sector #1 a partir de los datos de validación de Global Forest
Change.
123

Los objetos de deforestación generados para el Sector #2 presentan una adecuada


representación del fenómeno, y si bien comparándolos con los datos de referencia IDEAM,
Ilustración 62, y Global Forest Change, Ilustración 64, no se presentan notables
diferencias, en tamaño, forma y/o distribución de estos, como lo ocurrido en el sector #1.
Puede observarse a simple vista que el método RF, Ilustración 62 C, es el que mejor
resultados ofrece. Los métodos DT, Knn y SVM, Ilustración 62 D a F, entregan buenos
resultados, pero los objetos de deforestación generados se presentan dispersos o
desconectados, así que no permiten caracterizar completamente el fenómeno. En base a
los datos de validación de IDEAM otros objetos de deforestación diferentes a la “vía” son
generados por todos métodos; en el caso del método DT, Ilustración 62 D, se genera un
mayor cantidad de estos, lo que se asocia a una mayor sensibilidad del método a la
detección de áreas de cambio asociadas a variaciones fenológicas de vegetación
secundaria y o a cambios en la respuesta espectral de bosque por deforestación.
.
Los indicadores de exactitud temática promedio de los objetos son muy altos, entre 75% a
100%, tanto para IDEAM, Ilustración 63 A, como para Global Forest Change, Ilustración
65 A, para todas las clases en todas las métricas. Lo que indicaría que para este sector
todos los métodos ofrece una adecuada delimitación de los objetos asociados a las
coberturas de Bosque y No Bosque.

Los objetos de deforestación generados por el método de RF (Ilustración 62 C) presentan


una mejor probabilidad (exactitud del usuario) de representar las áreas deforestadas, y una
mayor correspondencia con los datos de evaluación (exactitud del productor) de acuerdo
a los datos del IDEAM, Ilustración 63 B y C, así como para Global Forest Change,
Ilustración 65 B y C. En ambos casos es evidente la mayor correspondencia de los objetos
de deforestación obtenidos por este método al ser validado con los dos conjuntos de datos
de referencia. Si bien para el caso de la validación con los datos de Global Forest Change
la exactitud del usuario, Ilustración 65 B, es menor par el Método RF que para la validación
con datos IDEAM, Ilustración 63 B, lo que indicara una mejor definición de los objetos de
deforestación de acuerdo a lo identificado por IDEAM. Los métodos SVM y Knn, Ilustración
63 Ilustración 65, presentan menores exactitudes por métrica (promedio, usuario y
productor) que los el método RF pero aun así estas son superiores a las del metodo DT,
cuyos errores pos omisión, Ilustración 65 B, y comisión, Ilustración 65 C, son muy altos
para cada set de datos de validación, lo que indica una muy baja correspondencia de las
detecciones coincidentes, los bajos valores de las métricas de Forma y Posición, en ambos
casos indicarían que los objetos de deforestación son más pequeños o más numerosos
que los objetos de validación.
124

Ilustración 62 Resultados comparativos para el Sector #2, a partir de los


A B C D E F datos de validación IDEAM (polígonos rojos) y cada uno de los métodos
empleados (polígonos purpura). Como referencia se presentan las imágenes
del primer frame T0 (A) y ultimo frame T5 (B).

Ilustración 63 Gráficos radiales comparando las estadísticas de exactitud Promedio


A B C para todas las clases (A) y la Exactitud del Usuario (B) y Productor (C) para la clase
deforestación en el Sector #2 a partir de los datos de validación de IDEAM.

Ilustración 64 Resultados comparativos para el Sector #2, a partir de los


A B C D E F datos de validación Global Forest Change (polígonos rojos) y cada uno de
los métodos empleados (polígonos purpura). Como referencia se presentan
las imágenes del primer frame T0 (A) y último frame T5 (B).
125

Ilustración 65 Gráficos radiales comparando las estadísticas de exactitud Promedio


A B C para todas las clases (A) y la Exactitud del Usuario (B) y Productor (C) para la clase
deforestación en el Sector #2 a partir de los datos de validación de Global Forest
Change.

Los resultados del Sector #3 son similares para todos los métodos, en todas las métricas
STEP y para ambos procesos de validación. Comparados con los datos de validación
IDEAM, Ilustración 66 A y B, y Global Forest Change, Ilustración 68 A y B, todos los
resultados subestiman el área deforestada, dado que por las características espectrales
de la vegetación y la presencia de nubes, para el T0, los algoritmos de clasificación
determinan que inicialmente esta área es No Bosque, aunque espectralmente dicha área
podría ser de Bosque, y aun dado el fuerte cambio a suelo desnudo en el T1, ver Ilustración
57, y de mantenerse claramente hasta el T5 como un área de No Bosque, el modelamiento
de la dinámica de dichos objetos es de No Bosque Estable. De allí que aunque todos los
métodos generan un objeto de deforestación, Ilustración 66 e Ilustración 68 paneles C a F,
las detecciones de deforestación no son comparables a las indicadas por los datos de
validación IDEAM y Global Forest Change.

La exactitud promedio para todos los métodos en todas las métricas a partir de ambos
conjuntos de validación son superiores al 85%, ver Ilustración 67 A e Ilustración 69 A. Pero
en el análisis de la exactitud de la clase deforestación la subestimación del área
deforestada por todos los métodos en comparación con los datos de validación generan
indicadores muy altos de exactitud del productor para todas las métricas STEP, es decir
un bajo error de omisión, por cuanto toda el área del objeto de deforestación está contenido
en el objeto de validación deforestación, ver Ilustración 66 y Ilustración 68 paneles C a F;
pero de igual forma se obtienen una muy baja exactitud del usuario, un alto indicador del
error de comisión, por cuanto, las áreas indicadas como deforestación en los conjuntos de
validación no fueron identificados como tales, sino por el contrario como áreas de Bosque
o No Bosque.
126

Ilustración 66 Resultados comparativos para el Sector #3, a partir de los


A B C D E F datos de validación IDEAM (polígonos rojos) y cada uno de los métodos
empleados (polígonos purpura). Como referencia se presentan las imágenes
del primer frame T0 (A) y ultimo frame T5 (B).

Ilustración 67 Gráficos radiales comparando las estadísticas de exactitud Promedio


A B C para todas las clases (A) y la Exactitud del Usuario (B) y Productor (C) para la clase
deforestación en el Sector #3 a partir de los datos de validación de IDEAM.

Ilustración 68 Resultados comparativos para el Sector #3, a partir de los


A B C D E F datos de validación Global Forest Change (polígonos rojos) y cada uno de
los métodos empleados (polígonos purpura). Como se referencia se
presentan las imágenes del primer frame T0 (A) y ultimo frame T5 (B).
127

Ilustración 69 Gráficos radiales comparando las estadísticas de exactitud Promedio


A B C para todas las clases (A) y la Exactitud del Usuario (B) y Productor (C) para la clase
deforestación en el Sector #3 a partir de los datos de validación de Global Forest
Change.

4.7. RESULTADOS DE LAS


CLASIFICACIONES
Ahora se procede al análisis de los datos obtenidos sobre los objetos de deforestación a
nivel de cuantificación de área, número de polígonos, para cada uno de los cuatro
algoritmos a fin de dar una perspectiva general de los resultados de la detección y
delimitación de los objetos de Deforestación a partir de la comparación con los datos de
validación. Inicialmente se presenta, ver Ilustración 70, el consolidado de número de
Objetos de deforestación generados para la última detección para cada uno de los métodos
(para toda el área de estudio).
3000
Numero de Objetos de Deforestación

2367 2408
2500

2000
1617
1500 1249
1037
1000

500 214

0
DT Knn RF SVM IDEAM GFC

Ilustración 70 Comparación del número de objetos de deforestación generados por cada algoritmo y
los datos de referencia IDEAM y Global Forest Change. Los datos corresponden al agregado del
frame T4, que correspondería al reporte de deforestación para 2014.
128

Todos los algoritmos aplicados generan más objetos de deforestación que los reportados
por los datos de referencia IDEAM y Global Forest Change. A partir de los datos de
validación de IDEAM los algoritmos DT y Knn generan 12 veces más objetos de
deforestación que los reportados oficialmente, mientras que los algoritmos SVM y RF
generan 6 y 7.8 veces más objetos de deforestación que los detectados por IDEAM.
Comparados con el número de objetos generados y los reportados por Global Forest
Change este indicador varía entre 2.3, para los algoritmos DT y Knn, a 1.2 y 1.6 veces el
número de polígonos para los algoritmos SVM y RF respectivamente.

La comparación y análisis del indicador de área deforestada se presentara de tres formas:


(i) el área deforestada detectada para cada uno de 5 los frames de la serie de tiempo, ver
Ilustración 71, (ii) el área deforestada acumulada hasta cada uno de los frames de la serie
de tiempo, ver Ilustración 72, y finalmente (iii) el área total deforestada (acumulada para el
frame T5) determinada por cada algoritmo en comparación con los datos de referencia
IDEAM y Global Forest Change, ver Ilustración 73.
.
365.2
225.5
215.8
HECTAREAS

183.2
118.8

116.3
104.9
92.3

92.3

88.7
56.9

56.3

41.5
40.1

36.5
30.5

28.2
15.6
10.1

3.2
DT KNN RF SVM

T1 T2 T3 T4 T5

Ilustración 71 Comparación de los resultados de la detección de áreas deforestada por cada Frame
analizado de la serie de tiempo para el periodo de análisis 2013 (Frames T1 a T5)
731.4

710.3
662.0
643.1
628.7
521.7
409.0
HECTAREAS

365.2

356.4
342.0

304.0
248.4

203.1
203.0

171.8
168.8

167.0
118.8

116.3
104.9

DT KNN RF SVM

T1 T2 T3 T4 T5

Ilustración 72 Comparación de los resultados de la detección acumulada de áreas deforestada en


cada Frame de la serie de tiempo para el periodo de análisis 2013 (Frames T1 a T5)
129

800.0 731.4 745.8


710.3
700.0
600.0
487.4
500.0
Hectareas

400.0 356.4
304.0
300.0
200.0
100.0
0.0
DT Knn RF SVM IDEAM GFC
Ilustración 73 Comparación de los resultados de la detección total del área deforestada (área
deforestada acumulada para el Frame T5) para el periodo de análisis 2013

A partir de los resultados del área deforestada para cada uno de los momentos de la serie
de tiempo, ver Ilustración 71, se puede decir que la tendencia en el área deforestada para
el área de estudio, a partir de los resultados de los algoritmos SVM, RF y Knn, que hay
una mayor cantidad de deforestación en los momentos T1 con un descenso hasta los
frames T2 a T3 para luego un aumento hacia el T4 a T5. Para el método DT, esta tendencia
es similar, excepto por el momento T2, donde el área deforestada es la mayor de todos los
momentos. Para el método Knn las detecciones de los dos primeros momentos de la serie
de tiempo son considerablemente altos, en comparación con los mismos momentos para
los demás métodos, pero al mismo tiempo las detecciones para los últimos 3 momentos
son las más bajas, excepto para el T4.

Son evidentes las similitudes en las tendencias para las áreas deforestadas acumuladas,
ver Ilustración 72, de los métodos Knn y DT y de igual forma para los métodos SVM y RF.
Los datos acumulados del frame T5 corresponderían al área deforestada para el periodo
2013, y se consolidan y comparan, en la Ilustración 73, con las áreas de los datos de
validación IDEAM y Global Forest Change. Se puede observar que las estimaciones de
área Knn y DT son similares a la estimación de Global Forest Change, mientras que la
detección acumulada de los métodos RF y SVM correspondería, subestimando en un 25%
aproximadamente, el área estimada por IDEAM.

Finalmente se presenta a continuación los datos de las áreas de las clases estables
Bosque y No Bosque para el frame T5 para cada uno de los métodos y los datos de
validación. Puede notarse que el método Knn estima una mayor cantidad de área de No
Bosque, y por ende una menor área de bosque estable, respecto a ambos datos de
validación.
130

180000.0

160000.0

154634.8
153375.1

150878.0
149879.4

149162.7
140000.0

146594.8
120000.0
Hectareas

100000.0

80000.0

60000.0

40000.0

33228.8
29569.1

28998.0
20000.0
26094.6

25066.7

19296.5
0.0
DT Knn RF SVM IDEAM GFC

T5 - Bosque T5 - No Bosque

Ilustración 74 Comparación de los resultados para las clases estables, Bosque y No Bosque, para
cada método de clasificación en el frame T5.

4.8. Algoritmo GEOBIA para detección de


la deforestación en una serie de tiempo.
El modelamiento en el lenguaje CNL de eCognition permitió definir un flujo de proceso
automatizado, Rule Set, para la segmentación, entrenamiento y generación del mapa de
salida a partir de cada uno de los métodos disponibles. El proceso puede decirse está
dividido en 6 grandes procesos, que se señalan en la siguiente gráfica, y a seguir son
brevemente descritos:

Ilustración 75 Esquema de procesos del algoritmo CNL para la detección de objetos de deforestación
en un entorno GEOBIA
131

1. Preparación: estas tareas se definen para la configuración de la visualización de


los datos a analizar, se definen combinaciones de color, numero de ventanas a
presentar y se inicializan algunas variables requeridas en procesos posteriores, ver
Ilustración 75 1. Se calculan además los índices de vegetación y áreas quemadas,
como se indicó en la sección 4.1.1.1.
2. Segmentación. Este proceso, ver Ilustración 75 2, es el que generara los
elementos básicos del análisis GEOBIA, los objetos geográficos. Inicialmente y
empleando los datos auxiliares de CFMASK se procede a extraer las áreas de
nubes, como se indicó en la sección 4.1.1.2. Posteriormente se realiza la
segmentación del resto de la zona de interés a partir de los parámetros de la
segmentación 4.1.1.3.
3. Muestreo: A partir de los objetos generados por la segmentación y como se
indicaba en la sección 4.1, a partir de los datos de muestreo generados sobre los
mapas de Bosque y No Bosque Estable IDEAM 1990-2013 se procede a identificar
cuáles de los objeto generados corresponden a muestras de las clases bosque y
No Bosque (Resultado de la Fase 2), ver Ilustración 75 3.

Ilustración 76. Primeras 3 partes del Algoritmo GEOBIA desarrollado para la detección de la
deforestación en una serie de tiempo. Preparación de datos, Segmentación y Generación del
Muestreo.
132

4. Clasificación: Para cada uno de los algoritmos a aplicar procede a tomar las
muestras definidas en la etapa previa y realizar el entrenamiento, (Resultado de la
Fase 4). En esta parte del proceso se genera para cada método y en cada Frame
de la serie de tiempo, Ilustración 77 4, el entrenamiento del algoritmo, la aplicación
del método con los parámetros definidos, sección 4.3.2, y se aplican los algoritmos
de Análisis de Cambios, Ilustración 75 5, y Exportación de los datos, Ilustración 75
6.

5
6

Ilustración 77 Cuarta parte del Algoritmo GEOBIA desarrollado para la detección de la


deforestación en una serie de tiempo. Entrenamiento y clasificación de cada Frame de la
Serie de tiempo por cada método definido.

5. Análisis de Cambios: Como los proceso de clasificación de la etapa anterior se


aplican sobre cada uno de las escenas de la serie de tiempo, el proceso de análisis
de cambio, se implementa como un Algoritmo externo al proceso principal, y se
basa en el análisis de conectividad espaciotemporal (Link) entre los objetos de una
clase en un momento con los objetos de otra case en el momento de tiempo
siguiente. Así de esta forma se determinan cuáles son las áreas de Deforestación
(objetos que de Bosque en T1 pasan a No Bosque en T2) (Resultado de la Fase
5). Se generan los mapas para cada Frame y se construye el mapa agregado.
133

Ilustración 78 Quinta parte del Algoritmo GEOBIA desarrollado para la detección de la deforestación
en una serie de tiempo. Determinación de los cambios y depuración de las áreas de deforestación.

El proceso de generación de los links espaciotemporales se muestra en en la Ilustración


79 proceso 1 Detección. La implementación se llevó a cabo a partir de la construcción
iterativa de los objetos de Deforestación, Bosque y No Bosque, (procesos 'Tframe' cycles:
do en la Ilustración 80) y la posterior determinación del tipo de ajuste a realizar. En el caso,
por ejemplo, de un objeto deforestación conectado temporalmente, Link(in) o Link(out), a
otro objeto de deforestación, solo se debe validar la primera detección de deforestación, y
la segunda deforestación es un error debido a variaciones por omisión o comisión en la
detección del área de Bosque o No Bosque, y por ende sea ajustada de acuerdo a los
Links de ese objeto de deforestación invalida y los objetos siguientes en la serie de tiempo
(procesos on map en la Ilustración 80).

Ilustración 79 Proceso para la determinación de las áreas de deforestación entre Frames


consecutivos de la Serie de tiempo. Elaboración Propia.
134

Ilustración 80 Proceso de ajuste de las detecciones de deforestación a partir de la evaluación


mediante procesos iterativos entre las coberturas Bosque, No Bosque y Deforestación.

6. Exportar: El último proceso de cada uno de los algoritmos de clasificación usados


es generar el mapa final de cambio entre dos periodos de tiempo y generar la salida
vectorial para el proceso de presentación de los resultados.

Ilustración 81 Sexta y última parte del Algoritmo GEOBIA desarrollado para la detección de la
deforestación en una serie de tiempo. Exportación de los datos para la presentación y análisis.
135

CAPITULO 5. RECOMENDACIONES
136

Sobre el desarrollo metodológico.


 El modelamiento e implementación de los proceso de detección de cambios de los
objetos de Bosque y No Bosque para la definición de los objetos de deforestación
fue posible gracias a las herramientas de modelamiento GEOBIA que se ofrecen
en la herramienta eCognition. En posteriores desarrollos se debe buscar adaptar la
presente propuesta metodológica a los entornos de análisis de imágenes
orientados a objetos tanto de tipo comercial (PCI, ERDAS, Berkley, ArcGIS, ENVI)
así como lo más recomendable es una alternativa en software libre para poder
ampliar el rango de aplicación de la metodología.

Sobre la definición de los Objetos de


deforestación.
 Para una adecuada determinación de la deforestación en una zona se recomienda
emplear imágenes “fuera” de la ventana de tiempo del análisis de la serie de tiempo
(2 o tres frames después de la fecha de interés final), o si la serie se actualiza
constantemente la detección agregada que se emplee como dato de reporte sea
aquella generada dos frames antes del frame final.

Sobre los resultados Obtenidos (áreas, exactitud


temática).
 Es fundamental para los usuarios determinar la pertinencia de los resultados a partir
del análisis de los indicadores de exactitud del productor y el usuario por cada
clase. Pues el solo usar como referencia de la exactitud del mapa la exactitud
promedio puede llevar a reducir el efecto particular de las variaciones de los
indicadores de STEP para ciertas clases.

Sobre la aplicación práctica de los resultados y la


metodología.
 Un método de detección de áreas deforestadas (Objetos de deforestación) en un
entorno orientado a objetos requiere de una adecuada estructuración, carga y
actualización de los datos, por lo que la implementación y desarrollo de esta
requiere una adecuada infraestructura de datos: Organización, almacenamiento y
recuperación de datos.
137

CAPITULO 6. CONCLUSIONES
138

Sobre el desarrollo metodológico.


 La implementación de una metodología para la cuantificación de la deforestación
en un entorno completamente orientado a objetos (GEOBIA) fue exitosa, cada una
de las fases de un proceso de análisis multitemporal y/o de series de tiempo se
pudieron aplicar en un ambiente de análisis orientado a objetos: Estructuración,
entrenamiento, clasificación, detección de cambios, ajuste de las detecciones y
validación de la exactitud temática.
 La metodología desarrollada permitió integrar los datos del monitoreo de Bosques
oficial de Colombia, en las fase de entrenamiento y clasificación, para hacer asi
compatible los resultados obtenidos con los datos del mapa de referencia y
demostrar así la viabilidad de establecer un sistema de monitoreo y alertas basada
en objetos.
 El análisis de los datos de imágenes como una serie de tiempo se ofrece como una
poderosa alternativa para el desarrollo de tareas de análisis y modelamiento
orientadas a objetos, donde se requiere un alto componente de análisis espectral y
de igual forma una alta lógica de análisis espacial y temporal aplicada a los proceso
de modelamiento y clasificación de los datos.
 La aplicación de múltiples algoritmos de aprendizaje de maquina permitió el análisis
de diferentes tipos de parámetros y características de aplicación de estos. Los
métodos aplicados al no ser métodos paramétricos pueden trabajar con múltiples
tipos de variable, aunque en el presente estudio se utilizaron variables de tipo
continuo, no se descarta la aplicación de tipo categórico a la serie de tiempo.
 La generación de datos en diferentes niveles de agregación temporal (por frame o
consolidado/agregado) permitiría implementar el proceso de monitoreo y alerta
temprana (usando datos SENTINEL2 y Landsat) así como los proceso de reporte
y control anuales a los proceso de deforestación llevados a cabo hoy en día por
IDEAM.

Sobre la definición de los Objetos de


deforestación.
 La implementación de un proceso de “seguimiento” de las características de un
mismo objeto en diferentes momentos, frames, de la serie de tiempo permitió
modelar diferentes características propias de los proceso de cambios de coberturas
de la tierra: permanencia del proceso de cambio, características de área y tamaño.
Aunque no se modelaron relaciones de tipo espacial, como distancia a ríos o vías,
que son, en algunos casos, drivers de deforestación, este tipo de procesos pueden
en un futuro implementarse en la presente metodología dado la amplia variedad de
elementos y propiedades de los objetos en un entorno GEOBIA.
139

 La metodología empelando proceso de análisis espaciaotemporal para determinar


la validez y permanencia de un cambio a nivel temático en cada una de las
imágenes de la serie, es altamente dependiente de una adecuado muestreo, la
capacidad del algoritmo de reconocimiento de patrones en generar una adecuada
clasificación de los datos y un adecuado enmascaramiento de las áreas de nubes
y sombras.
 Se consideran que el proceso de modelado e implementación de la definición de
objeto de deforestación fue adecuadamente llevado a cabo en la metodología
propuesta, se validaron los procesos a nivel temático, temporal y espacial que se
consideraron en la definición de deforestación.

Sobre los resultados Obtenidos (áreas, exactitud


temática).
 SI bien los resultados obtenidos sobrestiman en algunos casos en hasta 12 veces
el área deforestada en la zona, a partir de los datos de validación IDEAM, se
pueden considerar como un “adecuado primer resultado” de una metodología
automatizada, sin ningún tipo de postprocesamiento, o uso de variables auxiliares,
criterios de probabilidad, cercanía o distancia, etc. a los resultados de cada
algoritmo.
 En un análisis preliminar si se reportara el área deforesta coincidente en los 4
algoritmos esta sería de 520 has en 581 Objetos de deforestación, lo que es un
valor muy similar al reporte oficial. Es decir que existen diferentes enfoques para
poder usar este resultado como una aproximación al proceso de detección y alerta
tempana en un sistema de monitoreo. O la necesidad de establecer criterios de
clasificaciones tanto espectrales como espaciales para reducir la sobrestimación
de los objetos de deforestación.
 Los resultados de la validación de exactitud geométrica y temática mediante la
matriz STEP permiten conocer detalladamente la correspondencia entre los datos
de muestreo y el mapa de referencia. En el caso de la presente aplicación, la
comparación del mapa clasificado y el mapa de referencia fue completa, es decir
todos los objetos de referencia validaban a todos los objetos clasificados. Lo que
es una tarea computacionalmente intensiva y se debió reducir las áreas de estudio
a 3 sectores específicos.
 Los valores geométricos (forma, borde y posición) no varían significativamente de
un método a otro a partir del indicador de la exactitud promedio, pero en términos
generales los objetos de deforestación generados a partir de los objetos de Bosque
y No Bosque clasificados por el método de RF y SVM presentan valores más altos
en la similaridad temática (Theme), borde (Edge) y posición (Position).
140

 En el caso de cada uno de los métodos empleados y a partir de los indicadores de


la matriz STEP, así como del área detectada y el número de Objetos de
deforestación, los métodos Knn y DT generan un área similar a la reportada por
Global Forest Change pero con 2.3 veces más polígonos, a partir de los análisis de
las métricas STEP estos métodos presentaban una menor exactitud en las métricas
geométricas y de exactitud temática, incluso para el Sector #2, no hay ninguna
coincidencia entre los datos detectados por el método DT y los datos de referencia.
En el mismo análisis para los métodos SVM y RF, si bien generan un área menor
a la reportada en un número mayor de polígonos, las métricas de STEP para los
objetos de deforestación muestran una adecuada y mayor correspondencia de
estos resultados y los objetos de referencia tanto geométricamente (Shape, Edge
y Position) así como temáticamente (Theme).

Sobre la aplicación práctica de los resultados y la


metodología.
 Los reportes de detección de cada momento de la serie o el resultado agregado
total puede ser un insumo base para una validación realizada por un intérprete
experto o un postprocesamiento a los datos para determinar las áreas efectivas de
deforestación en un sistema de alertas tempranas o de monitoreo de la
deforestación.
 Para el sistema de monitoreo de bosques de Colombia esta metodología puede ser
integrada a su sistema de procesamiento, e incluso puede actualizarse para seguir
el nuevo protocolo de procesamiento basada en la detección directa de cambios a
partir de componentes principales.
141

BIBLIOGRAFÍA
Abdulaziz, A. M., Hurtado, J. M., & Al-Douri, R. (2009). Application of multitemporal Landsat
data to monitor land cover changes in the Eastern Nile Delta region, Egypt.
International Journal of Remote Sensing, 30(11), 2977–2996.
Achard, F., & Hansen, M. C. (2012a). Global Forest Monitoring from Earth Observation.
CRC Press.
Achard, F., & Hansen, M. C. (2012b). Global Forest Monitoring from Earth Observation.
CRC Press.
Addesso, P., Conte, R., Longo, M., Restaino, R., & Vivone, G. (2012). SVM-based cloud
detection aided by contextual information. En Advances in Radar and Remote
Sensing (TyWRRS), 2012 Tyrrhenian Workshop on (pp. 214–221). IEEE.
Aguirre-Gutiérrez, J., Seijmonsbergen, A. C., & Duivenvoorden, J. F. (2012). Optimizing
land cover classification accuracy for change detection, a combined pixel-based
and object-based approach in a mountainous area in Mexico. Applied Geography,
34, 29–37.
Ardila, J., & Espejo, O. J. (2005). Extracción de Información Temática en imágenes
satelitales mediante la aplicación y validación de una metodología de clasificación
orientada a objetos. Semana de Geomática, Bogotá DC, Colombia, Instituto
Geográfico Agustín Codazzi.
Ardila, J., Espejo, O. J., & Herrera, J. L. (2004). Validación de una Metodología de
Clasificación de Imágenes Satelitales en un Entorno Orientado a Objetos.
Ingeniería, 10(1), 61–69.
Ardila López, J. P., & Espejo Valero, O. J. (2005). Extracción de Información Temática en
imágenes satelitales mediante la aplicación y validación de una metodología de
clasificación orientada a objetos. Semana de Geomática, Bogotá DC, Colombia,
Instituto Geográfico Agustín Codazzi.
Armenteras, D., Rudas, G., Rodriguez, N., Sua, S., & Romero, M. (2006). Patterns and
causes of deforestation in the Colombian Amazon. Ecological Indicators, 6(2), 353–
368.
Asner, G. P., Knapp, D. E., Balaji, A., & Páez-Acosta, G. (2009). Automated mapping of
tropical deforestation and forest degradation: CLASlite. Journal of Applied Remote
Sensing, 3(1), 033543–033543.
Baatz, M., & Schäpe, A. (2000). Multiresolution segmentation: an optimization approach for
high quality multi-scale image segmentation. Angewandte geographische
informationsverarbeitung, 12(12), 12–23.
Blaschke, T. (2005). Towards a framework for change detection based on image objects.
Göttinger Geographische Abhandlungen, 113, 1–9.
Blaschke, T. (2010). Object based image analysis for remote sensing. ISPRS Journal of
Photogrammetry and Remote Sensing, 65(1), 2-16.
Blaschke, Thomas, & Hay, G. J. (2001). Object-oriented image analysis and scale-space:
theory and methods for modeling and evaluating multiscale landscape structure.
International Archives of Photogrammetry and Remote Sensing, 34(4), 22–29.
Blaschke, Thomas, & Strobl, J. (2001). What’s wrong with pixels? Some recent
developments interfacing remote sensing and GIS. GeoBIT/GIS, 6, 12–17.
Bontemps, S., Bogaert, P., Titeux, N., & Defourny, P. (2008). An object-based change
detection method accounting for temporal dependences in time series with medium
to coarse spatial resolution. Remote Sensing of Environment, 112(6), 3181–3191.
142

Boulesteix, A.-L., Janitza, S., Kruppa, J., & König, I. R. (2012). Overview of random forest
methodology and practical guidance with emphasis on computational biology and
bioinformatics. Wiley Interdisciplinary Reviews: Data Mining and Knowledge
Discovery, 2(6), 493–507.
Breiman, L. (2001). Random forests. Machine learning, 45(1), 5–32.
Buddhiraju, K. M., & Rizvi, I. A. (2010). Comparison of CBF, ANN and SVM classifiers for
object based classification of high resolution satellite images. En Geoscience and
Remote Sensing Symposium (IGARSS), 2010 IEEE International (pp. 40–43).
IEEE.
Cabrera, E., Galindo, G., Espejo, O. J., Gualdron, M., & Vargas, R. (2013, Diciembre).
Deforestación Y Cultivos De Úso Ilícito: Un Análisis Espacial De La Pérdida Del
Bosque En La Amazonia Colombia. Revista del Ejercito Nacional de COlombia,
(168).
Cabrera, E., Vargas, D. M., Galindo, G., García, M. C., Ordóñez, M. F., Vergara, L. K., …
Giraldo, P. (2011a). Memoria técnica de la cuantificación de la deforestación
histórica nacional–escalas gruesa y fina. Bogotá, DC, Colombia: Instituto de
Hidrología, Meteorología y Estudios Ambientales (IDEAM).
Cabrera, E., Vargas, D. M., Galindo, G., García, M. C., Ordóñez, M. F., Vergara, L. K., …
Giraldo, P. (2011b). Memoria técnica de la cuantificación de la deforestación
histórica nacional–escalas gruesa y fina. Bogotá, DC, Colombia: Instituto de
Hidrología, Meteorología y Estudios Ambientales (IDEAM).
Cheng, G., & Han, J. (2016). A survey on object detection in optical remote sensing images.
ISPRS Journal of Photogrammetry and Remote Sensing, 117, 11–28.
Chethan, H. K., Kumar, G. H., & Raghavendra, R. (2009). Texture based approach for cloud
classification using SVM. En Advances in Recent Technologies in Communication
and Computing, 2009. ARTCom’09. International Conference on (pp. 688–690).
IEEE.
Colditz, R. R., Schmidt, M., Ressl, R., Hansen, M. C., & Dech, S. (2008). A method for
selecting training data and its effect on automated land cover mapping of large
areas. En Geoscience and Remote Sensing Symposium, 2008. IGARSS 2008.
IEEE International (Vol. 4, p. IV–542). IEEE.
Congalton, R. G. (1991). A review of assessing the accuracy of classifications of remotely
sensed data. Remote Sensing of Environment, 37(1), 35-46.
Congalton, R. G., & Green, K. (2008a). Assessing the accuracy of remotely sensed data:
principles and practices. CRC press.
Congalton, R. G., & Green, K. (2008b). Assessing the accuracy of remotely sensed data:
principles and practices. CRC press.
Dávalos, L. M., Bejarano, A. C., Hall, M. A., Correa, H. L., Corthals, A., & Espejo, O. J.
(2011). Forests and drugs: coca-driven deforestation in tropical biodiversity
hotspots. Environ. Sci. Technol, 45(4), 1219–1227.
Desclée, B., Bogaert, P., & Defourny, P. (2006). Forest change detection by statistical
object-based method. Remote Sensing of Environment, 102(1), 1–11.
eCognition Developer, D. (2009). 8, Reference Book. Definiens AG, München.
Etter, A., McAlpine, C., Phinn, S., Pullar, D., & Possingham, H. (2006). Characterizing a
tropical deforestation wave: a dynamic spatial analysis of a deforestation hotspot in
the Colombian Amazon. Global Change Biology, 12(8), 1409–1420.
Etter, A., McAlpine, C., Wilson, K., Phinn, S., & Possingham, H. (2006). Regional patterns
of agricultural land use and deforestation in Colombia. Agriculture, ecosystems &
environment, 114(2), 369–386.
143

Formaggio, A. R., Vieira, M. A., & Renno, C. D. (2012). Object Based Image Analysis
(OBIA) and Data Mining (DM) in Landsat time series for mapping soybean in
intensive agricultural regions (pp. 2257-2260). IEEE.
Fuller, R. M., Smith, G. M., & Devereux, B. J. (2003). The characterisation and
measurement of land cover change through remote sensing: problems in
operational applications? International Journal of Applied Earth Observation and
Geoinformation, 4(3), 243–253.
Galindo, G., Espejo, O. J., Cabrera, E., & Rubiano, J. C. (2015). Protocolo De
Procesamiento Digital De Imagenes Para La Cuantificación De La Deforestación
En Colombia V. 2.
García, U. G. M., García, C. M. H., Rondón, J. M. R., & Castellanos, H. O. A. (2011).
Instituto Amazónico de Investigaciones Científicas, Sinchi.
Gebhardt, S., Wehrmann, T., Ruiz, M. A. M., Maeda, P., Bishop, J., Schramm, M., …
Schmidt, M. (2014). MAD-MEX: Automatic Wall-to-Wall Land Cover Monitoring for
the Mexican REDD-MRV Program Using All Landsat Data. Remote Sensing, 6(5),
3923-3943.
Global Forest Change. (s. f.). Recuperado 10 de junio de 2015, a partir de
http://google.org/crisismap/google.com/science-2013-global-forest/
GOFC-GOLD, A. (2010). A Sourcebook of Methods and Procedures for Monitoring and
Reporting Anthropogenic Greenhouse Gas Emissions and Removals Caused by
Deforestation, Gains and Losses of Carbon Stocks in Forests Remaining Forests,
and Forestation. AB, Canada: GOFC-GOLD GOFC-GOLD Project Office. Natural
Resources Canada Calgary.
Hall, O., & Hay, G. J. (2003). A multiscale object-specific approach to digital change
detection. International Journal of Applied Earth Observation and Geoinformation,
4(4), 311–327.
Hamunyela, E., Verbesselt, J., & Herold, M. (2016). Using spatial context to improve early
detection of deforestation from Landsat time series. Remote Sensing of
Environment, 172, 126–138.
Hansen, M. C., Potapov, P. V., Moore, R., Hancher, M., Turubanova, S. A., Tyukavina, A.,
… Townshend, J. R. G. (2013). High-Resolution Global Maps of 21st-Century
Forest Cover Change. Science, 342(6160), 850-853.
Hansen, Matthew C., Krylov, A., Tyukavina, A., Potapov, P. V., Turubanova, S., Bryan
Zutta, … Moore, R. (2016). Humid tropical forest disturbance alerts using Landsat
data. Environmental Research Letters, 11(3), 034008.
Hansen, Matthew C., & Loveland, T. R. (2012). A review of large area monitoring of land
cover change using Landsat data. Remote sensing of Environment, 122, 66–74.
Hansen, Matthew C., Potapov, P. V., Moore, R., Hancher, M., Turubanova, S. A.,
Tyukavina, A., … others. (2013). High-resolution global maps of 21st-century forest
cover change. science, 342(6160), 850–853.
Hay, G. J., & Castilla, G. (2008). Geographic Object-Based Image Analysis (GEOBIA): A
new name for a new discipline. Object-based image analysis, 75–89.
Hay, Geoffrey J., & Blaschke, T. (2009). Special issue: Geographic objectbased image
analysis (geobia). Photogrammetric Engineering and Remote Sensing, 76(2), 121–
122.
Hostert, P., Griffiths, P., van der Linden, S., & Pflugmacher, D. (2015). Time series analyses
in a new era of optical satellite data. En Remote Sensing Time Series (pp. 25–41).
Springer.
144

Hussain, M., Chen, D., Cheng, A., Wei, H., & Stanley, D. (2013). Change detection from
remotely sensed images: From pixel-based to object-based approaches. ISPRS
Journal of Photogrammetry and Remote Sensing, 80, 91-106.
IDEAM. (2010). Leyenda Nacional de Coberturas de la Tierra. Metodología CORINE Land
Cover adaptada para Colombia Escala 1:100.000.
IDEAM. (2012). Manual de Control de Calidad para el Procedimiento de Cobertura de la
Tierra. Recuperado 21 de julio de 2016,
IDEAM, I., & CORMAGDALENA, M. de C. de la. (2008). Metodología CORINE land Cover
adaptada para Colombia a escala 1: 100.000. Instituto de Hidrología, Meteorología
y Estudios Ambientales, Instituto Geográfico Agustín Codazzi y Corporación
Autónoma Regional del río Grande de La Magdalena: Bogotá, DC, 200.
Im, J., Jensen, J. R., & Tullis, J. A. (2008). Object-based change detection using correlation
image analysis and image segmentation. International Journal of Remote Sensing,
29(2), 399–423.
Im, Jungho, & Jensen, J. R. (2005). A change detection model based on neighborhood
correlation image analysis and decision tree classification. Remote Sensing of
Environment, 99(3), 326–340.
Janssen, L. L. (2000). Principles of remote sensing (2.a ed.).
Jensen, J. R. (2009a). Remote Sensing of the Environment: An Earth Resource
Perspective 2/e. Pearson Education India.
Jensen, J. R. (2009b). Remote Sensing of the Environment: An Earth Resource
Perspective 2/e. Pearson Education India.
Jeon, S. B., Olofsson, P., & Woodcock, C. E. (2014). Land use change in New England: a
reversal of the forest transition. Journal of Land Use Science, 9(1), 105–130.
Johansen, K., Bartolo, R., & Phinn, S. (2010). SPECIAL FEATURE–Geographic Object-
Based Image Analysis. Journal of Spatial Science, 55(1), 3–7.
Johansen, Kylie, & Johansen, K. (2011). Time-series analysis of rainforest clearing in
Sabah, Borneo using Landsat imagery (pp. 277-280). IEEE.
Kaehler, A., & Bradski, G. (2014). Learning OpenCV. O’Reilly Media, Inc.
Khalilia, M., Chakraborty, S., & Popescu, M. (2011). Predicting disease risks from highly
imbalanced data using random forest. BMC medical informatics and decision
making, 11(1), 1.
Latorre, J. P., & Corredor, L. P. (2011). Analisis multitemporal de las coberturas de la tierra
de los parques nacionales naturales de colombia. 2005-2007 / 2010-2012.
Li, N., Huo, H., & Fang, T. (2012). Integrating segmentation and classification accuracy for
accuracy assessment in object-based image analysis (pp. 599-604). IEEE.
Lillesand, T. M., Kiefer, R. W., & Chipman, J. W. (2004). Remote sensing and image
interpretation. John Wiley & Sons Ltd.
Liu, C., Frazier, P., & Kumar, L. (2007). Comparative assessment of the measures of
thematic classification accuracy. Remote Sensing of Environment, 107(4), 606-616.
Lizarazo, I. (2008). SVM-based segmentation and classification of remotely sensed data.
International Journal of Remote Sensing, 29(24), 7277–7283.
Lizarazo, I. (2010). Fuzzy Image Regions For Quantitative Land Cover Analysis. GEOBIA
2010.
Lizarazo, I. (2014a). Accuracy assessment of object-based image classification: another
STEP. International Journal of Remote Sensing, 35(16), 6135-6156.
Lizarazo, I. (2014b). Accuracy assessment of object-based image classification: another
STEP. International Journal of Remote Sensing, 35(16), 6135–6156.
145

Longley, P. A., Goodchild, M. F., Maguire, D. J., & Rhind, D. W. (2005). Geographic
information systems and science. Wiley.
Lu, D., & Weng, Q. (2007). A survey of image classification methods and techniques for
improving classification performance. International journal of Remote sensing,
28(5), 823–870.
Möller, M., Lymburner, L., & Volk, M. (2007). The comparison index: A tool for assessing
the accuracy of image segmentation. International Journal of Applied Earth
Observation and Geoinformation, 9(3), 311–321.
Novoa, C., & Aguilar, D. (2012). Metodologia Para La Actualización Del Mapa De Cobertura
De La Tierra. Lineamiento Metodológico Documento de trabajo Versión 3. IDEAM.
Olofsson, P., Foody, G. M., Herold, M., Stehman, S. V., Woodcock, C. E., & Wulder, M. A.
(2014). Good practices for estimating area and assessing accuracy of land change.
Remote Sensing of Environment, 148, 42–57.
Olofsson, P., Foody, G. M., Stehman, S. V., & Woodcock, C. E. (2013). Making better use
of accuracy data in land change studies: Estimating accuracy and area and
quantifying uncertainty using stratified estimation. Remote Sensing of Environment,
129, 122–131.
Olofsson, P., Holden, C. E., Bullock, E. L., & Woodcock, C. E. (2016). Time series analysis
of satellite data reveals continuous deforestation of New England since the 1980s.
Environmental Research Letters, 11(6), 064002.
Olofsson, P., Torchinava, P., Woodcock, C. E., Baccini, A., Houghton, R. A., Ozdogan, M.,
… Yang, X. (2010). Implications of land use change on the national terrestrial
carbon budget of Georgia. Carbon balance and management, 5(4).
Parques Nacionales Naturales de Colombia. (s. f.). Parques Nacionales.
Phillips, J. F., Duque, A., Cabrera, K., Yepes, A., Navarrete, D., García, M. C., … Galindo,
G. (2011a). Estimación de las reserves potenciales de carbono almacenadas en la
biomasa aérea en bosques naturales de Colombia. Instituto de Hidrología,
Meteorología y Estudios Ambientales (IDEAM), Bogotá, DC, Colombia.
Phillips, J. F., Duque, A., Cabrera, K., Yepes, A., Navarrete, D., García, M. C., … Galindo,
G. (2011b). Estimación de las reserves potenciales de carbono almacenadas en la
biomasa aérea en bosques naturales de Colombia. Instituto de Hidrología,
Meteorología y Estudios Ambientales (IDEAM), Bogotá, DC, Colombia.
Platt, R. V., & Rapoza, L. (2008). An Evaluation of an Object-Oriented Paradigm for Land
Use/Land Cover Classification∗. The Professional Geographer, 60(1), 87–100.
Pontius, R. G., & Millones, M. (2011). Death to Kappa: birth of quantity disagreement and
allocation disagreement for accuracy assessment. International Journal of Remote
Sensing, 32(15), 4407-4429.
Prodes, P. (2013). Monitoramento da Floresta Amazônica brasileira por satélite. Instituto
Nacional de Pesquisas Espaciais Projeto Prodes.
Proyecto SIMCI. (2009). Análisis multitemporal de Cultivos de Coca 2007-2008.
Ramirez, S., Galindo, G., & Espejo, O. J. (2014). Evaluación de la exactitud temática del
mapa de cambio de bosque para la región amazónica colombiana en el periodo
2010-2012.
Ramirez, S., & Lizarazo, I. (2016). Quick STEP: Accuracy assessment similarity matrix for
GEOBIA. QGIS plugin version 0.1.
Reymondin, L., Jarvis, A., Pérez-Uribe, A., Touval, J., Argote, K., Rebetez, J., … Mulligan,
M. (2012a). A methodology for near real-time monitoring of habitat change at
continental scales using MODIS-NDVI and TRMM. Submitted Remote Sensing of
Environment.
146

Reymondin, L., Jarvis, A., Pérez-Uribe, A., Touval, J., Argote, K., Rebetez, J., … Mulligan,
M. (2012b). A methodology for near real-time monitoring of habitat change at
continental scales using MODIS-NDVI and TRMM. Submitted Remote Sensing of
Environment.
Ribeiro, V., de Freitas, U. M., de Queiroz, G. R., Petinatti, M. R., & Abreu, E. S. (2007). The
Amazon Deforestation Monitoring System. OSGeo Journal, 3(1).
Salinero, E. C. (2002a). Teledetección ambiental. La observación de la Tierra desde el
espacio. Ariel Ciencia.
Salinero, E. C. (2002b). Teledetección ambiental. La observación de la Tierra desde el
espacio. Ariel Ciencia.
Sarría, F. A. (2006). Sistemas de Información Geográfica. Universidad de Murcia.
Senseman, G. M., Bagley, C. F., & Tweddale, S. A. (1995). Accuracy Assessment of the
Discrete Classification of Remotely-Sensed Digital Data for Landcover Mapping.
DTIC Document.
Seto, K. C., Woodcock, C. E., Song, C., Huang, X., Lu, J., & Kaufmann, R. K. (2002).
Monitoring land-use change in the Pearl River Delta using Landsat TM. International
Journal of Remote Sensing, 23(10), 1985–2004.
Shekhar, S., & Xiong, H. (2008). Encyclopedia of GIS. Springer.
Tan, P.-N. (2007). Introduction to data mining. Pearson Education India.
Tso, B., & Mather, P. M. (2009). Classification methods for remotely sensed data. CRC
PressI Llc.
UNODC. (2014a). Analisis Multitemporal del Cultivos de Coca. Periodo 2001-2012.
UNODC. (2014b). Censo de Cultivos de Coca 2013.
UNODC, & Parques Nacionales Naturales de Colombia. (2004). Análisis Multitemporal de
cultivos de coca en las Áreas del Sistema de Parques Nacionales Naturales Periodo
2001 - 2004.
Valeriano, D. M., Mello, E. M. K., Moreira, J. C., Shimabukuro, Y. E., Duarte, V., Souza, I.
M., … Souza, R. C. M. (2004). Monitoring tropical forest from space: the Prodes
digital project. International Archives of Photogrammetry Remote Sensing and
Spatial Information Sciences, 35, 272–274.
van Oort, P. A. J. (2007). Interpreting the change detection error matrix. Remote Sensing
of Environment, 108(1), 1-8.
Weng, Q. (2011). Advances in Environmental Remote Sensing: Sensors, Algorithms, and
Applications. CRC Press.
Wilches, H. M., & Ch, M. C. (2005). Adaptación DE LA Metodología Corine Land Cover
PARA Colombia Adjustment OF Corine Land Cover Methodology FOR Colombia.
Wolpert, D. H., & Macready, W. G. (1997). No free lunch theorems for optimization. IEEE
transactions on evolutionary computation, 1(1), 67–82.
Wu, J., Cui, Z., Sheng, V. S., Shi, Y., & Zhao, P. (2014). Mixed pattern matching-based
traffic abnormal behavior recognition. The Scientific World Journal, 2014.
Wulder, M. A., Masek, J. G., Cohen, W. B., Loveland, T. R., & Woodcock, C. E. (2012).
Opening the archive: How free data has enabled the science and monitoring
promise of Landsat. Remote Sensing of Environment, 122, 2–10.
Yang, X., & Li, J. (2012). Advances in Mapping from Remote Sensor Imagery: Techniques
and Applications. CRC Press.
Zhou, W., Troy, A., & Grove, M. (2008). Object-based land cover classification and change
analysis in the Baltimore metropolitan area using multitemporal high resolution
remote sensing data. Sensors, 8(3), 1613–1636.
147

Zhu, Z., Wang, S., & Woodcock, C. E. (2015). Improvement and expansion of the Fmask
algorithm: cloud, cloud shadow, and snow detection for Landsats 4–7, 8, and
Sentinel 2 images. Remote Sensing of Environment, 159, 269–277.
Zhu, Z., & Woodcock, C. E. (2012). Object-based cloud and cloud shadow detection in
Landsat imagery. Remote Sensing of Environment, 118, 83–94.
148

ANEXO 1.
Estructura en XML para la importación (ingesta) de los datos de la
serie de tiempo en eCognition.
<?xml version="1.0" encoding="UTF-8"?>
<ImportDefinitions>
<ImportDefinition name="Customized Import" description="">
<LcnsIds></LcnsIds>
<SceneSearch folders-from-file-system="no" bdi-driver="" scene-name="{scene}" map-
name="">
<TagString>{{root}\sr\sub8_sr_{scene}_{frame}.img:reverse}</TagString>
<SiteInfo x-coo="decimal" y-coo="decimal">
<TagString></TagString>
</SiteInfo>
</SceneSearch>
<SceneDefinition force-fitting="0" geo-coding="from-file" scene-extent="union" scene-
unit="auto" pixel-size="auto" frame-res="1." slice-res="1." slice-order="desc">
<ImageLayer channel="1" alias="AZUL" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{search-string}</TagString>
</ImageLayer>
<ImageLayer channel="2" alias="VERDE" driver="GDAL" nodata-value="0." nodata-
apply-type="and">
<TagString>{search-string}</TagString>
</ImageLayer>
<ImageLayer channel="3" alias="ROJO" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{search-string}</TagString>
</ImageLayer>
<ImageLayer channel="4" alias="IRC" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{search-string}</TagString>
</ImageLayer>
<ImageLayer channel="5" alias="IRM" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{search-string}</TagString>
</ImageLayer>
<ImageLayer channel="6" alias="IRL" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{search-string}</TagString>
</ImageLayer>
<ImageLayer channel="1" alias="" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{{root}\Fraccional\sub8_frac_{scene}_{frame}.img:reverse}</TagString>
</ImageLayer>
<ImageLayer channel="2" alias="S" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{{root}\Fraccional\sub8_frac_{scene}_{frame}.img:reverse}</TagString>
149

</ImageLayer>
<ImageLayer channel="3" alias="VF" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{{root}\Fraccional\sub8_frac_{scene}_{frame}.img:reverse}</TagString>
</ImageLayer>
<ImageLayer channel="4" alias="VNF" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{{root}\Fraccional\sub8_frac_{scene}_{frame}.img:reverse}</TagString>
</ImageLayer>
<ImageLayer channel="1" alias="" driver="" nodata-value="0." nodata-apply-type="and">

<TagString>{{root}\cfmask\sub_sr_{scene}_{frame}_cfmask_t.img:reverse}</TagString>
</ImageLayer>
<ImageLayer channel="2" alias="CFMASK" driver="" nodata-value="0." nodata-apply-
type="and">

<TagString>{{root}\cfmask\sub_sr_{scene}_{frame}_cfmask_t.img:reverse}</TagString>
</ImageLayer>
<ImageLayer channel="1" alias="" driver="" nodata-value="0." nodata-apply-type="and">
<TagString>{{root}\Muestreo\muestreo_{scene}_{frame}_t.img:reverse}</TagString>
</ImageLayer>
<ImageLayer channel="2" alias="MUESTREO" driver="" nodata-value="0." nodata-apply-
type="and">
<TagString>{{root}\Muestreo\muestreo_{scene}_{frame}_t.img:reverse}</TagString>
</ImageLayer>
<ImageLayer channel="1" alias="" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{{root}\INDICES\indices_{scene}_{frame}.img:reverse}</TagString>
</ImageLayer>
<ImageLayer channel="2" alias="NDVI" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{{root}\INDICES\indices_{scene}_{frame}.img:reverse}</TagString>
</ImageLayer>
<ImageLayer channel="3" alias="NBR" driver="GDAL" nodata-value="0." nodata-apply-
type="and">
<TagString>{{root}\INDICES\indices_{scene}_{frame}.img:reverse}</TagString>
</ImageLayer>
</SceneDefinition>
</ImportDefinition>
</ImportDefinitions>
150

ANEXO 2.
Determinación del espacio de características más adecuado para
la clasificación de Bosque y No Bosque empleando 3
clasificadores Machine Learning.

Se realiza la evaluación y comparación de la exactitud temática a partir de 7000 puntos de


validación sobre un sector del área estudio. Se implementa la clasificación de las clases
de Bosque y No Bosque empleando 3 diferentes clasificadores Árboles de Decisión (DT),
Maquinas de Soporte Vectorial (SVM) y Random Forest (RF), en tres diferentes
configuraciones del espacio de características empelando diferentes conjuntos de datos.

Empleando 3000 puntos de entrenamiento y 7000 puntos de validación sobre un recorte


de 1000x1000 pixeles a partir de las coordenadas UTM 18 Norte (Ver Tabla 26) a la imagen
LandSat 8 del 10 de Enero de 2014:

UL X 333345 LR X 303345
UL Y 656085 LR Y 686085
Tabla 26. Coordenadas que delimitan la muestra de la imagen para la optimización de SVM

El recorte de la imagen corresponde a un sector en el departamento del Meta en los


municipios de Vistahermosa, Puerto Lleras y Puerto Rico (Ver Mapa 1). La zona cubre una
porción al norte del del PNN La Macarena identificado como uno de los puntos de
deforestación histórica más activos según las estadísticas oficiales del IDEAM, y entre los
factores determinantes y aceleradores de la deforestación se encuentran: los proceso de
colonización y ampliación de la frontera agrícola y el cultivo de hoja de coca. Los datos de
referencia son tomados de Mapas de Bosque - No bosque, ver Mapa 20, para el periodo
2013 elaborado por el Proyecto de Monitoreo de bosques y Carbono del IDEAM,
disponibles desde el SIAC.
151

Mapa 20 Localización General de los puntos de entrenamiento y validación para la optimización de


los parámetros de los calificadores no paramétricos SVM, DT, RF y Knn.

Una primera prueba solo empleando los datos espectrales (XS), en una segunda prueba
se emplean únicamente los datos de cobertura fraccional, índices NDVI, NDBR y ARVI y
los 3 componentes de la transformación Tasseled Cap (IND+FRACC) y finalmente la
combinación de todos los datos (XS+IND+FRACC) para la clasificación. Se compara el
indicador de exactitud temática promedio, ver Tabla 27, derivado de la matriz de confusión
y el índice Kappa, ver Tabla 28, que resumen adecuadamente los errores de omisión y
comisión determinados por la misma matriz para ofrecer así un mejor estimador de la
calidad del proceso de clasificación.
XS IND+FRA XS+IND+FRACC
DT 92,89% 91,00% 92,89%
GEOBIA SVM 90,30% 92,89% 93,19%
RF 92,40% 91,30% 92,49%
Tabla 27. Resumen de resultados del Indicador de exactitud promedio para cada clasificador en los 3
ejercicios.

XS FRACC XS+IND+FRACC
DT 81,34% 75,78% 81,34%
GEOBIA SVM 75,96% 80,41% 81,36%
RF 80,32% 76,89% 80,44%
Tabla 28. Resumen de resultados del índice kappa para cada clasificador en los 3 ejercicios.

Los resultados para los tres métodos, DT, SVM y RF son sobresalientemente altos,
siempre superiores 90% en el indicador de exactitud promedio y más del 80% en el
indicador Kappa. Y aunque los tres métodos se desempeñan de forma adecuada, las
diferencias únicamente comparativas entre los valores Kappa y promedio no parecen
significativamente altas. Se puede anotar inicialmente que los resultados empleando los
datos espectrales y fraccionales simultáneamente ofrece una mejoría en los resultados.
Se determinan además los intervalos de confianza del índice kappa, de acuerdo con (Tan,
2007).
152

Ecuación 11. Intervalo de confianza para kappa (Tan, 2007).

95%
Limite Límite
Superior Inferior
XS 81,63% 81,05%
DT FRACC 76,10% 75,46%
XS+IND+FRACC 81,63% 81,05%
XS 76,27% 75,64%
GEOBIA SVM FRACC 80,70% 80,11%
XS+IND+FRACC 81,64% 81,07%
XS 80,61% 80,03%
RF FRACC 77,20% 76,58%
XS+IND+FRACC 80,73% 80,14%
Tabla 29. Intervalos de confianza al 95% para kappa.

El índice Kappa nos da un mejor panorama de los resultados sobre el desempeño de cada
método, incorporando no solo los aciertos en la matriz de confusión sino además los
errores de comisión y omisión. Se observa en promedio que los métodos de clasificación
por Árboles de decisión y Maquinas de soporte Vectorial ofrecen los mayores indicadores.
Sin embargo para obtener una adecuada y más concluyente comparación y determinar si
la exactitud entre ellas es significativamente diferentes (Senseman, Bagley, & Tweddale,
1995) se implementa el test de independencia estadística entre dos matrices de confusión
expuesto en (Congalton & Green, 2008b), se determina inicialmente las varianzas del
indicador Kappa a partir del método Delta:

Ecuación 12. Varianza de kappa (Congalton & Green, 2008b)

Y posteriormente se determina la desviación normal estándar Z, que expresa la


significancia entre la diferencia de dos matrices de error. Cuando el valor de Z es mayor a
153

1.96 la diferencia entonces es significativa al 95% de confianza. Y si excede 2.58 es


entonces significativa al 99% (Senseman et al., 1995). Se realiza una comparación entre cada
uno de los resultados obtenidos que se presenta en la Tabla 30.

Ecuación 13. Desviación Normal Estandar. (Congalton & Green, 2008b)

DT SVM RF
XS+IND+F XS+IND+ XS+IND+
XS FRACC XS FRACC XS FRACC
RACC FRACC FRACC
XS - 4,578 0,000 4,561 0,805 0,014 0,891 3,720 0,788

FRACC - 4,578 0,139 3,726 4,545 3,712 0,872 3,808


DT
XS+IND+FR
- 4,561 0,805 0,014 0,891 3,720 0,788
ACC

XS - 3,683 4,526 3,670 0,754 3,768

SVM FRACC - 0,809 0,071 2,873 2,873


XS+IND+FR
- 0,895 3,694 0,792
ACC
XS - 2,847 0,102
RF
FRACC - 2,944

Tabla 30 Resumen de las comparaciones entre clasificaciones a partir de la desviación normal


estándar de kappa.

De acuerdo a los resultados del análisis de la diferencia de los índices Kappa para todas
las combinaciones de clasificadores los métodos en los que se ha empleado únicamente
los datos espectrales o su combinación con los datos de cobertura fraccional, son
significativamente diferentes, y de acuerdo al valor de kappa, de una mayor exactitud
temática que empleando únicamente los datos de cobertura fraccional e índices. No es
posible determinar a un nivel de confianza del 95% y/o 99% una diferencia significativa de
un método, bien sea SVM, DT o RF sobre otro. Por ende el desarrollo de los procesos para
la clasificación de la cobertura bosque y no bosque se realizara siempre la comparación y
generación de los datos por todos los métodos definidos a partir de los datos espectrales
y de índices y transformaciones, y no se preferirá en la metodología un método sobre otro,
hasta no realizar la evaluación final.
154

ANEXO 3.
Matrices STEP de los resultados de la evaluación de los métodos
DT, RF, SVM y Knn a partir de los datos de referencia IDEAM y
Global Forest Cnange.
Sector #1. Método RF. Validación IDEAM.
SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 90,830 4,839 1,637 97,305 93%
Deforestación 6,292 13,916 1,164 21,371 65%
No Bosque 8,636 12,517 53,341 74,494 72%
Total 105,758 31,272 56,142 193,171 100%
Exactitud Usuario (%) 86% 44% 95% 100% 82%
Tabla 31 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el
Sector #1 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 106,611 6,583 2,223 115,417 92%
Deforestación 7,398 15,636 1,387 24,421 64%
No Bosque 11,582 21,396 71,718 104,696 69%
Total 125,591 43,616 75,328 244,535 100%
Exactitud Usuario (%) 85% 36% 95% 100% 79%
Tabla 32 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para
el Sector #1 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 103,396 132 480 104,008 99%
Deforestación 1,030 3,440 459 4,928 70%
No Bosque 3,928 445 44,640 49,013 91%
Total 108,354 4,017 45,578 157,949 100%
Exactitud Usuario (%) 95% 86% 98% 100% 96%
Tabla 33 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el
Sector #1 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 105,464 3,028 619 109,112 97%
Deforestación 3,265 11,101 1,375 15,741 71%
No Bosque 7,466 19,133 51,117 77,717 66%
Total 116,195 33,263 53,111 202,569 100%
Exactitud Usuario (%) 91% 33% 96% 100% 83%
Tabla 34 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF
para el Sector #1 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 82% 60.0% 100.0%
Theme 79% 56.7% 100.0%
Edge 96% 81.1% 100.0%
Position 83% 61.2% 100.0%
Tabla 35 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para
el Sector #1 a partir de los datos IDEAM.
155

Sector #1. Método DT. Validación IDEAM.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 83,828 1,370 1,675 86,873 96%
Deforestación 8,999 - 442 9,441 0%
No Bosque 9,323 - 48,093 57,415 84%
Total 102,149 1,370 50,209 153,729 100%
Exactitud Usuario (%) 82% 0% 96% 100% 86%
Tabla 36 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el
Sector #1 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 107,056 1,827 2,223 111,106 96%
Deforestación 9,787 - 462 10,250 0%
No Bosque 13,169 - 72,135 85,304 85%
Total 130,012 1,827 74,820 206,660 100%
Exactitud Usuario (%) 82% 0% 96% 100% 87%
Tabla 37 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT para
el Sector #1 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 101,720 68 480 102,267 99%
Deforestación 3,396 - 149 3,545 0%
No Bosque 6,130 - 47,197 53,327 89%
Total 111,246 68 47,825 159,139 100%
Exactitud Usuario (%) 91% 0% 99% 100% 94%
Tabla 38 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el
Sector #1 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 104,851 658 639 106,148 99%
Deforestación 4,346 - 740 5,086 0%
No Bosque 8,730 - 51,422 60,153 85%
Total 117,927 658 52,802 171,387 100%
Exactitud Usuario (%) 89% 0% 97% 100% 91%
Tabla 39 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT
para el Sector #1 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 86% 65.3% 100.0%
Theme 87% 66.6% 100.0%
Edge 94% 77.0% 100.0%
Position 91% 73.2% 100.0%
Tabla 40 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT para
el Sector #1 a partir de los datos IDEAM.
156

Sector #1. Método KNN. Validación IDEAM.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 90,503 16,204 3,281 109,988 82%
Deforestación 5,560 21,923 731 28,214 78%
No Bosque 8,473 675 65,679 74,827 88%
Total 104,537 38,801 69,691 213,029 100%
Exactitud Usuario (%) 87% 57% 94% 100% 84%
Tabla 41 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el
Sector #1 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 102,845 20,573 4,679 128,097 80%
Deforestación 6,782 26,334 1,002 34,118 77%
No Bosque 10,591 823 74,636 86,050 87%
Total 120,218 47,730 80,316 248,264 100%
Exactitud Usuario (%) 86% 55% 93% 100% 82%
Tabla 42 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN
para el Sector #1 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 102,845 588 1,743 105,176 98%
Deforestación 1,208 7,571 299 9,078 83%
No Bosque 3,919 34 71,650 75,603 95%
Total 107,971 8,193 73,692 189,856 100%
Exactitud Usuario (%) 95% 92% 97% 100% 96%
Tabla 43 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el
Sector #1 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 101,816 10,377 9,112 121305.8 84%
Deforestación 3,481 17,035 635 21150.82 81%
No Bosque 6,990 428 73,889 81307.28 91%
Total 112,288 27,840 83,636 223763.8 100%
Exactitud Usuario (%) 91% 61% 88% 100% 86%
Tabla 44 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN
para el Sector #1 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 84% 62.3% 100.0%
Theme 82% 60.3% 100.0%
Edge 96% 81.1% 100.0%
Position 86% 65.8% 100.0%
Tabla 45 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN
para el Sector #1 a partir de los datos IDEAM.
157

Sector #1. Método SVM. Validación IDEAM.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 94,892 5,522 1,604 102,019 93%
Deforestación 6,294 15,381 613 22,287 69%
No Bosque 6,531 21,668 65,749 93,948 70%
Total 107,717 42,570 67,966 218,254 100%
Exactitud Usuario (%) 88% 36% 97% 100% 81%
Tabla 46 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el
Sector #1 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 106,457 7,406 2,300 116,163 92%
Deforestación 7,784 17,282 848 25,913 67%
No Bosque 8,114 35,386 73,876 117,376 63%
Total 122,355 60,074 77,023 259,452 100%
Exactitud Usuario (%) 87% 29% 96% 100% 76%
Tabla 47 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM
para el Sector #1 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 105,344 174 541 106,058 99%
Deforestación 916 3,284 231 4,430 74%
No Bosque 3,436 1,914 72,398 77,748 93%
Total 109,695 5,371 73,170 188,236 100%
Exactitud Usuario (%) 96% 61% 99% 100% 96%
Tabla 48 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el
Sector #1 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 105,311 3,316 3,757 112,385 94%
Deforestación 3,460 12,097 602 16,159 75%
No Bosque 5,105 31,173 72,398 108,676 67%
Total 113,876 46,586 76,757 237,219 100%
Exactitud Usuario (%) 92% 26% 94% 100% 80%
Tabla 49 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM
para el Sector #1 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 81% 58.4% 100.0%
Theme 76% 52.8% 98.8%
Edge 96% 81.6% 100.0%
Position 80% 57.6% 100.0%
Tabla 50 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM
para el Sector #1 a partir de los datos IDEAM.
158

Sector #1. Método RF. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 414,259 192,085 2,337 608,681 68%
Deforestación 17,076 488,751 817 506,644 96%
No Bosque 11,145 179,493 19,671 210,309 9%
Total 442,480 860,329 22,825 1,325,633 100%
Exactitud Usuario (%) 94% 57% 86% 100% 70%
Tabla 51 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 830,547 343,558 5,300 1,179,404 70%
Deforestación 28,896 807,296 918 837,110 96%
No Bosque 20,264 315,849 41,483 377,595 11%
Total 879,706 1,466,702 47,700 2,394,109 100%
Exactitud Usuario (%) 94% 55% 87% 100% 70%
Tabla 52 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para
el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 266,376 40,687 38 307,102 87%
Deforestación 3,355 303,471 15 306,841 99%
No Bosque 1,682 26,661 857 29,201 3%
Total 271,413 370,820 910 643,143 100%
Exactitud Usuario (%) 98% 82% 94% 100% 89%
Tabla 53 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 565,499 537,519 5,005 1,108,023 51%
Deforestación 21,820 763,163 17 784,999 97%
No Bosque 5,269 319,721 21,844 346,833 6%
Total 592,587 1,620,402 26,865 2,239,855 100%
Exactitud Usuario (%) 95% 47% 81% 100% 60%
Tabla 54 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF
para el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 70% 63.8% 75.4%
Theme 70% 64.3% 75.9%
Edge 89% 84.5% 92.9%
Position 60% 54.1% 66.4%
Tabla 55 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para
el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.
159

Sector #1. Método DT. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 369,637 196,689 505 566,830 65%
Deforestación 24,889 438,746 432 464,068 95%
No Bosque 4,478 193,139 - 197,617 0%
Total 399,004 828,573 937 1,228,515 100%
Exactitud Usuario (%) 93% 53% 0% 100% 66%
Tabla 56 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 824,595 353,710 1,098 1,179,403 70%
Deforestación 40,044 796,166 900 837,110 95%
No Bosque 9,140 368,457 - 377,597 0%
Total 873,778 1,518,332 1,998 2,394,109 100%
Exactitud Usuario (%) 94% 52% 0% 100% 68%
Tabla 57 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT para
el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 255,694 52,947 24 308,665 83%
Deforestación 633 297,328 7 297,968 100%
No Bosque 1,005 39,593 - 40,599 0%
Total 257,332 389,868 31 647,231 100%
Exactitud Usuario (%) 99% 76% 0% 100% 85%
Tabla 58 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 574,152 553,627 362 1,128,142 51%
Deforestación 21,954 731,987 82 754,023 97%
No Bosque 2,193 366,645 - 368,838 0%
Total 598,299 1,652,260 444 2,251,003 100%
Exactitud Usuario (%) 96% 44% 0% 100% 58%
Tabla 59 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT
para el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 66% 59.8% 71.6%
Theme 68% 61.8% 73.5%
Edge 85% 80.8% 89.6%
Position 58% 51.8% 64.2%
Tabla 60 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT para
el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.
160

Sector #1. Método KNN. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 516,658 170,857 6,637 694,153 74%
Deforestación 27,225 478,659 11,204 517,088 93%
No Bosque 10,350 193,040 15,192 218,582 7%
Total 554,233 842,557 33,033 1,429,823 100%
Exactitud Usuario (%) 93% 57% 46% 100% 71%
Tabla 61 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 875,692 295,044 8,667 1,179,403 74%
Deforestación 45,845 774,147 17,118 837,110 92%
No Bosque 16,427 334,755 26,415 377,597 7%
Total 937,963 1,403,945 52,200 2,394,109 100%
Exactitud Usuario (%) 93% 55% 51% 100% 70%
Tabla 62 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN
para el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 464,117 37,745 1,577 503,438 92%
Deforestación 2,296 310,207 743 313,246 99%
No Bosque 1,351 25,182 922 27,455 3%
Total 467,763 373,134 3,242 844,138 100%
Exactitud Usuario (%) 99% 83% 28% 100% 92%
Tabla 63 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 840,664 506,981 5,064 1352709 62%
Deforestación 83,074 721,963 7,158 812194.1 89%
No Bosque 25,723 328,137 9,987 363847.6 3%
Total 949,462 1,557,080 22,209 2528751 100%
Exactitud Usuario (%) 89% 46% 45% 100% 62%
Tabla 64 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN
para el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 71% 64.9% 76.5%
Theme 70% 64.2% 75.8%
Edge 92% 88.1% 96.0%
Position 62% 56.1% 68.3%
Tabla 65 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN
para el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.
161

Sector #1. Método SVM. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 507,188 185,243 5,238 697,669 73%
Deforestación 23,416 500,606 817 524,839 95%
No Bosque 9,084 179,946 26,600 215,630 12%
Total 539,688 865,796 32,655 1,438,138 100%
Exactitud Usuario (%) 94% 58% 81% 100% 72%
Tabla 66 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 845,313 325,186 8,906 1,179,404 72%
Deforestación 40,218 795,974 918 837,110 95%
No Bosque 13,976 307,743 55,877 377,595 15%
Total 899,506 1,428,902 65,700 2,394,109 100%
Exactitud Usuario (%) 94% 56% 85% 100% 71%
Tabla 67 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM
para el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 414,203 40,147 985 455,335 91%
Deforestación 989 296,882 15 297,886 100%
No Bosque 1,286 32,915 1,472 35,672 4%
Total 416,478 369,944 2,472 788,893 100%
Exactitud Usuario (%) 99% 80% 60% 100% 90%
Tabla 68 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el
Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 794,594 515,954 5,569 1,316,117 60%
Deforestación 53,392 753,685 58 807,134 93%
No Bosque 7,826 314,857 33,818 356,501 9%
Total 855,812 1,584,496 39,444 2,479,752 100%
Exactitud Usuario (%) 93% 48% 86% 100% 64%
Tabla 69 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM
para el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 72% 66.2% 77.7%
Theme 71% 65.1% 76.7%
Edge 90% 86.4% 94.5%
Position 64% 57.7% 70.0%
Tabla 70 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM
para el Sector #1 a partir de los datos GLOBAL FOREST CHANGE.
162

Sector #2. Método RF. Validación IDEAM.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 128,531 3,777 11,058 143,366 90%
Deforestación 4,339 102,666 6,886 113,892 90%
No Bosque 41,891 28,312 903,380 973,584 93%
Total 174,761 134,755 921,325 1,230,841 100%
Exactitud Usuario (%) 74% 76% 98% 100% 92%
Tabla 71 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el
Sector #2 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 141,867 4,932 15,310 162,109 88%
Deforestación 6,447 105,696 8,205 120,348 88%
No Bosque 57,311 36,641 1,038,368 1,132,320 92%
Total 205,625 147,270 1,061,883 1,414,777 100%
Exactitud Usuario (%) 69% 72% 98% 100% 91%
Tabla 72 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para
el Sector #2 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 84,298 1,711 5,556 91,564 92%
Deforestación 1,104 65,003 5,433 71,540 91%
No Bosque 2,918 1,974 1,027,984 1,032,877 100%
Total 88,320 68,688 1,038,973 1,195,981 100%
Exactitud Usuario (%) 95% 95% 99% 100% 98%
Tabla 73 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el
Sector #2 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 131,832 1,122 27,752 160,705 82%
Deforestación 8,811 93,104 2,303 104,218 89%
No Bosque 38,096 25,233 1,027,984 1,091,313 94%
Total 178,738 119,459 1,058,040 1,356,237 100%
Exactitud Usuario (%) 74% 78% 97% 100% 92%
Tabla 74 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF
para el Sector #2 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 92% 80.2% 100.0%
Theme 91% 78.3% 100.0%
Edge 98% 90.6% 100.0%
Position 92% 80.5% 100.0%
Tabla 75 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para
el Sector #2 a partir de los datos IDEAM.
163

Sector #2. Método DT. Validación IDEAM.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 131,194 11,708 13,145 156,047 84%
Deforestación 16,186 24,810 7,529 48,525 51%
No Bosque 40,036 15,305 932,925 988,266 94%
Total 187,415 51,823 953,599 1,192,837 100%
Exactitud Usuario (%) 70% 48% 98% 100% 91%
Tabla 76 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el
Sector #2 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 136,140 18,180 17,364 171,684 79%
Deforestación 24,420 38,051 8,987 71,457 53%
No Bosque 49,598 28,890 1,048,230 1,126,718 93%
Total 210,157 85,121 1,074,581 1,369,859 100%
Exactitud Usuario (%) 65% 45% 98% 100% 89%
Tabla 77 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT para
el Sector #2 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 87,634 899 6,599 95,132 92%
Deforestación 7,094 6,245 5,929 19,267 32%
No Bosque 3,774 318 1,016,783 1,020,875 100%
Total 98,502 7,462 1,029,311 1,135,274 100%
Exactitud Usuario (%) 89% 84% 99% 100% 98%
Tabla 78 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el
Sector #2 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 126,469 9,452 24,951 160,872 79%
Deforestación 20,585 8,687 2,493 31,765 27%
No Bosque 33,242 20,146 1,037,748 1,091,135 95%
Total 180,296 38,285 1,065,191 1,283,772 100%
Exactitud Usuario (%) 70% 23% 97% 100% 91%
Tabla 79 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT
para el Sector #2 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 91% 78.9% 100.0%
Theme 89% 76.0% 100.0%
Edge 98% 89.4% 100.0%
Position 91% 79.0% 100.0%
Tabla 80 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT para
el Sector #2 a partir de los datos IDEAM.
164

Sector #2. Método KNN. Validación IDEAM.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 87,611 38,782 20,252 146,645 60%
Deforestación 14,757 34,105 9,991 58,853 58%
No Bosque 29,046 6,736 975,731 1,011,513 96%
Total 131,414 79,623 1,005,973 1,217,010 100%
Exactitud Usuario (%) 67% 43% 97% 100% 90%
Tabla 81 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el
Sector #2 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 115,977 58,767 26,274 201,018 58%
Deforestación 19,536 47,211 11,331 78,078 60%
No Bosque 42,526 9,865 1,060,577 1,112,968 95%
Total 178,039 115,843 1,098,181 1,392,063 100%
Exactitud Usuario (%) 65% 41% 97% 100% 88%
Tabla 82 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN
para el Sector #2 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 73,045 2,873 10,537 86,456 84%
Deforestación 3,919 12,521 7,107 23,548 53%
No Bosque 2,416 244 1,039,365 1,042,025 100%
Total 79,380 15,638 1,057,010 1,152,028 100%
Exactitud Usuario (%) 92% 80% 98% 100% 98%
Tabla 83 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el
Sector #2 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 89,474 28,279 39,057 156808.8 57%
Deforestación 15,117 22,541 2,680 40338.71 56%
No Bosque 27,383 7,314 1,060,577 1095274 97%
Total 131,973 58,134 1,102,314 1292421 100%
Exactitud Usuario (%) 68% 39% 96% 100% 91%
Tabla 84 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN
para el Sector #2 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 90% 77.3% 100.0%
Theme 88% 74.2% 100.0%
Edge 98% 89.0% 100.0%
Position 91% 78.1% 100.0%
Tabla 85 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN
para el Sector 1 a partir de los datos IDEAM.
165

Sector #2. Método SVM. Validación IDEAM.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 127,950 3,678 15,181 146,808 87%
Deforestación 14,445 47,993 6,134 68,572 70%
No Bosque 43,105 25,790 885,197 954,091 93%
Total 185,499 77,461 906,512 1,169,472 100%
Exactitud Usuario (%) 69% 62% 98% 100% 91%
Tabla 86 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el
Sector #2 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 136,670 4,932 22,265 163,867 83%
Deforestación 18,168 66,236 7,424 91,828 72%
No Bosque 53,294 40,869 1,041,408 1,135,571 92%
Total 208,132 112,038 1,071,097 1,391,267 100%
Exactitud Usuario (%) 66% 59% 97% 100% 89%
Tabla 87 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM
para el Sector #2 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 89,334 1,711 10,229 101,274 88%
Deforestación 6,062 17,623 4,900 28,585 62%
No Bosque 3,995 839 999,752 1,004,585 100%
Total 99,391 20,172 1,014,880 1,134,444 100%
Exactitud Usuario (%) 90% 87% 99% 100% 98%
Tabla 88 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el
Sector #2 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 128,579 1,226 43,100 172,905 74%
Deforestación 13,052 29,954 2,129 45,136 66%
No Bosque 36,673 26,924 1,030,994 1,094,591 94%
Total 178,304 58,105 1,076,223 1,312,632 100%
Exactitud Usuario (%) 72% 52% 96% 100% 91%
Tabla 89 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM
para el Sector #2 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 91% 78.1% 100.0%
Theme 89% 76.3% 100.0%
Edge 98% 88.8% 100.0%
Position 91% 78.0% 100.0%
Tabla 90 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM
para el Sector #2 a partir de los datos IDEAM.
166

Sector #2. Método RF. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 544,318 63,888 198 608,404 89%
Deforestación 165,331 4,604,624 60,246 4,830,201 95%
No Bosque 32,623 27,407 85,278 145,308 59%
Total 742,273 4,695,919 145,722 5,583,913 100%
Exactitud Usuario (%) 73% 98% 59% 100% 94%
Tabla 91 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 641,755 107,923 441 750,119 86%
Deforestación 260,113 4,747,035 87,144 5,094,292 93%
No Bosque 45,422 37,019 100,515 182,955 55%
Total 947,289 4,891,977 188,100 6,027,366 100%
Exactitud Usuario (%) 68% 97% 53% 100% 91%
Tabla 92 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF para
el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 399,555 23,024 128 422,707 95%
Deforestación 9,109 3,465,336 2,661 3,477,106 100%
No Bosque 5,543 11,590 29,286 46,418 63%
Total 414,207 3,499,950 32,074 3,946,231 100%
Exactitud Usuario (%) 96% 99% 91% 100% 99%
Tabla 93 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 635,283 457,794 1,323 1,094,400 58%
Deforestación 224,102 4,699,565 63,548 4,987,216 94%
No Bosque 63,126 54,951 73,944 192,021 39%
Total 922,511 5,212,310 138,815 6,273,637 100%
Exactitud Usuario (%) 69% 90% 53% 100% 86%
Tabla 94 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF
para el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 94% 88.9% 98.6%
Theme 91% 85.5% 96.6%
Edge 99% 95.8% 100.0%
Position 86% 79.8% 92.7%
Tabla 95 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF para
el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.
167

Sector #2. Método DT. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 535,641 72,336 9,725 617,702 87%
Deforestación 176,735 4,553,519 22,101 4,752,355 96%
No Bosque 73,150 25,546 25,047 123,743 20%
Total 785,526 4,651,401 56,873 5,493,800 100%
Exactitud Usuario (%) 68% 98% 44% 100% 93%
Tabla 96 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 610,198 122,100 17,820 750,117 81%
Deforestación 251,638 4,793,178 49,478 5,094,293 94%
No Bosque 106,337 35,196 41,423 182,955 23%
Total 968,172 4,950,474 108,720 6,027,366 100%
Exactitud Usuario (%) 63% 97% 38% 100% 90%
Tabla 97 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT para
el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 383,731 29,412 127 413,270 93%
Deforestación 13,292 3,546,952 361 3,560,605 100%
No Bosque 20,303 9,526 4,418 34,247 13%
Total 417,326 3,585,890 4,906 4,008,122 100%
Exactitud Usuario (%) 92% 99% 90% 100% 98%
Tabla 98 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 597,720 553,301 9,283 1,160,303 52%
Deforestación 222,810 4,745,246 34,505 5,002,561 95%
No Bosque 109,441 34,619 5,933 149,994 4%
Total 929,971 5,333,166 49,721 6,312,858 100%
Exactitud Usuario (%) 64% 89% 12% 100% 85%
Tabla 99 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT
para el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 93% 88.0% 98.0%
Theme 90% 84.6% 95.9%
Edge 98% 95.0% 100.0%
Position 85% 78.1% 91.2%
Tabla 100 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT
para el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.
168

Sector #2. Método KNN. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 428,381 96,255 42,498 567,134 76%
Deforestación 119,944 4,474,128 20,724 4,614,796 97%
No Bosque 71,260 32,228 36,946 140,434 26%
Total 619,585 4,602,611 100,168 5,322,364 100%
Exactitud Usuario (%) 69% 97% 37% 100% 93%
Tabla 101 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 535,514 153,699 60,909 750,122 71%
Deforestación 194,095 4,864,004 36,194 5,094,292 95%
No Bosque 90,597 41,498 50,858 182,952 28%
Total 820,206 5,059,200 147,960 6,027,366 100%
Exactitud Usuario (%) 65% 96% 34% 100% 90%
Tabla 102 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN
para el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 335,260 44,152 5,405 384,817 87%
Deforestación 7,911 3,648,291 1,921 3,658,123 100%
No Bosque 16,183 10,856 7,823 34,862 22%
Total 359,354 3,703,299 15,149 4,077,802 100%
Exactitud Usuario (%) 93% 99% 52% 100% 98%
Tabla 103 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 439,866 554,737 29,071 1023673 43%
Deforestación 136,517 4,894,200 29,405 5060122 97%
No Bosque 59,671 40,644 25,433 125747.7 20%
Total 636,053 5,489,581 83,908 6209543 100%
Exactitud Usuario (%) 69% 89% 30% 100% 86%
Tabla 104 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN
para el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 93% 87.7% 97.7%
Theme 90% 84.8% 96.0%
Edge 98% 94.5% 100.0%
Position 86% 79.9% 92.8%
Tabla 105 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN
para el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.
169

Sector #2. Método SVM. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 527,097 81,733 260 609,090 87%
Deforestación 194,913 4,708,760 43,167 4,946,839 95%
No Bosque 65,924 25,254 46,847 138,025 34%
Total 787,934 4,815,747 90,274 5,693,954 100%
Exactitud Usuario (%) 67% 98% 52% 100% 93%
Tabla 106 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 614,009 144,669 441 759,119 81%
Deforestación 257,497 4,756,323 80,477 5,094,296 93%
No Bosque 87,336 33,432 62,183 182,951 34%
Total 958,842 4,934,424 143,100 6,036,366 100%
Exactitud Usuario (%) 64% 96% 43% 100% 90%
Tabla 107 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM
para el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 391,342 38,686 128 430,156 91%
Deforestación 10,869 3,519,679 1,304 3,531,853 100%
No Bosque 14,268 9,783 10,209 34,260 30%
Total 416,479 3,568,148 11,642 3,996,269 100%
Exactitud Usuario (%) 94% 99% 88% 100% 98%
Tabla 108 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el
Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 621,505 573,959 573 1,196,036 52%
Deforestación 230,188 4,708,760 58,630 4,997,577 94%
No Bosque 75,252 53,290 22,706 151,249 15%
Total 926,945 5,336,008 81,909 6,344,863 100%
Exactitud Usuario (%) 67% 88% 28% 100% 84%
Tabla 109 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM
para el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 93% 87.6% 97.7%
Theme 90% 84.2% 95.5%
Edge 98% 94.9% 100.0%
Position 84% 77.6% 90.8%
Tabla 110 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM
para el Sector #2 a partir de los datos GLOBAL FOREST CHANGE.
170

Sector #3. Método RF. Validación IDEAM.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 240,084 - 59,139 299,223 80%
Deforestación 418,446 30,600 40,896 489,942 6%
No Bosque 338,115 3,564 13,416,620 13,758,300 98%
Total 996,645 34,164 13,516,660 14,547,460 100%
Exactitud Usuario (%) 24% 90% 99% 100% 94%
Tabla 111 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el
Sector #3 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 404,100 - 86,400 490,500 82%
Deforestación 774,900 30,600 57,600 863,100 4%
No Bosque 516,168 3,600 18,632,890 19,152,660 97%
Total 1,695,168 34,200 18,776,890 20,506,260 100%
Exactitud Usuario (%) 24% 89% 99% 100% 93%
Tabla 112 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF
para el Sector #3 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 123,408 - 19,833 143,241 86%
Deforestación 418,446 734 29,952 449,132 0%
No Bosque 48,205 18 13,969,960 14,018,180 100%
Total 590,059 752 14,019,750 14,610,560 100%
Exactitud Usuario (%) 21% 98% 100% 100% 96%
Tabla 113 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el
Sector #3 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 76,266 - 330,935 407,201 19%
Deforestación 503,685 22,338 19,584 545,607 4%
No Bosque 420,906 3,132 18,632,260 19,056,300 98%
Total 1,000,857 25,470 18,982,780 20,009,110 100%
Exactitud Usuario (%) 8% 88% 98% 100% 94%
Tabla 114 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF
para el Sector #3 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 94% 77.9% 100.0%
Theme 93% 76.0% 100.0%
Edge 96% 82.2% 100.0%
Position 94% 77.1% 100.0%
Tabla 115 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF
para el Sector #3 a partir de los datos IDEAM.
171

Sector #3. Método DT. Validación IDEAM.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 233,676 - 132,003 365,679 64%
Deforestación 493,632 30,600 53,856 578,088 5%
No Bosque 205,677 3,564 16,975,760 17,185,000 99%
Total 932,985 34,164 17,161,620 18,128,770 100%
Exactitud Usuario (%) 25% 90% 99% 100% 95%
Tabla 116 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el
Sector #3 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 338,400 - 152,100 490,500 69%
Deforestación 771,300 30,600 61,200 863,100 4%
No Bosque 287,100 3,600 18,861,950 19,152,650 98%
34,200 19,075,250 20,506,250 100%
Total
1,396,800
Exactitud Usuario (%) 24% 89% 99% 100% 94%
Tabla 117 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT
para el Sector #3 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 100,544 - 38,466 139,010 72%
Deforestación 462,780 734 35,496 499,010 0%
No Bosque 32,231 18 14,146,460 14,178,710 100%
Total 595,555 752 14,220,420 14,816,730 100%
Exactitud Usuario (%) 17% 98% 99% 100% 96%
Tabla 118 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el
Sector #3 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 39,699 - 417,960 457,659 9%
Deforestación 501,345 22,338 21,420 545,103 4%
No Bosque 243,324 3,132 18,861,950 19,108,410 99%
Total 784,368 25,470 19,301,330 20,111,170 100%
Exactitud Usuario (%) 5% 88% 98% 100% 94%
Tabla 119 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT
para el Sector #3 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 95% 79.6% 100.0%
Theme 94% 77.4% 100.0%
Edge 96% 81.6% 100.0%
Position 94% 77.9% 100.0%
Tabla 120 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT
para el Sector #3 a partir de los datos IDEAM.
172

Sector #3. Método KNN. Validación IDEAM.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 170,352 - 265,815 436,167 39%
Deforestación 681,444 35,856 78,408 795,708 5%
No Bosque 115,821 5,832 18,439,270 18,560,920 99%
Total 967,617 41,688 18,783,490 19,792,800 100%
Exactitud Usuario (%) 18% 86% 98% 100% 94%
Tabla 121 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el
Sector #3 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 191,700 - 298,800 490,500 39%
Deforestación 740,700 43,200 79,200 863,100 5%
No Bosque 135,900 7,200 19,009,550 19,152,650 99%
Total 1,068,300 50,400 19,387,550 20,506,250 100%
Exactitud Usuario (%) 18% 86% 98% 100% 94%
Tabla 122 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN
para el Sector #3 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 23,009 - 85,311 108,320 21%
Deforestación 385,164 1,987 41,976 429,127 0%
No Bosque 9,538 69 14,447,260 14,456,870 100%
Total 417,711 2,056 14,574,550 14,994,310 100%
Exactitud Usuario (%) 6% 97% 99% 100% 97%
Tabla 123 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el
Sector #3 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 150,255 - 443,160 593,415 25%
Deforestación 725,886 31,104 26,928 783,918 4%
No Bosque 109,575 6,264 19,009,550 19,125,390 99%
Total 985,716 37,368 19,479,640 20,502,720 100%
Exactitud Usuario (%) 15% 83% 98% 100% 94%
Tabla 124 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN
para el Sector #3 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 94% 78.1% 100.0%
Theme 94% 77.5% 100.0%
Edge 97% 82.3% 100.0%
Position 94% 77.1% 100.0%
Tabla 125 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN
para el Sector 1 a partir de los datos IDEAM.
173

Sector #3. Método SVM. Validación IDEAM.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 255,114 - 143,991 399,105 64%
Deforestación 583,209 35,856 57,330 676,395 5%
No Bosque 333,579 5,832 13,306,670 13,646,080 98%
Total 1,171,902 41,688 13,507,990 14,721,580 100%
Exactitud Usuario (%) 22% 86% 99% 100% 92%
Tabla 126 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el
Sector #3 a partir de los datos IDEAM.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 290,700 - 199,800 490,500 59%
Deforestación 738,000 43,200 81,900 863,100 5%
No Bosque 403,668 7,200 18,741,790 19,152,660 98%
Total 1,432,368 50,400 19,023,490 20,506,260 100%
Exactitud Usuario (%) 20% 86% 99% 100% 93%
Tabla 127 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM
para el Sector #3 a partir de los datos IDEAM.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 45,792 - 74,151 119,943 38%
Deforestación 353,082 1,987 45,864 400,933 0%
No Bosque 14,809 69 14,056,340 14,071,220 100%
Total 413,683 2,056 14,176,360 14,592,090 100%
Exactitud Usuario (%) 11% 97% 99% 100% 97%
Tabla 128 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el
Sector #3 a partir de los datos IDEAM.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 223,074 - 353,250 576,324 39%
Deforestación 722,295 31,104 27,846 781,245 4%
No Bosque 307,614 6,264 18,741,790 19,055,670 98%
Total 1,252,983 37,368 19,122,890 20,413,240 100%
Exactitud Usuario (%) 18% 83% 98% 100% 93%
Tabla 129 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM
para el Sector #3 a partir de los datos IDEAM.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 92% 75.0% 100.0%
Theme 93% 76.1% 100.0%
Edge 97% 82.6% 100.0%
Position 93% 76.2% 100.0%
Tabla 130 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM
para el Sector #3 a partir de los datos IDEAM.
174

Sector #3. Método RF. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 218,871 - 56,716 275,587 79%
Deforestación 346,020 24,762 16,131 386,912 6%
No Bosque 660,790 2,577 18,452,960 19,116,330 97%
Total 1,225,680 27,339 18,525,810 19,778,830 100%
Exactitud Usuario (%) 18% 91% 100% 100% 95%
Tabla 131 Matriz de errores ponderados para Área (Shape) por el método de clasificación RF para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 266,168 - 109,542 375,710 71%
Deforestación 533,441 30,570 21,764 585,774 5%
No Bosque 895,560 3,630 18,645,580 19,544,770 95%
Total 1,695,168 34,200 18,776,890 20,506,250 100%
Exactitud Usuario (%) 16% 89% 99% 100% 92%
Tabla 132 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación RF
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 80,079 - 35,945 116,024 69%
Deforestación 216,238 1,376 8,572 226,185 1%
No Bosque 89,996 18 17,885,490 17,975,500 99%
Total 386,313 1,393 17,930,010 18,317,710 100%
Exactitud Usuario (%) 21% 99% 100% 100% 98%
Tabla 133 Matriz de errores ponderados para Borde (Edge) por el método de clasificación RF para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 245,945 - 1,914,927 2,160,872 11%
Deforestación 274,266 15,591 119,330 409,187 4%
No Bosque 983,714 3,158 18,663,350 19,650,220 95%
Total 1,503,925 18,749 20,697,610 22,220,280 100%
Exactitud Usuario (%) 16% 83% 90% 100% 85%
Tabla 134 Matriz de errores ponderados para Posición (Position) por el método de clasificación RF
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 95% 92.0% 97.1%
Theme 92% 89.5% 95.3%
Edge 98% 96.4% 99.8%
Position 85% 81.4% 88.9%
Tabla 135 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación RF
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.
175

Sector #3. Método DT. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 192,906 - 82,550 275,456 70%
Deforestación 407,584 24,762 17,999 450,345 5%
No Bosque 533,893 2,577 15,318,510 15,854,980 97%
Total 1,134,383 27,339 15,419,060 16,580,780 100%
Exactitud Usuario (%) 17% 91% 99% 100% 94%
Tabla 136 Matriz de errores ponderados para Área (Shape) por el método de clasificación DT para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 234,633 - 141,078 375,711 62%
Deforestación 533,352 30,570 21,852 585,774 5%
No Bosque 628,815 3,630 18,912,320 19,544,760 97%
Total 1,396,800 34,200 19,075,250 20,506,250 100%
Exactitud Usuario (%) 17% 89% 99% 100% 94%
Tabla 137 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación DT
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 81,439 - 27,933 109,372 74%
Deforestación 201,961 1,376 7,669 211,006 1%
No Bosque 65,646 18 18,911,780 18,977,440 100%
Total 349,046 1,393 18,947,380 19,297,820 100%
Exactitud Usuario (%) 23% 99% 100% 100% 98%
Tabla 138 Matriz de errores ponderados para Borde (Edge) por el método de clasificación DT para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 120,247 - 2,249,838 2,370,085 5%
Deforestación 283,428 15,591 114,835 413,854 4%
No Bosque 771,184 3,158 18,931,340 19,705,680 96%
Total 1,174,860 18,749 21,296,010 22,489,620 100%
Exactitud Usuario (%) 10% 83% 89% 100% 85%
Tabla 139 Matriz de errores ponderados para Posición (Position) por el método de clasificación DT
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 94% 91.0% 96.3%
Theme 94% 90.8% 96.4%
Edge 98% 96.8% 100.0%
Position 85% 81.0% 88.5%
Tabla 140 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación DT
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.
176

Sector #3. Método KNN. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 112,375 - 124,595 236,970 47%
Deforestación 448,278 28,292 16,962 493,532 6%
No Bosque 263,130 4,822 13,412,040 13,679,990 98%
Total 823,783 33,114 13,553,600 14,410,490 100%
Exactitud Usuario (%) 14% 85% 99% 100% 94%
Tabla 141 Matriz de errores ponderados para Área (Shape) por el método de clasificación KNN para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 172,359 - 203,352 375,711 46%
Deforestación 520,823 42,227 22,725 585,774 7%
No Bosque 375,119 8,174 19,161,480 19,544,770 98%
Total 1,068,300 50,400 19,387,560 20,506,260 100%
Exactitud Usuario (%) 16% 84% 99% 100% 94%
Tabla 142 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación KNN
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 37,643 - 40,625 78,267 48%
Deforestación 192,918 2,829 8,792 204,539 1%
No Bosque 26,682 67 18,197,840 18,224,590 100%
Total 257,242 2,896 18,247,260 18,507,400 100%
Exactitud Usuario (%) 15% 98% 100% 100% 99%
Tabla 143 Matriz de errores ponderados para Borde (Edge) por el método de clasificación KNN para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 178,117 - 2,532,736 2710852 7%
Deforestación 605,049 22,380 119,636 747065.3 3%
No Bosque 357,337 7,111 19,243,380 19607830 98%
Total 1,140,503 29,491 21,895,750 23065750 100%
Exactitud Usuario (%) 16% 76% 88% 100% 84%
Tabla 144 Matriz de errores ponderados para Posición (Position) por el método de clasificación KNN
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 94% 91.4% 96.6%
Theme 94% 91.9% 97.4%
Edge 99% 97.0% 100.0%
Position 84% 80.5% 88.0%
Tabla 145 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación KNN
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.
177

Sector #3. Método SVM. Validación GLOBAL FOREST CHANGE.


SHAPE Bosque Deforestación No Bosque Total Exactitud Productor (%)
Bosque 124,265 - 103,703 227,968 55%
Deforestación 493,729 28,292 16,738 538,759 5%
No Bosque 579,913 4,822 18,448,640 19,033,380 97%
33,114 18,569,080 19,800,100 100%
Total
1,197,907
Exactitud Usuario (%) 10% 85% 99% 100% 94%
Tabla 146 Matriz de errores ponderados para Área (Shape) por el método de clasificación SVM para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

THEME Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 204,168 - 171,540 375,708 54%
Deforestación 520,823 42,227 22,725 585,774 7%
No Bosque 707,378 8,174 18,829,220 19,544,770 96%
50,400 19,023,480 20,506,250 100%
Total
1,432,368
Exactitud Usuario (%) 14% 84% 99% 100% 93%
Tabla 147 Matriz de errores ponderados para Tematico (Theme) por el método de clasificación SVM
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

EDGE Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 63,616 - 65,385 129,001 49%
Deforestación 197,242 2,829 8,974 209,046 1%
No Bosque 38,091 67 17,695,960 17,734,120 100%
Total 298,949 2,896 17,770,320 18,072,160 100%
Exactitud Usuario (%) 21% 98% 100% 100% 98%
Tabla 148 Matriz de errores ponderados para Borde (Edge) por el método de clasificación SVM para el
Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

POSITION Bosque Deforestación No Bosque Total Exactitud Productor (%)


Bosque 219,405 - 2,061,249 2,280,654 10%
Deforestación 599,702 22,380 119,636 741,718 3%
No Bosque 627,032 7,111 18,880,610 19,514,750 97%
Total 1,446,138 29,491 21,061,500 22,537,120 100%
Exactitud Usuario (%) 15% 76% 90% 100% 85%
Tabla 149 Matriz de errores ponderados para Posición (Position) por el método de clasificación SVM
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

Exactitud Promedio por Componente Lim Inf IC 95% Lim Sup IC 95%
Shape 94% 91.3% 96.5%
Theme 93% 90.2% 95.9%
Edge 98% 96.6% 100.0%
Position 85% 81.1% 88.6%
Tabla 150 Matriz de Exactitud Promedio Geométrica y Temática por el método de clasificación SVM
para el Sector #3 a partir de los datos GLOBAL FOREST CHANGE.

También podría gustarte