Está en la página 1de 20

INTEGRACIÓN DE IMÁGENES

SATELITALES SENTINEL-2 EN
CDCOL
Proyecto de Grado

UNIVERSIDAD DE LOS ANDES


FACULTAD DE INGENIERÍA
DEPARTAMENTO DE INGENIERÍA DE SISTEMAS Y COMPUTACIÓN
JUNIO 2020

David Felipe Niño Romero


Df.nino10@uniandes.edu.co

Harold Enrique Castro Barrera


hcastro@uniandes.edu.co
CONTENIDO

0 RESUMEN

El instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM) en conjunto con la Universidad


de los Andes desarrolló el cubo de datos de Colombia (CDCol), herramienta que ofrece a los usuarios un
flujo de trabajo y capacidad de procesamiento desde la obtención hasta el análisis de las imágenes
satelitales Landsat. La misión espacial Landsat desplegó una flota de satélites para la observación
terrestre, que en su versión 8, realiza captura de imágenes con resolución de 30 metros por píxel y permite
capturar imágenes de un punto de la tierra cada 16 días. La disponibilidad de estas imágenes satelitales
fue uno de los motivos por los cuales CDCol usa como input estas imágenes. Sin embargo, la misión
espacial recientemente lanzada, Sentinel-2, permite mayor resolución temporal y espacial. Este trabajo
propondrá un flujo de trabajo para la obtención y procesamiento de estas imágenes con miras a la posible
integración de estas con CDCol.

1 INTRODUCCIÓN

Los cambios a los que somete la tierra por procesos naturales y antropogénicos cambian para siempre la
tierra. Detectar y hacer seguimiento a estos cambios permite a las sociedades tomar mejores decisiones
y pronosticar contextos futuros (Giuliani, G., et al. 2019).

La agenda para el desarrollo sostenible fue adoptada por todos los estados miembros en 2015. En este
marco, los objetivos de desarrollo sostenible (ODS) son la base para trabajar por un futuro mejor y más
sostenible para todos (Naciones Unidas. 2015). Los retos que traen los ODS implican mecanismos y
herramientas para no solo para lograr dichos objetivos, sino también para hacer seguimiento a los
indicadores con los cuales se monitorea el nivel de avance hacia estos objetivos. Específicamente,
Colombia acordó unos objetivos para mantener y proteger la vida silvestre y la naturaleza. Como
indicadores de estos objetivos, la agenda colombiana incluye “miles de hectáreas protegidas”, “porcentaje
de la superficie cubierta por bosque natural”, “Pérdida anualizada de bosque natural” y “áreas en proceso
de restauración” (Departamento Nacional de Planeación, 2019). Sin embargo, un monitoreo manual de
estos indicadores se hace costoso tanto en tiempo como monetariamente. Alternativas inicialmente
podrían ser la toma de fotografías desde aeronaves, toma desde tierra de fotografías en el lugar de interés,
uso de drones o uso de imágenes satelitales. Las fotografías desde aeronaves para clasificar y detectar
cambios en el suelo se vuelven una alternativa prometedora cuando las áreas de interés no son demasiado
grandes y el seguimiento no se debe hacer por tiempos prolongados. En caso contrario, se vuelven una
alternativa costosa, operacionalmente compleja y poco escalable. La misma situación ocurre para las
imágenes desde drones y fotografías desde tierra.

La información de satélites puede apoyar el logro de los ODS ya que proveen información y estadísticas
clave para la toma de decisiones (Metternicht, G., et al. 2020). A pesar de que esta información no contiene
métricas directas, su análisis y procesamiento pueden apoyar a países como Colombia en la consecución
de estos objetivos. Los satélites de observación terrestre permiten recolectar constantemente información
sobre cambios en la tierra. Sin embargo, el uso de estas imágenes conlleva también retos importantes.
Con el creciente número de imágenes, es necesaria una capacidad de procesamiento y almacenamiento
que permita que puedan ser empleadas para los análisis. Adicionalmente, un gran reto que conllevan todas
las imágenes de observación de la tierra desde el espacio son los efectos atmosféricos. Estos impiden o
dificultan el análisis de las imágenes ya que cubren y distorsionan la superficie terrestre. Con miras a un
sistema que permita la clasificación de suelos, monitorear cultivos, detectar cambios de uso de suelo a
una escala de país, se requiere una metodología que permita automatizar y procesar resultados listos para
la toma de decisiones, corrigiendo los efectos de la atmosfera.

En este trabajo se propone una metodología para la descarga y procesamiento de las imágenes de
Sentinel-2. Una de las misiones de satélites de acceso libre y con mayor resolucion tanto temporal como
espacial. Se comparan herramientas existentes para la automatización de la descarga de las imágenes.

Page 1 of 19
De igual manera, se comparan metodologías para la corrección atmosférica. Finalmente, se analiza la
solución encontrad en la que en el proceso de corrección atmosférica se logra una clasificación de suelos
a través de la herramienta SEN2COR.

2 Contexto

2.1 Objetivos

Hasta el momento, CDCol ha usado imágenes satelitales de la misión Landsat para hacer mapas de
cobertura de tierras y seguimiento a deforestación. Sin embargo, dada la disponibilidad y mejor resolución
espaciotemporal de las imágenes de la misión Sentinel-2, integración de estas imágenes con CDCol abriría
una ventana a nuevas y mejores aplicaciones como monitoreo de cultivos.

Se busca generar una metodología estándar y automatizable para la descarga y corrección de las
imágenes satelitales Sentinel-2. Adicionalmente se propondrá una herramienta para generación de mapas
de cobertura de suelos que permitirán ser un input en las clasificaciones más detalladas.

2.2 Antecedentes

La necesidad por detectar y analizar las condiciones y problemas ambientales no es nueva. En los 40s un
investigador independiente en Estados Unidos usó fotografías tomadas desde aeronaves en combinación
con imágenes desde tierra para construir y validar un mapa de cobertura terrestre sobre todo el país
norteamericano. En los 70s, el primer mapa que usaba imágenes satelitales fue construido sobre el sur de
Estados Unidos (Anderson, J. 1976). Con el lanzamiento de la primera misión Landsat en 1972, los mapas
de cobertura terrestre con imágenes satelitales empezaron a tomar fuerza (Defries, R. S. et al. 1999).

En los 80s, se empezaban a producir los mapas interpretados por computadores. Una comparación de
estos con los mapas producidos con interpretación humana de las imágenes determinaba que aún la
capacidad de cómputo era muy limitada para producir resultados tan buenos como los de los humanos
(Schneider, S. 1980). Con el tiempo las nuevas técnicas de computación como aprendizaje de máquina se
aplicaron a la producción de los mapas de cobertura. En los 90s se aplicaron técnicas de aprendizaje
supervisado y redes neuronales. Se encontró un prometedor resultado con las redes neuronales que
podría aplicarse con mejores recursos computacionales (Hepner, G. 1990).

En los 2000 se construye un mapa de cobertura de suelos global con una resolucion espacial de 1 km por
píxel usando el Radiómetro Avanzado de muy Alta Resolución (AVHRR, por sus siglas en inglés). Este
mapa segmentó la tierra en 12 clases sobre un área de 37294 x 1 km pixeles (Hansen, M., et al. 2000). El
mapa fue parte de una iniciativa conjunta de varias instituciones para generar mapas de cambios de uso
de tierra nacionales.

Proyectos privados también entraron en la carrera por construir una representación digital de la tierra. A
pesar de tener un enfoque distinto, en 2005 Google Earth hizo posible para cualquier persona con un pc
reciente obtener imágenes y versiones en 3D de la tierra. La noción de “la tierra digital”, un objetivo
planteado para que la población pudiese navegar por todo el mundo y a través de la historia de las
imágenes, para algunos se había cumplido con este instrumento (Grossner, K. 2006). Este mismo objetivo
condujo a la creación de un prototipo Alejandría digital, que aspiraba a facilitar la búsqueda y uso
personalizado de las imágenes satelitales con una interfaz de usuario (Smith, T. et al. 2001).

El aumento constante de misiones y, por tanto, del número de imágenes satelitales llevó a que en 2017 se
creara una herramienta para estandarizar su acceso y uso. El Cubo de Datos Abierto (ODC, por sus siglas
en inglés), adicionalmente, buscaba aumentar el valor e impacto de la información de los satélites
proveyendo una arquitectura abierta y gratuita, incentivando su uso en la comunidad científica. El ODC

Page 2 of 19
Programa/País Fuente de datos principal Periodo de estudio Escala
5 hectáreas - Mínima
CORINE (EU) Landsat TM/ETM+ 1990 - 2000 - 2006 Unidad de Mapeado
(MMU)

Intervalos de 5 - 10
EODS / Canadá Landsat TM/ETM+ Landsat píxel
años

NLCD / (EE.UU.) Landsat TM/ETM+ 1992 - 2001 Landsat píxel

NLC / Sudáfrica Landsat TM/ETM+ 1994/95 - 2000 MMU: 1 ha

NCAS - LCCP / Landsat MSS, TM, ETM+, 1972 - 2000, varios 50m (1979-88), 25m
Australia desde 1972; NOAA NDVI periodos de tiempo (desde 1989)

LCDB2 / Nueva
Spot and Landsat 7 ETM+ 1996/97 - 2001/02 Landsat píxel
Zelanda

ESA / Suiza, Países


Landsat TM/ETM+ 1990 - 2000 Landsat píxel
Bajos, España, Italia
Tabla 1 : Programas de cobertura o cambio en la cobertura de tierras hasta 2008 (Modificado de Herold, M. et al. 2008)

está basado en la implementación del Cubo de Datos de Geociencia Australiano (AGDC, por sus siglas en
inglés) adaptado para permitir la inclusión de una variedad amplia de usuarios (Killough, B. 2018). Como
resultado, ofrece un mecanismo para la ingesta (descarga), almacenamiento, procesamiento y análisis
eficiente de imágenes satelitales (Rizvi, S. R., et al. 2018). Numerosas implementaciones del ODC se han
llevado a cabo incluyendo Australia, Colombia, México, Suiza, Taiwán, y Tanzania. Cada una de estas
implementaciones se construyeron teniendo en cuenta los requerimientos y casos de uso de cada situación
particular. Por ejemplo, monitoreo del agua en la cuenca del Murray-Darling, Australia, seguimiento de la
cobertura de nieve en Suiza, y evaluación de capital ambiental y servicios ecosistémicos en México (Dhu,
T., et al. 2019).

Desarrollos recientes han ofrecido evidencia de la capacidad y flexibilidad del ODC. La iniciativa Datos de
Observación para Monitoreo de Ecosistemas (EODESM, por sus siglas en inglés), aspiró a ser una
aproximación para construir mapas de coberturas terrestre y sus cambios. Logró ser una herramienta para
producir mapas a un nivel nacional usando imágenes Landsat y ser integrable con el ODC (Lucas, R. et
al. 2019).

La metodología de estandarización de mapas de cobertura terrestre CORINE, desarrollada por la agencia


espacial europea (ESA, por sus siglas en inglés), fue aplicada en Colombia en 2009. El objetivo fue crear
un mapa de cobertura a escala 1:100000 entre 1992 y 2005 sobre los andes colombianos usando
imágenes de la misión satelital IKONOS. Este mapa fue desarrollado en conjunto con La Oficina Nacional
de Bosques francesa (ONF, por sus siglas en francés), el Instituto Geográfico Agustín Codazzi (IGAC), la
Corporación Autónoma Regional del Magdalena (Cormagdalena), y el IDEAM. Como resultado se encontró
aumento en áreas de cultivo y disminución en áreas de bosque y pastizales (Hernández, G., et al. 2009).

Page 3 of 19
CDCol fue desarrollado basado en el ODC para producir una plataforma unificada de análisis de imágenes
satelitales en Colombia. Se desarrollaron metodologías altamente replicables y se modificó la
implementación para mejor adaptación al área colombiana con imágenes Landsat. Esta herramienta fue
aplicada para calcular cobertura de bosques, deforestación, reservas de carbono y emisiones de carbono
por deforestación. Los desarrolladores del CDCol procuraron producir una herramienta que fuera
independiente de cualquier plataforma externa a la hora de administrar la información, de fácil
implementación de nuevos algoritmos para el análisis de las imágenes y altamente replicable (Ariza-
Porras, C., et al. 2017).

Dentro de los algoritmos implementados en CDCol se incluyen algoritmos de aprendizaje de máquina para
clasificación supervisada, árboles de decisión. Con este, se realizó un mapa de cobertura de tierra sobre
la Orinoquía colombiana. Así como este, hay múltiples algoritmos dentro del banco de algoritmos que están
disponibles en CDCol para los usuarios. La clasificación de tierras mencionada se realizó con las imágenes
Landsat con 7 clases temáticas que incluían cultivos, área urbana, pastizales, bosques, pradera, cuerpos
de agua, y otros logrando una precisión de 86% (Pachón, I., et al. 2018).

2.3 Imágenes satelitales de la misión Sentinel-2

El uso de imágenes satelitales para la observación terrestre es una técnica conocida como teledetección.
Este proceso incluye la captura y transferencia de datos desde los sensores satelitales hacia la tierra.
Adicionalmente, los sensores de los satélites, así como una cámara de fotografía, tienen especificaciones
que permiten comparar su desempeño. Específicamente, una característica clave de los satélites son sus
resoluciones. Hay diferentes tipos de resoluciones, la resolución espacial es la distancia capturada por la
parte más pequeña de una imagen. Generalmente se mide esta resolución como metros por píxel. Si un
píxel captura menor distancia la imagen tendrá mejor calidad. La resolucion espectral indica cuantas
bandas y de cuanto ancho es capaz de percibir el sensor. Mayor numero de bandas indican mejor
resolucion espectral. La resolución temporal indica con qué frecuencia pasa el satélite por un punto
específico de la tierra (Pardo, C., 2020).

Sentinel-2 es la segunda misión europea de constelación de satélites (Sentinel-2A y 2B) con una órbita
polar. Es decir, se mueve casi perpendicular a la línea del ecuador. Es importante no confundirse con la
enumeración que contienen las imágenes de esta constelación. Como se mencionó, el nombre Sentinel-2
hace referencia a que es la segunda misión del programa espacial europeo. Sentinel-2A hace referencia
al satélite A de la segunda misión de este programa. Adicionalmente, existen niveles de procesamiento de
las imágenes. Uno de estos niveles es el Sentinel-L2A, que se mencionará más adelante. Esta misión fue
diseñada para alimentar el sistema de monitoreo global para el ambiente y la seguridad (GMES, por sus
siglas en inglés). Los dos satélites de la constelación se mueven con un desfase de 180 grados, cada uno
con un Instrumento Multi Espectral (MSI). El MSI mide la radiación que refleja la tierra y que atraviesa la
atmosfera. Permite la captura de 13 bandas espectrales que incluyen los segmentos del espectro
electromagnético visibles y cercanos al infrarrojo (VNIR, por sus siglas en inglés) hasta los Infrarrojos de
Onda Corta (SWIR). Las bandas se distribuyen así:

- 4 bandas con 10 metros de resolución espacial que incluyen al azul, verde, rojo y cercano a infrarrojo.

- 6 bandas con 20 metros de resolución espacial: 4 bandas delgadas para caracterización de vegetación,
y dos bandas mas anchas que en el segmento SWIR para aplicaciones como detección de
nieve/hielo/nubes o la humedad de vegetación.

-3 bandas con 60 metros de resolución espacial principalmente para la detección de nubes y correcciones
atmosféricas.

Page 4 of 19
Figura 1: Bandas espectrales de MSI de Sentinel-2 y su resolución espacial. Tomado de Gatti, A., & Galoppo, A. (2018)

Dentro de los objetivos de la misión Sentinel-2 se incluye ofrecer una fuente operacional de información
óptica, con alta resolucion temporal, alta cobertura, oportuno, y confiable.

Los niveles de procesamiento de las imágenes Sentinel-2 que están disponibles para su descarga son
niveles 1C y 2A. El nivel 1C o L1C proporciona una imagen ortorectificada con reflectancia Top-of-
Atmosphere (TOA) con registros multiespectrales y máscaras de agua y nubes. Las máscaras son mapas
de pixeles que indican que pixeles están representando agua y cuales están representando nubes. Las
imágenes Sentinel L1C no son fieles a lo que se encuentra en la superficie terrestre ya que están
distorsionadas por los efectos atmosféricos. El nivel de procesamiento 2A o L2A, proporciona imágenes
de reflectancia ortorectificadas Bottom-of-Atmosphere (BOA) con registro multiespectral y una clasificación
de escenas por nubes, sombra de nubes, vegetación, tierra/desiertos, agua y nieve y se le considera como
la información lista para análisis.

Un producto Sentinel-2 se entrega al usuario dependiendo del área de interés que el mismo haya
seleccionado y los metadatos que crea relevantes. Este producto está compuesto por un grupo de
“Granules” o “Tiles” (para productos ortorectificados) que intersecan el área de interés definida por el
usuario. Un Granule es la partición mínima e indivisible de un producto que contiene todas las bandas
espectrales posibles. Un Tile consiste en una imagen ortorectificada de 100 km x 100 km en proyección
cartográfica de referencia UTM/WGS84. La órbita de los satélites sentinel-2 no es completamente
perpendicular al ecuador, en otras palabas, se tiene un grado de inclinación de la orbita para que recorra
las diferentes zonas de la tierra. Debido a esto, la construcción de un Tile puede llegar a ser la suma de
capturas de los dos satélites.

Page 5 of 19
Figura 2: Consolidación de tiles. Tomado de Gatti, A., & Galoppo, A. (2018)

A cada Tile se le asigna un nombre o código de referencia. Los Tiles que cubren Colombia se observan en
la figura 3.

Figura 3: Tiles sobre Colombia

Page 6 of 19
Por último, es importante entender cómo se nombran los productos Sentinel-2. Los productos tienen
una convención que facilita la identificación de cada una de las características de estos. Cada nombre
representa un Tile y se compone de:

MMM_DDDDDD_<id de la instancia>

Donde: <Instance_ID> = [Hora de la toma]_Nxxyy_ROOO_Txxxxx_[Discriminador de producto]

Campo Significado Longitud máxima Ejemplo


MMM Id de la misión (S2A o S2B) 3 S2A
n/a Separador 1 _
DDDDDD Descriptor semántico para describir 6 MSIL2A
nivel de procesamiento
n/a Separador 1 _
Hora de la Fecha y hora en UTC con resolución de 15 20171103T102201
toma segundos. YYYYMMDDThhmmss
n/a Separador 1 _
Nxxyy Base de producción 5 N0206
n/a Separador 1 _
ROOO Número de órbita 4 R065
n/a Separador 1 _
Txxxxx Numero de Tile 6 T32TNS
n/a Separador 1 _
Discriminador Cadena de caracteres que diferencia 15 20171106T195236
de Producto cada producto asociado a la toma.
Total caracteres sin la extensión 60
Tabla 2: Identificación de las partes del nombre de un producto Sentinel-2 Tomado de Gatti, A., & Galoppo, A. (2018)

Ejemplo del nombre de un producto:


S2A_MSIL2A_20171103T102201_N0206_R065_T32TNS_20171106T195236.SAFE

La extensión .SAFE es el Formato Estándar de Archivo para Europa (SAFE, por sus siglas en inglés)

2.4 Identificación del problema y de su importancia

En la literatura hay múltiples desafíos comunes en el uso de imágenes satelitales para desarrollar mapas
de cobertura de tierra. Principalmente, se encontró que la estandarización de las metodologías es un reto
importante, ya que sin esta no es posible comparar resultados de los mapas construidos (Nunnally, N.
1970). Dentro de estos desafíos se encontró la incompatibilidad e inconsistencia de las clases usadas para
la clasificación. Asimismo, la duplicación de esfuerzos donde metodologías ya probadas se desarrollaban
nuevamente para el mismo fin, lo cual, entre otras cosas, contribuye a la falta de estandarización. Otro reto
importante encontrado en múltiples proyectos fue la dificultad para reproducir metodologías de obtención
de la información y la dificultad de agrupar diferentes fuentes de datos.

En el mismo sentido, se encuentra el constante reto en la estandarización de los procesos aplicados a las
imágenes. Esta categoría abarca las dificultades para emplear una metodología común para la
ortorectificación de las imágenes, la corrección atmosférica y la georreferenciación de estas. La corrección
atmosférica incluye también la detección de las nubes presentes en la imagen, que consiste en generar
un mapa de pixeles donde se clasifica un píxel como nube o no nube dependiendo del color del píxel y su
intensidad.

Page 7 of 19
Una de las barreras para el uso de la información de observación terrestre es la dificultad para acceder y
manipular a la información. En parte porque la capacidad de computo requerida para manipular estas
imágenes es elevada y también porque, para su uso, se les requiere realizar un procesamiento para su
corrección y preparamiento. Las metodologías para realizar este proceso aún son poco conocidas para
usuarios finales, por lo que desincentivan su uso en proliferado.

3 DISEÑO Y ESPECIFICACIONES

3.1 Definición del problema

Con el aumento de las misiones espaciales para la observación terrestre la cantidad de información que
recibimos desde el espacio sobre nuestra superficie terrestre es cada vez mayor. La misión Landsat, por
ejemplo, ha recolectado a lo largo del tiempo alrededor de 2 petabytes de información y continúa
aumentando (Giuliani, G., et al. 2018).

De la misma forma, la reciente misión espacial Sentinel-2, ha proporcionado un acceso a información de


mejor resolución y abiertamente accesible para usuarios. El uso de estas imágenes para aplicaciones de
mayor precisión es prometedor. Sin embargo, el acceso, procesamiento y análisis eficiente y estandarizado
de esta información es materia de estudio y debate.

3.2 Especificaciones

Se busca encontrar una metodología estándar para la descarga, corrección y análisis de la información
proporcionada por los satélites Sentinel-2. Al hacerlo, se busca que se disminuyan las barreras
tecnológicas y de conocimiento para el uso de estas imágenes. Se espera incluir a una variedad amplia
de usuarios finales, con el objetivo de ampliar el valor del uso de estas imágenes. Por lo tanto, se requiere
que esta metodología incluya:

Escalabilidad: esto es, debe ser una metodología que aplique para computadores personales como para
maquinas con grandes capacidades como CDCol.

Replicabilidad: uno de los grandes problemas actuales es que soluciones disponibles son difícilmente
reproducibles, lo que evita que usuarios puedan desplegar la solución y puedan conseguir y aportar a los
resultados ya obtenidos.

Capacidad para ser Automatizable: Para casos en que los análisis de cobertura de tierras se requieran
sobre extensiones de tierra importantes y a lo largo de largos periodos, se requiere una solución para que
especificando parámetros se puedan obtener las imágenes sin importar el volumen de los datos.

Información lista para análisis: Debido a que el proceso de corrección de las imágenes es un proceso
transversal a todas las imágenes que se vayan a analizar, proporcionar una metodología en la que las
imágenes disponibles ya se encuentren listas para ser usadas por los analistas incentivaría en gran medida
su uso ya que requerirían menores recursos.

Eficiencia económica: Múltiples soluciones para obtener las imágenes Sentinel-2 incluyen costos a pesar
de que la información esta disponible gratuitamente. Esto se debe a que el acceso a la información es
gratuito, pero, al ser volúmenes de información grandes incurren en costos de transferencia de datos.

3.3 Restricciones

Dada la disponibilidad libre de costos para las imágenes Sentinel-2, se debe encontrar una forma de
obtener estas imágenes sin incurrir en gastos por la descarga. Funcionar en pcs personales de mínimo 8

Page 8 of 19
GB de memoria RAM y con un almacenamiento de 512 GB. Este almacenamiento es necesario por el
volumen de la información que contienen las imágenes satelitales.

4 IMPLEMENTACIÓN

4.1 Descripción de la implementación

La implementación de esta metodología se dividió en las etapas de descarga, corrección y construcción


del mapa de cobertura de tierras.

4.1.1 Ingesta o descarga de imágenes

En esta etapa se evaluaron algunas metodologías disponibles. En primer lugar, se evaluó el método
manual de descarga de las imágenes sentinel-2 desde la plataforma desarrollada por ESA, Copernicus
(https://scihub.copernicus.eu/). Esta plataforma permite a sus usuarios navegar intuitivamente por una
interfaz que ofrece un mapa para seleccionar y filtrar el área de interés por las fechas que se quieren
analizar. Se debe estar registrado y se debe iniciar sesión en la plataforma. La transferencia de datos a
través de esta plataforma es gratuita, así como el acceso a las imágenes. Sin embargo, aplica un límite de
descarga de máximo 2 descargas concurrentes por usuario. La figura 4 muestra una selección de área de
interés y filtro por fecha y producto.

El segundo método para obtención de las imágenes implementado fue Google Cloud Platform. Allí las
imágenes se encuentran en un conjunto de datos público que se pueden consultar por Big Query también.
Estas imágenes son las producidas por el satélite A de la constelación en niveles de procesamiento L1C
y L2A. Consultas a esta plataforma permiten filtrar programáticamente las imágenes por área de interés,
fechas y nivel de procesamiento entre otros. Para implementar este método se realizó un script en Python
que descarga los metadatos de las imágenes y a partir de esta información construye el resto de la imagen.
Dentro de este método también es posible agrupar la plataforma de Amazon Web Services, que de manera
similar ofrece un conjunto de datos accesible públicamente que se puede filtrar por área de interés,
cobertura de nubes, y fechas.

La aproximación anterior se probó debido a que el cubo de datos suizo hace uso de esta para su
integración con imágenes Sentinel. Sin embargo, debido a problemas con versiones de las dependencias
en la instalación, no fue posible reproducir los resultados con este cubo de datos. A pesar de esto, con
esta implementación se logra establecer un esquema para un flujo de trabajo y se emplean ideas
implementadas en este cubo para ejecutar este proyecto.

Por último, se probó una librería de Python que usa directamente los servicios del API de Copernicus para
descargar las imágenes. Por lo tanto, restricciones de la plataforma Copernicus aplican para esta librería
también. Sentinelsat es una librería de código abierto creada con el propósito de buscar, filtrar y descargar
productos Sentinel desde Copernicus Access Hub (Wille, M. 2020). Ofrece los productos de los satélites
A y B, por lo que la resolucion temporal es la máxima posible para la misión Sentinel.

Page 9 of 19
Figure 4: Selección del área de interés en Copernicus Open Access Hub

4.1.2 Corrección de las imágenes Sentinel-2-L1C

Hay varias razones para motivar a realizar las correcciones atmosféricas y no descargar las imágenes
corregidas. Entre ellas se encuentra que teniendo control de la corrección se pueden aplicar ejecuciones
especificas que se adapten a las condiciones del terreno de interés. Por ejemplo, el uso de Modelos de
Elevación Digital (DEM) permiten incluir en la corrección de la imagen la profundidad de la tierra que se
esta observando. Lo cual, dependiendo de las características del terreno puede resultar en una menor o
mayor calidad de la corrección.

Como se mencionó antes, la disponibilidad de imágenes Sentinel-2 incluye las imágenes con niveles de
procesamiento L1C y L2A. Las imágenes L1C están ortorectificadas, por lo que, si se quiere realizar el
procesamiento de estas imágenes y tener control sobre su ejecución, se hace necesario realizar su
corrección atmosférica. Existen también varias herramientas para realizar la corrección atmosférica de
imágenes. Ejemplos de estas son MAJA, 6S, y SEN2COR.

SEN2COR es la herramienta usada por el cubo de datos suizo para realizar la corrección de las imágenes
L1C. Adicionalmente, es la herramienta escogida por ESA para ofrecer los productos L2A en su plataforma.
Esta herramienta se basa en tablas de búsqueda ejecutadas con libRadtran, modelo de transferencia de
radiación. Estudios han demostrado que el funcionamiento de SEN2COR es muy preciso, encontrando
correlaciones de mas de 0.98 para clasificaciones y correcciones y un 92% de las muestras probadas con
esta herramienta dentro del requerimiento. La radiometría de reflectancia de la superficie se encontró fuera
de las especificaciones para bandas 5 y 12 pero dentro de los requerimientos para las demás bandas. Esto
quiere decir que produce resultados acertados y que es una herramienta recomendable para la corrección
y clasificación de imágenes Sentinel-2 (Louis, J., et al. 2019).

4.1.3 Ejecución de algoritmos de análisis y cobertura de suelos

Una vez se tienen las imágenes corregidas es posible usarlas para realizar análisis para aplicaciones
especializadas. Para el caso de este proyecto se buscaba realizar una clasificación de suelos, por lo que
se encontraron dos alternativas automatizables para lograr dicho objetivo.

Page 10 of 19
La primera opción, una colección de paquetes en Python de código abierto llamada eo-learn. Está diseñada
para facilitar el acceso y procesamiento de secuencias espaciotemporales de una forma automática. Se
usó esta librería para implementar algoritmos que pudieran llevar a obtener una cobertura de suelos. Para
hacer esto, se desarrollaron scripts en Python siguiendo el flujo de trabajo propuesto por esta librería. Eo-
learn ofrece una gran flexibilidad ya que define áreas de interés georreferenciadas, asocia tareas a estas
áreas, ejecuta algoritmos que pueden ser nuevos o ya desarrollados y genera un flujo altamente replicable
para otras áreas de interés. Sin embargo, su uso se vio limitado por su capacidad actual de descarga de
imágenes.

En segunda instancia, se analizó con mayor profundidad el resultado de SEN2COR. Como resultado de
este análisis se pudo encontrar que parte de los productos que produce esta herramienta es una mascara
con diferentes clasificaciones de pixeles. Para poder observar esta mascara se usa la herramienta QGIS,
donde es posible importar esta imagen (en la opción agregar raster) en formato JP2 y se aplica un filtro de
color personalizado. Allí se relaciona cada clase clasificada con un color y se aplican los cambios. Los
resultados muestran una imagen clasificada por colores discretos. Esto se explica los siguientes pasos:

Agregar la imagen producida por SEN2COR. El resultado de interés se encuentra en el Path


“…/ProductName.SAFE/GRANULE/ID_Instancia/IMG_DATA/R20m/***_SCL_**.jp2” (Figuras 5 y 6).

Al agregar esta imagen, se tiene como resultado una imagen en escala de grises. Esta imagen es la
clasificación de suelos, sin embargo, aún no se han especificado los colores discretos de cada clase. Para
esto se seleccionan propiedades de la imagen (Figura 7), en la pestaña de simbología y se selecciona
“Singleband pseudocolor” (Figura 8) y se empiezan a agregar las clases de colores con su descripción
(Figura 9). Al terminar y aplicar los cambios se obtiene la clasificación de la tierra.

Figura 5: Proceso para agregar una imagen a QGIS (1)

Figura 6: Proceso para agregar una imagen a QGIS (2)

Page 11 of 19
Figura 7: Proceso para visualizar la clasificación generada (1)

Figura 8: Proceso para visualizar la clasificación generada (2)

Figura 9: Proceso para visualizar la clasificación generada (3)

Page 12 of 19
4.2 Resultados esperados

Uno de los problemas encontrados en la revisión literaria fue la duplicación de esfuerzos a la hora de tratar
y procesar las imágenes satelitales para producir, por ejemplo, mapas de cobertura terrestre. Como se
mencionó anteriormente, se desarrollaban herramientas nuevas para atacar problemas ya trabajados. Esta
fue la razón por la que se realizó una búsqueda de herramientas y desarrollos que ya hubiesen trabajado
los retos de descarga, corrección y análisis de las imágenes Sentinel-2. Una de estas herramientas fue el
cubo de datos suizo que, usando la herramienta SEN2COR producía imágenes listas para análisis. Con
esta experiencia se decidió trabajar para reproducir el cubo de datos suizo para poder reproducir también
sus resultados y poder adaptar esta implementación al caso colombiano. Dadas las dificultades que se
encontraron con las dependencias de esta implementación, se decidió estudiar los componentes
principales de esta solución para procurar producir resultados similares. Es allí donde se decidió tomar
directamente la herramienta SEN2COR para producir resultados propios. Con esta implementación se
esperaba encontrar un flujo de trabajo que permitiera desde la descarga hasta el análisis de las imágenes.

Por el mismo motivo, se buscaron alternativas que hubiesen atacado el problema de proporcionar un flujo
de trabajo con imágenes Sentinel-2. Se esperaba encontrar una opción eficiente, replicable, estándar y
posiblemente automatizable para implementar esta metodología en el cubo de datos colombiano. Esto
llevó a que se pudieran encontrar librerías de código abierto como eo-learn que ofrecen flexibilidad desde
la descarga y corrección hasta la ejecución de algoritmos.

6 RESULTADOS

Como resultado del proyecto, se logró identificar y proponer una metodología que es altamente flexible y
automatizable. Para ingesta, el resultado más prometedor se ve con la librería Sentinelsat, con la cual la
flexibilidad para peticiones hacia la plataforma de Copernicus, el filtrado de imágenes y la gratuidad de la
transferencia de datos, la hacen la opción más viable.

Para la corrección atmosférica de las imágenes se tienen opciones por un lado flexible, y por otro lado ágil.
El hecho de que recientemente se haya permitido el acceso libre a las imágenes corregidas en el portal
Coperincus y, por tanto, con la librería Sentinelsat, hace que se deba tomar la decisión de si se prefiere
tener control sobre las correcciones que se hacen. Si se decide priorizar el control sobre las correcciones
la opción viable para la corrección es SEN2COR ya que permite modificaciones y ajustes en la ejecución.

Por otro lado, si se decide usar las correcciones que se encuentran disponibles en Copernicus, se debe
tener en cuenta una inconsistencia encontrada en el API a la hora de descarga de imágenes Sentinel-2-
L2A. Se encontró que la búsqueda por nombre de Tile es inconsistente con la información encontrada
manualmente en la plataforma. Por lo tanto, una forma de resolver esto es evitar la búsqueda por nombre
del Tile, en vez de esto, usar un parámetro de referencia de coordenadas. Con este parámetro, el API de
Copernicus busca los Tiles que se intersequen con la forma zona seleccionada y no se usa el nombre del
Tile para la búsqueda. El área de interés se debe ingresar como parámetro como un archivo de
coordenadas con extensión GEOJSON.

Para la ejecución de algoritmos de clasificación de tierras se obtuvieron los siguientes resultados usando
las dos opciones automatizables disponibles.

6.1 USANDO LA LIBRERÍA EO-LEARN

Con eo-learn se logró obtener una medida de la vegetación conocida como Índice de Diferencia de
vegetación Normalizado (NDVI) así como la detección de agua y de nubes. Sin embargo, dadas
restricciones que se discutirán más adelante, esta implementación necesita trabajo adicional para poder
ser una solución eficiente en costos. Las figuras 9 y 10 muestran los resultados obtenidos con esta librería.

Con esta librería no solo es posible producir resultados de mapas de coberturas de suelos. También se
puede exportar un flujo de trabajo con tareas determinadas sobre áreas de interés específicas. Por este

Page 13 of 19
motivo, esta librería tiene un potencial amplio para generar replicabilidad. Adicionalmente, al ser de
código abierto, permite desarrollos y aportes de la comunidad. No solo es eficiente para la comunidad,
sino que es escalable ya que, al estar distribuido en tareas, se puede implementar en varias máquinas
con un poder de procesamiento agregado mayor, como en CDCol.

Figura 10: NDVI sobre área de interés usando eo-learn

6.2 RESULTADOS CON SEN2COR

Como se mencionó, SEN2COR no solo realiza la corrección atmosférica de las imágenes, sino que en el
proceso produce una clasificación de la imagen. Esta clasificación tiene 7 clases incluyendo nubes,
sombra de nubes, vegetación, tierra/desiertos, agua y nieve. Esta clasificación realizada es una
aproximación que puede ser usada como input para la ejecución de otros algoritmos especializados
como la detección de cultivos. Adicionalmente, se encontró que es fácilmente replicable ya que no tiene
dependencias. Es automatizable y flexible ya que se puede tener control de la ejecución y se puede
ejecutar como parte de una rutina. Con esto, es prometedor su uso para casos de ejecuciones en zonas
específicas de la topografía colombiana.

Figuras 12 y 13 muestran la clasificación para un área despejada del departamento del Tolima. Figuras
14 y 15 muestran la clasificación para un área con nubes.

Page 14 of 19
Figura 11: Área de interés del Tolima (despejada)

Figura 12: Clasificación de la tierra sobre el área del Tolima (despejada)

Page 15 of 19
Figura 13: Área de interés sobre Tolima (con nubes)

Figura 14: Clasificación de suelo del área de interés sobre Tolima (con nubes)

Page 16 of 19
7 CONCLUSIONES

7.1 Discusión

Los resultados muestran el potencial de herramientas como eo-learn y SEN2COR para volverse parte de
un marco de trabajo como el CDCol para integrarlo con imágenes Sentinel-2. Se logró obtener los mapas
de clasificación en ejecuciones locales, con eficiencia económica y con flexibilidad para las ejecuciones.
Evaluación cualitativa de los resultados muestran una buena aproximación hacia la clasificación. Esto se
puede usar como input para algoritmos más específicos de clasificación. Por ejemplo, para el monitoreo
de cultivos usar los pixeles que sean marcados como vegetación y no vegetación para así detectar los
cambios en estos. Adicionalmente, para las aplicaciones más específicas, se requiere clasificar con mayor
detalle esos pixeles de vegetación como cultivos o no cultivos para así poder usar ese producto intermedio
para detectar vegetación especifica sobre los cultivos deseados.

Se plantea un potencial de desarrollo con eol-learn ya que se encontró una limitante económica. Esta
librería está integrada con AWS a través de Sentinel Hub, un portal de análisis de las imágenes. Razón
por la cual, a través de estas plataformas la transferencia de datos tiene un limite gratuito mensual a partir
del cual se requiere una suscripción. Por otro lado, ya que es una librería de código abierto, los
desarrolladores se muestran abiertos a colaboraciones para implementar análisis con imágenes que se
tengan descargadas localmente.

Una opción prometedora que no se logró llevar a cabo fue el despliegue del cubo de datos suizo. Esto
muestra la dificultad que hay para desarrollar y mantener una metodología abierta a usuarios que permita
que la comunidad pueda aportar con desarrollos. Por otro lado, opciones como SEN2COR y eo-learn solo
requieren instalación de librerías que están listas para ser usadas. Estandarización con estas
herramientas, por otro lado, sí generaría un incentivo para que desarrolladores trabajen con esta
metodología.

7.2 Trabajo futuro

A futuro, se podrían usar las mascaras producidas por la herramienta SEN2COR para potenciar o validar
desarrollos de clasificación con imágenes satelitales que se hagan usando aprendizaje de máquina.
Combinación de estas aproximaciones puede potencialmente producir resultados acertados.

Adicionalmente, el uso del flujo de trabajo con estas herramientas para aplicaciones más especializadas
se incentiva. Con la facilidad de obtención de imágenes corregidas y listas para análisis, el desarrollador
se puede concentrar en los algoritmos de clasificación, invirtiendo menos recursos de tiempo en
correcciones y descarga.

Por otro lado, la librería eo-learn, al ser un marco de trabajo desde su concepción puede ser aplicado a
imágenes de otros sensores. Por lo que esta metodología puede ser potencialmente escalable para
sensores satelitales futuros y de mayor precisión. Por otro lado, hay espacio para que esta librería sea
mas eficiente en costos al desarrollar métodos para que la librería use imágenes descargadas sin
necesidad de asumir costos de transferencias de datos.

8 REFERENCIAS

Giuliani, G., Chatenoux, B., Honeck, E., & Richard, J. P. (2018, July). Towards sentinel-2 analysis ready
data: A swiss data cube perspective. In IGARSS 2018-2018 IEEE International Geoscience and Remote
Sensing Symposium (pp. 8659-8662). IEEE.

Naciones Unidas, 2015. Transformar nnuestro mundo: La agenda 2030 para el desarrollo sostenible.
Resolucion de aprobación por la asamblea general. Recuperado de

Page 17 of 19
https://www.un.org/ga/search/view_doc.asp?symbol=A/RES/70/1&Lang=S. Accedido el 1ro de julio de
2020

HAO, P. Y., TANG, H. J., CHEN, Z. X., Le, Y. U., & WU, M. Q. (2019). High resolution crop intensity mapping
using harmonized Landsat-8 and Sentinel-2 data. Journal of Integrative Agriculture, 18(12), 2883-2897.

Roy, D. P., Huang, H., Boschetti, L., Giglio, L., Yan, L., Zhang, H. H., & Li, Z. (2019). Landsat-8 and
Sentinel-2 burned area mapping-A combined sensor multi-temporal change detection approach. Remote
Sensing of Environment, 231, 111254.

Giuliani, G., Camara, G., Killough, B., Minchin, S. Earth Observation Open Science: Enhancing
Reproducible Science Using Data Cubes” (2019). 1.

Departamento Nacional de Planeación [National Planning Department] (2019). Sustainable Development


Goals. 15. Life on Land. https://www.ods.gov.co/en/goals/life-on-land

Metternicht, G., Mueller, N., & Lucas, R. (2020). Digital Earth for Sustainable Development Goals. In Manual
of Digital Earth (pp. 443-471). Springer, Singapore.

Anderson, J. R. (1976). A land use and land cover classification system for use with remote sensor data
(Vol. 964). US Government Printing Office.

Langford, M., & Bell, W. (1997). Land cover mapping in a tropical hillsides environment: a case study in the
Cauca region of Colombia. International Journal of Remote Sensing, 18(6), 1289-1306.

Nunally, N.; Witmer, R. Remote sensing for land-use studies. 1970. Vol 36. (https://trid.trb.org/view/93580)

Defries, R. S.; Townshend J. (1999). “Global land cover characterization from satellite data: from research
to operational implementation?” Global Ecology and Biogeography, 8: 367–379

Herold, M., Woodcock, C. E., Loveland, T. R., Townshend, J., Brady, M., Steenmans, C., & Schmullius, C.
C. (2008). Land-cover observations as part of a global earth observation system of systems (geoss):
progress, activities, and prospects. Ieee Systems Journal, 2(3).
https://doi.org/10.1109/JSYST.2008.925983

Grossner, K., & Clarke, K. (2007). Is Google Earth,“Digital Earth?”: Defining a vision. In Proceedings of the
Fifth International Symposium on Digital Earth. California.

Terence R. Smith, Greg Janee, James Frew, and Anita Coleman. (2001). The Alexandria digital earth
prototype. In Proceedings of the 1st ACM/IEEE-CS joint conference on Digital libraries (JCDL ’01).
Association for Computing Machinery, New York, NY, USA, 118–119. DOI:
https://doi.org/10.1145/379437.379463

Guo, H., Nativi, S., Liang, D., Craglia, M., Wang, L., Schade, S., ... & Shirazi, Z. (2020). Big Earth Data
science: an information framework for a sustainable planet. International Journal of Digital Earth, 1-25.

Killough, B. (2018, July). Overview of the open data cube initiative. In IGARSS 2018-2018 IEEE
International Geoscience and Remote Sensing Symposium (pp. 8629-8632). IEEE.

Rizvi, S. R., Killough, B., Cherry, A., & Gowda, S. (2018, July). The Ceos data cube portal: A user-friendly,
open source software solution for the distribution, exploration, analysis, and visualization of analysis ready
data. In IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium (pp. 8639-
8642). IEEE.

Dhu, T., Giuliani, G., Juárez, J., Kavvada, A., Killough, B., Merodio, P., ... & Ramage, S. (2019). National
open data cubes and their contribution to country-level development policies and practices. Data, 4(4), 144.

Page 18 of 19
Lucas, R., Mueller, N., Siggins, A., Owers, C., Clewley, D., Bunting, P., ... & Metternicht, G. (2019). Land
Cover Mapping using Digital Earth Australia. Data, 4(4), 143.

Hernández, G. M. V., & Acevedo, J. A. A. (2009). Implementación de la metodología Corine Land Cover
con imágenes Ikonos [The Corine land cover method base don Ikonos images]. Revista Ingenierías
Universidad de Medellín, 8(15), 39-52.

Ariza-Porras, C., Bravo, G., Villamizar, M., Moreno, A., Castro, H., Galindo, G., ... & Lozano, P. (2017,
September). CDCol: A geoscience data cube that meets colombian needs. In Colombian Conference on
Computing (pp. 87-99). Springer, Cham.

Pachón, I., Ramírez, S., Fonseca, D., Lozano-Rivera, P., Ariza, C., Mancipe, M. P., ... & Becerra, M. T.
(2018, July). Random forest data cube based algorithm for land cover classification: A colombian case. In
IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium (pp. 8651-8654).
IEEE.

Pardo, C., (2020). Metodología para el monitoreo de cultivos a partir de imágenes satelitales con Machine
Learning. Universidad de Los Andes.

Gatti, A., & Galoppo, A. (2018). Sentinel-2 products specification document. Available online (accessed
June 26, 2020) https://sentinel.esa.int/documents/247904/685211/Sentinel-2-Products-Specification-
Document

Huck, A. (n.d.). Products and Algorithms – Sentinel-2 MSI Technical Guide – Sentinel Online. Retrieved
June 26, 2020, from https://sentinel.esa.int/web/sentinel/technical-guides/sentinel-2-msi/products-
algorithms

Wille, M., Clauss, K. (June 2020). Sentinelsat Documentation. Retrieved June 26, 2020 from
https://buildmedia.readthedocs.org/media/pdf/sentinelsat/master/sentinelsat.pdf

Louis, J., Pflug, B., Main-Knorn, M., Debaecker, V., Mueller-Wilm, U., Iannone, R. Q., ... & Gascon, F.
(2019, July). Sentinel-2 global surface reflectance level-2A product generated with Sen2Cor. In IGARSS
2019-2019 IEEE International Geoscience and Remote Sensing Symposium (pp. 8522-8525). IEEE.

Koprivec, F., Peternelj, J., & Kenda, K. Feature Selection in Land-Cover Classification using EO-learn.

Page 19 of 19

También podría gustarte