Documentos de Académico
Documentos de Profesional
Documentos de Cultura
resolución actuales implica algunos desafíos técnicos que deben afrontarse. La plataforma de
Google Earth Engine (GEE) proporciona un marco para el desarrollo de algoritmos y productos
creados sobre estos datos de una manera fácil y escalable. En este documento, aprovechamos las
capacidades de la plataforma GEE para explotar la gran cantidad de información en la dimensión
temporal mediante el procesamiento de una larga serie de imágenes de satélite. Un algoritmo de
detección de nubes para Landsat-8, que utiliza imágenes anteriores de la misma ubicación para
detectar nubes, se implementa y se prueba en la plataforma GEE.
INTRO
La proliferación de satélites de observación de la Tierra (EO), como Landsat-8 [1] o Sentinel-2 [2],
junto con sus altas resoluciones espaciales y espectrales, ha aumentado la cantidad de datos que
se procesarán exponencialmente. Se requiere acceso rápido a archivos distribuidos, alta
automatización del sistema e implementaciones paralelas y escalables para manejar estos
enormes volúmenes de datos geoespaciales. Además, algunos de los pasos de preprocesamiento
de las imágenes adquiridas por estos sensores, como la detección de nubes, deben llevarse a cabo
operativamente dentro de la cadena estándar de procesamiento de instrumentos [3]. Por lo tanto,
los algoritmos de detección remota particularmente exigentes se beneficiarían de las plataformas
existentes que nos permiten implementarlos en un grupo distribuido de recursos de computación
en la nube. En este contexto, la plataforma del motor de Google Earth (GEE,
earthengine.google.com) se ha revelado como uno de los desarrollos más prometedores para el
acceso y análisis de datos de las ciencias de la Tierra [4, 5]. La infraestructura de la nube de Google
contiene un catálogo de múltiples petabytes de imágenes satelitales de satélites conocidos, que
incluyen Landsat, Sentinels y MODIS entre otros1. Además, proporciona herramientas de
programación para acceder, operar y visualizar dichos datos de una manera fácil y escalable. Por lo
tanto, la conveniencia de la plataforma Este trabajo ha sido respaldado por Google Inc. bajo el
Premio del motor de Google Earth (GEE) titulado 'Detección de nubes en la nube' (L. Gomez-
Chova), y el Ministerio de Economía y Competitividad de España ´ (MINECO) bajo los proyectos
TEC2016-77741-R y TIN2015-64210-R. es doble: (1) otorga acceso a una vasta imagen satelital, sin
la molestia de descargarla, usando la misma sintaxis independientemente del sensor satelital; y (2)
la carga computacional de entrenamiento y prueba del modelo se realiza en la plataforma
distribuida paralela GEE, que realiza automáticamente una gestión eficiente de la memoria y
distribuye la potencia de procesamiento en las máquinas virtuales, evitando problemas de
concurrencia, que comúnmente surgen en el contexto de alta información. Procesamiento de
volumen. En este documento, para ilustrar las ventajas prácticas del GEE, implementamos un
algoritmo multitemporal de detección de nubes para series de tiempo de imágenes satelitales de
alta resolución de Landsat-8. La infraestructura de GEE otorga acceso al catálogo completo de
Landsat-8 y a una plataforma de computación distribuida paralela [6], que son requisitos
esenciales para procesar series de tiempo de imágenes satelitales de manera operativa. La Sección
2 presenta las características más relevantes de la plataforma del motor de Google Earth. La
sección 3 presenta la metodología de detección de nube implementada. En la sección 4,
describimos las series de tiempo utilizadas en los experimentos e ilustramos los resultados del
método propuesto. Finalmente, la sección 5 concluye el trabajo y describe el trabajo futuro.
LA PLATAFORMA
Como se mencionó anteriormente, las principales ventajas de la plataforma GEE son el acceso a un
catálogo completo y completo de productos de detección remota y la capacidad de procesar todos
estos productos muy rápidamente a través de una paralelización masiva. El catálogo de datos GEE
está compuesto por datos de Landsat 4, 5, 7 y 8 procesados por el Servicio Geológico de los
Estados Unidos (USGS), varios productos MODIS, incluidos composites globales, recientemente
imágenes de satélites Sentinel 1 y 2, y muchos más. Todos los datos son preprocesados y
georreferenciados, facilitando su uso. Además, los científicos también pueden cargar sus propios
datos en formatos raster o vectoriales para analizarlos y trabajar con ellos. El motor de
computación GEE se basa en cientos de máquinas de centros de datos de Google, y la
paralelización de los algoritmos programados es sencilla utilizando la interfaz de programación de
aplicaciones (API) proporcionada. Los cálculos solo se realizan realmente en los datos requeridos, y
cuando el usuario los solicita. Además, los resultados calculados se almacenan en caché, de modo
que cuando los usuarios solicitan el mismo procesamiento no es necesario e puede acceder al GEE
utilizando un IDE basado en la web, una API de JavaScript o una API de Python. Permite análisis
geoespaciales complejos que incluyen superposición, álgebra de mapas, operaciones de matriz,
procesamiento de imágenes, clasificación, detección de cambios, análisis de series de tiempo,
extracción de estadísticas de imágenes, etc. También incluye herramientas para visualizar
resultados como mapas, cuadros, tablas e imágenes que Se puede exportar. Usando los lenguajes
de programación JavaScript o Python, los usuarios tienen acceso a los algoritmos proporcionados,
o pueden desarrollar los suyos propios. La paralelización de los algoritmos se basa en el modelo de
programación MapReduce [7]. Los usuarios definen sus algoritmos en términos de funciones de
mapa y de reducción, y la plataforma subyacente paraleliza automáticamente el cálculo en una
gran cantidad de clústeres. En el modelo de programación MapReduce, el cálculo toma un
conjunto de pares clave-valor de entrada y produce un conjunto de pares clave-valor de salida
correspondientes. En este contexto, un valor puede ser cualquier objeto, por ejemplo, un valor
escalar, un vector, una matriz u objetos estructurados en general, mientras que la clave es un
identificador único asociado con él. El usuario debe proporcionar tanto el mapa como las
funciones de reducción. La función de mapa toma un solo par de entrada y produce un conjunto
de pares de clave-valor intermedio. El algoritmo MapReducer agrupa todos los valores que tienen
la misma clave y pasa estos grupos a la función de reducción. La función de reducción recibe de
manera iterativa una clave y sus valores asociados y combina estos valores formando un conjunto
reducido de valores (generalmente uno), que son la salida final de la cadena MapReduce. En la
plataforma GEE, los usuarios generalmente tienen que proporcionar solo la función de mapa. Por
ejemplo, cuando se trabaja con una serie temporal completa de imágenes Landsat (una colección
de imágenes que utiliza la terminología GEE), se puede definir una función de mapa que realice
una operación utilizando todas o algunas bandas de cada imagen en la colección de imágenes. Una
vez que se define la función de mapa, el usuario la aplica a toda la colección de imágenes
simplemente llamando al método de mapa API para este tipo de objetos. Finalmente, para
obtener resultados, el usuario llama a uno de los "reductores" proporcionados por la plataforma
GEE, que cubre casi todas las operaciones de imagen posibles, como calcular la media, la mediana,
la varianza, el máximo, el mínimo, las operaciones lógicas (y, o no) , ajuste lineal, etc. En la
siguiente sección explicaremos el algoritmo y los detalles de su implementación en la plataforma
GEE.
RESULTADOS
CONCLUSIONES