Está en la página 1de 4

UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO

PROGRAMA DE INGENIERIA DE SISTEMAS


INTELIGENCIA ARTIFICIAL

La tarea consiste en realizar un informe, donde se describa el conjunto


de datos a utilizar en el producto acreditable 2.

Los puntos del informe son:


1. Nombre del conjunto de datos:
 RicePAL

2. Link de descarga.
 https://drive.google.com/file/d/
1piYZa02Cgvwuj5Un8Df_N3yDmt8xTArZ/view?usp=sharing

3. Resumen del conjunto de datos.


 Este repositorio contiene los códigos para el artículo: Predicción
del rendimiento del arroz con datos Multi-Temporal Sentinel-2 y 3D
CNN: Un estudio de caso en Nepal. La estimación del rendimiento
de los cultivos es una cuestión importante del seguimiento de los
cultivos que sigue siendo un desafío particular en los países en
desarrollo debido al problema de la disponibilidad de datos
oportunos y adecuados. Mientras que los sistemas agrícolas
tradicionales se basan principalmente en datos escasos de
estudios sobre el terreno, las imágenes de teledetección
multitemporales y multiespectrales disponibles de forma gratuita
son herramientas excelentes para respaldar estos sistemas
vulnerables al monitorear y estimar con precisión los rendimientos
de los cultivos antes de la cosecha. En este contexto, se presenta
el uso de imágenes Sentinel-2 (S2), con resoluciones espaciales,
espectrales y temporales medias, para estimar los rendimientos de
los cultivos de arroz en Nepal como estudio de caso. Se construye
una nueva base de datos de cultivos de arroz a gran escala
(RicePAL) compuesta por datos multitemporales de S2 y clima /
suelo de los distritos de Terai en Nepal. Luego se propone una
nueva red neuronal convolucional 3D (CNN) adaptada a estas
restricciones de datos intrínsecos para la estimación precisa del
rendimiento de los cultivos de arroz. Y para finalizar se estudia el
efecto de considerar diferentes configuraciones de datos
temporales, climáticos y de suelo en términos del rendimiento
logrado por el enfoque propuesto y varios métodos de estimación
de rendimiento basados en CNN y regresión de última generación.

4. Descripción de cada característica.


 La Tabla resume la descripción de los datos y las fuentes de
información que se han considerado para construir el
conjunto de datos de estimación del rendimiento del cultivo
de arroz.

Datos Fuente

B02-B08, B8A, B11 y B12 https://scihub.copernicus.eu/ acceso

Sentinel-2 NDVI Calculado utilizando las bandas B04 y


B08
Máscara de nube Disponible con productos L1C

Clima https://www.dhm.gov.np/ acceso


Auxiliar
Suelo https://krishiprabidhi.net/

Máscara de cultivo de
Basado en Qamer.
arroz
Sobre el terreno Rendimiento del cultivo
https://mold.gov.np/
de arroz

a) Datos de Sentinel-2
Los sensores S2 proporcionan un total de 13 bandas espectrales con
una resolución espacial que oscila entre 10 m y 60 m. Entre estas
bandas espectrales, las bandas clásicas RGB e infrarrojo cercano (NIR)
con resolución espacial de 10 m están dedicadas a aplicaciones
terrestres. Entre las seis bandas a una resolución de 20 m, se utilizan
cuatro bandas estrechas en el dominio espectral del borde rojo de la
vegetación y dos bandas grandes infrarrojas de onda corta (SWIR) para
la detección de nieve / hielo / nubes y la evaluación del estrés por
humedad. Las bandas restantes a 60 m están dedicadas a la corrección
atmosférica y la detección de cirros. Entre las 13 bandas espectrales de
S2, las tres bandas con resolución de 60 m (B01, B09 y B10) están
dedicadas a la corrección atmosférica y la detección de cirros. Estas
bandas normalmente no se consideran en las tareas de clasificación de
cultivos por lo tanto, se excluyeron de los datos de salida. Como
resultado, se concatenaron cuatro bandas remuestreadas a 20 m (B02-
B04 y B08) y seis bandas con una resolución espacial nominal de 20 m
(B05-B07, B8A, B11 y B12) para la cadena de procesamiento de datos
considerada.
NDVI es el indicador más utilizado para monitorear la salud de la
vegetación y clasificar la extensión de la vegetación. Además, puede ser
útil filtrar las nubes, ya que los valores de reflectancia de las nubes en
bandas visibles son más altos que los de la banda NIR que produce
valores negativos de NDVI similares al agua y la nieve. Por estas
razones, NDVI también se calculó e incluyó en el conjunto de datos. Por
otro lado, se utiliza bandas adicionales (máscaras de nubes y mapas
NDVI) para filtrar las nubes, así como los píxeles que no son de
vegetación de los volúmenes de datos anuales.

b) Datos de Sentinel-2
Datos climáticos: Los datos climáticos considerados se enumeran en la
Tabla.
Variables climáticas Unidad

Precipitación Milímetros (mm)


Temperatura máxima Grado Celsius (◦C)
Temperatura mínima Grado Celsius (◦C)
Humedad relativa Porcentaje (% )

Se realizó una interpolación espacial para volver a muestrear estos


datos a la resolución espacial S2 considerada (20 m). Este proceso de
interpolación es necesario para producir un volumen de datos uniforme
con imágenes S2 y los datos climáticos disponibles. Se utilizó el método
de validación cruzada Leave one out para evaluar el error asociado con
el modelo con parámetros, produciendo un error medio (ME) y RMSE. El
parámetro del modelo con menos ME y RMSE se utiliza para la
generación superficial de datos climáticos particulares. Los datos ráster
resultantes se normalizaron dentro del rango de [0–1] mediante el uso
de la normalización mín-máx para ajustar los datos de entrada a una
escala común para una mejor convergencia de los algoritmos de
aprendizaje automático.
Datos del suelo: Los datos del suelo de resolución espacial de 250 m,
que incluye seis variables, a saber, el contenido de boro, el contenido de
arcilla, la materia orgánica, el pH, la arena y el nitrógeno total. Los datos
del suelo se normalizaron dentro del rango de [0–1].

c) Sobre el terreno
Máscara de cultivo de arroz: En particular, este procedimiento emplea
datos MODIS auxiliares durante el período a largo plazo 2006-2014 para
producir anotaciones sólidas de cultivos basadas en la clasificación del
arroz durante todo el período. Una vez que se produce este mapa de
arroz de resolución gruesa, lo re-proyectamos a la proyección UTM /
WGS84 y lo volvimos a muestrear en 20 m para generar las etiquetas de
arroz del suelo correspondientes a la resolución espacial S2. Luego,
filtramos este mapa resultante con la máscara de cobertura terrestre con
el objetivo de garantizar que nuestras etiquetas finales de verdad sobre
el terreno no incluyan áreas no agrícolas, si las hay. Finalmente,
revisamos manualmente las anotaciones obtenidas para corregir
posibles desviaciones. Estas etiquetas finales de arroz se utilizan como
mapas de cultivos de verdad sobre el suelo.
Rendimiento de los cultivos de arroz: calculamos el rendimiento
promedio por píxel de arroz en cada distrito distribuyendo
uniformemente su valor de producción total sobre el número de píxeles
de arroz dentro del distrito (lógicamente utilizando la resolución espacial
de píxeles S2 considerada, es decir, 20 × 20 m).

También podría gustarte