Está en la página 1de 8

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/350535319

Identification of phenological stages of sugarcane cultivation using Sentinel-2


images

Conference Paper · October 2020


DOI: 10.1109/CIMPS52057.2020.9390095

CITATIONS READS
0 158

4 authors:

Humberto Cruz-Sanabria María Guadalupe Sánchez


Instituto Tecnológico de Ciudad Guzmán TecNM-Instituto Tecnológico de Ciudad Guzmán
2 PUBLICATIONS   0 CITATIONS    25 PUBLICATIONS   70 CITATIONS   

SEE PROFILE SEE PROFILE

Juan Pablo Rivera Caicedo Himer Avila-George


Consejo Nacional de Ciencia y Tecnología University of Guadalajara
126 PUBLICATIONS   3,194 CITATIONS    101 PUBLICATIONS   496 CITATIONS   

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Intelligent food engineering View project

Atmospheric Look-up table Generator (ALG) View project

All content following this page was uploaded by Himer Avila-George on 12 August 2021.

The user has requested enhancement of the downloaded file.


Identificación de las etapas fenológicas del cultivo de caña de azúcar
usando imágenes Sentinel-2
Identification of phenological stages of sugarcane cultivation using
2020 9th International Conference On Software Process Improvement (CIMPS) | 978-1-6654-0376-4/20/$31.00 ©2020 IEEE | DOI: 10.1109/CIMPS52057.2020.9390095

Sentinel-2 images
Humberto Cruz-Sanabria, María Guadalupe Sánchez
Departamento de Sistemas y Computación, TecNM - Instituto Tecnológico de Ciudad Guzmán,
Ciudad Guzmán, Jalisco, México.
{humbertoM19291006,msanchez}@itcg.edu.mx

Juan Pablo Rivera-Caicedo


CONACYT - Secretaría de Investigación y Posgrado, Universidad Autónoma de Nayarit,
Tepic, Nayarit, México.
jprivera@uan.edu.mx

Himer Avila-George
Departamento de Ciencias Computacionales e Ingenierías, Universidad de Guadalajara,
Ameca, Jalisco, México.
himer.avila@academicos.udg.mx

Resumen—La caña de azúcar es un cultivo de gran importancia technique with k = 10 iterations. The results show that the method
comercial y económica en más de 130 países incluido México. Uno Random Forest achieves an accuracy = 92.45 %, which is the best
de los principales problemas al cual se enfrentan los productores suited to identify the growth stages of sugarcane crops.
de caña de azúcar es como mejorar el rendimiento del cultivo.
Para poder desarrollar nuevas técnicas que puedan mejorar Keywords - Sugarcane, Sentinel-2, Spectral vegetation index,
el rendimiento del cultivo de caña de azúcar, es clave poder Supervised classification, Phenological phases.
identificar las etapas críticas de crecimiento y que se puedan
tomar decisiones oportunas. En este artículo, se presenta un I. I NTRODUCCIÓN
método para identificar las etapas fenológicas de cultivos de En México, el cultivo de caña de azúcar es de gran impor-
caña de azúcar usando datos del sensor MultiSpectral Instrument
a bordo del satélite Sentinel-2. Para el desarrollo del método tancia comercial y económica; su principal uso es la produc-
propuesto, se evaluaron los métodos de clasificación: k-Nearest ción de azúcar, aunque también se utiliza en la fabricación
Neighbors, Random Forest, Support Vector Machine y Naïve de papel, abono, alimento para animales y alcohol [1]. Un
Bayes usando como datos de entrada series temporales de cinco problema que ha prevalecido en los últimos 35 años, es como
índices de vegetación; los resultados se validaron utilizando la mejorar la tasa de crecimiento del cultivo la cual sólo ha au-
técnica de validación cruzada con k = 10 iteraciones. Los
resultados muestran que la técnica Random Forest logra un mentado en un 2.4 % [2]. De acuerdo con el Comité Nacional
accuracy = 92.45 siendo la que mejor se adecua al proceso para el Desarrollo Sustentable de la Caña de Azúcar (CONA-
de identificación de las etapas de crecimiento de cultivos de caña DESUCA), es necesario implementar mejoras tecnológicas,
de azúcar. desde la preparación del terreno, siembra, labores y prácticas
culturales [3]. Por lo tanto, es fundamental comprender como
Palabras clave - Caña de azúcar, Sentinel-2,Índices espectrales,
clasificación supervisada, etapas fenológicas. las plantas perciben y responden a su entorno, así como los
cambios morfológicos y anatómicos que se presentan durante
Abstract—Sugarcane is a crop of great commercial and economic su desarrollo. Para poder analizar los cambios morfológicos
importance in over 130 countries, including Mexico. One of the y anatómicos en las plantas de caña de azúcar, es necesario
main problems faced by sugarcane producers is how to improve the identificar las diferentes etapas fenológicas del ciclo de vida
yield of the crop. In order to develop new techniques that can impro-
ve the yield of the sugarcane crop, it is key to be able to identify the de la planta, esto permite el reconocimiento de etapas críticas
critical stages of growth and to be able to make timely decisions. In que pueden ayudar en el desarrollo de medidas para mejorar el
this paper, a method is presented to identify the phenological stages rendimiento del cultivo [4]; lo anterior se puede llevar a cabo
of sugarcane crops using data from the MultiSpectral Instrument a través del análisis de los datos obtenidos desde los satélites.
sensor onboard the Sentinel-2 satellite. For the development of Desde la década de los 70, con el lanzamiento del primer
the proposed method, classification some methods were evaluated:
k-Nearest Neighbors, Random Forest, Support Vector Machine, and satélite de la serie LandSat, las técnicas de teledetección han
Naïve Bayes. Also, time series of five vegetation indices were used sido usadas para el monitorio del desarrollo vegetativo y
as input data; the results were validated using the cross-validation salud de los cultivos agrícolas. A partir de ese año, se han

978-1-6654-0376-4/20/$31.00 ©2020 IEEE


110
Authorized licensed use limited to: UNIVERSIDAD DE GUADALAJARA. Downloaded on April 01,2021 at 21:40:48 UTC from IEEE Xplore. Restrictions apply.
desarrollado nuevos sensores con mejoras en la resolución extensiones de cultivos usando sensores de baja resolución,
espectral, espacial y radiométrica, lo cual ha permitido mejorar i.e., 30m por píxel.
el conocimiento de la tierra. Uno de los sensores más actuales, La ESA a través del programa COPERNICUS, ha puesto
fue desarrollado por la Agencia Espacial Europea (ESA, por a disposición de la comunidad imágenes del sensor MSI de
sus siglas en inglés), se trata del MultiSpectral Instrument forma gratuita. El sensor MSI ha brindado una mejora en la
(MSI), el cual es capaz de capturar imágenes en 13 bandas resolución espacial y temporal (10m por píxel), dicho sensor
distintas del espectro electromagnético. El MSI viaja a bordo esta montado en los satélites Sentinel-2. Se han registrado va-
de los satélites Sentinel-2 [5]. rios estudios que aprovechan la resolución de las imágenes del
En los cultivos de caña de azúcar después de su primer MSI para para la identificación fenológica de los cultivos [8],
corte (socas), se pueden identificar 3 etapas fenológicas: (1) [11], el monitorio de riego y fertilización [12], la cartografía
brotación y amacollamiento, (2) rápido crecimiento y (3) de la intensidad de los cultivos [13], por mencionar algunas
maduración [2]; las cuales se ilustran en la Figura 1 modificada aplicaciones.
desde [6]. Un problema recurrente en los cultivos de caña, es En México, se han realizado varios estudios sobre cultivos
que algunos productores no llevan un control preciso de la de caña de azúcar usando datos satélites, los cuales abarcan
fecha de corte, por lo tanto, muchas veces se desconoce la temas como: evaluación de plagas [14], impacto en la salinidad
etapa fenológica en la que se encuentra el cultivo, dificultando del suelo [15], entre otros.
el desarrollo de medidas agrícolas que propicien un mejor
rendimiento. III. M ÉTODO PROPUESTO
Área de estudio
El área de estudio esta ubicada en el municipio de el
Rincón, Jalisco, México con coordenadas (19° 40’01.4” N,
103° 24’42.6” W). El terreno se encuentra sembrado con
la variedad de caña de azúcar ATEMex 96-40 y los datos
registrados corresponden al ciclo de corte resoca 1, ver la
Tabla I.

TABLA I. D ISTRIBUCIÓN DE LAS ETAPAS FENOLÓGICAS DEL CULTIVO


EN LA ZONA DE ESTUDIO

Figura 1. Principales etapas fenológicas de la caña de azúcar Etapa fenológica Periodo


Febrero 2019
Los índices de vegetación son combinaciones algebraicas de Marzo 2019
Brotación y Amacollamiento
ciertas bandas que permiten realzar un fenómeno o respuesta Abril 2019
biológica del cultivo [7]. En [8] y [9], se propone el uso Mayo 2019
de imágenes satelitales para realizar el mapeo de cultivos en Junio 2019
Julio 2019
grandes extensiones de terreno. Rápido Crecimiento Agosto 2019
En el presente trabajo, se propone un método para identificar Septiembre 2019
las etapas fenológicas del cultivo de caña de azúcar en el ciclo Octubre 2019
resoca 1, mediante el uso de series temporales construidas a Noviembre 2019
partir de índices de vegetación. Diciembre 2019
Maduración
Enero 2020
Después de esta sección introductoria, el artículo se es- Febrero 2020
tructura de la siguiente manera: la sección II presenta una
breve exploración de los antecedentes del estudio propuesto;
la sección III describe el método propuesto; la sección IV
muestra los resultados obtenidos, y finalmente, en la sección Datos de estudio
V se presentan las conclusiones y trabajos futuros. Para este trabajo se utilizaron los datos del sensor MSI,
los cuales fueron descargados del sitio web de Sentinels
II. A NTECEDENTES Scientific Data Hub de la ESA1 . El MSI ofrece datos en 13
De acuerdo con Abdel-Rahman y Ahmed [10], las técnicas bandas distintas del espectro electromagnético, ver Tabla II;
de percepción remota se han aplicado con éxito en estudios las imágenes capturadas tienen una resolución de 10, 20 y
relacionados con los cultivos de caña de azúcar, por ejemplo, 60 metros por píxel [5], con un nivel de nubosidad menor
clasificación de áreas cultivadas, identificación de variedades, al 50 %. En total se obtuvieron un total de 54 imágenes,
desarrollo de modelos de estimación de producción y monito- correspondientes al periodo de estudio.
rio de deficiencias nutricionales y estrés hídrico. La mayoría de
los estudios antes mencionados, se han realizado en grandes 1 https://scihub.copernicus.eu/dhus/

978-1-6654-0376-4/20/$31.00 ©2020 IEEE


111
Authorized licensed use limited to: UNIVERSIDAD DE GUADALAJARA. Downloaded on April 01,2021 at 21:40:48 UTC from IEEE Xplore. Restrictions apply.
TABLA II. R ESOLUCIÓN DE LAS BANDAS DEL S ENTINEL -2 Pre-Procesamiento: La etapa de pre-procesamiento esta
constituida por tres funciones (1) corrección atmosférica, (2)
Banda Intervalos de longitud de onda Resolución de píxel remuestreo, y (3) extracción de la zona de interés; cada función
1 443 nm 60 m se explica a continuación.
2 540 nm 10 m
3 560 nm 10 m
Las imágenes satelitales necesitan una corrección atmosfé-
4 665 nm 10 m rica, esto se debe a que la energía reflejada por un cultivo
5 705 nm 20 m agrícola en su camino hacia el sensor, recibe aportaciones
6 740 nm 20 m
7 783 nm 20 m
de la iteración de la energía con la atmósfera las cuales
8 842 nm 10 m provienen del vapor de agua y los gases en la atmósfera; esas
8a 965 nm 20 m aportaciones de energía se pueden etiquetar como ruido, el
9 940 nm 60 m
10 1375 nm 60 m
cual repercute negativamente en los resultados. Por lo tanto, es
11 1610 nm 20 m importante quitar la mayor cantidad del ruido para obtener la
12 2190 nm 20 m energía reflejada por los cultivos. La corrección atmosférica se
realizó con la herramienta Sen2Cor2 , la cual fue desarrollada
por la ESA.
Metodología Posteriormente, el remuestreo homogeniza la resolución
En la Figura 2, se muestra el método propuesto para la espacial de las imágenes (detalles visibles en la imagen).
clasificación de las etapas fenológicas de cultivos de caña de Las imágenes descargadas se encuentran en tres distintas
azúcar. A continuación, se describe cada una de las etapas del resoluciones espaciales, ver Tabla II; lo que significa que un
método propuesto. píxel en la imagen descargada representa 10, 20 o 60 metros
reales del terreno sensado. Cuanto menor sea el área terrestre
representada por cada píxel mayores son los detalles captados
1. Descarga de imágenes [16].
1. Definir un periodo de tiempo para realizar el
estudio. En el presente trabajo, se seleccionó la resolución de 10 m
2. Descargar imágenes desde el sitio Copernicus con la finalidad de tener mayor detalle de los cultivos de caña
Open Access Hub.
de azúcar, por lo tanto fue necesario remuestrear las imágenes
de 20 m y 60 m de resolución. El remuestreo consiste en
realizar un tratamiento digital de las imágenes para transformar
2. Pre-procesamiento
1. Corrección atmosférica.
la resolución de las imágenes de 20 m y 60 m a 10 m, dicho
2. Remuestreo. tratamiento digital se hizo con la herramienta SNAP3 .
3. Recorte y extracción de la zona de interés. Posteriormente, las imágenes fueron recortadas utilizando
la herramienta subset del software SNAP; la zona de estudio
se delimito mediante un polígono generado mediante la apli-
cación en línea GeoJSON4 . A continuación, se exportaron los
3. Cálculo de ı́ndices píxeles de la zona de interés a un archivo plano, para ello
(NDVI,GNDVI,SAVI,PVI, y LAI) se utilizó la herramienta Mask-Pixels y un archivo shapefile
generado con el software ArcGIS.
Cálculo de índices: Una vez que se han extraído los píxeles
de la zona de interés, el método propone la creación de
índices que permitan extraer las características para clasificar
4. Cálculo de series temporales los cultivos de caña de azúcar según su etapa fenológica.
Los índices permiten aumentar las diferencias de reflectancia
entre usos del suelo; los índices más usados en estudios de
teledetección para clasificar vegetación son:
Índice de vegetación de diferencia normalizada (NDVI)
5. Clasificación del cultivo de caña Índice de vegetación de diferencia normalizada Verde
(KNN, RF, SVM, y NB)
(GNDVI)
Índice de Vegetación Ajustado al Suelo (SAVI)
Figura 2. Método propuesto para identificar las etapas fenológicas en cultivos Índice de Vegetación Perpendicular (PVI)
de caña de azúcar. Índice de área foliar (LAI)
El NDVI representado en la Ec. 1 fue propuesto por
Descarga: Para la descarga de los datos del Sentinel-2, se
Rouse [17], este se ha utilizado ampliamente en trabajos
desarrolló un script en Python, el cual se enlaza al repositorio
de Sentinels Scientific Data Hub de la ESA, el script recibe 2 https://step.esa.int/
como parámetros de entrada el periodo de tiempo para la 3 http://step.esa.int/

descarga de las imágenes y el nivel de nubosidad deseado. 4 http://geojson.io/

978-1-6654-0376-4/20/$31.00 ©2020 IEEE


112
Authorized licensed use limited to: UNIVERSIDAD DE GUADALAJARA. Downloaded on April 01,2021 at 21:40:48 UTC from IEEE Xplore. Restrictions apply.
relacionados con la caña de azúcar [18], [19]. El NDVI es la regresión en el cual la banda roja se toma como variable
relación de las diferencias en las reflectividades para la banda independiente y la banda infrarroja como variable dependiente,
del infrarrojo cercano (NIR) y la banda roja (RED). ver Ec. 4.

(N IR − RED) (aN IR − RED + b)


N DV I = . (1) PV I = p . (4)
(N IR + RED) (a2 + 1)
El NDVI minimiza efectos topográficos y produce una es- donde a es pendiente de la línea del suelo y b es el gradiente
cala lineal de medición, la cual va de –1 a 1. La normalización de la línea del suelo.
que realiza el NDVI, reduce el efecto de la degradación de ca- Si en un punto concreto no hay vegetación, ese punto se
libración del sensor y la influencia de los efectos atmosféricos. representará sobre la línea del suelo. Pero si hay una cierta
El valor cero representa el valor aproximado donde empieza cantidad de vegetación, la reflectividad de esa zona en el rojo
la ausencia de vegetación, los valores negativos representan será más baja que la del suelo desnudo, y en el infrarrojo
superficies sin vegetación. Valores muy bajos de NDVI, del será más alta, por lo que el punto quedará representado
orden de 0.1, suelen corresponder a áreas rocosas, arenosas alejado de la línea del suelo. Sin embargo, debido a que
o nevadas. Valores de 0.2 a 0.3 pueden corresponder a áreas PVI depende de la precisión con que se determine la línea
con arbustos o pasturas naturales. A partir de estos valores, del suelo, puede presentar una elevada dispersión. Además,
se tienen los niveles correspondientes a praderas o cultivos, este índice sólo debería ser utilizado en imágenes que se han
dependiendo del valor alcanzado [20]. Sin embargo, el NDVI corregido atmosféricamente, ya que es sensible a los cambios
tiene el inconveniente de ser sensible a la reflectividad del atmosféricos. Algunos estudios que utilizan este índice de
suelo sobre el que se sitúa la planta, lo que limita su potencial vegetación son [28] y [29].
de discriminación, este problema es bastante grave cuando la El índice LAI hace referencia al conjunto de masa foliar
cubierta vegetal es menor al 50. de una cobertura vegetal y, por tanto, a su capacidad de
El GNDVI es una variante de NDVI que utiliza la banda fotosíntesis relacionado con el contenido de pigmentos (índice
Verde para que sea más sensible a la variación del contenido de clorofila), lo que permite conocer el estado de salud de los
de clorofila en el cultivo, la Ec. 2 muestra su fórmula. GNDVI cultivos [30]. La estimación se hace por medio de una red
es empleado comúnmente para determinar el consumo de neuronal de tres capas con la siguiente topología: Capa de
agua y nitrógeno de la cubierta vegetal [21], algunos estudios entrada de 11 neuronas (8 bandas y 3 ángulos de la geometría
recientes en donde se utiliza son [22] y [23]. de observación e iluminación), la capa oculta con 5 neuronas
y función de transferencia tipo tangente sigmoidal, ver Ec.
(N IR − GREEN ) 5, como capa de salida una neurona con una función de
GN DV I = . (2)
(N IR + GREEN ) activación lineal.
Los valores arrojados por dicho índice oscilan entre -1 y 1. 1
Valores entre -1 y 0 están asociados a la presencia de agua o f (x) = (5)
1 − e−x
suelo desnudo [22]. El cálculo de los índices se realizó con el software SNAP,
El índice SAVI mostrado en la Ec. 3, se utiliza para corregir en específico para los índices de vegetación NDVI, GNDVI,
el NDVI por la influencia del brillo del suelo en áreas donde SAVI y PVI, se hizo utilizando la función Vegetation Index
la cobertura vegetativa es baja. SAVI obtiene los efectos del Processor; con respecto al índice LAI, éste se calculó usando
suelo en el NDVI por medio de la constate L = 0.428, la cual la función Biophysical Processor.
toma valores de 0 a 1 inversos a la densidad de la vegetación, Cálculo de series temporales: Por cada índice (NDVI,
con el fin de que el impacto del brillo del suelo quede reducido GNDVI, SAVI, PVI y LAI) se construyeron 3 series tempo-
en el índice [24]. rales usando python, las cuales corresponden a los valores
(N IR − RED) medio, máximo y mínimo de cada índice calculado en los 54
SAV I = (1 + L). (3) datos obtenidos en la etapa de descarga de imágenes. En total,
(N IR + RED + L)
se obtuvieron 15 series temporales, i.e., 15 características. La
El índice SAVI esta adaptado a estudios de análisis de vege- información de las series temporales se usó para crear un
tación en etapas de crecimiento inicial o vegetación dispersa dataset al cual se agregó la etiqueta correspondiente a la etapa
[25], [26]. fenológica en cada fecha. Este dataset se utilizó en la etapa de
El índice PVI fue desarrollado por Perry y Lautenschla- clasificación y para graficar las series temporales utilizando el
ger [27], con el propósito de minimizar el efecto que causa el paquete Matplotlib de Python.
brillo del suelo en cultivos con baja densidad de vegetación. Clasificación: Para la etapa de clasificación se consideraron
PVI emplea la distancia perpendicular desde cada coordenada los clasificadores: k-Nearest Neighbors (KNN), Random Forest
de píxel hasta la línea del suelo; la línea del suelo desnudo (RF), Support Vector Machine (SVM) y Naïve Bayes (NB).
se calcula a partir de la reflectividad en el rojo y el infrarrojo La razón principal por la que se eligieron las técnicas de
cercano de una serie de píxeles de suelo desnudo localizados clasificación previamente mencionadas, se debe a que son de
en la imagen, el cálculo se realiza mediante un análisis de las más comunes y que han tenido éxito en estudios agrícolas.

978-1-6654-0376-4/20/$31.00 ©2020 IEEE


113
Authorized licensed use limited to: UNIVERSIDAD DE GUADALAJARA. Downloaded on April 01,2021 at 21:40:48 UTC from IEEE Xplore. Restrictions apply.
Por ejemplo, en [31], los autores utilizaron RF y NB para
determinar la autenticidad de muestras de caña de azúcar P recision ∗ Recall
F − measure = 2 ∗ (9)
orgánica; en [32] proponen el uso de series temporales y RF P recision + Recall
para el monitoreo de cultivos de caña de azúcar; Guedes y IV. R ESULTADOS
Pereira [33] propusieron el uso de KNN para la clasificación Las series temporales se construyeron a partir de los valores
de la caña de azúcar cruda en presencia de pequeñas cantidades máximo, mínimo y media de los cinco índices utilizados en
de impurezas sólidas; recientemente, Wang et al. [8], propu- el presente artículo (NDVI, GNDVI, SAVI, PVI y LAI). La
sieron modelos para realizar mapas de cultivos de caña de Figura 3 muestra las series temporales del valor medio de
azúcar mediante la integración de imágenes multitemporales cada índice de vegetación. En esta figura, las líneas verticales
del satélite Sentinel-2 y algoritmos de aprendizaje automático punteadas indican la separación de las etapas fenológicas,
basados en las técnicas basados en SVM y RF. de izquierda a derecha se encuentra la etapa de brote o
La técnica de validación utilizada fue k-fold cross-validation amacollamiento, seguido por la etapa de rápido crecimiento
con k=10. Este enfoque implica que se divida aleatoriamente y finalmente la etapa de maduración.
el conjunto de observaciones en k grupos, o pliegues, de En la Tabla III, se muestran las resultados obtenidos por
aproximadamente el mismo tamaño. El primer pliegue se trata los clasificadores KNN, RF, SVM y NB considerando las 15
como un conjunto de validación, y el método se ajusta a los características, i.e., las 15 series temporales compuestas por
k-1 pliegues restantes. El error cuadrático medio, M SE1 , se los valores máximo, medio y mínimo calculados para cada
calcula a partir de las observaciones en el pliegue extendido. uno de los 5 índices analizados en el presente estudio.
Este procedimiento se repite k veces; cada vez, un grupo
diferente de observaciones se trata como un conjunto de TABLA III. R ESULTADOS DE LA CLASIFICACIÓN DE LAS 15
validación. Este proceso da como resultado k estimaciones del CARACTERÍSTICAS DE LAS SERIES TEMPORALES .
error de prueba, M SE1 , M SE2 , ..., M SEk . La estimación
de k-fold cross-validation se calcula promediando estos valores Métrica KNN-5 RF SVM NB
[34]. Las métricas consideradas para evaluar los clasificadores Accuracy 84.906 92.453 79.245 81.132
Precision 0.845 0.926 0.798 0.834
fueron: accuracy, precision, recall, y F-measure. Recall 0.849 0.925 0.792 0.811
El accuracy es la relación entre el número de predicciones F-Measure 0.843 0.923 0.787 0.808
correctas y el número total de muestras de entrada [35], ver
Ec. 6. Se puede observar en la Tabla III que el clasificador RF
tp + tn es el que proporciona mejores resultados en la clasificación,
Accuracy = (6) con una exactitud del 92.452 %. Sin embargo, a pesar de que
ts
el resultado es bueno, pueden existir características las cuales
donde: tp son los positivos verdaderos, es decir los casos estén proporcionando poca información respecto a la etapa
en los que el clasificador predijo una clase y ésta realmente fenológica del cultivo, por lo que se consideró realizar una
pertenecía a esa clase; tn son los negativos verdaderos, es decir selección de las mejores características.
los casos en los que el clasificador predijo que la instancia no
pertenecía a una clase y esta realmente no pertenecía a esa Seleccionado las mejores características
clase; finalmente, ts es el total de instancias del conjunto. Para realizar el proceso de selección de características se
Por otra parte, la precision cuya fórmula se muestra en la utilizó el método CfsSubsetEval el cual está incluido en el
Ec. 7, denota la proporción de casos positivos predichos que software Weka [37]. Este método mide la importancia de las
son correctamente positivos reales [36]. características sobre la base de la capacidad predictiva de las
tp características y su grado de redundancia.
P recision = (7) CfsSubsetEval selecciona el subconjunto que tiene menos
tp + f p
intercorrelación pero esta altamente correlacionado con la
donde fp son los positivos falsos, es decir, los casos en los que clase objetivo [37]. Los resultados arrojaron que las mejores
el clasificador predijo una instancia a una clase que no era la características son: LAIMax, LAIMin, GNDVIMean, SAVI-
correcta. Max, PVIMean, PVIMAx.
El recall es la proporción de casos positivos reales que se
predicen correctamente [36], ver Ec. 8. Evaluando con las mejores características
La Tabla IV muestra los resultados obtenidos por cada
tp
Recall = (8) clasificador usando sólo las seis mejores características de-
tp + f n terminadas en el paso anterior.
donde fn son los falsos negativos, es decir, las instancias de En la Tabla IV, se puede observar el impacto de eliminar
una clase clasificadas incorrectamente en otras clases. información redundante o poco descriptiva respecto a la etapa
Finalmente, el F-measure es una métrica que combina la fenológica del cultivo, pues considerando solo seis de las
precision y recall en la media armónica de estos [35], ver 15 características, se logró mantener el comportamiento de
Ec. 9. KNN-5 y de RF. Además, los clasificadores NB y SVM

978-1-6654-0376-4/20/$31.00 ©2020 IEEE


114
Authorized licensed use limited to: UNIVERSIDAD DE GUADALAJARA. Downloaded on April 01,2021 at 21:40:48 UTC from IEEE Xplore. Restrictions apply.
20.0 LAI
GNDVI
17.5 NDVI
15.0 SAVI
PVI
12.5
10.0
7.5
5.0
2.5
0.0
0 50 100 150 200 250 300 350 400
Día después del corte

Figura 3. Series temporales de los índices de vegetación NDVI, GNDVI, SAVI, PVI y LAI.

TABLA IV. R ESULTADOS DE LA CLASIFICACIÓN CONSIDERANDO LAS desarrollo nos permitirá mapas de salud vegetal para caña de
MEJORES CARACTERÍSTICAS azúcar y se contará con la metodología para escalar el análisis
de otros cultivos en el Estado de Jalisco.
Métrica KNN-5 RF SVM NB
Accuracy 84.906 92.453 83.019 83.019
Precision 0.845 0.926 0.826 0.847 R EFERENCIAS
Recall 0.849 0.925 0.830 0.830
F-Measure 0.843 0.923 0.820 0.828 [1] F. C. Gómez-Merino, L. I. Trejo-Téllez, J. Salazar-Ortiz, J. A. Pérez-
Sato, H. E. Sentíes-Herrera, J. J. Bello-Bello, and N. Aguilar-Rivera,
“La diversificación de la agroindustria azucarera como estrategia para
México,” Agroproductividad, vol. 10, no. 11, pp. 7–12, 2017.
proporcionaron mejores resultados con la selección de éstas [2] N. Aguilar Rivera, “Ficha técnica del cultivo de la caña de azúcar
características. (saccharum officinarum l.),” pp. 1–20, 2015, secretaría de Agricultura,
Ganadería, Desarrollo Rural, Pesca y Alimentación.
[3] CONADESUCA, “Agenda nacional de investigación, innovación y trans-
V. C ONCLUSIONES ferencia de tecnología de la caña de azúcar,” CONADESUCA, Tech.
Rep., 2017.
En éste artículo, se presentó un método para identificar [4] L. Endres, C. Moura dos Santos, G. Verissimo de Souza, M. Menossi,
las etapas fenológicas de cultivos de caña de azúcar usando J. C. Marcelino dos Santos et al., “Morphological changes recorded in
datos del sensor MultiSpectral Instrument a bordo del saté- different phenophases of sugarcane plants subjected to water stress in
tropical field conditions,” Australian Journal of Crop Science, vol. 12,
lite Sentinel-2. Para el desarrollo del método propuesto, se no. 7, p. 1041, 2018.
evaluaron los métodos de clasificación: k-Nearest Neighbors, [5] J. Delegido, A. Pezzola, A. Casella, C. Winschel, E. Urrego, J. Jimenez,
Random Forest, Support Vector Machine y Naïve Bayes usando G. Soria, J. Sobrino, and J. Moreno, “Estimación del grado de severidad
de incendios en el sur de la provincia de Buenos Aires, Argentina,
como datos de entrada series temporales de cinco índices de usando Sentinel-2 y su comparación con Landsat-8,” Revista de Telede-
vegetación. Se llevó a cabo un proceso de selección de las tección, no. 51, pp. 47–60, 2018.
mejores características y se logró mantener el comportamiento [6] G. McCollam, “Correlating nitrogen application rates in sugarcane with
low-cost normalized difference vegetation index (NDVI),” Ellendale
de exactitud con solo seis de las 15 características, lo cual Farms LLC, Tech. Rep. FS14-282, 2018.
influye positivamente en la cantidad de datos a procesar. [7] P. Sanseechan, K. Saengprachathanarug, J. Posom, S. Wongpichet,
Los resultados indican que el clasificador Random Forest C. Chea, and M. Wongphati, “Use of vegetation indices in monitoring
sugarcane white leaf disease symptoms in sugarcane field using mul-
logra un F − measure = 0.923, siendo éste el que mejor se tispectral uav aerial imagery,” in IOP Conference Series: Earth and
ajusta al proceso de identificación de las etapas de crecimiento Environmental Science, vol. 301, no. 1. IOP Publishing, 2019, p.
de cultivos de caña de azúcar. La caracterización del estado 012025.
fenológico es una etapa clave para realizar el monitoreo de [8] M. Wang, Z. Liu, M. H. A. Baig, Y. Wang, Y. Li, and Y. Chen, “Mapping
sugarcane in complex landscapes by integrating multi-temporal Sentinel-
cultivos para identificar presencia de plagas, deficiencias de 2 images and machine learning algorithms,” Land Use Policy, vol. 88,
nutrientes a nivel de suelo y cultivo, debido a los cambios p. 104190, 2019.
en la respuesta espectral que se realzan con los índices de [9] F. Henry, D. E. Herwindiati, S. Mulyono, and J. Hendryli, “Sugarcane
land classification with satellite imagery using logistic regression mo-
vegetación. del,” in IOP conference series: materials science and engineering, vol.
Como trabajo futuro se implementará la sinergia de desa- 185, 2017, p. 012024.
rrollos tecnológicas previos realizados como la adaptación de [10] E. M. Abdel-Rahman and F. B. Ahmed, “The application of remote
sensing techniques to sugarcane (Saccharum spp. hybrid) production:
los requerimientos básicos para caña para la aplicación PulAm a review of the literature,” International Journal of Remote Sensing,
[38] y la cadena de procesado de imágenes Sentinel-2 [39]. El vol. 29, no. 13, pp. 3753–3767, 2008.

978-1-6654-0376-4/20/$31.00 ©2020 IEEE


115
Authorized licensed use limited to: UNIVERSIDAD DE GUADALAJARA. Downloaded on April 01,2021 at 21:40:48 UTC from IEEE Xplore. Restrictions apply.
[11] H. Jiang, D. Li, W. Jing, J. Xu, J. Huang, J. Yang, and S. Chen, “Early estimation in arid grasslands,” Remote Sensing of Environment, vol. 209,
season mapping of sugarcane by applying machine learning algorithms pp. 439–445, 2018.
to Sentinel-1A/2 time series data: a case study in Zhanjiang City, China,” [26] H. Ma, Y. Jing, W. Huang, Y. Shi, Y. Dong, J. Zhang, and L. Liu,
Remote Sensing, vol. 11, no. 7, p. 861, 2019. “Integrating early growth information to monitor winter wheat powdery
[12] G. F. de Souza, P. Maillard, R. S. Florentino, J. G. E. Machado Filho, mildew using multi-temporal Landsat-8 imagery,” Sensors, vol. 18,
and L. A. R. Gutierrez, “Combining Sentinel-1 and Sentinel-2 images no. 10, p. 3290, 2018.
to monitor irrigation in sugar cane,” in Remote Sensing for Agriculture, [27] C. R. Perry Jr and L. F. Lautenschlager, “Functional equivalence of
Ecosystems, and Hydrology XX, vol. 10783. International Society for spectral vegetation indices,” Remote sensing of environment, vol. 14,
Optics and Photonics, 2018, p. 1078306. no. 1-3, pp. 169–182, 1984.
[13] L. Liu, X. Xiao, Y. Qin, J. Wang, X. Xu, Y. Hu, and Z. Qiao, “Mapping [28] T. A. Naji, “Study of vegetation cover distribution using DVI, PVI,
cropping intensity in China using time series Landsat and Sentinel-2 WDVI indices with 2D-space plot,” in J. Phys.: Conf. Series. IOP
images and Google Earth Engine,” Remote Sensing of Environment, vol. Publishing, 2018, p. 012083.
239, p. 111624, 2020. [29] C. A. da Silva, M. R. Nanni, P. E. Teodoro, and G. F. C. Silva, “Ve-
[14] L. A. O. Vargas, G. G. Mendoza, R. A. Gómez, N. A. Rivero, and getation indices for discrimination of soybean areas: A new approach,”
L. Y. Espinosa, “Characterization of diatraea saccharalis in sugarcane Agronomy journal, vol. 109, no. 4, pp. 1331–1343, 2017.
(saccharum officinarum) with field spectroradiometry,” International [30] T. Dong, J. Liu, J. Shang, B. Qian, B. Ma, J. M. Kovacs, D. Walters,
Journal of Environmental and Agriculture Research, vol. 2, pp. 1–6, X. Jiao, X. Geng, and Y. Shi, “Assessment of red-edge vegetation indices
2016. for crop leaf area index estimation,” Remote Sensing of Environment, vol.
[15] R. Soca, J. Rojas, B. Willems, L. Ocola, R. Fernández, and J. C. Pérez, 222, pp. 133–143, 2019.
“Identificación de las tierras degradadas por la salinidad del suelo en [31] R. M. Barbosa, B. L. Batista, C. V. Barião, R. M. Varrique, V. A.
los cultivos de caña de azucar mediante imágenes de satélite,” Revista Coelho, A. D. Campiglia, and F. Barbosa Jr, “A simple and practical
de Investigación de Física, vol. 19, no. 1, pp. 1–9, 2016. control of the authenticity of organic sugarcane samples based on the
use of machine-learning algorithms and trace elements determination
[16] S. Khorram, C. F. Van der Wiele, F. H. Koch, S. A. Nelson, and M. D.
by inductively coupled plasma mass spectrometry,” Food chemistry, vol.
Potts, Principles of applied remote sensing. Springer, 2016.
184, pp. 154–159, 2015.
[17] J. W. Rouse, “Monitoring the vernal advancement of retrogradation of [32] S. Döker and İ. İ. Boşgelmez, “Rapid extraction and reverse phase-liquid
natural vegetation, NASA/GSFG, Type III,” Final Report, vol. 371, 1974. chromatographic separation of mercury (ii) and methylmercury in fish
[18] J. L. Fernandes, N. F. F. Ebecken, and J. C. D. M. Esquerdo, “Sugarcane samples with inductively coupled plasma mass spectrometric detection
yield prediction in brazil using ndvi time series and neural networks applying oxygen addition into plasma,” Food chemistry, vol. 184, pp.
ensemble,” International Journal of Remote Sensing, vol. 38, no. 16, 147–153, 2015.
pp. 4631–4644, 2017. [33] W. N. Guedes and F. M. V. Pereira, “Raw sugarcane classification in the
[19] I. Pinheiro Lisboa, J. Melo Damian, M. Roberto Cherubin, P. P. Silva Ba- presence of small solid impurity amounts using a simple and effective
rros, P. Ricardo Fiorio, C. C. Cerri, and C. Eduardo Pellegrino Cerri, digital imaging system,” Computers and Electronics in Agriculture, vol.
“Prediction of sugarcane yield based on NDVI and concentration of 156, pp. 307–311, 2019.
leaf-tissue nutrients in fields managed with straw removal,” Agronomy, [34] G. James, D. Witten, T. Hastie, and R. Tibshirani, An introduction to
vol. 8, no. 9, p. 196, 2018. statistical learning. Springer, 2013, vol. 112.
[20] J. Yao, Y. Chen, Y. Zhao, W. Mao, X. Xu, Y. Liu, and Q. Yang, [35] G. Hackeling, Mastering Machine Learning with scikit-learn. Packt
“Response of vegetation NDVI to climatic extremes in the arid region of Publishing Ltd, 2017.
Central Asia: a case study in Xinjiang, China,” Theoretical and applied [36] D. M. Powers, “Evaluation: From Precision, Recall and F-Factor to
climatology, vol. 131, no. 3-4, pp. 1503–1515, 2018. ROC, informedness, markedness & correlation,” Flinders University,
[21] A. A. Gitelson, Y. J. Kaufman, M. N. Merzlyak et al., “Use of a green Adelaide, Australia, techreport SIE-07-001, 2007.
channel in remote sensing of global vegetation from EOS-MODIS,” [37] L. Kotthoff, C. Thornton, and F. Hutter, “User guide for auto-WEKA
Remote sensing of Environment, vol. 58, no. 3, pp. 289–298, 1996. version 2.6,” Dept. Comput. Sci., Univ. British Columbia, BETA lab,
[22] D. A. G. Cárdenas, J. A. R. Valencia, D. F. A. Velásquez, and J. R. P. Vancouver, BC, Canada, Tech. Rep, vol. 2, 2017.
Gonzalez, “Dynamics of the indices ndvi and gndvi in a rice growing [38] A. Perez-Mena, J. A. Fernández-Zepeda, J. P. Rivera-Caicedo, and
in its reproduction phase from multi-spectral aerial images taken by H. Avila-George, “Pulam: An app for monitoring crops,” in International
drones,” in International Conference of ICT for Adapting Agriculture to Conference on Software Process Improvement. Springer, 2018, pp. 196–
Climate Change. Springer, 2018, pp. 106–119. 205.
[23] A. Kayad, M. Sozzi, S. Gatto, F. Marinello, and F. Pirotti, “Monitoring [39] R. Rodriguez-Ramirez, M. G. Sánchez, J. P. Rivera-Caicedo, D. Fajardo-
Within-Field Variability of Corn Yield using Sentinel-2 and Machine Delgado, and H. Avila-George, “Automating an image processing chain
Learning Techniques,” Remote Sensing, vol. 11, no. 23, p. 2873, 2019. of the Sentinel-2 satellite,” in International Conference on Software
[24] A. Huete, “A soil-adjusted vegetation index (SAVI),” Remote sensing of Process Improvement. Springer, 2018, pp. 216–224.
environment, vol. 25, pp. 295–309, 1988.
[25] H. Ren, G. Zhou, and F. Zhang, “Using negative soil adjustment factor
in soil-adjusted vegetation index (SAVI) for aboveground living biomass

978-1-6654-0376-4/20/$31.00 ©2020 IEEE


116
Authorized licensed use limited to: UNIVERSIDAD DE GUADALAJARA. Downloaded on April 01,2021 at 21:40:48 UTC from IEEE Xplore. Restrictions apply.
View publication stats

También podría gustarte