Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Brayan Stiven Rodriguez Cuervo1, María Fernanda Rodríguez Peña2, Javier Alberto
Chaparro Preciado3
Bogotá, Colombia
brayan.rodriguez-c@mail.escuelaing.edu.co
0000-0002-5378-6313
Investigación y desarrollo
Bogotá, Colombia
maria.rodriguez-pe@mail.escuelaing.edu.co
0000-0002-2262-7176
Investigación y desarrollo
______________________________
Abstract
The problem presented during the development of this article aims to identify the
irrigation factor in plants using machine learning techniques and then implemented in
hardware (ARM Cortez M4 Processor) capable of predicting this factor and activate the
irrigation system accordingly. The development includes, the use of classification techniques
and finally their application.
Keywords
Machine Learning, Irrigation factors, drip, sprinkler, micro-sprinkler, sorting techniques.
Resumen
El problema presentado durante el desarrollo de este artículo tiene por objeto la
identificación del factor de riego en las plantas haciendo uso de las técnicas de machine
learning para luego ser implementado en UN hardware (Procesador ARM Cortex M4) capaz
de predecir este factor y activar el sistema de riego según corresponda. El desarrollo incluye
un proceso de investigación, la recopilación de datos para la capacitación, el uso de técnicas
de clasificación y, por último, su aplicación.
Palabras clave
Machine Learning, Factores de riego, goteo, aspersión, microaspersión, técnicas de
clasificación.
1. INTRODUCTION en un sistema recae sobre la eficiencia y el
rendimiento que este tenga ante el
Estudios científicos demuestran que una tratamiento de los datos, razón por la cual
planta en condiciones ideales se encuentra varían los usos muchas veces según la clase
en un estado fisiológico óptimo gracias a sus de datos que se están analizando e incluso
procesos de autorregulación, sin embargo, debido a algunos comportamientos
cuando se rompe este equilibrio la planta estadísticos. Para el desarrollo de este
empieza a tener afectaciones en sus células proyecto se han utilizado todos los
que se ven reflejados en su rendimiento. [1] algoritmos anteriormente descritos, sin
Todos los procesos de dicho equilibrio embargo, la selección del algoritmo estará
son causados por varios factores; durante el dada por temas de eficiencia y exactitud en
desarrollo de este proyecto el enfoque se el tratamiento de los datos.
hará en dos delo los factores que más
afectan el desarrollo de la planta El primer paso para desarrollar los modelos
(Temperatura y humedad del suelo). Estos de predicción y machine learning es la toma
factores tienen repercusiones en el de los datos, para lo cual se hace uso de dos
desarrollo de la planta, especialmente en sensores: temperatura y humedad en suelo
relación con el tema del déficit o exceso (DHT11 y FC-28 respectivamente). Estos
hídrico, por tal motivo el principal objeto de datos son tomados durante 1 semana en un
estudio será evaluar los factores pequeño arbusto puesto en un jardín (Buxus
anteriormente descritos para automatizar Sempervirens) bajo condiciones de sol,
el proceso de riego en las plantas según su oscuridad, lluvia, neblina y sequía. Una vez
necesidad. obtenidos los datos se realiza un proceso de
normalización y filtración sobre los mismos
Se hará uso de las técnicas de machine para eliminar redundancias y datos
learning para clasificar el tipo de necesidad erróneos, luego de ello se realiza el proceso
hídrica que requiere una planta ante la de clustering para determinar
variación de los factores anteriormente características similares en los datos y
descritos. Las técnicas de machine learning posteriormente definir las clases y variables
son métodos analíticos que permiten que un predictoras requeridas en machine
sistema de forma automatizada descubra learning. Una vez se tienen definidas las
patrones, tendencias y relaciones en los características de los datos, inicia el proceso
datos, así los datos de entrada de un de uso de los algoritmos de machine
sistema son analizados para predecir learning para encontrar el método más
valores de salida dentro de un rango eficiente y exacto que permita determinar la
aceptable. [2] necesidad hídrica que requiere la planta en
tratamiento. Una vez se ha elegido el
Algunos de los algoritmos más usados método más eficiente para el conjunto de
para machine learning son: Clasificadores datos dispuestos, se procede a realizar la
KNN, Árboles de decisión, Clasificador de implementación del sistema de riego
Naive Bayes, Regresión lineal y logística, mediante la tarjeta programable Arduino
Máquinas de soporte vectorial, redes Nano 33 que utiliza un procesador Arm
neuronales y Perceptrón multicapa; todos Cortex-M4 [3] este hardware responde de
ellos utilizan distintos modelos manera eficiente al prototipado de máquina
matemáticos y estadísticos para guiar el inteligente, a través de dispositivos
aprendizaje automático. La selección del electrónicos realiza: la toma de datos
tipo de técnica de machine learning a usar
clasifica el factor de riego y predice la como inundación y sequía absoluta a
necesidad hídrica de la planta. diferentes temperaturas.
2. METODOLOGÍA
Clases: Riego por goteo, Riego por Generalizando los patrones que se
aspersión y Riego por microaspersión. presentan en el gráfico de dispersión y
realizando el proceso de clustering, se
Según la necesidad hídrica de la planta presenta nuevamente la gráfica
se regula el nivel de agua al que debe delimitando las zonas para las cuales se
ponerse el sistema de riego, de tal manera está realizando la clasificación según las
que se pueden clasificar los tipos de riego variables predictoras.
según las variables predictoras (Esto a nivel
hardware está dado por un sistema de riego **En el eje X (Temperatura ºC)
que posee las tres técnicas de riego, cuya **En el eje Y (Humedad en suelo)
regulación viene dada por un software que
controla el acceso a cada técnica). FACTOR DE RIEGO
4
00
Una breve explicación acerca de la
influencia del tipo de riego en las plantas se
3
presenta en la Tabla 1. (CLASES). 00
El algoritmo escoge el mejor plano Las ANN (red neuronal artificial) se pueden
posible buscando que exista el mayor aplicar en tareas de: clasificación,
margen de separación entre las clases a predicción numérica, reconocimiento de
dividir ya que es muy probable que la línea patrones no supervisado. Se aplican mejor a
(o el plano) con mayor margen conduzca a las situaciones donde los datos de se
una clasificación más acertada en el futuro. especifican bien la entrada y de salida, la
Dentro de este clasificador, existen los parte compleja se encuentra entre estos dos
vectores de soporte, que son aquellos puntos puntos. Es por ello que la capacidad de una
que están sobre el límite de los planos de red neuronal para aprender está enraizada
división, usando estos vectores es que se en su topología, o en los patrones y
define el MMH (maximal margin estructuras de las neuronas
hyperplane). interconectadas. Las tres características
Sin embargo, como es de esperarse, los clave en las ANN son: el número de capas,
datos en la vida real no son fácilmente verificar si la información en la red puede
separables, es por esto por lo que el viajar hacia atrás y el número de nodos
algoritmo también es capaz de reconocer a dentro de cada capa de la red.
los datos “mal clasificados” que están del
otro lado del plano de separación y les En general las redes neuronales son
asigna un costo que sirve también para alimentadas por la señal de entrada
escoger plano con el máximo margen dirigiéndose en una dirección continua de
posible. conexión a conexión hasta llegar a la salida,
este tipo de red se denomina red de avance.
Una de las características más importantes A pesar de la restricción en el flujo de
de los SVM es que son multidimensionales, información, las redes feedforward ofrecen
puesto que el comportamiento de los datos una sorprendente cantidad de flexibilidad.
en la vida real no se acomoda a una relación Por ejemplo, el número de niveles y nodos
lineal y gracias a esta característica, los en cada nivel se puede variar, se pueden
datos se modelan como si lo fueran. A estos modelar múltiples resultados
métodos de linealización se les llama simultáneamente. Ver Figura 4.
Kernel. La clasificación de los datos se hizo
probando la SVM con los distintos Kernel,
entre ellos: lineal, radial, polinomial e
hiperbólico, y de esta manera obteniendo
información de cuál clasificó mejor los
datos. Es importante mencionar que los
datos del Dataset se acondicionaron para
obtener el mejor rendimiento de los SVM
(normalización). [10]
Figura 4. Modelo de red Neuronal
𝑵
Figura 5. Red Neuronal factor de riego
Brayaaaaaaaaaaaaaaaaaaan