Está en la página 1de 14

IDENTIFICACIÓN DEL FACTOR DE RIEGO EN LAS PLANTAS USANDO TECNICAS

DE MACHINE LEARNING E IMPLEMENTANDO EN PROCESADOR ARM CORTEX-

M0

Brayan Stiven Rodríguez Cuervo 1, María Fernanda Rodríguez Peña, Javier

Alberto Chaparro Preciado3

1 Pregrado
Ingeniería Electrónica
Escuela Colombiana de Ingeniería Julio Garavito
Brayan.rodriguez-c@mail.escuelaing.edu.co
0000-
0002-5378-6313
Investigación y desarrollo

2 Pregrado
Ingeniería Electrónica
Escuela Colombiana de Ingeniería Julio Garavito
Maria.rodriguez-pe@mail.escuelaing.edu.co
0000-
0002-2262-7176
Investigación y desarrollo

3 Doctorado
Ingeniería Electrónica
Escuela Colombiana de Ingeniería Julio
Garavito Javier.chaparro@escuelaing.edu.com
Investigación, Desarrollo y asesoría
Abstract
This article contains a detailed report on the development and execution of the project that aims to
identify the irrigation factor in plants using the automatic learning method and then implement an
irrigation system capable of predicting this factor and activate the irrigation system accordingly. The
development includes a research process, data collections for training, the use of classification
techniques and finally their implementation.

Palabras clave
Machine Learning, Factores de riego, goteo, aspersión, microaspersión, técnicas de clasificación-
1. INTRODUCCIÓN distintos

Según los expertos, una planta en


condiciones ideales se encuentra en un estado
fisiológico óptimo gracias a sus procesos de
autorregulación, sin embargo, cuando se
rompe este equilibrio la planta empieza a tener
afectaciones en sus células que se ven
reflejados en su rendimiento. [1]

Todos los procesos de ruptura de dicho


equilibrio son causados por varios factores;
durante el desarrollo de este proyecto el
enfoque se hará en dos de los factores que más
afectan el desarrollo de la planta (Temperatura
y humedad del suelo). Estos factores tienen
repercusiones en el desarrollo de la planta,
especialmente en relación con el tema del
déficit o exceso hídrico, por tal motivo el
principal objeto de estudio será evaluar los
factores anteriormente descritos para
automatizar el proceso de riego en las plantas
según su necesidad.
Se hará uso de las técnicas de machine
learning para clasificar el tipo de necesidad
hídrica que requiere una planta ante la
variación de los factores anteriormente
descritos. Las técnicas de machine learning
son métodos analíticos que permiten que un
sistema de forma automatizada descubra
patrones, tendencias y relaciones en los datos,
así los datos de entrada de un sistema son
analizados para predecir valores de salida
dentro de un rango aceptable. [2] Algunos de
los algoritmos más usados para machine
learning son: Clasificadores KNN, Árboles de
decisión, Clasificador de Naive Bayes,
Regresión lineal y logística, Máquinas de
soporte vectorial, redes neuronales y
Perceptrón multicapa; todos ellos utilizan
modelos matemáticos y estadísticos machine learning es la toma de los datos, para
para guiar el aprendizaje lo cual se hace uso de dos sensores:
automático. La selección del tipo de temperatura y humedad en suelo (DHT11 y
técnica de machine learning a usar FC-28 respectivamente). Estos datos son
en un sistema recae sobre la tomados durante 1 semana en un pequeño
eficiencia y el rendimiento que este arbusto puesto en un jardín (Buxus
tenga ante el tratamiento de los Sempervirens) bajo condiciones de sol,
datos, razón por la cuál varían los oscuridad, lluvia, neblina y sequía. Una vez
usos muchas veces según la clase de obtenidos los datos se realiza un proceso de
datos que se están analizando e normalización y filtración sobre los mismos
incluso debido a algunos para eliminar redundancias y datos erróneos,
comportamientos estadísticos. Para luego de ello se realiza el proceso de clustering
el desarrollo de este proyecto se han para determinar características similares en los
utilizado todos los algoritmos datos y posteriormente definir las clases y
anteriormente descritos, sin variables predictoras requeridas en machine
embargo, la selección del algoritmo learning. Una vez se tienen definidas las
estará dada por temas de eficiencia características de los datos, inicia el proceso de
y exactitud en el tratamiento de los uso de los algoritmos de machine learning
datos. para encontrar el método más eficiente y
exacto que permita determinar la necesidad
El primer paso para desarrollar hídrica que requiere la planta en tratamiento.
los modelos de predicción y Una vez se ha elegido el método más eficiente
para el conjunto de
datos dispuesto, se procede a realizar la 2.1 Dataset
implementación del sistema de riego mediante
la tarjeta programable Arduino Nano 33 que Para obtener el Dataset se utiliza un pequeño arbusto
utiliza un procesador Arm Cortex-M0 [3] este puesto en un jardín (Buxus Sempervirens), en
hardware responde de manera eficiente al condiciones normales, le hemos instalado dos tipos de
prototipado de máquina inteligente, a través de sensores, un sensor de temperatura DHT11 y un
dispositivos electrónicos realiza: la toma de higrómetro (sensor de humedad) FC-28. Una vez
datos, clasifica el factor de riego y predice la conectados los sensores se inicia la toma de datos a
necesidad hídrica de la planta. través de un programa implementado en un Arduino 1,
el cuál entrega valores correspondientes a la temperatura
2. METODOLOGÍA ambiente y humedad en el suelo de la planta.
Esta toma de datos se lleva a cabo
El riego de las plantas es uno de los
factores que más influyen en la vida de las
plantas, es una de las actividades más simples
para el cuidado de las plantas, sin embargo, en
muchos casos el riego no es solamente regarles
o rociarles un poco de agua; son varios los
factores que inciden en la cantidad y la forma
en cómo se les suministra agua a las plantas.
La agricultura de riego sobre la cual trabaja
este proyecto consiste en determinar el
suministro de la cantidad necesaria de agua en
las plantas o cultivos mediante diversos
métodos artificiales de riego (goteo,
microaspersión y aspersión). [4]
durante 1 semana (realizando tomas
cada 10 minutos), dejando la planta
bajo condiciones normales de
iluminación excesiva, iluminación
moderada, oscuridad, lluvia,
neblina y sequía. Para poder
obtener la mayor cantidad de datos
que informen sobre el estado de la
planta, se han forzado estados como
inundación y sequía absoluta a
diferentes temperaturas.
Ilustración 1. Evidencia de la toma de datos en Buxus
Sempervirens

Antes de realizar la caracterización


del sistema se han tomado los datos
obtenidos durante toda la semana y
sobre ellos se ha realizado un
proceso de normalización y filtración
de datos para eliminar redundancias
y datos erróneos, obteniendo así un
total de 183 datos en el data set.

2.2 Caracterización

Para la caracterización del


sistema de riego se realiza el proceso
de clustering para enlazar y definir
características similares en cada una
de las muestras.
Posteriormente se realiza un gráfico
de dispersión para visualizar las
muestras tomadas para posteriormente
definir las clases y variables
predictoras requeridas en machine
learning.
i- Riego por goteo: El agua es
distribuida de manera localizada en
la planta, por gotas, a través de
goteros instalados en una manguera
de goteo conectada a una tubería de
distribución. [5]
ii- Riego por aspersión: El agua es
distribuida a través de aspersores,
Ilustración 2. Gráfico de dispersión Dataset Factor de Riego los cuales producen gotas de agua
de diferentes tamaños, imitando
Basándose en los patrones que presenta la una precipitación natural. [5]
Ilustración 2 son planteados los requerimientos
para la utilización de los métodos de machine iii- Riego por microaspersión: Es una
learning, estableciendo así las variables modificación del sistema de
predictoras y clases a las que pertenece cada aspersión tradicional que permite
uno de los datos. asperjar el agua a poca distancia de
la planta y de manera localizada.
Se presenta entonces: [5]

- Variables predictoras El tipo de riego que una planta requiere está


i. Humedad en el suelo dado por el porcentaje hídrico que el sistema de
ii. Temperatura ambiente riego seleccionado es capaz de suministrar, este
porcentaje hídrico está dado por la Tabla 1.
- Clases
i. Riego por goteo Tabla 1. Porcentaje hídrico según el tipo de riego
ii. Riego por aspersión
iii. Riego por microaspersión Riego por goteo 90 -
95%
Riego por microaspersión 85 -
Según la necesidad hídrica de la planta se
90%
regula el nivel de agua al que debe ponerse el Riego por aspersión 80 -
sistema de riego, de tal manera que se pueden 85%
clasificar los tipos de riego según las variables
predictoras (Esto a nivel hardware está dado Generalizando los patrones que se
por un sistema de riego que posee las tres presentan en el gráfico de dispersión y
técnicas de riego, cuya regulación viene dada realizando el proceso de clustering, se presenta
por un software que controla el acceso a cada nuevamente la gráfica delimitando las zonas
técnica). para las cuales se está realizando la
clasificación según las variables predictoras.
Una breve explicación acerca de la
influencia del tipo de riego en la planta se **En el eje X (Temperatura ºC)
presenta a continuación (CLASES). **En el eje Y (Humedad en suelo)
las clases establecidas anteriormente.
FACTOR DE RIEGO
400 Tabla 2. Medias TEMPERATURA °C HUMEDAD EN
y desviación SUELO
300 estándar

MED DESVIACI MED DESVIACI


200 IA ÓN IA ÓN
ASPERSIÓN 18,3 2,76 184, 53,61
100 9 59
MICROASPERSI 24,2 1,70 217, 20,39
0 ÓN 1 98
CLASIFICACION RIEGO GOTEO 24,6 3,58 319, 47,28
0 102030 40
0 02

2.3 Clasificadores
Ilustración 3. Caracterización y clasificación
a) Clasificador KNN
En la figura 1. Representamos las En En la Es un algoritmo basado en instancia de
Ilustración 3. Se representan las clases tipo supervisado de Machine Learning. Es
anteriormente descritas: un método bastante sencillo que
esencialmente busca las observaciones
- Verde: Riego por aspersión más cercanas a la que está tratando de
- Azul: Riego por microaspersión predecir y clasifica el nuevo punto de
- Amarillo: Riego por goteo. interés basado en la mayoría de los datos
que le rodean. Para encontrar la distancia
 Amarillo/Riego por goteo: Plantas en
más corta entre las múltiples
extrema sequía y humedad media
observaciones se aplica la ecuación de la
sometidas a altas temperaturas
distancia Euclídea [4]:
requieren el mayor factor de riego (90
-95%).
 Azul /Riego por microaspersión: 𝒏
Plantas con suelo húmedo a
temperaturas altas requieren un factor 𝒅(𝑨, 𝑩) = √∑(𝑨𝒊 − 𝑩𝒊)𝟐 (𝟏)
de riego medio (85 – 90%). 𝒊=𝟏
 Verde/ Riego por aspersión:
Plantas con suelo húmedo y con
KNN al ser un algoritmo de aprendizaje
tendencia a la sequía, sometidas a
supervisado, significa que previamente se
temperaturas bajas y medias requieren
un factor de riego mínimo (80 – 85%) debe etiquetar el conjunto de datos de
para compensar los efectos de un alza entrenamiento con la clase esperada dada
de temperatura por cada fila de datos, en este caso, sin tos
inmediatamente después de una fuerte o con tos.
helada.
La desventaja que tiene KNN es que no
Uno de los análisis estadísticos que se les realiza puede aprender un modelo explícito, lo
a los datos es el cálculo de la media y que hace es memorizar las instancias de
desviación estándar para cada una de las entrenamiento, las cuales forman la base
variables predictoras y para cada una de de
conocimiento para la fase de
predicción. [6] b) Clasificador de Naive Bayes
Naive Bayes es un algoritmo muy bueno para 𝑷(𝑨|𝒃𝟏, 𝒃𝟐, . . , 𝒃𝒏−𝟏, 𝒃𝒏)
la clasificación basado en el teorema de Bayes = 𝑷(𝑨)𝑷(𝒃𝟏, 𝒃𝟐, . . , 𝒃𝒏−𝟏, 𝒃𝒏|𝑨)
con una suposición de independencia entre los
predictores, en realidad es muy sencillo, fácil de 𝑷(𝑨|𝒃𝟏, 𝒃𝟐, . . , 𝒃𝒏−𝟏, 𝒃𝒏)
𝒏
construir y particularmente útil para conjuntos
= 𝑷(𝑨) ∏ 𝑷(𝒃𝒊|𝑨) (𝟑)
de datos muy grandes.
𝒊=𝟏

El clasificador asume que el efecto de una Como tenemos 2 clases que clasificar en este
característica particular en una clase es trabajo, la ecuación (3) se debe usar tanto para
independiente de otras características. Incluso si la clase con tos y sin tos, donde n es el número
estas características son interdependientes, estas de las características usadas, en este caso 9. Se
características se consideran de forma puede obtener más información sobre el
independiente. Esta suposición simplifica la algoritmo en [7].
computación, y por eso se considera ingenua.
Esta suposición se denomina independencia c) Árbol de decisión
condicional de clase. [7]
El árbol de decisiones en esencia es un
La fórmula del teorema de Bayes es: diagrama de flujo, con una amplia
aplicabilidad, aunque no tienen un ajuste ideal
𝑷(𝑩|𝑨) 𝑷(𝑨)
si los datos tienen un gran número de
características, esto genera una cantidad
enrome de decisiones y la complejidad del
árbol sería alta.

Los árboles de decisión se crean utilizando una


heurística llamada
𝑷(𝑨|𝑩) = (𝟐)
𝑷(𝑩) partición recursiva, la cual va
dividiendo los datos en subconjuntos de
Donde: las características cada vez más
 P(A): es la probabilidad de que la pequeños de clases similares. Todo
hipótesis A sea cierta
comienza con el nodo raíz (representa el
(independientemente de los datos).
conjunto de datos completo), el algoritmo
 P(B): probabilidad de los datos
(independientemente de la hipótesis). escoge una característica que es la más
 P(A|B): es la probabilidad de la predictiva de la clase, se divide entonces
hipótesis A dada los datos B. en grupos con distintos valores de esta
 P(B|A): es la probabilidad de los datos B característica formando de esta manera las
dado que la hipótesis A era cierta. primeras ramas del árbol. Posteriormente
el algoritmo sigue dividiendo y creando
La ecuación (2) es válida para una característica, nodos que le permitan alcanzar un criterio
pero en este caso se trabajan 9 características (ver de detención.
Tabla1), por lo cual se debe generalizar el teorema
de Bayes, obteniendo la siguiente expresión:
El árbol de decisión continúa dividiendo debe tomar para clasificar serán cada vez más
indefinidamente las características y específicas, y cuando se realice un entrenamiento
creando con los datos de prueba, el modelo quedará sobre
subconjuntos cada vez más pequeños, pero ajustado con estos datos de entrenamiento. Para ello
esto precede a un problema, pues entre es necesario un proceso de poda que reduce el
más grande sea el árbol, las decisiones que tamaño del nodo para que generalice mejor los datos.
Una manera de detener el crecimiento del planos e hiperplanos que distinguen de
árbol es limitar de cierta forma el número forma equidistante a los datos clasificados
de decisiones, así se garantiza que el árbol en distintas dimensiones, de esta manera
evite hacer trabajos innecesarios. Esto los datos quedan distribuidos
también es una desventaja, pues nada homogéneamente a raíz de dichas
garantiza que el árbol se pierda algún particiones.
patrón importante. [8] Por ejemplo, en un espacio de 2 dimensiones un
hiperplano es un subespacio plano de una sola
Una alternativa, llamada post-poda, dimensión, o lo que es lo mismo, una línea,
consiste en crear un árbol que sea definida por la ecuación lineal:
demasiado grande, luego usar criterios de
poda basados en las tasas de error en los 𝜷𝟎 + 𝜷 𝟏 𝑿 𝟏 + 𝜷 𝟐 𝑿 𝟐 = 𝟎 (𝟖)
nodos para reducir el tamaño del árbol a
un nivel más apropiado. Este es a menudo El algoritmo escoge el mejor plano posible
un enfoque más efectivo que la poda buscando que exista el mayor margen de
previa porque es bastante difícil separación entre las clases a dividir ya que es
determinar la profundidad óptima de un muy probable que la línea (o el plano) con
árbol de decisión sin hacerlo crecer mayor margen conduzca a una clasificación más
primero. acertada en el futuro. Dentro de este
clasificador, existen los vectores de soporte, que
d) Máquinas de soporte vectorial
son aquellos puntos que están sobre el límite de
los planos de división, usando estos vectores es
La máquina de soporte vectorial usada
que se define el MMH (maximal magin
para clasificar los datos se basa en un
hyperplane).
método de modelamiento de
Sin embargo, como es de esperarse, los datos
en la vida real no son fácilmente separables, es
por esto por lo que el algoritmo también es
capaz de reconocer a los datos “mal
clasificados” que están del otro lado del plano
de separación y les asigna un costo que sirve
también para escoger plano con el máximo
margen posible.

Una de las características más importantes de


los SVM es que son multidimensionales, puesto
que el comportamiento de los datos en la vida
real no se acomoda a una relación lineal y
gracias a esta característica, los datos se (normalización). [9]
modelan como si lo fueran. A estos métodos de
linealización se les llama Kernel. La e) Red Neuronal
clasificación de los datos se hizo probando la
SVM con los distintos Kernel, entre ellos: lineal, Las redes neuronales utilizan conceptos tomados de una
radial, polinomial e hiperbólico, y de esta comprensión del cerebro humano para modelar funciones
manera obteniendo información de cuál clasificó arbitrarias. Las máquinas de soporte vectorial
mejor los datos. Es importante mencionar que utilizan superficies
los datos del Dataset se acondicionaron para multidimensionales para definir la relación entre
obtener el mejor rendimiento de los SVM características y resultados.
conexión a conexión hasta llegar a la salida, este
Las ANN (red neuronal artificial) se pueden tipo de red se denomina red de avance. A pesar
aplicar en tareas de: clasificación, predicción de la restricción en el flujo de información, las
numérica, reconocimiento de patrones no redes feedforward ofrecen una sorprendente
supervisado. Se aplican mejor a las situaciones cantidad de flexibilidad. Por ejemplo, el número
donde los datos de se especifican bien la entrada de niveles y nodos en cada nivel se puede variar,
y de salida, la parte compleja se encuentra entre se pueden modelar múltiples resultados
estos dos puntos. Es por ello que la capacidad de simultáneamente.
una red neuronal para aprender está enraizada en
su topología, o en los patrones y estructuras de
las neuronas interconectadas. Las tres
características clave en las ANN son: el número
de capas, verificar si la información en la red
puede viajar hacia atrás y el número de nodos
dentro de cada capa de la red.

Ilustración 4. Modelo de Red Neuronal

𝑵𝒆𝒕𝒋 = ∑ 𝒙𝒊𝒘𝒋𝒊 + 𝜽𝒋 (𝟔)


𝒊=𝟏

En la ecuación (6) se representa la manera de


calcular las entradas de la red neuronal cuyo
modelo básico se puede ver la (Ilustración 4).
Por lo general, la red neuronal debe aprender
todo el conjunto de patrones de entrenamiento y
por ello no debe entrenarse utilizan do un error
local, sino que el aprendizaje se hace en
términos de un error global. En la siguiente
ecuación definimos el error cuadrático medio:
𝒑 𝑵 (𝒌)
(𝒌)
𝑬𝒓𝒓𝒐𝒓 = 𝟏 ∑ ∑(𝒚 − 𝒅 )𝟐 (𝟕)
En general las redes neuronales son alimentadas 𝟐𝑷 𝒋 𝒋
por la señal de entrada dirigiéndose en una 𝒌=𝟏 𝒋=𝟏
dirección continua de
Donde: mejor exactitud, toda vez que con una sola capa la
 N: número de neuronas en la capa de exactitud oscilaba entre el 30% y 40%, mientras que, con
salida una capa extra, la exactitud del método mejora a un 90%
 P: número de patrones de de exactitud.
entrenamiento [10]
En la Ilustración 5, se muestra el diagrama que
Para la aplicación de este algoritmo corresponde a la red neuronal propuesta para el sistema en
(específicamente para el factor de riego) se han mención; para este caso los pesos y kernel se obtienen del
dispuesto de dos capas ocultas, para lograr la programa usando las librerías de Sk. Learn y sobre esos
valores f) Regresión Logística Multivariable
se realizan manualmente las funciones
Las regresiones en general consideran la
relación que existe entre una variable
numérica con una o más variables numéricas
dependientes o independientes. La regresión
logística es un método de regresión que
relaciona una variable cualitativa binaria con
una o más variables cuantitativas. En este
caso, utilizamos esta bondad de la regresión
logística ya que la clasificación de los datos de
tos se puede expresar de manera binaria. [11]

La regresión logística permite modelar los


datos no linealmente sino con una función cuyo
rango esta siempre entre 0 y
1. Una de las funciones más usadas en casos
como este es la función sigmoide.
RELU y Sigmoide correspondientes para cada 𝟏
(𝟒)
capa de entrada y salida 𝝈(𝒙) = −𝒙
respectivamente. 𝟏+𝒆
Este modelo se basa en asignar una
probabilidad (valor de la función) al clasificador
en donde discriminará unos datos de otro y
finalmente los clasificará según su nivel de
probabilidad. Por lo cual una vez estimados los
coeficientes del modelo logístico, es posible
conocer la probabilidad de que la variable
dependiente pertenezca al nivel de referencia,
dado un determinado valor del predictor. Para
ello se emplea la ecuación del modelo:

𝟏
𝒑̂(𝒀 = ) ̂
𝒆𝜷𝟎 +𝜷
̂
𝟏𝒙 (𝟓)
= 𝜷̂ +𝜷̂ 𝒙

Ilustración 5. Red Neuronal Factor de Riego 𝑿 𝟏+𝒆 𝟎 𝟏


Haciendo uso de las ecuaciones de aplicación
para el clasificador de regresión multivariable
y tomando los
valores de 𝛽 que resultan de los algoritmos, se
muestran en la Ilustración 6 las ecuaciones Ilustración 6. Ecuaciones clasificador de regresión logística
correspondientes para el método.
artículo. a) Clasificador KNN
DATOS DE PRUEBA
Los resultados que se encuentran a PREDICCIÓN ASPERSI MICROASPERSI GOT
continuación corresponden ÓN ÓN EO
al rendimiento ASPERSIÓN 15 0 0
presentado para los datos con cada MICROASPERSI 2 17 0
uno de los clasificadores. ÓN
GOTEO 0 1 20
I. Matriz de Confusión
b) Clasificador de Naive Bayes
3. RESULTADOS DATOS DE PRUEBA
PREDICCIÓN ASPERSI MICROASPERSI GOT
Si bien es cierto los algoritmos de machine ÓN ÓN EO
learning son aplicables a cualquier conjunto de ASPERSIÓN 19 0 0
datos, una de las etapas más importantes para MICROASPERSI 0 18 0
ÓN
obtener un sistema de procesamiento y
clasificación automático eficiente corresponde c) Árbol de decisión
a el estudio de la precisión de cada uno de los DATOS DE PRUEBA
métodos, junto con su matriz de confusión, la PREDICCIÓN ASPERSI MICROASPERSI GOT
cual permite visualizar el desempeño de cada ÓN ÓN EO
uno de los algoritmos. En la matriz de ASPERSIÓN 20 0 0
confusión se representan el número de MICROASPERSI 0 18 1
predicciones de cada clase respecto a las ÓN
GOTEO 0 0 16
instancias o elementos “bien clasificados” en la
clase que corresponde.
d) Máquinas de soporte vectorial
DATOS DE PRUEBA
Los dos elementos anteriormente mencionados
PREDICCIÓN ASPERSI MICROASPERSI GOT
permiten comparar el rendimiento de todos los
ÓN ÓN EO
clasificadores, definir el clasificador con el ASPERSIÓN 9 0 10
mejor desempeño. MICROASPERSI 2 0 18
ÓN
Finalmente, el clasificador con mejor GOTEO 2 0 14
rendimiento será del que se implementará en
hardware, tal y como se ha mencionado en el e) Red Neuronal (MLP)
título de este
DATOS DE PRUEBA
PREDICCIÓN ASPERSI MICROASPERSI GOT
ÓN ÓN EO
ASPERSIÓN 14 0 0
MICROASPERSI 0 16 0
ÓN
GOTEO 0 2 23
f) Regresión Logística hardware, tal y como se ha mencionado en el
Multivariable título de este
DATOS DE PRUEBA
PREDICCIÓN ASPERSI MICROASPERSI GOT
ÓN ÓN EO
ASPERSIÓN 17 0 0
MICROASPERSI 0 16 0
ÓN
GOTEO 0 0 22

II. Exactitud de los clasificadores

Tabla 3. Exactitud de los clasificadores

Clasificador Exactitu
d
Clasificador KNN 94%
Clasificador Naive Bayes 96%
Árbol de Decisión 99,20%
Máquina de Soporte Vectorial 49%
Red Neuronal (MLP) 96%
Regresión Logística
Multivariable 100%

a) Validación
Haciendo un estudio sobre el desempeño
de cada uno de los clasificadores, resulta ser
el clasificador de Regresión Logística
Multivariable el que mejor desempeño
presenta; con un rendimiento del 100% y
una matriz de confusión perfecta
(clasificando al 100%) se elige como el
clasificador estrella de todo el proceso de la
aplicación de los algoritmos de machine
learning.

b) Implementación

Finalmente, el clasificador con mejor


rendimiento será del que se implementará en
4. ANÁLISIS
5. CONCLUSIONES

6. REFERENCIAS BIBLIOGRÁFICAS

[1] N. G.M, «Intagri S.C,» [En línea].


Available:
https://www.intagri.com/articulos/nutri ci
%20on-vegetal/estres-vegetal-parte-1-
estres-%20por-altas-temperaturas..
[Último acceso: 1 09 2020].
[2] R. APD, «apd,» 04 04 2019. [En línea].
Available: https://www.apd.es/algoritmos-
del- machine- learning/#:~:text=Conceptos
%20como% 20inteligencia%20artificial
%20(IA,inel udibles%20en%20el
%20contexto%20act ual.&text=En%20su
%20forma%20m% C3%A1s%20b
%C3%A1sica,dentro%20d e%20un
%20rango%20aceptable.. [Último acceso:
2020 11 18].

[3] «Arduino STORE,» [En línea].


Available:
https://store.arduino.cc/usa/nano-33- ble-
sense. [Último acceso: 18 11 2020].
[4] C. B. e. Irrigazione, «Wikipedia,»
Edagrícola , 1970. [En línea]. Available:
https://es.wikipedia.org/wiki/Riego#:~:t
ext=Actualmente%2C%20se%20utiliza
%20el%20riego,y%20la%20fertilizaci%
C3%B3n%20del%20suelo.&text=Para%
20implantar%20un%20sistema%20efici
ente,%2Dplanta%20y%20Agua%2Dsuel
o.. [Último acceso: 18 11 2020].
[5] «Fao.org,» [En línea]. Available:
http://www.fao.org/3/aj470s/aj470s02.p
df. [Último acceso: 1 9 2020].
[6] «Clasificador con K-Nearest-Neighbor,»
Na8, 10 6 2018. [En línea]. Available:
https://www.aprendemachinelearning.c
om/clasificar-con-k-nearest-neighbor-
ejemplo-en-python/.. [Último acceso: 18
11 2020].
[7] L. González, Naive Bayes - Teoría, 10 9
2019. [En línea]. Available:
https://ligdigonzalez.com/naive-bayes-
teoria-machine-learning/..
[8 L. J. Moscovitz. [En línea]. Available:
] http://www.konradlorenz.edu.co/images
/stories/articulos/Leonardo_Jimenez_M
oscovitz_Especializacion.pdf.
[9 C. Martínez, «MÁQUINAS DE VECTOR
] SOPORTE,» 2018. [En línea]. Available:
https://rpubs.com/Cristina_Gil/SVM..

[1 N. Anzola, «Máquinas de soporte vectorial


0] y redes neuronales artificiales en la
predicción,» USD/COP, 2015.
[1 J. Rodrigo, 2016. [En línea]. Available:
1] https://www.cienciadedatos.net/docume
ntos/27_regresion_logistica_simple_y_
multiple..

8. ANEXOS

También podría gustarte