Está en la página 1de 12

IDENTIFICACIÓN DEL FACTOR DE RIEGO EN LAS PLANTAS USANDO TECNICAS

DE MACHINE LEARNING E IMPLEMENTANDO EN PROCESADOR ARM CORTEX-

M0

Brayan Stiven Rodríguez Cuervo 1, María Fernanda Rodríguez Peña, Javier Alberto

Chaparro Preciado3

1 Pregrado
Ingeniería Electrónica
Escuela Colombiana de Ingeniería Julio Garavito
Brayan.rodriguez-c@mail.escuelaing.edu.co 0000-
0002-5378-6313
Investigación y desarrollo

2 Pregrado
Ingeniería Electrónica
Escuela Colombiana de Ingeniería Julio Garavito
Maria.rodriguez-pe@mail.escuelaing.edu.co 0000-
0002-2262-7176
Investigación y desarrollo

3 Doctorado Ingeniería
Electrónica
Escuela Colombiana de Ingeniería Julio Garavito
Javier.chaparro@escuelaing.edu.com Investigación,
Desarrollo y asesoría
Abstract
This article contains a detailed report on the development and execution of the project that aims to
identify the irrigation factor in plants using the automatic learning method and then implement an
irrigation system capable of predicting this factor and activate the irrigation system accordingly. The
development includes a research process, data collections for training, the use of classification
techniques and finally their implementation.

Palabras clave
Machine Learning, Factores de riego, goteo, aspersión, microaspersión, técnicas de clasificación-
1. INTRODUCCIÓN modelos matemáticos y estadísticos para guiar
el aprendizaje automático. La selección del
Según los expertos, una planta en tipo de técnica de machine learning a usar en
condiciones ideales se encuentra en un estado un sistema recae sobre la eficiencia y el
fisiológico óptimo gracias a sus procesos de rendimiento que este tenga ante el tratamiento
autorregulación, sin embargo, cuando se de los datos, razón por la cuál varían los usos
rompe este equilibrio la planta empieza a tener muchas veces según la clase de datos que se
afectaciones en sus células que se ven están analizando e incluso debido a algunos
reflejados en su rendimiento. [1] comportamientos estadísticos. Para el
desarrollo de este proyecto se han utilizado
Todos los procesos de ruptura de dicho todos los algoritmos anteriormente descritos,
equilibrio son causados por varios factores; sin embargo, la selección del algoritmo estará
durante el desarrollo de este proyecto el dada por temas de eficiencia y exactitud en el
enfoque se hará en dos de los factores que más tratamiento de los datos.
afectan el desarrollo de la planta (Temperatura
y humedad del suelo). Estos factores tienen El primer paso para desarrollar los modelos
repercusiones en el desarrollo de la planta, de predicción y machine learning es la toma
especialmente en relación con el tema del de los datos, para lo cual se hace uso de dos
déficit o exceso hídrico, por tal motivo el sensores: temperatura y humedad en suelo
principal objeto de estudio será evaluar los (DHT11 y FC-28 respectivamente). Estos
factores anteriormente descritos para datos son tomados durante 1 semana en un
automatizar el proceso de riego en las plantas pequeño arbusto puesto en un jardín (Buxus
según su necesidad. Sempervirens) bajo condiciones de sol,
Se hará uso de las técnicas de machine oscuridad, lluvia, neblina y sequía. Una vez
learning para clasificar el tipo de necesidad obtenidos los datos se realiza un proceso de
hídrica que requiere una planta ante la normalización y filtración sobre los mismos
variación de los factores anteriormente para eliminar redundancias y datos erróneos,
descritos. Las técnicas de machine learning luego de ello se realiza el proceso de clustering
son métodos analíticos que permiten que un para determinar características similares en los
sistema de forma automatizada descubra datos y posteriormente definir las clases y
patrones, tendencias y relaciones en los datos, variables predictoras requeridas en machine
así los datos de entrada de un sistema son learning. Una vez se tienen definidas las
analizados para predecir valores de salida características de los datos, inicia el proceso de
dentro de un rango aceptable. [2] Algunos de uso de los algoritmos de machine learning
los algoritmos más usados para machine para encontrar el método más eficiente y
learning son: Clasificadores KNN, Árboles de exacto que permita determinar la necesidad
decisión, Clasificador de Naive Bayes, hídrica que requiere la planta en tratamiento.
Regresión lineal y logística, Máquinas de Una vez se ha elegido el método más eficiente
soporte vectorial, redes neuronales y para el conjunto de
Perceptrón multicapa; todos ellos utilizan
distintos
datos dispuestos, se procede a realizar la 2. METODOLOGÍA
implementación del sistema de riego mediante
la tarjeta programable Arduino Nano 33 que
utiliza un procesador Arm Cortex-M0 [3] este El riego de las plantas es uno de los factores que más
hardware responde de manera eficiente al influyen en la vida de las plantas, es una de las
prototipado de máquina inteligente, a través actividades más simples para el cuidado de las plantas,
de dispositivos electrónicos realiza: la toma de sin embargo, en muchos casos el riego no es solamente
datos, clasifica el factor de riego y predice la regarles o rociarles un poco de agua; son varios los
necesidad hídrica de la planta. factores que inciden en la cantidad y la forma en cómo se
les suministra agua a las plantas. La agricultura de riego
sobre la cual trabaja este proyecto consiste en durante 1 semana (realizando tomas cada 10
determinar el suministro de la cantidad minutos), dejando la planta bajo condiciones
necesaria de agua en las plantas o cultivos normales de iluminación excesiva,
mediante diversos métodos artificiales de riego iluminación moderada, oscuridad, lluvia,
(goteo, microaspersión y aspersión). [4] neblina y sequía. Para poder obtener la mayor
cantidad de datos que informen sobre el
2.1 Dataset estado de la planta, se han forzado estados
como inundación y sequía absoluta a
Para obtener el Dataset se utiliza un diferentes temperaturas.
pequeño arbusto puesto en un jardín (Buxus
Sempervirens), en condiciones normales, le
hemos instalado dos tipos de sensores, un
sensor de temperatura DHT11 y un
higrómetro (sensor de humedad) FC-28. Una
vez conectados los sensores se inicia la toma
de datos a través de un programa
implementado en un Arduino 1, el cuál
entrega valores correspondientes a la
temperatura ambiente y humedad en el suelo
de la planta.
Esta toma de datos se lleva a cabo
Ilustración 1. Evidencia de la toma de datos en Buxus Sempervirens

Antes de realizar la caracterización del


sistema se han tomado los datos obtenidos
durante toda la semana y sobre ellos se ha
realizado un proceso de normalización y
filtración de datos para eliminar redundancias y
datos erróneos, obteniendo así un total de 183
datos en el data set.

2.2 Caracterización

Para la caracterización del sistema de


riego se realiza el proceso de clustering para
enlazar y definir características similares en
cada una de las muestras.
Posteriormente se realiza un gráfico de
dispersión para visualizar las muestras tomadas
para posteriormente definir las clases y variables
predictoras requeridas en machine learning.
i- Riego por goteo: El agua es
distribuida de manera localizada en
la planta, por gotas, a través de
goteros instalados en una manguera
de goteo conectada a una tubería de
distribución. [5]
ii- Riego por aspersión: El agua es
distribuida a través de aspersores,
Ilustración 2. Gráfico de dispersión Dataset Factor de Riego los cuales producen gotas de agua
de diferentes tamaños, imitando
Basándose en los patrones que presenta la una precipitación natural. [5]
Ilustración 2 son planteados los requerimientos
para la utilización de los métodos de machine iii- Riego por microaspersión: Es
learning, estableciendo así las variables una modificación del sistema de
predictoras y clases a las que pertenece cada aspersión tradicional que permite
uno de los datos. asperjar el agua a poca distancia de
la planta y de manera localizada.
Se presenta entonces: [5]
El tipo de riego que una planta requiere está
- Variables predictoras dado por el porcentaje hídrico que el sistema de
i. Humedad en el suelo riego seleccionado es capaz de suministrar, este
ii. Temperatura ambiente porcentaje hídrico está dado por la Tabla 1.
Tabla 1. Porcentaje hídrico según el tipo de riego
- Clases
i. Riego por goteo Riego por goteo 90 -
ii. Riego por aspersión 95%
iii. Riego por microaspersión Riego por 85 -
microaspersión 90%
Según la necesidad hídrica de la planta se Riego por aspersión 80 -
regula el nivel de agua al que debe ponerse el 85%
sistema de riego, de tal manera que se pueden
clasificar los tipos de riego según las variables
predictoras (Esto a nivel hardware está dado Generalizando los patrones que se
por un sistema de riego que posee las tres presentan en el gráfico de dispersión y
técnicas de riego, cuya regulación viene dada realizando el proceso de clustering, se presenta
por un software que controla el acceso a cada nuevamente la gráfica delimitando las zonas
técnica). para las cuales se está realizando la
clasificación según las variables predictoras.
Una breve explicación acerca de la
influencia del tipo de riego en la planta se **En el eje X (Temperatura ºC)
presenta a continuación (CLASES). **En el eje Y (Humedad en suelo)
las clases establecidas anteriormente.
FACTOR DE RIEGO Tabla 2. Medias
400 y desviación
TEMPERATUR HUMEDAD EN
estándar A °C SUELO
300
ME DESVIA ME DESVIA
DIA CIÓN DIA CIÓN
200
ASPERSIÓN 18,3 2,76 184, 53,61
9 59
100 MICROASPER 24,2 1,70 217, 20,39
SIÓN 1 98
0 GOTEO 24,6 3,58 319, 47,28
CLASIFICACION RIEGO
0 102030 40 0 02

2.3 Clasificadores
Ilustración 3. Caracterización y clasificación
a) Clasificador KNN
En la figura 1. Representamos las En En la Es un algoritmo basado en instancia de
Ilustración 3. Se representan las clases tipo supervisado de Machine Learning. Es
anteriormente descritas: un método bastante sencillo que
esencialmente busca las observaciones
- Verde: Riego por aspersión más cercanas a la que está tratando de
- Azul: Riego por microaspersión predecir y clasifica el nuevo punto de
- Amarillo: Riego por goteo. interés basado en la mayoría de los datos
que le rodean. Para encontrar la distancia
 Amarillo/Riego por goteo: Plantas en más corta entre las múltiples
extrema sequía y humedad media observaciones se aplica la ecuación de la
sometidas a altas temperaturas distancia Euclídea [4]:
requieren el mayor factor de riego (90
-95%).
 Azul /Riego por microaspersión: 𝒏
Plantas con suelo húmedo a
temperaturas altas requieren un factor 𝒅(𝑨, 𝑩) = √∑(𝑨𝒊 − 𝑩𝒊 )𝟐 (𝟏)
de riego medio (85 – 90%).
𝒊=𝟏
 Verde/ Riego por aspersión:
Plantas con suelo húmedo y con
tendencia a la sequía, sometidas a KNN al ser un algoritmo de aprendizaje
temperaturas bajas y medias requieren supervisado, significa que previamente se
un factor de riego mínimo (80 – 85%) debe etiquetar el conjunto de datos de
para compensar los efectos de un alza entrenamiento con la clase esperada dada
de temperatura por cada fila de datos, en este caso, sin tos
inmediatamente después de una fuerte o con tos.
helada.
La desventaja que tiene KNN es que no
Uno de los análisis estadísticos que se les realiza puede aprender un modelo explícito, lo
a los datos es el cálculo de la media y que hace es memorizar las instancias de
desviación estándar para cada una de las entrenamiento, las cuales forman la base
variables predictoras y para cada una de de
conocimiento para la fase de construir y particularmente útil para conjuntos de datos
predicción. [6] muy grandes.
b) Clasificador de Naive Bayes El clasificador asume que el efecto de una característica
particular en una clase es independiente de otras
Naive Bayes es un algoritmo muy bueno para características. Incluso si estas características son
la clasificación basado en el teorema de Bayes interdependientes, estas características se consideran de
con una suposición de independencia entre los forma independiente. Esta suposición simplifica la
predictores, en realidad es muy sencillo, fácil de computación, y por eso se considera ingenua. Esta
suposición se denomina independencia condicional de
clase. [7]
𝑷(𝑨|𝒃𝟏, 𝒃𝟐, . . , 𝒃𝒏−𝟏, 𝒃𝒏)
La fórmula del teorema de Bayes es: = 𝑷(𝑨)𝑷(𝒃𝟏, 𝒃𝟐, . . , 𝒃𝒏−𝟏, 𝒃𝒏|𝑨)
𝑷(𝑩|𝑨) 𝑷(𝑨)
𝑷(𝑨|𝒃𝟏, 𝒃𝟐, . . , 𝒃𝒏−𝟏, 𝒃𝒏)
𝒏
= 𝑷(𝑨) ∏ 𝑷(𝒃𝒊 |𝑨) (𝟑)
𝒊=𝟏

Como tenemos 2 clases que clasificar en este


trabajo, la ecuación (3) se debe usar tanto para
la clase con tos y sin tos, donde n es el número
de las características usadas, en este caso 9. Se
puede obtener más información sobre el
algoritmo en [7].

c) Árbol de decisión
El árbol de decisiones en esencia es un
diagrama de flujo, con una amplia
aplicabilidad, aunque no tienen un ajuste ideal
si los datos tienen un gran número de
características, esto genera una cantidad
enrome de decisiones y la complejidad del
árbol sería alta.

Los árboles de decisión se crean utilizando una


heurística llamada
𝑷(𝑨|𝑩) = (𝟐)
𝑷(𝑩) partición recursiva, la cual va
Donde: dividiendo los datos en subconjuntos de
las características cada vez más
 P(A): es la probabilidad de que la pequeños de clases similares. Todo
hipótesis A sea cierta comienza con el nodo raíz (representa el
(independientemente de los datos). conjunto de datos completo), el algoritmo
 P(B): probabilidad de los datos escoge una característica que es la más
(independientemente de la hipótesis).
 P(A|B): es la probabilidad de la predictiva de la clase, se divide entonces
hipótesis A dada los datos B. en grupos con distintos valores de esta
 P(B|A): es la probabilidad de los datos B característica formando de esta manera las
dado que la hipótesis A era cierta. primeras ramas del árbol. Posteriormente
el algoritmo sigue dividiendo y creando
La ecuación (2) es válida para una característica, nodos que le permitan alcanzar un criterio
pero en este caso se trabajan 9 características (ver de detención.
Tabla1), por lo cual se debe generalizar el teorema
de Bayes, obteniendo la siguiente expresión:
El árbol de decisión continúa dividiendo crecimiento del árbol es limitar de cierta forma el
indefinidamente las características y número de decisiones, así se garantiza que el árbol
creando evite hacer trabajos innecesarios. Esto también es
subconjuntos cada vez más pequeños, pero una desventaja, pues nada garantiza que el árbol se
esto precede a un problema, pues entre pierda algún patrón importante. [8]
más grande sea el árbol, las decisiones que
debe tomar para clasificar serán cada vez Una alternativa, llamada post-poda, consiste en crear
más específicas, y cuando se realice un un árbol que sea demasiado grande, luego usar
entrenamiento con los datos de prueba, el criterios de poda basados en las tasas de error en los
modelo quedará sobre ajustado con estos nodos para reducir el tamaño del árbol a un nivel
datos de entrenamiento. Para ello es más apropiado. Este es a menudo un enfoque más
necesario un proceso de poda que reduce efectivo que la poda previa porque es bastante difícil
el tamaño del nodo para que generalice determinar la profundidad óptima de un árbol de
mejor los datos. Una manera de detener el decisión sin hacerlo crecer primero.
d) Máquinas de soporte vectorial planos e hiperplanos que distinguen de
forma equidistante a los datos clasificados
La máquina de soporte vectorial usada en distintas dimensiones, de esta manera
para clasificar los datos se basa en un los datos quedan distribuidos
método de modelamiento de homogéneamente a raíz de dichas
particiones.
Por ejemplo, en un espacio de 2 dimensiones un
hiperplano es un subespacio plano de una sola
dimensión, o lo que es lo mismo, una línea,
definida por la ecuación lineal:

𝜷𝟎 + 𝜷 𝟏 𝑿 𝟏 + 𝜷 𝟐 𝑿 𝟐 = 𝟎 (𝟖)
El algoritmo escoge el mejor plano posible
buscando que exista el mayor margen de
separación entre las clases a dividir ya que es
muy probable que la línea (o el plano) con
mayor margen conduzca a una clasificación más
acertada en el futuro. Dentro de este
clasificador, existen los vectores de soporte, que
son aquellos puntos que están sobre el límite de
los planos de división, usando estos vectores es
que se define el MMH (maximal magin
hyperplane).

Sin embargo, como es de esperarse, los datos


en la vida real no son fácilmente separables, es
por esto por lo que el algoritmo también es
capaz de reconocer a los datos “mal
clasificados” que están del otro lado del plano
de separación y les asigna un costo que sirve
también para escoger plano con el máximo
margen posible.

Una de las características más importantes de


los SVM es que son multidimensionales, puesto
que el comportamiento de los datos en la vida
real no se acomoda a una relación lineal y
gracias a esta característica, los datos se
modelan como si lo fueran. A estos métodos de Las ANN (red neuronal artificial) se pueden aplicar en
linealización se les llama Kernel. La tareas de: clasificación, predicción numérica,
clasificación de los datos se hizo probando la reconocimiento de patrones no supervisado. Se aplican
SVM con los distintos Kernel, entre ellos: lineal, mejor a las situaciones donde los datos de se especifican
radial, polinomial e hiperbólico, y de esta bien la entrada y de salida, la parte compleja se encuentra
manera obteniendo información de cuál clasificó entre estos dos puntos. Es por ello que la capacidad de
mejor los datos. Es importante mencionar que una red neuronal para aprender está enraizada en su
los datos del Dataset se acondicionaron para topología, o en los patrones y estructuras de las neuronas
obtener el mejor rendimiento de los SVM interconectadas. Las tres características clave en las ANN
(normalización). [9] son: el número de capas, verificar si la información en la
red puede viajar hacia atrás y el número de nodos dentro
e) Red Neuronal de cada capa de la red.

Las redes neuronales utilizan conceptos


tomados de una comprensión del cerebro
humano para modelar funciones arbitrarias. Las
máquinas de soporte vectorial utilizan
superficies
multidimensionales para definir la relación
entre características y resultados.
conexión a conexión hasta llegar a la 𝒊=𝟏
salida, este tipo de red se denomina
red de avance. A pesar de la En la ecuación (6) se representa la manera de
restricción en el flujo de información, calcular las entradas de la red neuronal cuyo
las redes feedforward ofrecen una modelo básico se puede ver la (Ilustración 4).
sorprendente cantidad de flexibilidad. Por lo general, la red neuronal debe aprender
Por ejemplo, el número de niveles y todo el conjunto de patrones de entrenamiento y
por ello no debe entrenarse utilizan do un error
nodos en cada nivel se puede variar, local, sino que el aprendizaje se hace en
se pueden modelar múltiples términos de un error global. En la siguiente
resultados simultáneamente. ecuación definimos el error cuadrático medio:
Ilustración 4. Modelo de Red Neuronal

𝑵
𝑵𝒆𝒕𝒋 = ∑ 𝒙𝒊 𝒘𝒋𝒊 + 𝜽𝒋 (𝟔)

𝒑 𝑵
(𝒌) (𝒌) 𝟐
𝑬𝒓𝒓𝒐𝒓 = 𝟏 ∑ ∑(𝒚 − 𝒅 ) (𝟕)
En general las redes neuronales son alimentadas 𝟐𝑷 𝒌=𝟏 𝒋=𝟏 𝒋 𝒋
por la señal de entrada dirigiéndose en una
dirección continua de
Donde: f) Regresión Logística Multivariable
 N: número de neuronas en la capa de
salida Las regresiones en general consideran la
 P: número de patrones de relación que existe entre una variable
entrenamiento [10] numérica con una o más variables numéricas
dependientes o independientes. La regresión
Para la aplicación de este algoritmo logística es un método de regresión que
(específicamente para el factor de riego) se han relaciona una variable cualitativa binaria con
dispuesto de dos capas ocultas, para lograr la una o más variables cuantitativas. En este
mejor exactitud, toda vez que con una sola capa caso, utilizamos esta bondad de la regresión
la exactitud oscilaba entre el 30% y 40%, logística ya que la clasificación de los datos de
mientras que, con una capa extra, la exactitud tos se puede expresar de manera binaria. [11]
del método mejora a un 90% de exactitud.
La regresión logística permite modelar los
En la Ilustración 5, se muestra el diagrama que datos no linealmente sino con una función cuyo
corresponde a la red neuronal propuesta para el
sistema en mención; para este caso los pesos y rango esta siempre entre 0 y
kernel se obtienen del programa usando las 1. Una de las funciones más usadas en casos
librerías de Sk. Learn y sobre esos valores como este es la función sigmoide.
se realizan manualmente las funciones
RELU y Sigmoide correspondientes para cada 𝟏
capa de entrada y salida 𝝈(𝒙) = (𝟒)
respectivamente. 𝟏+𝒆 −𝒙
Este modelo se basa en asignar una
probabilidad (valor de la función) al clasificador
en donde discriminará unos datos de otro y
finalmente los clasificará según su nivel de
probabilidad. Por lo cual una vez estimados los
coeficientes del modelo logístico, es posible
conocer la probabilidad de que la variable
dependiente pertenezca al nivel de referencia,
dado un determinado valor del predictor. Para
ello se emplea la ecuación del modelo:

𝟏 ̂ ̂ (𝟓)
𝒑̂ (𝒀 = )= 𝒆𝜷𝟎 +𝜷 𝟏𝒙
𝜷̂ +𝜷̂ 𝒙

Ilustración 5. Red Neuronal Factor de Riego 𝑿 𝟏+𝒆 𝟎 𝟏


Haciendo uso de las ecuaciones de aplicación
para el clasificador de regresión multivariable
y tomando los
valores de 𝛽 que resultan de los algoritmos, se artículo.
muestran en la Ilustración 6 las ecuaciones
correspondientes para el método. Los resultados que se encuentran a
continuación corresponden al
rendimiento presentado para los datos con cada
uno de los clasificadores.

I. Matriz de Confusión

a) Clasificador KNN
DATOS DE PRUEBA
PREDICCIÓN ASPERS MICROASPER GOT
IÓN SIÓN EO
Ilustración 6. Ecuaciones clasificador de regresión ASPERSIÓN 15 0 0
logística MICROASPER 2 17 0
SIÓN
GOTEO 0 1 20

b) Clasificador de Naive Bayes


3. RESULTADOS DATOS DE PRUEBA
PREDICCIÓN ASPERSI MICROASPERSI GOT
Si bien es cierto los algoritmos de machine ÓN ÓN EO
learning son aplicables a cualquier conjunto de ASPERSIÓN 19 0 0
datos, una de las etapas más importantes para MICROASPERSI 0 18 0
obtener un sistema de procesamiento y ÓN
clasificación automático eficiente corresponde c) Árbol de decisión
a el estudio de la precisión de cada uno de los DATOS DE PRUEBA
métodos, junto con su matriz de confusión, la
cual permite visualizar el desempeño de cada PREDICCIÓN ASPERS MICROASPER GOT
uno de los algoritmos. En la matriz de IÓN SIÓN EO
confusión se representan el número de ASPERSIÓN 20 0 0
predicciones de cada clase respecto a las MICROASPER 0 18 1
instancias o elementos “bien clasificados” en la SIÓN
clase que corresponde. GOTEO 0 0 16
Los dos elementos anteriormente d) Máquinas de soporte vectorial
mencionados permiten comparar el
rendimiento de todos los clasificadores, definir DATOS DE PRUEBA
el clasificador con el mejor desempeño. PREDICCIÓN ASPERS MICROASPER GOT
IÓN SIÓN EO
Finalmente, el clasificador con mejor ASPERSIÓN 9 0 10
rendimiento será del que se implementará en MICROASPER 2 0 18
hardware, tal y como se ha mencionado en el SIÓN
título de este GOTEO 2 0 14

e) Red Neuronal (MLP)


DATOS DE PRUEBA
PREDICCIÓN ASPERS MICROASPER GOT
IÓN SIÓN EO
ASPERSIÓN 14 0 0
MICROASPER 0 16 0
SIÓN
GOTEO 0 2 23
f) Regresión Logística 4. ANÁLISIS
Multivariable
5. CONCLUSIONES
DATOS DE PRUEBA
PREDICCIÓ ASPERS MICROASPER GOT
N IÓN SIÓN EO 6. REFERENCIAS BIBLIOGRÁFICAS
ASPERSIÓN 17 0 0
MICROASPER 0 16 0
SIÓN
GOTEO 0 0 22

II. Exactitud de los clasificadores


Tabla 3. Exactitud de los clasificadores

Clasificador Exactitu
d
Clasificador KNN 94%
Clasificador Naive Bayes 96%
Árbol de Decisión 99,20%
Máquina de Soporte Vectorial 49%
Red Neuronal (MLP) 96%
Regresión Logística
Multivariable 100%

a) Validación
Haciendo un estudio sobre el desempeño
de cada uno de los clasificadores, resulta ser
el clasificador de Regresión Logística
Multivariable el que mejor desempeño
presenta; con un rendimiento del 100% y
una matriz de confusión perfecta
(clasificando al 100%) se elige como el
clasificador estrella de todo el proceso de la
aplicación de los algoritmos de machine
learning.

b) Implementación

Finalmente, el clasificador con mejor


rendimiento será del que se implementará
en hardware, tal y como se ha mencionado
en el título de este
[1] N. G.M, «Intagri S.C,» [En línea].
Available:
https://www.intagri.com/articulos/nutri ci
%20on-vegetal/estres-vegetal-parte-1-
estres-%20por-altas-temperaturas..
[Último acceso: 1 09 2020].

[2] R. APD, «apd,» 04 04 2019. [En línea].


Available: https://www.apd.es/algoritmos-
del- machine- learning/#:~:text=Conceptos
%20como% 20inteligencia%20artificial
%20(IA,inel udibles%20en%20el
%20contexto%20act ual.&text=En%20su
%20forma%20m% C3%A1s%20b
%C3%A1sica,dentro%20d e%20un
%20rango%20aceptable..
[Último acceso: 2020 11 18].

[3] «Arduino STORE,» [En línea].


Available:
https://store.arduino.cc/usa/nano-33-
ble-sense. [Último acceso: 18 11 2020].

[4] C. B. e. Irrigazione, «Wikipedia,»


Edagrícola , 1970. [En línea]. Available:
https://es.wikipedia.org/wiki/Riego#:~:t
ext=Actualmente%2C%20se%20utiliza
%20el%20riego,y%20la%20fertilizaci%
C3%B3n%20del%20suelo.&text=Para%
20implantar%20un%20sistema%20efici
ente,%2Dplanta%20y%20Agua%2Dsuel
o.. [Último acceso: 18 11 2020].

[5] «Fao.org,» [En línea]. Available:


http://www.fao.org/3/aj470s/aj470s02.p
df. [Último acceso: 1 9 2020].
[6] «Clasificador con K-Nearest-Neighbor,»
Na8, 10 6 2018. [En línea]. Available:
https://www.aprendemachinelearning.c
om/clasificar-con-k-nearest-neighbor-
ejemplo-en-python/.. [Último acceso: 18
11 2020].

[7] L. González, Naive Bayes - Teoría, 10 9


2019. [En línea]. Available:
https://ligdigonzalez.com/naive-bayes-
teoria-machine-learning/..

[8 L. J. Moscovitz. [En línea]. Available:


http://www.konradlorenz.edu.co/images
] /stories/articulos/Leonardo_Jimenez_M
oscovitz_Especializacion.pdf.

[9 C. Martínez, «MÁQUINAS DE VECTOR


SOPORTE,» 2018. [En línea]. Available:
] https://rpubs.com/Cristina_Gil/SVM..

[1 N. Anzola, «Máquinas de soporte vectorial


y redes neuronales artificiales en la
0] predicción,» USD/COP, 2015.

[1 J. Rodrigo, 2016. [En línea]. Available:


1] https://www.cienciadedatos.net/docume
ntos/27_regresion_logistica_simple_y_
multiple..

8. ANEXOS

También podría gustarte