Documentos de Académico
Documentos de Profesional
Documentos de Cultura
M0
1 Pregrado
Ingeniería Electrónica
Escuela Colombiana de Ingeniería Julio Garavito
Brayan.rodriguez-c@mail.escuelaing.edu.co
0000-
0002-5378-6313
Investigación y desarrollo
2 Pregrado
Ingeniería Electrónica
Escuela Colombiana de Ingeniería Julio Garavito
Maria.rodriguez-pe@mail.escuelaing.edu.co
0000-
0002-2262-7176
Investigación y desarrollo
3 Doctorado
Ingeniería Electrónica
Escuela Colombiana de Ingeniería Julio
Garavito Javier.chaparro@escuelaing.edu.com
Investigación, Desarrollo y asesoría
Abstract
This article contains a detailed report on the development and execution of the project that aims to
identify the irrigation factor in plants using the automatic learning method and then implement an
irrigation system capable of predicting this factor and activate the irrigation system accordingly. The
development includes a research process, data collections for training, the use of classification
techniques and finally their implementation.
Palabras clave
Machine Learning, Factores de riego, goteo, aspersión, microaspersión, técnicas de clasificación-
1. INTRODUCCIÓN distintos
2.2 Caracterización
2.3 Clasificadores
Ilustración 3. Caracterización y clasificación
a) Clasificador KNN
En la figura 1. Representamos las En En la Es un algoritmo basado en instancia de
Ilustración 3. Se representan las clases tipo supervisado de Machine Learning. Es
anteriormente descritas: un método bastante sencillo que
esencialmente busca las observaciones
- Verde: Riego por aspersión más cercanas a la que está tratando de
- Azul: Riego por microaspersión predecir y clasifica el nuevo punto de
- Amarillo: Riego por goteo. interés basado en la mayoría de los datos
que le rodean. Para encontrar la distancia
Amarillo/Riego por goteo: Plantas en
más corta entre las múltiples
extrema sequía y humedad media
observaciones se aplica la ecuación de la
sometidas a altas temperaturas
distancia Euclídea [4]:
requieren el mayor factor de riego (90
-95%).
Azul /Riego por microaspersión: 𝒏
Plantas con suelo húmedo a
temperaturas altas requieren un factor 𝒅(𝑨, 𝑩) = √∑(𝑨𝒊 − 𝑩𝒊)𝟐 (𝟏)
de riego medio (85 – 90%). 𝒊=𝟏
Verde/ Riego por aspersión:
Plantas con suelo húmedo y con
KNN al ser un algoritmo de aprendizaje
tendencia a la sequía, sometidas a
supervisado, significa que previamente se
temperaturas bajas y medias requieren
un factor de riego mínimo (80 – 85%) debe etiquetar el conjunto de datos de
para compensar los efectos de un alza entrenamiento con la clase esperada dada
de temperatura por cada fila de datos, en este caso, sin tos
inmediatamente después de una fuerte o con tos.
helada.
La desventaja que tiene KNN es que no
Uno de los análisis estadísticos que se les realiza puede aprender un modelo explícito, lo
a los datos es el cálculo de la media y que hace es memorizar las instancias de
desviación estándar para cada una de las entrenamiento, las cuales forman la base
variables predictoras y para cada una de de
conocimiento para la fase de
predicción. [6] b) Clasificador de Naive Bayes
Naive Bayes es un algoritmo muy bueno para 𝑷(𝑨|𝒃𝟏, 𝒃𝟐, . . , 𝒃𝒏−𝟏, 𝒃𝒏)
la clasificación basado en el teorema de Bayes = 𝑷(𝑨)𝑷(𝒃𝟏, 𝒃𝟐, . . , 𝒃𝒏−𝟏, 𝒃𝒏|𝑨)
con una suposición de independencia entre los
predictores, en realidad es muy sencillo, fácil de 𝑷(𝑨|𝒃𝟏, 𝒃𝟐, . . , 𝒃𝒏−𝟏, 𝒃𝒏)
𝒏
construir y particularmente útil para conjuntos
= 𝑷(𝑨) ∏ 𝑷(𝒃𝒊|𝑨) (𝟑)
de datos muy grandes.
𝒊=𝟏
El clasificador asume que el efecto de una Como tenemos 2 clases que clasificar en este
característica particular en una clase es trabajo, la ecuación (3) se debe usar tanto para
independiente de otras características. Incluso si la clase con tos y sin tos, donde n es el número
estas características son interdependientes, estas de las características usadas, en este caso 9. Se
características se consideran de forma puede obtener más información sobre el
independiente. Esta suposición simplifica la algoritmo en [7].
computación, y por eso se considera ingenua.
Esta suposición se denomina independencia c) Árbol de decisión
condicional de clase. [7]
El árbol de decisiones en esencia es un
La fórmula del teorema de Bayes es: diagrama de flujo, con una amplia
aplicabilidad, aunque no tienen un ajuste ideal
𝑷(𝑩|𝑨) 𝑷(𝑨)
si los datos tienen un gran número de
características, esto genera una cantidad
enrome de decisiones y la complejidad del
árbol sería alta.
𝟏
𝒑̂(𝒀 = ) ̂
𝒆𝜷𝟎 +𝜷
̂
𝟏𝒙 (𝟓)
= 𝜷̂ +𝜷̂ 𝒙
Clasificador Exactitu
d
Clasificador KNN 94%
Clasificador Naive Bayes 96%
Árbol de Decisión 99,20%
Máquina de Soporte Vectorial 49%
Red Neuronal (MLP) 96%
Regresión Logística
Multivariable 100%
a) Validación
Haciendo un estudio sobre el desempeño
de cada uno de los clasificadores, resulta ser
el clasificador de Regresión Logística
Multivariable el que mejor desempeño
presenta; con un rendimiento del 100% y
una matriz de confusión perfecta
(clasificando al 100%) se elige como el
clasificador estrella de todo el proceso de la
aplicación de los algoritmos de machine
learning.
b) Implementación
6. REFERENCIAS BIBLIOGRÁFICAS
8. ANEXOS