Está en la página 1de 12

Información Tecnológica

Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar
Vol. 33(3), 117-128 (2022)
http://dx.doi.org/10.4067/S0718-07642022000300117

Desarrollo de un sistema de clasificación de imágenes


digitales para medir la humedad en granos de café
Yurley T. Tovar, Andrés F. Calvo y Arley Bejarano
Facultad de ingenierías, Dpto. Ingeniería Electrónica, Universidad Tecnológica de Pereira, Pereira, Risaralda, Colombia
(correo-e: yurley-tatiana1997@utp.edu.co; afcalvo@utp.edu.co; abejarano@utp.edu.co)

Recibido Oct. 19, 2021; Aceptado Dic. 22, 2021; Versión final Ene. 28, 2022, Publicado Jun. 2022

Resumen

El principal objetivo de esta investigación es desarrollar un aplicativo móvil que permita medir la humedad en
granos de café por medio del procesamiento de imágenes, de técnicas de aprendizaje supervisado y de visión
por computador. En la etapa de secado de estos se debe garantizar que la humedad este entre el 10 % y el
12 % para certificar su calidad. Se crea una base de datos donde se define el protocolo de captura de
imágenes y se desarrolla un aplicativo móvil integrando el algoritmo diseñado para que los caficultores puedan
usarlo. El muestreo se realiza con celulares de gama media baja. El software es validado en laboratorio y en
campo, demostrando ser eficiente en un 99% y con una aceptación de más del 80% entre los caficultores. Se
concluye que los métodos de aprendizaje de máquina pueden ser adaptados para solucionar problemas en
la caficultura y la agroindustria.

Palabras clave: imágenes; aplicativos móviles; aprendizaje; máquina; profundo; extracción

Development of a digital image classification system for


measuring moisture in coffee beans
Abstract

The primary objective of this research study is to develop a mobile application that measures coffee bean
moisture by using image processing, supervised learning, and computer imaging. Coffee beans must have
moisture content between 10% and 12% to certify their quality. An image database is built, imaging protocols
are defined, and an algorithm is developed and integrated into a mobile application that coffee growers can
use. Testing and sampling is conducted using mid to lower end cell phones. The software is validated both in
the laboratory and in the field, proving to be 99% efficient. The digital image app’s acceptability is over 80%
among coffee growers. It is concluded that machine learning processes can be adapted to solve coffee farming
and agroindustry challenges.

Keywords: image; mobile applications; machine learning; deep; feature extraction

Información Tecnológica – Vol. 33 Nº 3 – 2022 117


Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar

INTRODUCCIÓN
El café juega un papel importante en el desarrollo económico de Colombia. En los últimos años la producción
nacional ha tenido el 8,1% de participación global con $ US 2.526.532, ocupando así el tercer lugar como
productor mundial (Cubillos et al., 2021). Cabe resaltar, que de los 590 municipios involucrados, las zonas
cafeteras consideradas como más importantes son Antioquia, Quindío, Risaralda y Caldas (Salazar, 2021).
No obstante, se ha tenido una reducción considerable en el número de áreas cultivadas debido a las
pérdidas que han tenido los caficultores causadas por plagas, hongos y el mal manejo de las etapas de
producción, problema que podría tratarse a partir del desarrollo de tecnologías que pretendan tecnificar esta
parte del sector productivo (Ocampo y Álvarez 2017; Salazar, 2021).
Una de las etapas productivas más importantes del café es el proceso de secado, el cual, consiste en
determinar el momento en el que la humedad de los granos se encuentra dentro de los porcentajes del 10%
al 12%. Esto se debe a dos razones: La primera consiste en su almacenamiento, ya que puede durar un
tiempo considerable en este estado y se requiere evitar la proliferación de hongos, mohos y fermentaciones
que puedan dañar sus características. Adicionalmente, el exceso o falta de agua puede significar la
disminución de ganancias para los caficultores enfocados en su venta finalizada esta fase (Fantazzini et al.,
2018; Guevara et al., 2019). Uno de los problemas más comunes que se tiene al medir la humedad del café
en la etapa de secado, se debe a que los caficultores obtienen este dato de manera empírica, donde, la
persona encargada opta por técnicas como morder, sacudir, crujir u observar el color de las almendras. Sin
embargo, esta esta actividad hace que la medida tomada sea subjetiva dando paso a interpretaciones
erróneas que ponen en riesgo todo el proceso de producción y la comercialización del grano. Es por esto, que
se hace necesario contar con instrumentos junto técnicas adecuadas que permitan extraer información
confiable.
Actualmente, existen equipos especializados que permiten determinar el grado de humedad del café de
manera confiable a partir de dos técnicas: La primera, consiste en utilizar métodos directos como el uso de
imágenes hiperespectrales (Caporaso et al., 2018) y espectroscopia infrarroja (Barbin et al., 2014). La
segunda, hace uso de mediciones indirectas donde los equipos se basan en las propiedades eléctricas de los
granos. En este caso, la unidad de medida es la corriente eléctrica convirtiendola en el contenido de humedad.
Dentro de los dispositivos más comunes que aplican este método están: MT-PRO, humímetro FS3, PM-410
y DHS-16A. Por otro lado, también se tiene el método Graviment, desarrollado por Cenicafe, el cual funciona
mediante un registro del peso de una muestra con granos de café, y la relación indica que al alcanzar los 104
o 105 gramos, la humedad relativa estaría entre el 10% y el 12% (Oliveros et al., 2009). Sin embargo, una de
las desventajas de todos los métodos nombrados consiste en que los procesos son realizados de forma
manual, lo que requiere de inversiones adicionales puesto que se necesita la contratación de personas
expertas o capacitar aquellas que harán uso de ellas.
Los métodos de medición de la humedad de café directos proporcionan una mayor confiabilidad en los
resultados obtenidos, ya que exigen un mayor cuidado y rigurosidad en el proceso, sin embargo, los equipos
utilizados son altamente costosos, razón por la cual generalmente se encuentran en laboratorios
especializados, adicionalmente, el proceso de medición resulta ser lento. Por otra parte, para calibrar los
equipos que realizan las mediciones indirectas, se deben establecer tablas de calibración que se ajusten de
acuerdo con el tipo del grano de café que se desea medir, en este caso el instrumento tendrá un margen de
error proporcionado por el calibrador. Finalmente, estos últimos también representan una alta inversión para
aquellos caficultores que deseen adquirirlos.
En este punto, cabe resaltar que las herramientas desarrolladas para la agricultura han demostrado ser
efectivas, ya que permiten realizar el monitoreo constante tanto de los cultivos como de sus procesos de
producción (Cisternas, 2020). Todo lo anterior se traduce en la búsqueda de la obtención de información que
sea oportuna, verás, confiable y respaldada, con la finalidad de mejorar todos los procesos involucrados y de
esta manera alcanzar mayores ganancias. Algunas de las tecnologías implementadas son: Softwares webs
que brindan todo tipo de información, realizan el monitoreo de variables agrícolas, entre otros; teledetecciones
con drones que permiten hacer el análisis de los cultivos con rapidez en grandes superficies, estudios
topográficos, controles de temperatura, etc, y sistemas de sensores con la finalidad de monitorizar los
parámetros determinantes para contar con una la mejor producción (Romero et al., 2018; Vega et al., 2021).
Los aplicativos móviles, por su parte, se han convertido en tecnologías ampliamente utilizadas por los
caficultores y agricultores en general debido a su facilidad de portabilidad, además de permitirles tener en
tiempo real los datos correspondientes al monitoreo de sus cultivos y procesos de producción para la toma
de decisiones temprana y acertada (Cisternas, 2020), todo esto sin requerir mayores inversiones como la
contratación de un experto o compra de equipos especializados. Algunas de las aplicaciones dedicadas para
el sector del café son: Saillog Ltd. y Cenicafé para informar cómo tratar enfermedades, plagas y deficiencias
nutricionales; Cafetalsoft, contribuye a la planificación de las prácticas de los cultivos de café, la utilización de
fertilizantes y generación de información tributaria; AlmacafeApp, app del café y Anacafe para consultar

118 Información Tecnológica – Vol. 33 Nº 3 – 2022


Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar

precios futuros del café, boletines técnicos y avisos importantes; entre otros. Sin embargo, hasta el momento,
no existe ninguna App enfocada en tecnificar alguna de las etapas de producción del café, las cuales
representan un papel importante para obtener un producto final de alta calidad.
El desarrollo de nuevas herramientas que permiten realizar diagnósticos en el sector agrícola ha tomado
fuerza gracias a la utilización de técnicas de aprendizaje de maquina y aprendizaje profundo, puesto que
permiten determinar en su gran mayoría los patrones que se generan a la hora de caracterizar enfermedades,
hongos y etapas de producción. Algunas de estas aplicaciones son: El diagnóstico de enfermedades en
plantas (Escudero et al., 2020; Bejarano et al., 2021); El Procesamiento de imágenes para detectar pixeles
enfermos (Singh et al., 2017); Mejoras procesos de clasificación (Cruz et al., 2021), entre otros (Santos et al.,
2020). Adicionalmente, también se han llevado a cabo investigaciones en el sector de la caficultura a partir
de técnicas de aprendizaje supervisado con el fin de obtener patrones del grano. Por ejemplo: Mediante redes
neuronales convolucionales (CNN) se clasificaron los granos de café verde a través sus defectos (Pinto et al.,
2017); Por regresión de mínimos cuadrados se obtiene la predicción de componentes como sacarosa, cafeína
y trigonelina en granos de café verde (Caporaso et al, 2017); Se realiza la clasificación de tres especies de
granos de café por medio el procesamiento de imágenes y la implementación de una red neuronal artificial
(Arboleda et al., 2018); Se clasifican los frutos de café a través de sus características colorimétricas usando
fotografías (Costa et al., 2020), entre otros. No obstante, la mayoría de estos estudios no llegan a
implementarse en softwares de fácil uso para los caficultores.
Cabe resaltar, que, hasta el momento, no se tiene registro de investigaciones que estudien los patrones de
colores que se generan en los granos de café en su fase de secado. Es por esto, que se desarrolló un
aplicativo móvil que por medio de técnicas de aprendizaje y visión por computador permite detectar la
humedad de los granos de café por medio de la captura de imágenes. Esto es posible debido a que de las
fotografías se pueden extraer características robustas como la transformada discreta Wavelet o Fourier
(Bejarano et al., 2018) en diferentes espacios de color como HSV, LAB, entre otros, (Singh et al, 2017), para
entrenar tanto técnicas clásicas de aprendizaje de máquina como las máquinas de soporte vectorial (SVM),
clasificadores bayesianos, árboles de decisión y vecinos más cercanos (KNN) (Biagettia et al., 2017), como
también técnicas de aprendizaje profundo como redes neuronales. Este proyecto, busca apoyar este sector
de la agricultura, teniendo como finalidad la tecnificación del proceso del secado del café.
Para esta investigación fue necesaria la creación de una base de datos en condiciones controladas, ya que,
al no existir investigaciones anteriores, no se tiene registro de imágenes de granos de café que se encuentren
debidamente etiquetadas en función de la humedad que presentan los mismos. Esta contiene un total de 6264
imágenes clasificadas con rangos de humedades desde el 9% hasta el 20% estados donde el fruto se
encuentra en su segunda etapa (Barzola et al., 2020). En este caso, la medida corresponde al dato arrojado
por el medidor experto PM-410. Las ventajas de la aplicación implementada son las siguientes: Primero, los
caficultores podrían saber si los granos de café ya están listos para finalizar el proceso de secado de manera
respaldada y no por medio de actividades empíricas con las que se obtienen mediciones subjetivas. Por otro
lado, no se tendría la necesidad de contratar a un experto o de adquirir la experiencia necesaria, lo que puede
llevar a tener altas pérdidas de dinero. Finalmente, cabe resaltar que el aplicativo es una herramienta de bajo
costo donde no se requeriría de una inversión considerable para tener una medida confiable, además de ser
portable.
Las metodologías implementadas para la detección de la humedad fueron validadas a partir de su eficiencia
en cuanto a la clasificación de imágenes nuevas. Por otra parte, el funcionamiento del aplicativo móvil se
validó según su rendimiento en campo y teniendo en cuenta la percepción por parte de usuarios caficultores,
esto último para garantizar que fuera fácil de usar e interactiva para los usuarios. Finalmente, en este trabajo
se presenta un sistema que permite la detección de la humedad en granos de café por medio de una robusta
metodología, la cual es validado desde su diseño hasta la etapa final donde es utilizado por los caficultores.
Los principales aportes de este artículo son: i) creación de una base de datos con un protocolo de captura y
etiquetada por medio de un sistema experto; ii) diseño y validación de una metodología que mide el nivel de
humedad de los granos de café; y iii) validación del sistema en condiciones reales con productores de la
región.
MATERIALES Y MÉTODOS
A continuación, se presentan de manera detallada las metodologías llevadas a cabo para la implementación
de un aplicativo móvil que permite la medición de la humedad en granos de café, casi como también los
resultados obtenidos a partir de las respectivas validaciones.
Diagnóstico de la humedad
La metodología utilizada para realizar el diagnóstico de la humedad en el café consistió, de manera inicial, en
la creación de la base de datos correspondiente, donde se definió el protocolo de la captura de las imágenes.

Información Tecnológica – Vol. 33 Nº 3 – 2022 119


Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar

Posteriormente, se diseñaron diferentes sistemas de clasificación propuestos en diferentes investigaciones


para la detección de patrones, esto con la finalidad de definir el modelo que genera una mayor eficiencia y
confiabilidad en la medición. Finalmente, se desarrolló un aplicativo móvil integrando el algoritmo diseñado
con la intención de que sea utilizado por los caficultores. En la figura 1 se presenta la metodología de manera
gráfica la cual será explicada con mayor detalle.

Implementación de
la base de datos

Procesamiento de
las imágenes

Clasificación de la
humedad

Validación de los
clasificadores

Implementación del
aplicativo móvil

Validación del
aplicativo móvil

Fig. 1. Metodología diseñada para el desarrollo del proyecto.

Base de datos

En la literatura se puede verificar que existen diferentes métodos que son usados para la medición de la
humedad del café, donde la más utilizada consiste en realizar una actividad empírica donde el caficultor trilla
los granos y por medio de su experiencia determina si estos se encuentran listos para continuar con la
siguiente etapa de producción o no, dicha decisión se toma de manera subjetiva lo que puede conllevar a
pérdidas económicas considerables. Por otro lado, al realizar una búsqueda más exhaustiva se determinó
que existe una gran laguna de investigación en este sector de la agricultura y que no se encuentran bases de
datos de imágenes bajo protocolos de captura que permitan clasificar el café en sus diferentes etapas de
humedad.

Debido a lo anterior, se construyó una base de datos teniendo en cuenta cumplir con un protocolo de captura
de imágenes el cual es el siguiente: Primero, se extraen las submuestras de todo el café que se encuentre en
proceso de secado; Segundo, se realiza la medición de la humedad de la sección separada para dicha tarea,
esto a partir del medidor experto Grain Moisture Tester PM-410 (KETT, 2020); Tercero, se verifica que las
condiciones lumínicas sean las mejores, se recomienda tomar las fotos en la franja horaria de 9:00am a
4:00pm. Así mismo, es necesario garantizar que las imágenes no presenten ninguna distorsión ni poda
iluminación; Cuarto, se capturan las fotografías utilizando un estudio de fondo blanco enfocando únicamente
los granos de café a una distancia de 20cm, la superficie debe encontrarse totalmente limpia. En la figura 2
se muestra de manera gráfica el procedimiento llevado a cabo y los equipos utilizados para la captura de las
imágenes.

Fig. 2. Equipos y procedimiento realizado para realizar la captura de las imágenes de la base de datos.

120 Información Tecnológica – Vol. 33 Nº 3 – 2022


Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar

El muestreo se realizó con celulares de gama media baja, cuyas cámaras poseen una resolución de 12MB
(4000x3000) y 13Mp (4160x3120). Este tamaño de imagen es adecuado, puesto permite muestrear las
diferentes tonalidades de colores que presentan los granos de café al cambiar de humedad. Cada una de las
fotos capturadas fueron guardadas en archivos cuyos nombres correspondieron a la humedad que
presentaron los granos, métrica obtenida del medidor experto. En la figura 3 se presenta un diagrama general
de la captura y etiquetado de la base de datos. La base de datos descrita se puede encontrar en el siguiente
enlace, donde el rango de humedad de los granos de café se encuentra entre 9% y 20%. Se debe tener en
cuenta que las imágenes se encuentran con su máxima resolución https://1bestlinks.net/jP2Di. En esta base
de datos se cuenta con un total de 12000 imágenes, distribuidas de forma balanceada en cada una de las
clases.

Cantidad de Cantidad de
Clase Clase
muestras muestras
9 1000 15 1000
10 1000 16 1000
11 1000 17 1000
12 1000 18 1000
13 1000 19 1000
14 1000 20 1000

Fig. 3. Procedimiento realizado para la creación de la base de datos.

Procesamiento de imágenes

Inicialmente, se redimensionan todas las imágenes a un tamaño de 500 x 500 pixeles utilizando el método de
interpolación bicúbico (Sreedhar et al., 2013) a partir de la función principal de redimensionamiento de Python
Image.Resize(). Se realiza este proceso, debido a que las imágenes son de alta resolución y la metodología
funciona correctamente al utilizar fotografías de menor tamaño, lo que permite optimizar el costo
computacional de la misma (Escudero et al., 2020). Como se especifica en (Escudero et al., 2020), el algoritmo
puede llegar a tener precisiones iguales al trabajar con la imagen completa o con tamaños de hasta 100x100
pixeles, sin embargo, no redimensiona a este tamaño desde el principio, debido a que la fotografía queda
borrosa y se pierde la información necesaria para detectar el patrón. Por lo anterior, se define una región de
interés dentro de la imagen de 500x500 pixeles que abarque el grano de café y cumple con el tamaño
recomendado. Para obtener esta sección, se ubica el recorte en centro de la imagen, debido a que los granos
siempre se encuentran en esta zona en cada captura de la base de datos.

Finalmente, se resaltaron los colores de los granos de café y eliminó el fondo de las imágenes, para esto, se
implementó un algoritmo de procesamiento donde se aumenta el contraste de los pixeles aplicando un filtro
Gaussiano con sigma 0.1, posteriormente la imagen se dividió en sus 3 canales respectivos RGB donde los
pixeles que no correspondían a los granos de café se pusieron de color negro. Por último, las ventanas RGB
se volvieron a unir transformándolas a escala de grises. En la figura 4 se observa el resultado de aplicar el
algoritmo.

Algoritmo de
Redimensio-
acondiciona-
namiento de la
miento de
imagen
imagen

Imagen de la base de Imagen de la base Imagen de la base de


datos en RGB de datos en RGB datos Procesada
4000x3000 100x100 100x100

Fig. 4. Proceso realizado en la etapa de procesamiento de imagen.

Información Tecnológica – Vol. 33 Nº 3 – 2022 121


Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar

Extracción de características

En esta etapa se computan y se analizan los mejores descriptores para identificar la humedad en los granos
de café a través de las imágenes. En este proceso no solo se extraen las propiedades del color de las
imágenes sino también las diferentes transformadas para obtener las mejores características que permitan
identificar el objetivo propuesto (Bejarano, 2018). En la figura 5 se presentan los atributos obtenidos los cuales
se explicarán con mayor detalle posteriormente.

Transformada Discreta Wavelet


(DWT) (1x12) Descriptor de
salida:
x = [DWT, H]
(1X33)
Histogramas (H) (1x21)

Imagen procesada
100x100

Fig. 5. Proceso realizado en la etapa de extracción de características

El primer descriptor escogido corresponde a la Transformada Discreta Wavelet, ya que es una de las
herramientas más utilizadas con el fin de resolver problemas de compresión de imágenes, realce de
características, análisis de texturas y eliminación de ruido, permitiendo extraer los detalles desde diferentes
niveles de resolución. Esto se logra a parir de la descomposición la imagen original en cuatro sub-imágenes,
donde, a cada una de ellas, se les aplica filtros específicos que proporcionan el realce de los detalles,
generando como salida cuatro matrices de coeficientes, una de aproximación, y los otros tres con los detalles
verticales, horizontales y diagonales respectivamente (Pérez et al., 2017). Finalmente, para cada matriz de
coeficientes (vertical, horizontal y diagonal), se calcularon los momentos estadísticos de media (µ), desviación
estándar (σ), sesgo (δ) y curtosis (κ), los cuales describen las variaciones entregadas por cada dirección de
la transformada de una forma reducida, sin eliminar información relevante para la descripción del patrón, lo
que resulta fundamental para disminuir el costo computacional del mismo. Lo anterior permite obtener el
descriptor DWJ dado por (Escudero et al., 2020):

DWJ(j,m,u) = [µj ,µm ,µu ,σj ,σm ,σu ,δj ,δm ,δu ,κj ,κm ,κu ] =[1x12] (1)

El último descriptor escogido corresponde al cálculo de los histogramas de las imágenes con un total de 21
bins donde se obtiene el descriptor H. Éste es escogido ya que permite obtener la distribución de colores de
las imágenes en función de la frecuencia de los mismos en intervalos de datos. Se elige 21 componentes del
histograma, debido a que esta cantidad de bins, genera el mejor rendimiento para la detección de humedad.
Para determinar este resultado, se realizaron pruebas variando el número de bins y verificando el porcentaje
de acierto de la metodología.

H=[Histo1,Histo2,Histo3,…,Histo20,Histo21]=[1x21] (2)

Finalmente, se obtiene el vector de descriptores 𝑋𝑖 que describirá cada una de las imágenes cuya
representación es la siguiente:

Xi =[DWJ(j,m,u) , H]=[1x33] (3)

Clasificación de la humedad en los granos de café

En esta etapa se llevó a cabo la implementación y análisis de diferentes metodologías de clasificación de


aprendizaje supervisado para la detección de la humedad en el café. En este caso, por un lado, se
desarrollaron los métodos de máquina de soporte vectorial, árbol de decisiones y KNN, los cuales
corresponden a los algoritmos de aprendizaje de máquina más comúnmente utilizados para la detección de
patrones. Por el otro, también se llevaron a cabo técnicas de aprendizaje profundo como redes neuronales
CNNLeNet, CNN LeNet-v2 y CNN Inception-v3 para realizar la misma tarea, esto debido a que han
demostrado presentar mejores resultados en cuanto a precisión en la clasificación de aplicaciones que se
basan en imágenes en comparación con los métodos tradicionales (Zurita, 2016).

122 Información Tecnológica – Vol. 33 Nº 3 – 2022


Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar

La elección de la mejor metodología se basó, de manera inicial, en determinar cuál de ellas presentaba una
alta eficiencia a la hora de realizar la clasificación de la humedad de los granos de café haciendo uso de
imágenes nuevas no conocidas por los algoritmos. Posteriormente, debido a los rendimientos obtenidos,
también se tuvo en cuenta el tiempo requerido por cada una de las técnicas para entregar los resultados
esperados. Finalmente, se define el clasificador CNNLeNet como el algoritmo óptimo para realizar la tarea
propuesta. Cabe resaltar que la base de datos presenta un correcto balance en cuanto al número de
fotografías que se tienen de cada clase (porcentajes de humedad).
Aplicativo móvil
El aplicativo móvil desarrollado es HumiCafé, el cual permite detectar la humedad en el café utilizando una
estructura cliente-servidor. El dispositivo móvil se utiliza como herramienta de captura y envío de la
información al servidor, en donde se aplica el procedimiento propuesto en la figura 7. En este procedimiento
se ejecuta el algoritmo de aprendizaje supervisado. Este algoritmo se elige, buscando el método que mejor
desempeño evidencia en la etapa de validación de esta investigación. Esta aplicación fue creada para
Smartphones que tienen sistema operativo Android. La estructura cliente-servidor, permite que el celular no
ejecute de manera directa el algoritmo de aprendizaje supervisado, debido a que este exige un gran costo
computacional, lo que garantiza que la aplicación funcione correctamente en celulares que sean de gama
baja o media.
Para empezar el proceso de medición, se captura los granos de café por medio de la cámara del celular, esta
imagen es enviada al servidor, para ser procesada, analizada y así obtener un porcentaje de humedad. Para
realizar la comunicación entre el celular y servidor se realizan solicitudes http-post, estas solicitudes permiten
enviar la información de la imagen y el porcentaje de humedad, para que el celular las muestre en una interfaz.
Cabe resaltar que las fotos también pueden ser analizadas, si están almacenadas del celular, por medio de
la opción galería. En la figura 6 se muestra el funcionamiento del aplicativo móvil.

Envió de
Envió de información
información (Humedad del
(Imagen) café)
HTTP-POST HTTP-POST

Servidor
(Procesamiento y clasificación)

Captura o selección
de imagen

Fig. 6. Descripción gráfica de funcionamiento del Aplicativo móvil.

Inicio

Recepción de la imagen

Procesamiento de la imagen

Clasificación de la humedad
utilizando un modelo de
aprendizaje supervisado

Envío de respuesta al aplicativo


móvil

Fin

Fig. 7. Diagrama de flujo del procedimiento realizado por parte del servidor.

Información Tecnológica – Vol. 33 Nº 3 – 2022 123


Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar

VALIDACION DEL SOFTWARE

El software desarrollado para la detección de la humedad en granos de café fue validado a partir de dos
aspectos: eficiencia de la metodología de clasificación y el funcionamiento del aplicativo móvil en campo junto
a la percepción de los caficultores luego de usarlo. Cada apartado se explicará de una manera más detallada
a continuación.

Validación estadística

Esta validación se realizó con la finalidad de determinar la mejor metodología de clasificación para la
clasificación de la humedad del café por medio de imágenes. En este caso se compararon entre sí los métodos
implementados como la máquina de soporte vectorial, arboles de decisión, KNN y las redes neuronales
CNNLeNet, CNN LeNet-v2, junto a la CNN Inception-v3. Las métricas utilizadas para la elección de la
metodología fueron su eficiencia en cuanto a la clasificación de imágenes nuevas, teniendo en cuenta cada
uno de los niveles de humedad de manera independiente, y el tiempo que les conlleva a cada uno de los
métodos realizar dicho proceso. Para el KNN, específicamente, se utilizaron 5 vecinos y un 70% de imágenes
etiquetadas.

Las pruebas implementadas para determinar la eficiencia de los algoritmos clasificadores se realizaron
utilizando la herramienta de cross-validación, la cual permite fraccionar la base de datos de forma aleatoria y
siguiendo una distribución Gaussiana. Las muestras fueron divididas en dos partes, 70% de los datos para
entrenamiento y 30% para validación, proceso que se repitió de manera aleatoria utilizando un experimento
de Montecarlo. Cabe resaltar que para cada iteración de calculó la respectiva matriz de confusión con la
finalidad de determinar la eficiencia a la hora de calcular el porcentaje de humedad en cada uno de sus niveles
de manera independiente. Finalmente, cada una de las metodologías fue evaluada determinando el tiempo
que le conllevaba clasificar nuevas imágenes. En este caso, se hizo uso de imágenes diferentes a las
utilizadas para el entrenamiento de los algoritmos. Todas las validaciones fueron realizadas en un computador
Intel Core i7 5500U y 8Gb de memoria RAM usando lenguaje Python.

Validación en campo

Luego de evaluar todas las metodologías e implementar la mejor en el servidor con la finalidad de ser utilizada
por medio del aplicativo móvil para determinar la humead en los granos de café, se realiza el proceso de
socialización del software en campo con la finalidad de validar su correcto funcionamiento. Para conocer la
perspectiva del caficultor con respecto al aplicativo móvil, se concertaron diferentes reuniones con algunos
de ellos. En estas se realizó la exposición sobre el cómo utilizar la aplicación, y el protocolo de captura de las
imágenes para obtener una correcta medición de la humedad del café. Adicionalmente, a cada una de las
personas que asistieron se les propuso validar el estado de los granos del café que tuvieran en ese momento
en proceso de secado por medio de la herramienta desarrollada. Luego de que cada uno de los caficultores
utilizaran el aplicativo móvil desarrollado, se realizó una encuesta TAM (modelo de aceptación tecnológico).
Esta actividad busca determinar varias cosas: La primera es la aceptación del aplicativo móvil por parte de
las personas encargadas de realizar el proceso de secado del café, es decir, el grado en el cual consideran
que la aplicación es interactiva y de fácil uso y la segunda es la efectividad y desempeño como sistema de
apoyo (Yong et al., 2010).

RESULTADOS Y DISCUSIÓN

En esta sección se presentan los resultados obtenidos en el diseño del sistema experto implementado, el cual
fue validado con los caficultores. Para lograr determinar la humedad del café por medio de imágenes, se
desarrollaron diferentes técnicas de aprendizaje máquina y aprendizaje profundo cuyos resultados se
presentan en la tabla 1, de los cuales, el método seleccionado como el mejor fue definido a partir de las
métricas de precisión y el tiempo que se toman para realizar una nueva predicción. Esta última, se debe a
que la imagen debe ser envida a un servidor desde el aplicativo móvil y se busca que la respuesta de la
medición sea entregada al caficultor en menor tiempo posible. En la tabla 1 se puede evidenciar que todos
los métodos tuvieron precisiones mayores al 90%, donde se destaca el desempeño de las redes neuronales
ya que todas estas éstas presentaron 99% de aciertos con datos nuevos. Por otro lado, las técnicas de
aprendizaje de máquina como los árboles de decisión, KNN y SVM presentaron porcentajes menores al 95%,
lo que se significa que las redes realizan una mejor extracción de las características que componen a las
imágenes.

En función de los tiempos medidos a cada una de las técnicas evaluadas, se puede concluir que las redes
neuronales requieren de un mayor tiempo de entrenamiento para alcanzar una precisión mayor al 95% donde
los rangos de tiempo se encuentran desde 3 hasta 5 minutos, esto se debe a que se incluye el tiempo que
conlleva extraer las características de cada una de las imágenes. En el caso de los algoritmos de aprendizaje

124 Información Tecnológica – Vol. 33 Nº 3 – 2022


Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar

de máquina, estos solo requieren de unos segundos para realizar su entrenamiento, sin embargo, la
extracción de características se implementa de manera externa donde se puede llegar a la conclusión de que
ambas actividades pueden demorar el mismo tiempo.

Por otro lado, a partir de los resultados obtenidos de los tiempos que les conllevo a cada uno de los métodos
predecir una nueva muestra, se puede determinar que el algoritmo más pertinente a implementar en el
aplicativo móvil es el CNNLeNet, ya que permite entregar la respuesta deseada en el menor tiempo (0,261s)
garantizando una precisión total del 99%. Cabe resaltar que los análisis de precisión de las técnicas utilizadas
no solo se realizaron de manera general, sino también en función de la clasificación realizada por los métodos
teniendo en cuenta cada una de las clases (humedades entre el 9% y 20%,), en este caso, en todas las
iteraciones de validación cruzada se obtuvieron las matrices de confusión, las cuales, posteriormente fueron
estudiadas. Esta información se puede visualizar en la tabla 2.

Tabla 1. Comparación de la precisión total de los clasificadores propuesto y sus tiempos tanto de entrenamiento como
clasificación de cada muestra.

Máquina de
CNN CNN LeNet- Árbol de
Modelo CNN LeNet soporte KNN
Inception-v3 v2 decisión
vectorial
Precisión [%] 99,48 ± 0,05 99,81 ± 0,01 99,71 ± 0,01 97,53±0,02 91,14 ± 0,01 97,55 ± 0,01
Tiempo de
102,72 ± 0,66 335,94 ± 15,96 164,82 ± 6,67 1,480 ±0,02 0,11 ±0,02 0,15 ±0,01
entrenamiento [s]
Tiempo de
predicción por 0,26 ± 0,01 0,37 ± 0,01 0,27 ± 0,02 0,321 ± 0,01 0,32 ± 0,01 0,32 ± 0,02
muestra [s]

Tabla 2. Comparación de clasificadores según su precisión por clase, es decir, por clasificación de la humedad.

Modelo Máquina de
CNN CNN Árbol de
(%) CNN LeNet soporte KNN
Inception-v3 LeNet-v2 decisión
Humedad vectorial
9 100.00±0.00 99,30±0,66 99,41±0,54 97,19±0,87 96,42±1,45 96,26±1,21
10 100.00±0.00 100.00±0.00 100.00±0.00 91,74±1,64 95,96±1,35 95,73±1,58
11 100.00±0.00 100.00±0.00 100.00±0.00 99,01±0,86 96,75±1,27 98,09±0,87
12 100.00±0.00 100.00±0.00 100.00±0.00 98,04±0,59 97,43±1,47 97,32±0,88
13 99,87±0,26 99,79±0,31 99,87±0,25 95,95±0,97 97,92±0,77 98,41±0,87
14 100.00±0.00 99,81±0,28 100.00±0.00 91,71±1,46 97,80±1,01 98,95±0,85
15 99,56±0,48 100.00±0.00 99,93±0,19 99,74±1,03 96,38±1,28 99,74±0,31
16 98,59±0,55 99,86±0,27 100.00±0.00 99,74±0,31 97,19±0,85 97,69±0,78
17 99,37±0,39 99,74±0,31 99,07±0,51 99,86±0,26 98,49±0,75 98,72±1,07
18 100.00±0.00 100.00±0.00 100.00±0.00 99,80±3,10 98,27±1,06 98,91±0,59
19 100.00±0.00 99,81±0,29 100.00±0.00 100.00±0.00 98,26±0,69 99,68±0,31
20 100.00±0.00 100.00±0.00 100.00±0.00 98,36±0,75 99,92±0,23 100.00±0.00

A partir de los resultados obtenidos, se puede demostrar que el sistema experto implementado es una
herramienta altamente eficaz a la hora de medir la humedad del café en comparación con los equipos que
realizan dicha medición ya sea a través de métodos directos o indirectos, esto garantiza que los caficultores
pueden hacer uso de una tecnología confiable, portable y fácil de usar con la cual pueden tomar decisiones
tanto acertadas como respaldadas. Finalmente, por medio de la tabla 2, se puede evidenciar que todas las
metodologías de clasificación implementadas permiten clasificar los posibles valores de humedad del café
con una precisión mayor al 90%, donde las técnicas de aprendizaje profundo presentan mejores rendimientos
en comparación con los resultados obtenidos de los algoritmos de aprendizaje de máquina. Finalmente, se
puede confirmar que la red neuronal CNN LeNet permite obtener dicha medición con un menor índice de error
ya que etiquetó de manera correcta un mayor número de imágenes en comparación con CNN Inception-v3 y
CNN LeNet-v2.

Información Tecnológica – Vol. 33 Nº 3 – 2022 125


Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar

Con la finalidad de conocer la aceptación del aplicativo móvil por parte de los caficultores y determinar su
grado de aceptación, se realizó la encuesta TAM, la cual permite saber si consideran que la aplicación es
interactiva, fácil de usar y si es de gran utilidad. Los resultados obtenidos al realizar el análisis de las
respuestas obtenías al realizar esta actividad son las siguientes: El 83% de las personas encuestadas
determinaron que es de gran utilidad, el 85% precisó una alta efectividad, el 85% un alto desempeño y el 89%
definió que presenta una alta productividad. Dicha información se presenta de manera gráfica en la figura 8.
50 60
44 54
39
40 50
33
Porcentaje

40

Porcentaje
30 32
30
20
20
12
10 4
10
2
0
0
Totalmente de De acuerdo Neutral Totalmente en
Totalmente de De acuerdo Neutral Totalmente en
acuerdo desacuerdo
acuerdo desacuerdo
(a) Opciones (b) Opciones

50 60
43 54
40 50
32
Porcentaje

40 35
Porcentaje

30
21 30
20
20
10 4 7
10 4
0
Totalmente de De acuerdo Neutral Totalmente en 0
acuerdo desacuerdo Totalmente de De acuerdo Neutral Totalmente en
acuerdo desacuerdo
(c) Opciones (d) Opciones

Fig. 8. Resultados de las encuestas de validación de usuario donde se relacionan las opciones que tuvieron los caficultores
con sus respuestas donde: a) es la utilidad, b) corresponde a la efectividad, c) consiste en el desempeño y d) muestra la
productividad.

Existen encuestas recientes, realizadas en el eje cafetero, que revelan que existe un gran porcentaje de
agricultores que cuentan con dispositivos con cámara y acceso a internet ya sea de manera móvil o fija, los
cuales consideran importante contar con aplicativos interactivos y fáciles de usar para mejorar el estado de
sus cultivos, sin embargo, aún existe un alto índice de desconocimiento de las herramientas que ya existen a
su disposición en ocasiones por rechazo al costo que conlleva utilizarlas (Escudero et al., 2020). Esto
corrobora la necesidad de implementar desarrollos que tecnifiquen los cultivos y los procesos agrícolas que
sean de fácil uso y que eviten el alto empleo de inversiones para tener acceso a los mismos.

Cabe resaltar que esta investigación no tiene precedentes con respecto a estudios que permitan realizar la
medición de la humedad de los granos de café a través de técnicas de aprendizaje supervisado y visión por
computador. Por otro lado, el aplicativo desarrollado, es un sistema experto de apoyo a los caficultores que
resulta ser de bajo costo en comparación con los equipos que existen en el mercado, los cuales fueron
nombrados anteriormente y que realizan la misma tarea. Otra de las ventajas del software es que presenta
una alta portabilidad, lo que indica que se puede medir el fenómeno en cuestión en cualquier parte sin
problema alguno al tener conectividad a internet, lo que significa que tampoco hay necesidad de llevar los
frutos a laboratorios externos, lo que evita mayores inversiones.

DISCUSIÓN FINAL

Se desarrolló un sistema de apoyo que permite realizar la medición de la humedad del café por medio de la
captura de imágenes. El uso de esta ayudará al caficultor a determinar si los granos ya se encuentran listos
para terminar con su fase de secado de una manera respaldada, evitando pérdidas tanto en la calidad del
fruto como de dinero. Cabe destacar que los modelos de aprendizaje profundo permiten realizar una mejor
clasificación de la humedad en los granos de café en comparación con las técnicas de aprendizaje de
máquina, esto se debe a que las redes neuronales son algoritmos especializados en la caracterización de
patrones que se encuentran en las imágenes. Por otro lado, las técnicas de aprendizaje profundo requieren

126 Información Tecnológica – Vol. 33 Nº 3 – 2022


Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar

de un mayor tiempo para su entrenamiento en comparación con los algoritmos de aprendizaje de máquina,
esto debido a la gran cantidad de capas que influyen a la hora de obtener los patrones de las bases de datos.
Sin embargo, estos métodos demostraron ser altamente competitivos no solo en cuanto a su eficiencia a la
hora de clasificar nuevas muestras, si no, también en función del tiempo requerido para realizar esta misma
tarea.

Finalmente, cabe destacar que la base de datos utilizada fue creada para realizar esta investigación, esto se
debe a que en la literatura no existe una base de datos de imágenes granos de café debidamente etiquetada
en función de la humedad que presentan los mismos, ya sea por un experto o un medidor calibrado evitando
mediciones subjetivas. Esta misma se puso a disposición del público para facilitar futuras investigaciones que
tengan como objetivo el desarrollo de metodologías que permitan mejorar este proceso.

CONCLUSIONES

De acuerdo con el trabajo presentado y a los resultados obtenidos, se pueden plantear las siguientes
conclusiones principales:

1.- Los métodos de aprendizaje de máquina pueden ser adaptados para solución de problemas de la
agroindustria, generando así apoyos diagnósticos que ayuden al personal en la toma de decisiones y mejora
en la calidad de los productos. Esto puede ser verificado con el diseño de un medidor de humedad de café el
cual logra eficiencias de detección mayores al 95% de acierto.

2.- El uso de aplicativos móviles son fundamentales para la inclusión de nuevas soluciones a la sociedad.
Esto se puede observar en las encuestas TAM, en las que se observa una adecuada aceptabilidad del
producto. Esto se logra debido a la familiaridad que tienen las personas con otras aplicaciones y con el uso
de los celulares, facilitando así el uso de nuevas estas tecnologías.

3.- Gracias al enfoque cliente-servidor adoptado en este trabajo, se puede fortalecer la base datos,
almacenando nuevas imágenes, que son enviadas por las personas que utilizan el producto. Esto permite
reentrenar el modelo de aprendizaje, con nuevas imágenes que pueden traer variabilidad al sistema y así
mejorar la respuesta del sistema. Lo anterior es fundamental no solo para el producto, si no para otras
investigaciones que propongan nuevos métodos basados en la base de datos propuesta en este trabajo. Por
otro lado, esta estructura facilita utilizar modelos de aprendizaje de máquina complejos y robustos, debido a
que el servidor es el encargado de procesar y clasificar la imagen, evitando esta carga al celular. Lo anterior
permite que el aplicativo pueda correr en celulares de alta, mediana y baja gama.

AGRADECIMIENTOS

Los autores agradecen a la Universidad Tecnológica de Pereira y a los integrantes del grupo de investigación
de ingeniería electrónica GIIE, por su apoyo que permitió culminar con éxito este trabajo.

REFERENCIAS

Arboleda, E., Fajardo, A., y Medina, R., Classification of coffee bean species using image processing, artificial neural
network, and K nearest neighbors, https://doi.org/10.1109/ICIRD.2018.8376326, ICIRD, 1–5 (2018)
Barbin, D., Madureira, A., y otros tres autores, Application of infrared spectral techniques on quality and compositional
attributes of coffee: An overview, https://doi.org/10.1016/j.foodres.2014.01.005, Food Research International, 61(1), 23–
32 (2014)
Barzola, A., Quiñones, L., y otros tres autores, Estimación de humedad de café pergamino utilizando un secador solar
automatizado mediante modelos matemáticos en Jaén-Perú, Tecnia, ISSN 2309-0413, 30(1), 107-113 (2020)
Bejarano, A., Calvo, A., y Carlos, H., Descriptores espacio-frecuencia para identificación automática de patrones de
textura en productos textiles utilizando aprendizaje supervisado, https://doi.org/10.18359/rcin.3212, Ciencia e Ingeniería
Neogranadina, 28(2), 63-82 (2018)
Bejarano, A., Escudero, C., y Calvo, A., Black Sigatoka Classification Using Convolutional Neural Networks,
https://doi.org/10.18178/ijmlc.2021.11.4.1055, International Journal of Machine Learning and Computing, 11(4), 323-326
(2021)
Biagettia, G., Crippaa, P., y otros tres autores, A comparative study of machine learning algorithms for physiological
signal classification, https://doi.org/10.1016/j.procs.2018.07.255, 126(1), 1977-1984 (2018)
Caporaso, N., Whitworth, M., Grebby, S., y Fisk, I., Non-destructive analysis of sucrose, caffeine and trigonelline on
single green coffee beans by hyperspectral imaging, https://doi.org/10.1016/j.foodres.2017.12.031, Food Research
International, 106(1), 193–203 (2017)

Información Tecnológica – Vol. 33 Nº 3 – 2022 127


Desarrollo de un sistema de clasificación de imágenes digitales para medir la humedad en granos de café Tovar

Caporaso, N., Whitworth, M., Grebby, S., y Fisk, I.D., Rapid prediction of single green coffee bean moisture and lipid
content by hyperspectral imaging, https://doi.org/10.1016/j.jfoodeng.2018.01.009, Journal of Food Engineering, 227(1),
18 – 29 (2018)
Cisternas, I., Velásquez, I., Caro, A., y Rodríguez, A., Systematic literature review of implementations of precision
agriculture, https://doi.org/10.1016/j.compag.2020.105626, Computers and Electronics in Agriculture, 176(1), 0168-1699
(2020)
Costa, A., de Sousa, D.A.G., y otros tres autores, Classification of Robusta coffee fruits at different maturation stages
using colorimetric characteristics, https://doi.org/10.1590/1809-4430-Eng.Agric.v40n4p518-525/2020, Engenharia
Agrícola, 40(4), 518-525 (2020)
Cruz, O., Carrera, J., y otros seis autores, A novel method for dried chili pepper classification using artificial intelligence,
https://doi.org/10.1016/j.jafr.2021.100099, Journal of Agriculture and Food Research, 3(1), 1543-2666 (2021)
Cubillos, J., Soltész, B., y Vasal, L., Bananas, Coffee and palmoil: The trade of agricultural commodities in the framework
of the EU-Colombia free trade agreement, https://doi.org/10.1371/journal.pone.0256242, PLoS ONE, 16(8), 242-256
(2021)
Escudero, C., Calvo, A., Bejarano, A., y otros dos autores, Development of a digital image classification system to
support technical assistance for Black Sigatoka detection, https://doi.org/10.1590/0100-29452020681, Revista Brasilera
de Fruticultura, 34(2), 681 (2020)
Fantazzini, T., Franco de la Rosa, D., y otros cuatro autores, Association between the artificial aging test and the natural
storage of coffee seeds, https://doi.org/10.1590/2317-1545v40n2188120, Journal of seed Science, 40(2), 164-172 (2018)
Guevara, M., Bernales, C., Saavedra, J., y Owaki, J., Efecto de la altitud en la calidad del café (Coffea arabica L.):
comparación entre secado mecánico y tradicional, https://doi.org/10.17268/sci.agropecu.2019.04.07, Scientia
Agropecuaria, 10(4), 505-510 (2019)
KETT, Kett electric laboratory., PM-410 Grain and coffee moisture tester, https://kett.com (2020)
Ocampo, O., y Álvarez, L., Tendencia de la producción y el consumo del café en Colombia,
https://doi.org/10.19053/01203053.v36.n64.2017.5419, CENES, 36(64), 139-165 (2017)
Oliveros, C., Peñuela, A., y Jurado, J., Controle la humedad del café en el secado solar, utilizando el método
GRAVIMET, Tomado de la biblioteca de CENICAFE – Colombia (2009)
Pérez, M., Lorenzo, J., Pérez, J., y Falcón, A., Filtrado wavelet en estudios planares óseos de Medicina Nuclear,
https://doi.org/10.1016/j.imadi.2016.12.002, Imagen Diagnóstica, 8(1), 3-14 (2017)
Pinto, C., Furukawa, J., Fukai, H., y Tamura, S., Classification of Green coffee bean images base on defect types using
convolutional neural network (CNN), https://doi.org/10.1109/ICAICTA.2017.8090980, ICAICTA, 1–5 (2017)
Romero, L., Piña, F., y Goire, M., Red de sensores inalámbricos para las casas de cultivos protegidos, Revista de
Ingeniería Electrónica, Automática y Comunicaciones, ISSN 1815-5928, 39(1), 16-26 (2018)
Salazar, F. A., Café de Colombia, análisis de los Principales Productores de café del mundo, Repositorio de la
Universidad Tecnológica de Pereira (2021)
Santos, D., Leonardo, D., y Gaona, P., Algoritmos de rastreo de movimiento utilizando técnicas de inteligencia artificial y
machine learning, https://doi.org/10.4067/S0718-07642020000300023, Información tecnológica, 31(3), 23-38 (2020)
Singh, V., y Misra, A., Detection of plant leaf diseases using image segmentation and soft computing techniques,
https://doi.org/10.1016/j.inpa.2016.10.005, Information Processing in Agriculture, 4(1), 41– 49 (2017)
Sreedhar, K., Rama, K., Enlargement of Image Based Upon Interpolation Techniques, IJARCCE, ISSN (Online) 2278-
1021, 2(12), 4631-4640 (2013)
Vega, A., De León, J., y otros 2 autores, Modelo matemático para determinar la correlación entre parámetros
fisicoquímicos y la calidad sensorial de café Geisha y Pacamara de Panamá, https://doi.org/10.4067/S0718-
07642021000100089, Inf. Tecnol., 32(1), 89-100 (2021)
Yong, L., Rivas, L., y Chaparro, J., Modelo de aceptación tecnológica (TAM): un estudio de la influencia de la cultura
nacional y del perfil del usuario en el uso de las TIC, Innovar, ISSN 0121-5051, 20(36), 187–204 (2010)
Zurita, G., Sanchez, V., y Cabrera, D., A review of vibration machine diagnostics by using artificial intelligence methods,
https://doi.org/10.23881/idupbo.016.1-8i, Investigación & Desarrollo, 16(1), 102-114 (2016)

128 Información Tecnológica – Vol. 33 Nº 3 – 2022

También podría gustarte