Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ponencia Clasificador de Tomates Con Histogramas de Color
Ponencia Clasificador de Tomates Con Histogramas de Color
Resumen
Las frutas y verduras tienen propiedades de color, forma y textura, las cuales pueden
ser utilizadas por sistemas automticos de anlisis y clasificacin. Mxico se encuentra
entre los tres principales pases exportadores de tomates, por lo que este estudio
presenta la aplicacin de tcnicas de visin por computadora, y de aprendizaje mquina
para la creacin de un modelo clasificador de tomates con base en sus propiedades de
color. Primero, se obtuvieron imgenes de tomates para ser preprocesadas para
encontrar la regin de inters. Segundo, se extrajeron a manera de histogramas las
propiedades de color que caracterizan a cada tomate, para posteriormente generar un
conjunto de datos. Finalmente, se utiliz el algoritmo de Naive Bayes para entrenar y
probar al clasificador con base en el conjunto de datos obtenido en la etapa anterior. El
resultado fue un clasificador que en promedio obtuvo una exactitud del 96% utilizando
K-Fold Cross Validation.
Palabras claves
Visin por computadora, aprendizaje mquina, histograma HSV, Naive Bayes
1. Introduccin
Los avances en las tecnologas han potencializado la creacin de aplicaciones que
intentan mejorar diferentes procesos agrcolas, tales como la inspeccin y la
clasificacin de frutas y verduras (Moreno-Bermdez, 2012; Tillett, 1991; Vibhute, 2012;
Vyas, 2013). Diferentes tcnicas de visin por computadora y de aprendizaje mquina
Pgina 1
V Congreso Internacional de TIC
Universidades Tecnolgicas, Playa del Carmen 2015
Playa del Carmen, Quintana Roo, 2015
se combinan para analizar las caractersticas de tamao, textura, forma y color de las
frutas y verduras (Faria, 2010; Pandey, 2013).
Pgina 2
V Congreso Internacional de TIC
Universidades Tecnolgicas, Playa del Carmen 2015
Playa del Carmen, Quintana Roo, 2015
2. Desarrollo
La metodologa seguida para la clasificacin automtica de tomates consiste
principalmente en tres fases. La primera fase es la adquisicin del conjunto de
imgenes que servirn para el entrenamiento del modelo clasificador. En esta fase, son
aplicadas diferentes tcnicas de procesamiento de imgenes a cada una de las
imgenes de tomates, con el objetivo de delimitar una regin de inters. En la segunda
fase, son extradas las caractersticas de color de cada imagen, esta informacin es
agregada al conjunto de datos que ser utilizado en la siguiente etapa. Finalmente, el
conjunto de datos es utilizado para entrenar un algoritmo de clasificacin, con el
objetivo de generar un modelo que permita encontrar patrones en los datos que
identifiquen las clases de tomates.
Pgina 3
V Congreso Internacional de TIC
Universidades Tecnolgicas, Playa del Carmen 2015
Playa del Carmen, Quintana Roo, 2015
Con la finalidad de extraer las propiedades de color sin que la iluminacin afecte
los resultados, se utiliz el modelo de espacio de color HSV (Hue, Saturation, Value).
Pgina 4
V Congreso Internacional de TIC
Universidades Tecnolgicas, Playa del Carmen 2015
Playa del Carmen, Quintana Roo, 2015
Pgina 5
V Congreso Internacional de TIC
Universidades Tecnolgicas, Playa del Carmen 2015
Playa del Carmen, Quintana Roo, 2015
a b c
d e f
El histograma resultante para cada una de las imgenes, representado como una
lista de valores, se anex a un archivo en formato .CSV junto con la clase
correspondiente a cada tomate. En total se generaron siete archivos, uno para cada
nmero de contenedores.
(1)
Pgina 6
V Congreso Internacional de TIC
Universidades Tecnolgicas, Playa del Carmen 2015
Playa del Carmen, Quintana Roo, 2015
3. Resultados
Se gener un modelo del clasificador para cada uno de los siete histogramas de
distribucin de las tonalidades de color. Los resultados de entrenar y validar cada
modelo utilizando el K-Fold Cross Validation se presentan en la figura 5. De acuerdo a
este anlisis a partir de 64 contenedores ya no hubo variacin, siendo el porcentaje
promedio de exactitud 96% y la desviacin estndar de .04. Siendo la exactitud la
proporcin del nmero de predicciones correctas (Hamilton, 2012).
Pgina 7
V Congreso Internacional de TIC
Universidades Tecnolgicas, Playa del Carmen 2015
Playa del Carmen, Quintana Roo, 2015
Pgina 8
V Congreso Internacional de TIC
Universidades Tecnolgicas, Playa del Carmen 2015
Playa del Carmen, Quintana Roo, 2015
a los tomates rojos, la clase 1 a los verdes y la clase 2 a los amarillos. En dicho reporte
se observ que para los valores de Precision, Recall y F1-score se obtuvo un 100% en
cada rubro. El resultado de Precision representa la proporcin de qu tan en lo correcto
est nuestro clasificador cuando dice que una instancia es positiva. De manera similar,
el resultado de Recall representa la proporcin de casos positivos que son
correctamente clasificados. Por su parte el F1-score es la media armnica que trata de
combinar las dos medidas anteriores (Garreta, 2013; Powers, 2011).
Pgina 9
V Congreso Internacional de TIC
Universidades Tecnolgicas, Playa del Carmen 2015
Playa del Carmen, Quintana Roo, 2015
tomates tomadas directamente desde la cmara del dispositivo mvil, como se aprecia
en la figura 8 con un tomate rojo.
4. Conclusiones
La combinacin de tcnicas de visin por computadora con tcnicas de aprendizaje
mquina hace posible la creacin de sistemas inteligentes que ayuden a la solucin de
problemas en diferentes reas productivas.
Pgina 10
V Congreso Internacional de TIC
Universidades Tecnolgicas, Playa del Carmen 2015
Playa del Carmen, Quintana Roo, 2015
Referencias
Abdesselam, A., Abdullah, Rahmat Choo. (2000). Pepper berries grading using artificial
neural networks. Paper presented at the TENCON 2000.
Aguilera, C., Ramos, Mario, Roa, Gabriel. (2006). An automatic grading system for
panels surfaces using artificial vision. International Journal of Computers,
Communications and Control, 1(2), 15-22.
Arivazhagan, S., Shebiah, R. N., Nidhyanandhan, S. S., & Ganesan, L. (2010). Fruit
recognition using color and texture features. Journal of Emerging Trends in
Computing and Information Sciences, 1(2), 90-94.
Demaagd, K., Oliver, A., Oostendrop, N., Scott, K. (2012). Practical Computer Vision
with SimpleCV: OReilly.
Faria, F. A., dos-Santos, J.A., Rocha, A., da-S., T. (2010). Automatic Classifier Fusion
for Produce Recognition.
Garreta, R., Moncecchi, G. (2013). Learning scikit-learn: Machine Learning in Python:
Packt Publishing.
Hamilton, H. (2012, 06/08/2012). Knowledge Discovery in Databases. Retrieved
07/25/2015, 2015, from
http://www2.cs.uregina.ca/~dbd/cs831/notes/confusion_matrix/confusion_matrix.h
tml
Krka, J. (2013). Recognition of Plants Based on Images of Fruit. Czech Technical
University in Prague.
Laykin, S., Alchanatis, V., Fallik, E., Edany. (2002). Image processing algorithms for
tomatoes classification. Transactions of the American Society of Agricultural
Engineers (ASAE), 45(3), 851-858.
Lopez, J. J., Cobos, M., & Aguilera, E. (2011). Computer-based detection and
classification of flaws in citrus fruits. Neural Computing and Applications, 20(7),
975-981.
Moreno-Bermdez, A., Ballesteros-Padilla, D., Snchez-Torres, G. (2012). UN
PROTOTIPO MECNICO PARA LA AUTOMATIZACIN DEL PROCESO DE
SELECCIN DEL MANGO TIPO EXPORTACIN. Revista Ingenieras
Universidad de Medelln.
Pgina 11
V Congreso Internacional de TIC
Universidades Tecnolgicas, Playa del Carmen 2015
Playa del Carmen, Quintana Roo, 2015
Pandey, R., Naik, S., Marfatia, R. (2013). Image Processing and Machine Learning for
Automated Fruit Grading System: A Technical Review. International Journal of
Computer Applications, 81(16), 29-39.
Powers, D. M. (2011). Evaluation: from precision, recall and F-measure to ROC. Bioinfo
Publications, 2229-3981.
Richert, W., Coelho, L. (2013). Building Machine Learning Systems with Python: Packt
Publishing.
SAGARPA. (2010). Monografa del Jitomate.
Saito, Y., Hatanakat, Toshiharu, Uosakit, Katsuji, Shigetot, Kazuhide. (2003). Eggplant
classification using artificial neural network. Paper presented at the Proceedings
of the International Joint Conference on Neural Networks.
Segaram, T. (2007). Programming Collecitive Intelligence: OReilly.
Tillett, R. D. (1991). Image analysis for agricultural processes: a review of potential
opportunities. Journal of Agricultural Engineering Research, 50, 247-258.
Unay, D., Gosselin, Bernard,. (2002). Apple Defect Detection and Quality Classification
with MLP-Neural Networks.
Vibhute, A., Bodhe, S.K. (2012). Applications of Image Processing in Agriculture: A
Survey. International Journal of Computer Application 52(2), 34-40.
Vyas, A., Talati, B., Naik, S. (2013). Colour Feature Extraction Techniques of Fruits: A
Survey. International Journal of Computer Applications, 83(15), 15-22.
Zhang, H. (2004). The Optimality of Naive Bayes. AA, 1(2), 3.
Zhang, Y., & Wu, L. (2012). Classification of Fruits Using Computer Vision and a
Multiclass Support Vector Machine. Sensors, 12(9), 12489-12505.
Pgina 12