Está en la página 1de 10

1

SISTEMA AUTOMÁTICO CLASIFICADOR DE


MANZANAS
Julián Esteban Durán Melo 285584, Felipe González Roldán 285591.

Resumen—Este documento presenta el informe final del de-


sarrollo de un sistema de clasificación de manzanas, según las
categorías de defectos que define la norma Códex Alimentarius
STAN 299-2010. Se presenta el modo de reconocimiento de
patrones en manzanas utilizando visión de maquina, así como
el desempeño alcanzado por el algoritmo final.
Figure 1. Segmentación de la imagen Ribot & Ruiz
Index Terms—Manzanas, clasificación, frutas, fisiopatías, seg-
mentación, extracción de características, defectos, redes neu-
ronales artificiales, desarrollo agricola.

La clasificación se realizo por dos métodos: el primero por


el número de píxeles blancos dentro del contorno de la imagen
que representan potenciales defectos, por lo cual la ausencia
de pixeles se consideraba una imagen sana y los restantes
defectos se detectaban por medidas estadisticas, de manera
que no emplearon sistemas de clasificación por características,
ni redes neuronales, lo que al final representó un porcentaje
de exito promedio de alrededor del 70%, este desarrollo es
significativo para el proyecto ya que aporta soluciones a la
problemática de detección de defectos superficiales en la fruta
y aporta mejoría en las técnicas de segmentación usadas.

I. I NTRODUCCIÓN
B. Visión de máquina aplicada a la clasificación de dátiles.
El proyecto: Sistema Automático Clasificador de Manzanas Al Ohali.
está enfocado al diseño de un sistema de análisis por imagen
para clasificación por categorías de defectos, teniendo en De igual manera en la Universidad Técnica de Arabia Sau-
cuenta la reglamentación internacional expuesta por la OMS dita se desarrollo un prototipo de una máquina clasificadora
en el Códex Alimentarius (norma STAN 299-2010) para el de Dátiles [10], que permitia categorizar estos frutos según
control de calidad del producto. tamaño, forma, flacidez, y brillo reflejado, este desarrollo
empleó una red neuronal tipo Backpropagation para la clasifi-
cacion y usó captura por video para la obtencion de imágenes
II. E STADO DEL ARTE de la fruta en tiempo real, en general el prototipo tuvo un éxito
A. Selector de fruta. Ribot y Ruiz. del orden del 75% .
En primera instancia en la Universidad Politécnica de
Catalunya se tiene un sistema selector de fruta focalizado en la
deteccion de defectos de melocotones (duraznos) desarrollado
por Miriam Fernandez Ribot [3]. En general se trata de un
desarrollo en forma de simulación, que no implementa un
mecanismo físico, y que realiza la clasificación de los frutos.
No obstante realiza en forma computacional una catego-
rización de los mismos a partir de imágenes recopiladas,
es un estudio útil puesto que presenta las generalidades del
tratamiento que se debe realizar con frutos redondos para seg-
mentarlos correctamente y analizar su superficie. En este con-
texto las manzanas son ciertamente similares a los duraznos,
tanto en forma como en los posibles defectos que se pueden
presentar en ambos, principalmente pudrición, desgarramiento
de la piel y picadura. Figure 2. a) Imagen binarizada de un Dátil. b)Prototitpo del clasificador.
2

múltiples instancias de la industria alimentaria, en particular


para el caso de la clasificación de frutas se tiene que el
Este prototipo aporta en dos campos significativos, primero
sistema más optimizado consiste en la grabación continua
en la detección de la flacidez (arrugamiento de la superficie
de un sistema de rodillos que hace rotar la fruta 360° y
de la fruta) que en el caso de los Dátiles son signo de calidad
que permite el monitoreo de más del 80% de su superficie
en las manzanas se considera como un defecto superficial, y
para determinar la calidad del producto y decidir si debe ser
como segunda medida en la captura de imágenes de la fruta
para exportación, comercializado en la planta, desechado, o
por video y la forma de procesar este tipo de información para
destinado para zumos.
extaer las características deseadas.
Para manejar altos volúmenes de producción, se configuran
varios arreglos de cámaras y rodillos a lo largo de varios
C. Control de calidad de alta velocidad aplicado a naranjas. carriles que transportan el producto, como es el caso de la
Recce. máquina Compac Invision 9000. Este sistema es capaz de
Finalmente se tiene el estudio desarrolado por por Michael detectar defectos sobre la piel de la fruta que comprenden las
Recce y John Taylor [7] del Departamento de Anatomía y marcas, deformaciones o manchas en la piel, daños causados
Biología de Desarrollo del Colegio Universitario de Londres por insectos, cortes, puntazos y también los machucones.
(Londres, Reino Unido) en conjunción con Alessio Plebe y
Giuseppe Tropiano de l’ A.I.D en Italia. En este estudio se
utilizan las naranjas: cómo analizarlas y detectar el tallo en
las imágenes aplicando procesado digital y una búsqueda de
defectos locales.
Este aspecto es interesante porque a menudo el tallo de la
fruta se confunde con un defecto, hecho similar se presenta
con las manzanas donde el pendúnculo puede aparecer como
una irregularidad. Inicialmente la técnica que utilizan es la
generación de histogramas de componente rojo (R) y verde (G)
para clasificar el color (el color determina el tipo de naranja, Figura 3. Compac Invision 9000
en este caso, debido a la naturaleza del fruto) mirando la
distribución de los píxeles de la fruta. Los defectos y el tallo
acostumbran a ser distorsiones en el histograma y se pueden
comparar con una distribución normal según un histograma de
E. Normatividad actual sobre las manzanas
una naranja “sana”.
Finalmente el grueso de la investigación se centra en la También en la actualidad existen unos estándares
búsqueda de defectos en la superficie de la fruta, segmentando formulados por la Organización Mundial de la Salud (OMS)
las regiones defectuosas de aquellas que no lo son utilizando para la comercialización de manzanas. Estos se encuentran
máscaras y los mismos histogramas. La marca del tallo en en el Codex Alimentarius [1], o código alimentario, que se
cualquier fruto suele confundirse con un defecto en el mo- ha convertido en un punto de referencia mundial para los
mento de procesar la imagen. Los creadores de este estudio consumidores, los productores y elaboradores de alimentos,
han basado la diferenciación del tallo respeto un defecto los organismos nacionales de control de los alimentos y el
cualquiera con el hecho que el tallo es una zona con más comercio alimentario internacional. El Codex Alimentarius
textura y con simetría radial. establece que las manzanas deben suministrarse frescas al
consumidor, después de su acondicionamiento y envasado.
Para ello debe realizarse un control de calidad en donde se
D. Clasificación de frutas en la industria debe situar el producto en una de las siguientes categorías:
En la actualidad la mayoría de las grandes industrias
poseen sistemas de clasificación y control de calidad • C ATEGORÍA “E XTRA ” : Los frutos clasificados en esta
automatizados, los cuales gozan de gran popularidad en categoría serán de calidad superior. Presentarán la forma,
la industria alimentaria donde el volumen de recolección desarrollo y coloración característicos de la variedad. Los
y procesado de alimentos puede llegar a enormes niveles. frutos presentarán el pedúnculo intacto y estarán exentos
Haciendo hincapié en el sector de las frutas, si el volumen de defectos, a excepción de muy ligeras alteraciones de la
de frutas para ser procesadas y clasificadas es muy grande, la epidermis, siempre que no perjudiquen al aspecto general, a
tarea resultaría muy ineficiente si es realizada por operarios, la calidad, ni a su presentación en el envase. Generalmente
lo cual prevalece en países no muy industrializados, pero si aplican para procesos de exportación.
se incorporan sistemas de clasificación automatizados que
empleen medios de visión digital el procesos se puede agilizar • C ATEGORÍA I : Los frutos clasificados en esta categoría
considerablemente, como se ha demostrado en la actualidad. serán de buena calidad superior. Presentarán las características
típicas de la variedad. No obstante, puede admitirse:
Durante mas de 30 años el procesos de desarrollo y re-
finación de este tipo de dispositivos ha estado presente en -Una ligera deformación.
3

-Un ligero defecto de desarrollo. IV. M ETODOLOGÍA UTILIZADA


-Un ligero defecto de coloración. V. P RE -P ROCESAMIENTO Y S EGMENTACIÓN
-Que el pedúnculo pueda estar ligeramente dañado.
La primera etapa de la construcción del programa consiste
La pulpa debe estar exenta de todo daño; sin embargo, se en el pre procesamiento y la segmentación de la imagen. El
admiten para cada fruto defectos de epidermis, siempre que área de interés de cada imagen es la correspondiente a la
no afecten al aspecto general, ni a la conservación dentro de superficie de la manzana, y por lo tanto ésta debe aislarse
los siguientes límites: totalmente de los demás elementos de la imagen. Para ello el
sistema debe estar en la capacidad de distinguir entre la región
-Los defectos de forma alargada no excederán en total de 2 del fondo y la región de la manzana.
cm. de longitud.
-Para los otros defectos, la superficie total no debe exceder A. Umbralización y filtro del Canal Rojo
de 1cm2 a excepción del moteado, que no debe presentar una En primer lugar se realiza una descomposición de la imágen
superficie superior a 1/4 de cm2. en sus tres canales componentes (rojo, verde y azul), puesto
que se encontró que en el canal rojo es más fácil distinguir
• C ATEGORÍA II : En esta categoría se incluyen los frutos la manzana del fondo. Se procede luego a la ecualización del
que no pueden clasificarse en las categorías superiores, pero histograma del canal R para resaltar los píxeles con mayor
responden a las categorías mínimas de calidad. Se admiten valor de gris. Como la imagen presenta un alto nivel de ruido
defectos de forma, desarrollo y coloración a condición de sal y pimienta producido por el fondo se le aplica un filtro
que los frutos conserven sus características. El pedúnculo morfológico a la imagen usando un kernel de 7x7.
puede faltar, siempre que no haya deterioro de la epidermis.
La pulpa no debe presentar defectos esenciales. Se admiten
para cada fruto defectos de epidermis dentro de los siguientes B. Llenado de la región de la manzana
límites: Con el preproceso hasta ahora se tiene la perspectiva de
donde se encuentra la manzana, a continuación se realiza un
-Defectos de forma alargada: no excederán en total de 4 cm. llenado de color blanco de la región de la manzana para
de longitud. eliminar los píxeles oscuros que se encuentran en el interior
-Para los otros defectos, la superficie total no debe exceder de la misma. Partiendo de la suposición que solo se encuentra
de 2.5 cm2 a excepción del moteado, que no debe presentar una sola manzana dentro de la imagen, se procede a buscar el
una superficie superior a 1 cm2. píxel más blanco, el cual sirve como semilla para realizar el
llenado de la región de interés.
• S IN C ATEGORÍA O CATEGORÍA 3 : Se sugiere que los
productos que no fueron ubicados en ninguna categoría sean
evaluados para su deposición residual o para la preparación de
zumos (Aplica categoría 3).

III. O BJETIVOS Y ALCANCE DEL PROYECTO


El objetivo principal del proyecto es el diseño e
implementación de un programa que realice la clasificación
de manzanas según la normatividad Códex Alimentarius
mediante el uso de técnicas de visión de máquina.

Para lograr este objetivo se delimita a la utilización de


imágenes que cumplan con los siguientes requisitos:

• Fondo negro: El fondo de un solo tono facilita el proceso


de segmentación de la imagen, y específicamente el negro
Figura 4. a) Canal R. b) Canal R ecualizado. c) Filtro morfológico d) Llenado
atenua el efecto de la sombra producida por la fuente de de la región de la manzana
iluminación.
• Iluminación controlada: Para las pruebas se utilizará una
fuente de luz blanca que incide en la misma dirección de
la toma de la fotografía.
• Imagen de resolución 320x240 o superior: para poder C. Umbralización y filtrado morfológico
realizar un adecuado muestreo de los defectos. Una vez se realizó el llenado de la región de interés se
• Manzanas de la especie Royal Gala: ya que con otras procede a realizar un suavizado gaussiano con un kernel de
especies varian en los niveles de gris de los canales V, G tamaño 9x9 en la imagen y una umbralización binaria con un
y R, y debido a esto los parametros de umbralización, y umbral de 170 en el nivel de gris para obtener una imagen
detección de defectos cambiarían. en blanco y negro que represente en blanco los píxeles de
4

la superficie de la manzana. Para mejorar la composición cuales se pueden dividir en 2 grupos, las que analizan el
de la porción blanca, retirar pequeñas manchas del fondo y histograma de la imagen segmentada y las que se extraen de
retirar el pendúnculo de la manzana de la imagen, ya que la imagen segmentada.
no aporta características para la clasificación, se realiza un
filtro mofológico con un kernel de 17x17, completando el pre 1) Características del histograma: Son medidas
proceso para la segmentación. estadísticas del histograma de la imagen segmentada
que proporcionan informacíon util acerca de la coloración
de la fruta y de algunos defectos, principalmente los
relacionados con la textura y cambio de color en la superficie,
las características de esta categoría son:

1) Media del histograma para los canales Red, Green, Value


y Yellow derivados de la imagen segmentada en RGB.
Estas características aportan información de utilidad en
lo referente a la coloración de la manzana, en partic-
ular mediante lso canales R,G, y Y(Yellow) es posible
conocer con cierta precisión el estado de maduración
de la fruta, lo cual es relevante para las categorias
establecidas, los canales S y V, son especialmente utiles
para detectar cambios en la iluminación en el caso del
canal S, por lo tanto se puede evidenciar si existen
Figura 5. a) Suavizado gaussiano. b) Umbralización binaria. c) Filtro defectos que impliquen retiro de la piel de la fruta
morfológico 2. y el canal V que presenta cambios significativos ante
defectos como el pardeamiento.
2) Mediana del histograma para los canales Green y Yellow
derivados de la imagen segmentada en RGB. La mediana
D. Operación And con la imagen en color de estos canales esta fuertemente ligada al estado de
Para la realización de la segmentación se realiza una op- maduracion de las manzanas, se descartó la mediana
eración And entre la imagen obtenida del preproceso y cada del canal R ya que se presentaba casi constante en la
canal de la imagen en color, obteniendo únicamente la imagen mayoría de las muestras.
de interes y un fondo con nivel de gris igual a cero en cada 3) Varianza o segundo momento normalizado del histogra-
canal por separado. Finalmente se unen los tres canales para ma para canales Red, Green y Yellow derivados de la
dar composición a la imagen segmentada en color. imagen segmentada en RGB. Este conjunto de caraterís-
ticas aporta información importante en lo referente a la
textura de la imagen en este caso de la manzana por lo
cual es ideal para detectar el defecto de arrugamiento.
En total se tienen 9 características derivadas del análisis
estadístico de los histogramas de los diferentes canales de los
espacios de color de la imagen segmentada.

2) Características de la imagen segmentada (área de


interés-manzana excluida del fondo): A diferencia de
las medidas estadísticas del histograma este conjunto
de características no contemplan el fondo de la imagen
segmentada sólo tienen en cuenta el area de interés que
corresponde a la manzana en sí misma, estas caracteristicas
son:

Figura 6. a) Canal R segmentado. b) Canal G segmentado. c) Canal B 1) Nivel promedio de Rojo y de Verde de la manzana, estas
segmentado d) Imagen en color segmentada
características coresponden al promedio del canal R y el
canal G únicamente de la manzana, por tanto difieren de
la media del histograma y son un indicador directo del
estado de maduración de la fruta.
VI. E XTRACCIÓN DE CARACTERÍSTICAS
2) Número de píxeles amarillos dentro del area de la man-
A. Caracteristicas usadas zana, corresponde al numero total de pixeles con rangos
Para la correcta clasificación de las manzanas en las para RGB de R>110, G>110 y B<50 que en general
categorías planteadas se utilizaron 14 características, las se consideran como una gran variedad de tonalidades
5

cercanas al amarillo, estos píxeles necesariamente se


encuentran en el interior del contorno que encierra el
perimetro de la manzana y contribuyen principalmente
a la diferenciación entre las categorías CE y C1.
3) Número de contornos internos en la manzana, esta
caracteristica hace referencia a los contornos internos
de la manzana con un umbral de perímetro mayor a
180 y menor al perímetro en sí mismo, estos contornos
aportan informacion de la textura de la piel de la fruta y
de posibles agujeros en la misma, por lo cual un índice
elevado de esta característica significa gran presencia de
defectos superficiales.
4) Perímetro, es la longitud del contorno principal de la
manzana, en general es un indicativo del tamaño de la
misma y sive para analizar posibles deformaciones que
se dan en con defectos como pudrición.

En general se añaden 5 característcas adicionales, para un


total de 14 características para el análisis de las manzanas. Figure 8. Salida de la matriz de características.
Estas características estan enfocadas a analizar el estado de
maduración de la fruta y posibles defectos en la misma,
para lograr la categorización en 4 niveles de calidad y no la
detección e identificación específica de los defectos como tal. Asimismo es relevante que en el programa se crean una
matriz de características para las imagenes de entrenamiento
y una matriz de características para los elementos de prueba.

VII. C LASIFICACIÓN CON RNA


B. Normalización de características
Una vez completado el proceso de extracción de las car-
Dado que los rangos de variación de los valores de cada acterísticas de la imagen se procedió a la elección de un
característica son distintos (exceptuando los derivados de his- tipo de clasificador para el proyecto. Se probaron los clasifi-
togramas) para tener una clasificación más efectiva los valores cadores bayesiano, distancias encadenadas y redes neuronales
numéricos se normalizaron respecto a conjunto de valores artificiales, siendo este último con el que se obtuvo mejor
máximos y mínimos resultado del análisis de la matriz de desempeño.
caracteríticas de la base de datos de imágenes la normalización
se realizó de 0 a 10 si se dejó un margen razonable para A. Clases de salida
posibles valores atípicos al probar con distintas muestras. En Para los clasificadores utilizados se especificaron 4 clases
general el conjunto de valores extremos fue: de salida, correspondientes a las enunciadas como categorías
en la norma Códex Alimentarius para las manzanas. Estas son:

• Categoría Extra (CE): Las manzanas pertenecientes a esta


clase debían tener un nivel de maduración justo, esto
es apta para el consumo humano, una coloración roja
Figure 7. Tabla de valores usado para normalizar uniforme y no debían presentar ningun defecto visible.

C. Matriz de características

La matriz de características estará conformada finalmente en


las filas por el número de muestras (imágenes de manzanas)
y en las columnas por 14 características por tanto su tamaño
será Número manzanas x Número de características. Gráfica-
mente el programa muestra la matriz por filas (imagenes de
manzanas) como sigue: Figura 9. Ejemplar de categoría Extra (BE)
6

• Categoría 1 (C1): En esta clase se contemplaban man-


zanas con una coloración roja relativamente uniforme,
aunque con posible manchas amarillas que denotan algo
de inmadurez, también se contemplaban leves defectos
que no impedian el consumo, como leve pardeamiento,
exposición de la piel y picadura mínima.

Figura 12. Ejemplar de categoría 3 (C3)

B. Red Neuronal utilizada


La red neuronal utilizada correspondió a un Perceptrón
Multicapa (MLP) compuesto de una capa de entrada, una capa
oculta y una capa de salida. La capa de entrada compuesta por
14 neuronas que es igual al número de características extraídas
Figura 10. Ejemplar de categoría 1 (C1) de cada imagen. La capa oculta compuesta por 13 neuronas.
Usando la regla empírica de partir con el 75 % del número de
neuronas de la capa de entrada [Descrita en 8], y con el uso
de la fórmula iterativa [Expuesta en 9]:
• Categoría 2 (C2): Esta categoría es intermedia ya que s 
considera defectos en las manzanas pero ya no son aptas N
n=C
apra el consumo humano sino podrían estar enfocadas dLog(N )
para otros usos, como alimento de animales o elaboración
de sumos, aquí se tuvo en cuenta la presencia general Donde n es el número de neuronas ocultas, d es la dimensión
de defectos como arrugamiento, picadura, pardeamiento, de entrada de la función objetivo f, N es el número de parejas
cizalladura e inmadurez pero en proporciones moderadas, de entrenamiento y C es una constante por determinar. Se
no a tal punto que inutilizaran la fruta. realizó el procedimiento que exponen los autores, que consiste
en ir variando la constante C para obtener diferentes números
de neuronas e ir probándolos en la red correspondiente. Se
busca entonces encontrar el numero de neuronas que mini-
mizan el error RMS. Con un valor C=8, se obtuvo el valor
de las 13 neuronas de la capa oculta. Finalmente el número
de neuronas de la capa de salida queda compuesta por el
número de clases determinado anteriormente (4 neuronas). La
función de activación para la totalidad de las neuronas fué una
sigmoide simétrica, que permite la clasificación en problemas
no lineales.

C. Entrenamiento
Se recopilo un conjunto de 100 muestras de imágenes de
Figura 11. Ejemplar de categoría 2 (C2)
manzanas Royal Gala que podían presentar defectos como
picadura, pardeamiento, cizallamiento, y falta de maduración.
Estas imágenes fueron obtenidas mediante una cámara fotográ-
fica digital, empleando una resolución de VGA de 640x480
píxeles, colocando las manzanas sobre una cartulina negra
• Categoría 3 (C3): La última clase donde se consideran (fondo), y directamente bajo una fuente de luz blanca, para
todas las manzanas con defectos pronunciados, por tanto evitar la aparición de la sombra de la fruta en la imagen. De
estas manzanas en la práctica no serían aptas para ningun la base de datos de imagenes en cuestión se organizo en 4
tipo de consumo, su uso se puede enfocar como abono o categorias dejando 60 imagenes (15 de cada clase) para el
usos afines a este. entrenamiento de la red neuronal.
7

Figura 13. Imagenes de manzanas usadas para entrenar

Figure 15. Resultados Prueba 2.

La red fué entrenada usando el método Backpropagation,


usando un criterio de terminación al alcanzar 600 iteraciones
o un error épsilon de 0.0001 para el conjunto de imágenes.
C. Prueba 3:
Entrenando lo Red con 15 muestras por cada categoría se
VIII. R ESULTADOS Y PRUEBAS
probó con 12 elementos, 6 de cada clase C2 y 6 de C3, el
Para la prueba del programa y la efectividad en la clasi- resultado obtenido fue:
ficación con las condiciones de entrenamiento dadas, se re-
alizaron 3 pruebas generales para la clasificación con la Red
Neuronal, en cada caso con 12 elementos de distintas clases.

A. Prueba 1:
Entrenando lo Red con 15 muestras por cada categoría se
probó con 12 elementos, 3 de cada clase obteniendose:

Figure 16. Resultados Prueba 3.

IX. M ATRICES DE CONFUSIÓN


La matriz de confusión es una herramienta de visualización
que se emplea en aprendizaje supervisado. Cada columna
de la matriz representa el número de predicciones de cada
Figure 14. Resultados Prueba 1. clase, mientras que cada fila representa a las instancias en la
clase real. Para cada una de las pruebas realizadas para la
verificación de la efectividad del algoritmo se ha realizado
una matriz de confusión, y se expone su respectivo análisis en
cada una de las siguientes subsecciones.

B. Prueba 2: A. Prueba 1:
Entrenando lo Red con 15 muestras por cada categoría se Para la prueba 1 se encontró un leve problema con la
probó con 12 elementos, 6 de cada clase CE y 6 de C1, el clasificación de una de las imágenes, la cual quedó ubicada
resultado obtenido fue: en la categoría 1 cuando pertenecía a la categoría extra.
8

Realizando un análisis para la clase “Categoría extra” se


tiene:

• Verdaderos positivos: 2
• Falsos positivos: 0
• Verdaderos Negativos: 9
• Falsos Negativos: 1

Figure 20. Estadísticos Prueba 2 Categoría 1.

C. Prueba 3:
En la prueba 3 se tuvo desacierto en las dos clases probadas,
Figure 17. Matriz de confusión Prueba 1. clasificando erróneamente dos elementos en cada una de
ellas, en el primer caso el sistema no identifico correctamente
la muesta en ninguna clase, la muestra 6 se clasifico como
categoria CE lo cual es un error grave dado que se tendría
Con lo cual se tienen los valores estadísticos siguientes: una manzana de baja calidad en la mejor categoría, y en las
muestras 10 y 11 se presento el mismo problema, en este
caso la muestras presentan sobre maduración es decir que por
el color rojo levemente oscuro el sistema las considera como
CE. Dada la situación se realizó el análisis para la “Categoría
2” y la “Categoría 3”, que presentan los siguientes resultados:

• Verdaderos positivos: 4
• Falsos positivos: 0
• Verdaderos Negativos: 6
• Falsos Negativos: 2
Figure 18. Estadísticos Prueba 1 Categoría Extra.

B. Prueba 2:
Para la prueba 2 se presentó un caso de error en la categoría
1, una imagen fue clasificada erróneamente. Realizando un
análisis para esta clase, se tiene: Figure 21. Matriz de confusión Prueba 3.

• Verdaderos positivos: 5
• Falsos positivos: 0
• Verdaderos Negativos: 6 Por lo cual para ambas clases se tienen los siguientes valores
• Falsos Negativos: 1 estadísticos:

Figure 19. Matriz de confusión Prueba 2.


Figure 22. Estadísticos Prueba 3 Categorías 2 & 3.

Con lo cual se tienen los valores estadísticos siguientes:


9

X. C OMENTARIOS Y C ONCLUSIONES y se probó con 12 imagenes de las cuales 3 correspondían


A. Sobre los resultados obtenidos a cada una de las categorías planteadas, el clasificador in-
terpretó todas la imagnes de prueba, como pertenecientes
• De los valores estadísticos resultantes se puede apreciar
a la clase CE, en consecuencia solo tuvo una tasa de
que el algoritmo realiza una clasificación aceptable que
efectividad del 25 % sin contar el error grave que consiste
cumple con los objetivos planteados para el proyecto,
en pasar una manzana C3 como CE.
cumpliendo con la clasificación dentro de las cuatro
• Clasificador de K vecinos más cercanos: Se entrenó de la
categorías previstas en el Códex Alimentarius, con una
misma manera que el clasificador bayesiano, pero en este
exactitud del 83,33% y una precisión del 100%. El pro-
caso se tuvo en cuenta 2 de los vecinos para le predicción,
grama implementado ofrece un método alternativo para
el resultado fue para las 6 primeras muestras categoría
la clasificación actual de las manzanas, y su innovación
CE y para las 6 restantes sin categoría, lo cual indica
radica en el uso de normatividad internacional de la OMS
una efectividad del 25 %, pero con la incidencia de pasar
para la categorización del producto.
manzanas CE por C1 y no lograr una clasificación exitosa
para la mitad de las muestras.
B. Sobre las limitaciones encontradas en la realización del • Distancias encadenadas: Este es un método de aprendiza-
proyecto je no supervisado, así que para la prueba se tomaron
• Las limitaciones encontradas en el desarrollo de la apli- las 72 muestras tanto de entrenamiento como de prue-
cación fueron principalmente las condiciones de ilumi- ba usadas para los otros clasificadores, y se obtuvo la
nación, el color del fondo y la resolución de la imagen generación de 10 clústeres, siendo el primero de ellos el
que se obtiene de la cámara fotográfica. La aplicación más grande con 42 elementos, seguido por el clúster 3 con
final es capaz de clasificar efectivamente manzanas Royal 12 elmentos y el clúster 4 con 9 elmentos, los restantes
Gala debido a que el entrenamiento de la red neuronal clústeres poseían de 1 a 3 elementos. en este caso se
artificial se realizó con imágenes correspondientes a esta tienen muchas mas clases de las previstas y adicional-
especie, sin embargo es posible usar clasificar otras mente una desproporción hacia un solo agrupameinto,
especies de color rojo característico, siempre y cuando cuando idealmente debería ser más simétrico, por lo que
las imágenes de entrenamiento cumplan con las carac- el resultado del clasificador no es satisfactorio.
terísticas expuestas en la sección de Objetivos y Alcance
del Proyecto.
XI. B IBLIOGRAFIA
C. Sobre el uso de video [1] CODEX - OMS. Norma CODEX para
• Se intentó realizar la aplicación usando extracción de las manzanas. CODEX STAN 299-2010. [En
características en video, se eligió una cámara de 1.8 línea] [Citado el: 27 de Marzo de 2012.]
MP con una velocidad de captura de 30 cuadros por http://www.codexalimentarius.net/web/standard_list.do?lang=es.
segundo, sin embargo se producieron dos inconvenientes. [2] D’Amato, Juan Pablo y otros. Procesamiento de imágenes
El primero correspondiente a la pérdida de defectos leves para la clasificación masiva de frutos. UNICEN, PLADEMA-
en la superficie debido a que la manzana en movimiento, ISISTAN. [En línea] [Citado el: 24 de Febrero de 2012.]
produce una imagen levemente borrosa. El segundo corre- www.pladema.net/~cgarcia/publications/JIDIS-2007.pdf.
spondiente al auto-enfoque de la cámara, ya que cuando [3] Fernández Ribot, Miriam y Ruiz Hidalgo, Javier.
no está presente una manzana el foco es más distante Selector de fruta y simulación de una aplicación real. [En
y en el momento de la aparición de la manzana en la línea] 8 de Junio de 2006. [Citado el: 17 de Marzo de 2012.]
imagen, la cámara ajusta su lente automáticamente para http://upcommons.upc.edu/pfc/bitstream/2099.1/3862/1/54962-
enfocarla, y mientras esto ocurre pasa la manzana sin 1.pdf
poder ser detallados sus defectos. Sin embargo con la [4] Gary Bradski. LearningOpenCV: Computer Vision with
adquisición de una cámara de alta velocidad con enfoque the OpenCV library. Pags 193 - 219. O’Reilly, 2008.
fijo es posible la obtención de las imágenes necesarias [5] Marinai, S. Hiromichi, F. Machine Learning in Document
para lograr la clasificación deseada. Analysis and Recognition. Springer-Verlag Berlin Heidelberg.
2008.
[6] R. C. Gonzáles, R. E. Woods, Digital image processing,3ra
D. Sobre el uso de otros clasificadores ed. Ed: Prentice Hall, Upper Saddle River,2008.
En general sólo se presenta el análisis de la red neuronal [7] RECCE M., TAYLOR J.” High speed vision-based quality
como clasificador debido a que fue la que presentó una tasa de grading of oranges”. Neural Networks for Identification,
éxito aceptable, los otros clasificadores probados no sólo no Control, Robotics, and Signal/Image Processing. Proceedings.,
eran exitosos sino que además presentaban una clasificación Inlernalional Workshop on, 21-23 , pp 136-144, 1996.
hasta cierto punto incoherente, adicional a la red neuronal se [8] Walczak, S. Cerpa, N. Heuristic Principles for
probó con Bayesiano, K Vecinos más cercanos y Distancias the Design of Articial Neural Networks. Publicado
encadenas; el resultado en cada caso fue: en Information and Software Technology. 1999.
• Clasificador Bayesiano: Se entrenó igual que la red http://utalca.academia.edu/NarcisoCerpa/Papers/656321/Heuristic_
neruonal con 15 imagenes representativas de cada clase, principles_for_the_design_of_articial_neural_networks. [En
10

línea] [Citado el: 9 de Junio de 2012.]


[9] Xu, S. Chen, L. A Novel Approach for Determining the
Optimal Number of Hidden Layer Neurons for FNN’s and
Its Application in Data Mining. 5th International Conference
on Information Technology and Applications (ICITA 2008).
http://eprints.utas.edu.au/6995/1/02-au-xu.pdf. Revisado el
10/6/12.
[10] Yousef Al Ohali. Computer vision based datefruit
grading system: Design and implementation. [En línea], año
2009. [Citado el: 25 de Marzo de 2012].

También podría gustarte