Está en la página 1de 9

2014 XL Latin American Computing Conference (CLEI)

An approach for improve the recognition of defects


in coffee beans using retinex algorithms

Rel Guzmán Apaza, Christian E. Portugal-Zambrano y César A. Beltrán-Castañón


Juan C. Gutiérrez-Cáceres Grupo de Reconocimiento de Patrones e IA Aplicada
Cátedra Concytec en Tecnologías de la información Sección de Ingeniería Informática
Av. Venezuela s/n, Universidad Nacional de San Agustín Pontificia Universidad Católica del Perú
Arequipa - Perú Av. Universitaria 1801, San Miguel, Lima 32, Perú
Email: {r.guzmanap,christ.pz.cs,jcgutierrezc}@gmail.com Email: cbeltran@pucp.pe

Abstract—This paper describes the development of a system for Este trabajo presenta una propuesta a la evaluación de calidad
evaluating the quality of coffee focused on the pre-processing of de café utilizando imágenes digitales, enfocada en el pre-
digital images using an algorithm based on the retinex theory procesamiento para luego extraer matrices de coocurrencia
called multi-scale retinex with color restoration (MSRCR). A de niveles de gris en imágenes de color y utilizarlas como
dataset of images of coffee beans are collected and others características en un clasificador multiclase, de este modo
techniques for image enhancement are compared, then a color
evaluar las características físicas en muestras de granos de
gray-level coocurrence matrix (CGLCM) technique is used for
features extraction and a Support Vector Machine (SVM) is used café. En la etapa de pre-procesamiento mejoramos el enfoque
to evaluate results with a set of prepared data, these results shows de mejoramiento de imágenes digitales de granos de café verde
a good visual quality and better accuracy in classification for utilizando un algoritmo basado en la teoría retinex denominado
MSRCR techniques compared with others, finally conclusions retinex multiescala con restauración de color (MSRCR) para
and future works are presented. mejorar los resultados de clasificación de defectos como una
etapa previa a la determinación de la calidad de una muestra
Keywords—Computer vision, image enhancement, retinex, MSRCR,
CGLCM, SVM, industrial quality, coffee beans de café según estándares establecidos por la SCAA (Specialty
Coffee Association of America) [1].
En este trabajo la teoría Retinex ha sido utilizada en un
I. I NTRODUCCIÓN conjunto de imágenes de granos de café verde para obtener
Se denomina café a la bebida que se obtiene de los frutos y una tasa de precisión mayor en la etapa de clasificación, por
semillas de la planta de café o cafeto (Coffea), los granos ello en la Sección II presentamos los trabajos relacionados
del café son uno de los principales productos de origen a la evaluación de la calidad del café y al mejoramiento
agrícola que se comercializa en los mercados internacionales, de imágenes digitales, en la Sección III se describen los
las plantas de café son originarias de la antigüa Etiopía, en Perú conceptos previos relacionados al tema, luego en la Sección IV
el café se desarrolla en casi todas las regiones geográficas del explicamos nuestra propuesta de mejoramiento de imágenes
territorio. coomo mejora en la etapa de clasificación, en la Sección V
Las etapas básicas de procesamiento de granos de café co- presentamos las pruebas y experimentos realizados, finalmente
mienza en las plantaciones, luego es cosechado (6 a 8 meses una discusión de los resultados y trabajos futuros es presentada
de madurez) para ser secado mediante técnicas especiales en la Sección VI.
y artesanales (secado al sol), la etapa de secado brinda la
coloración verde al grano, este posteriormente es clasificado II. T RABAJOS R ELACIONADOS
para eliminar impurezas y granos malos o deformes, también Las imágenes digitales han sido utilizadas y aplicadas en
es clasificado por tamaño, se le aplica una etapa de pulido para ambientes industriales como en el caso de la elaboración del
mejorar su aspecto y finalmente puesto en venta a usuarios café. Anualmente se realizan conferencias organizadas por la
locales o globales. Asociación para la Ciencia e Información de Café [2] donde se
Los granos del café son uno de los principales productos de presentan trabajos sobre los distintos problemas relacionados
origen agrícola que se comercializa en los mercados interna- con la elaboración del café y discusiones sobre su consumo.
cionales y a menudo supone una gran contribución a los rubros Se pretende utilizar técnicas de mejoramiento de imágenes
de exportación de las regiones productoras, gracias a premios digitales dentro de un proceso automatizado de evaluación
logrados por parte de productores de café nacionales su de- de calidad del café para el análisis físico de defectos, se
manda internacional se ha incrementado fuertemente, también muestran algunas investigaciones realizadas en la evaluación
la exigencia para asegurar la calidad del café en consecuencia de la calidad del café y en el mejoramiento de imágenes.
un 98 % de nuestra producción es para exportación.
Las dos especies más comercializadas de café son Coffea
A. Control de calidad física de granos de café verde
arabica (Arábica) y C. Canephora (Robusta), siendo el tipo
Arábica el más fino, por contener menor cantidad de cafeína; La evaluación de la calidad física de granos de café es muy
este es el tipo de café más estudiado y analizado en este importante debido a que es necesaria para cubrir la necesidad
trabajo. de los consumidores por la confianza que genera el grado de

c
978-1-4799-6130-6/14/$31.00 2014 IEEE
2014 XL Latin American Computing Conference (CLEI)

calidad [3]. [20] hace una recopilación de métodos de mejoramiento de


En la cosecha algunos autores solucionan el problema en imágenes en color considerando dos áreas: el modelamiento
la recolección automática de cerezas de café teniendo como de imágenes de color el cual se refiere al mejoramiento para
entrada imágenes digitales, segmentan los frutos y extraen extracción de textura, segmentación y síntesis, y la segunda
características de color y textura con la finalidad de clasifi- área referida al mejoramiento de imágenes con el objetivo de
carlas según su grado de madurez, asegurando que el café mejorar las características de visión en escenas con problemas
producido sea el mejor posible [4],en [5] también se propusie- de baja iluminación.
ron diferentes sistemas de segmentación, se utilizaron técnicas Otro enfoque que también se toma en la literatura es el me-
de crecimiento de regiones a partir de semillas SRG (Seeded joramiento de imágenes fundamentado en la teoría de retinex,
Region Growing) para la determinación de regiones de interés Edwin Land en [21] describe la teoría retinex como primer
en hojas de frutos de café. Las herramientas de segmentación intento para explicar como el sistema visual humano percibe
fueron aplicadas a imágenes de frutos de café adquiridas bajo el color, en este trabajo se muestra que la sensaciòn de color
condiciones controladas. Los resultados obtenidos muestran un esta correlacionada con la reflectancia, además que la cantidad
buen desempeño del detector de bordes de color implementado, de luz visible que llega al ojo depende del producto de la
así como de los sistemas de segmentación propuestos en [6]. reflectancia y la iluminación además, explica el término retinex
Para la evaluación de la calidad del café se requiere evaluar las como un sistema que emplea la estructura y función de la retina
características físicas de los granos de café que van a ser expor- y del cortex como necesarias para producir una imagen.
tados por medio de una muestra representativa, algunos autores En trabajos como [22],[23],[24],[25] se proponen algoritmos
analizan imágenes de granos de café verde, segmentan los para el mejoramiento de imágenes aplicando operaciones de
granos usando solo umbralización global y luego detección de vecindad de píxeles y otros enfoques como el método deno-
bordes con el filtro de sobel, finalmente extraen características minado Single Scale Retinex (SSR), para luego plantear el
morfológicas de cada grano de café para clasificarlos según la método Multi Scale Retinex (MSR) tomando en cuenta la
región donde se produjo el café [7]. En [8] se analiza imágenes división entre la iluminancia y la reflectancia y la imagen
de granos de café verde clasificándolos según su forma en resultante como un producto de estas [26].
los tipos Normal y Quebrado, además utiliza estándares para En consecuencia la condición primaria para el mejoramiento
medición de la calidad, por otro lado [9] tomó como referencia de imágenes es que la información que se quiere extraer,
el Estándar Nacional de Indonesia para la detección de defectos enfatizar o restaurar no debe estar totalmente oculta por las
usando procesamiento de imágenes digitales de granos de café. imperfecciones de la imagen [27]. De este modo podemos
extraer una relación entre las técnicas que utilizan vecindades
B. Mejoramiento de Imágenes Digitales de píxeles y aquellas que intentan modelar el comportamiento
de la visión humana, todas las técnicas requieren que la
En los trabajos relacionados con el mejoramiento de imágenes información visual a mejorar se encuentre en la escena.
digitales utilizando operaciones con histogramas se encuentran
algunos que hacen recopilaciones de técnicas de modificación
del histograma en imágenes de un canal o en escala de III. C ONCEPTOS P REVIOS
grises [10][11]. También algunos autores proponen técnicas
adaptativas, pero siempre sobre imágenes en escala de grises A. Estándar de evaluación física de granos de Café
[12][13].
En el procesamiento de imágenes de color es necesario una La medida de la calidad del café se expresa según un estándar
ecualización de histograma de tres canales RGB para el cual de evaluación definido por la Asociación de Cafés Especiales
se considera la correlación entre estos usando un método de SCAA [28] que clasifica en un manual los 13 posibles defectos
muy baja eficiencia [14]. También se utilizan técnicas de otras del grano de café, estos son descritos en el Cuadro I.
áreas como estadística y procesamiento de lenguaje con la En la evaluación del café se realiza un análisis manual a una
finalidad de establecer un proceso más preciso de ecualización muestra de granos de café realizando los siguientes pasos:
de histograma en varios canales [15].
Aparte de la necesidad de aplicar técnicas de ecualización 1) Se debe pesar una muestra representativa del lote
en [16] se utiliza otros espacios de color en los que se equivalente a 350 grs. de café verde.
trabaja con la saturación, luminosidad y la relación entre 2) Extender la muestra sobre una superficie lisa, plana y
estos comparando los resultados con el uso del espacio RGB limpia, preferiblemente de un color sólido que puede
y analizando la necesidad de preservación del componente ser blanco, azul o negro, para una mejor apreciación.
Hue en el mejoramiento de imagen, esto es utilizado también 3) Con la ayuda del manual de defectos de la SCAA
por otros trabajos que analizan el mejoramiento en espacios se identifican los diferentes tipos de daños siguiendo
similares a HSI [17]. las recomendaciones, comparando cada uno de los
En [18] se propone mejorar el componente I(intensidad) en granos defectuosos con las fotografías presentadas
el espacio de color EHSI el cual es una modificación del en dicho manual. Este paso es realizado por un
tradicional espacio HSI con la finalidad de utilizar un solo experto Q-Grader entrenado en el reconocimiento y
canal de este espacio para su mejoramiento y luego realiza clasificación manual de los granos.
una comparación con los espacios HSI, LHS, HSV, detallando 4) Cada uno de los defectos encontrados, sean completos
sus ventajas y desventajas en el mejoramiento de imágenes. o no, deberán registrarse en una hoja de evaluación
El mismo año [19] propone mejorar el componente V(valor) de café para dejar constancia del análisis realizado y
en el espacio de color IHSV a partir del espacio HSV, mas no del procedimiento para la obtención de los defectos
compara los resultados con el espacio EHSI. totales de la muestra.
2014 XL Latin American Computing Conference (CLEI)

Cuadro I: Tipos de defectos físicos en granos de café verde. 2) Calcular el histograma para cada región.
3) Cortar el histograma de manera que los valores del
Nro Nombre/Clase Descripción Física Muestra histograma que superan a α son cortados y distribui-
1 Brocado Leve (BRL) Pequeñas y oscuras perforaciones.
dos de manera uniforme en todo el histograma.

Medianas y oscuras perforaciones D. Espacio de Color iHSV


2 Brocado Severo (BRS)
(0.5mm-0.7mm) en diámetro.
El espacio de color iHSV es una modificación del espacio
3 Cereza Seca (CER)
Rojizo, presencia de manchas blancas o de color HSV para su aplicación en el mejoramiento de una
residuo.
imagen de tres canales, fue propuesto en [19]. Se propuso una
La forma externa tiene la forma de una modificación al espacio HSV para preservar la gama de color y
4 Concha (CON) concha de mar y la parte interna tiene
forma cónica o cilíndrica. mejorar una imagen en RGB perdiendo contraste para mejorar
Grano afectado por hongos o Cardenilla, la saturación de la imagen. Para la transformación al espacio
5 Daño por Hongo (HON) se le reconoce por las manchas de color iHSV , empezamos desde la conversión al espacio HSV , luego
amarillorojizo.
se modifica el componente V con:
Color blanco y decolorado, dando al
6 Flotador (FLO)
café verde una apariencia dispareja. S
V ′ = V × (1 − )
Tamaño pequeño, de baja densidad, de
2
7 Inmaduro (INM)
forma cóncava y con bordes afilados. luego se mejora la saturación S de la siguiente manera:
Marrón, Agrio o Vinagre Color amarillo pálido, amarillo intenso, S
8
(MAV) carmelita o rojizo. S′ =
2 − 2V ′
9 Negro (NEG) Color opaco.
donde 0.5 ≤ V ′ ≤ 1, luego en la conversión de iHSV a RGB
primero se restaura el valor de S como sigue:
10 Negro Parcial (NEP) Color opaco con manchas claras.
S = S′ × (2 − 2V ′ )
11 Normal (NOR) Color marrón verduzco. donde 0.5 ≤ V ′ ≤ 1 y para el valor de V :
Cubiertos parcial o totalmente por el 2V ′
12 Pergamino (PER) pergamino, que es una gruesa cáscara V=
tipo papel de color blanco o bronceado 2−S
13
Partido/Mordido o Cor- Coloración rojiza oscura con manchas finalmente se convierte de HSV a RGB.
tado (PMC) oscuras.

E. Teoría Retinex y Constancia de Color


B. Ecualización de Histograma (HE) La palabra Retinex es la unión de las palabras retina y cortex
sugiriendo que la vista y el cerebro están envueltos en un
Siendo [0, 255] los niveles de intensidad de la imagen y P la proceso, ambos conforman el sistema visual humano (HVS).
función de densidad de probabilidad del histograma generado Sabemos que las imágenes digitales en algunos casos son dife-
a partir de la imagen I, siendo M y N el largo y ancho de la rentes comparadas con la escena directamente percibida por el
imagen. La imagen mejorada Ieq se obtiene usando la siguiente HVS, nuestro sistema visual puede descontar automáticamente
ecuación. la variación de iluminación para asegurar que el color percibido
255
Ieq (i, j) = 255 ∑ P(I(i, j)) se mantenga constante bajo condiciones de iluminación varia-
i=0 bles [31], esta característica se llama “constancia de color”.
La Teoría Retinex de Edwin H. Land [21],[32],[33],[22] es el
para 0 ≤ i ≤ M y 0 ≤ j ≤ N. primer modelo computacional que trata de simular el modelo
de color HVS. Los supuestos básicos de la Teoría Retinex son:
C. Ecualización de Histograma con Contraste Limitado
(CLAHE) • El HVS realiza el mismo calculo en cada canal de
color de manera independiente al RGB.
Propuesto en [29], fue desarrollado originalmente para proce-
sar imágenes médicas de bajo contraste este algoritmo es una • En cada canal de color, la intensidad de color es
modificación del método AHE (Adaptive Histogram Equaliza- proporcional al producto de la reflectancia y la ilu-
tion) [30], el cual divide una imagen en regiones conceptuales minación.
y en cada una aplica la una etapa de ecualización de histograma
tradicional junto con una operación de limitación de la mejora • La reflectancia de un objeto puede puede ser percibida
de contraste. por el canal HVS mientras que la iluminación se
decrementa automáticamente.
El algoritmo recibe dos parámetros, 0 < α < 255 es el corte
limite (clip limit) y T el numero de regiones en grilla siguiendo La Figura 1 muestra el tablero de Adelson que muestra una
los siguientes pasos: ilusión de sombra. Para la percepción humana, la región B es
más oscura que la región A pero realmente tienen exactamente
1) Identificar las regiones de la grilla dividiendo la el mismo color, porque según la Teoría Retinex tienen dife-
imagen. rentes condiciones de iluminación, un dispositivo como una
2014 XL Latin American Computing Conference (CLEI)

Los algoritmos basados en rutas consideran la reflectancia en


cada pixel a lo largo de caminos aleatorios y aplican teoría
estocástica, estos requieren de un número largo de parámetros
y tienen alta complejidad computacional. Los algoritmos recur-
sivos extienden los algoritmos basados en rutas y reemplazan
el cálculo de ruta por un método que mejora su eficiencia
computacional.
En los algoritmos basados en ecuaciones diferenciales par-
ciales, se consideran funciones de umbral que son utilizadas
(a) Ilusión de sombra (b) Demostración para eliminar la iluminación, luego la reflectancia puede ser
recuperada resolviendo ecuaciones de Poisson.
Figura 1: Tablero de Adelson mostrando la ilusión de sombra Los algoritmos de centro-vecindad como el Single Scale Reti-
e iluminación. nex (SSR) y el Multi Scale Retinex (MSR) están basados en la
idea de que el componente iluminancia tiende a cambiar sua-
vemente contrario a la reflectancia la cual puede ser calculada
restando una imagen suavizada de la imagen de entrada, estos
cámara no conoce la cantidad de iluminancia del objeto y lo algoritmos son de implementación sencilla, necesitan muchos
que mide es el producto de dos componentes definidos de la parámetros y son bastante eficientes.
siguiente manera [34]:
G. Retinex Multiescala con Restauración de Color (MSRCR)
• Iluminancia (L): Monto de luz incidente en una
superficie. De acuerdo con la teoría retinex, un algoritmo de mejoramiento
de imagen requiere eliminar la iluminación en la imagen y
• Reflectancia (R): Ratio de la luz reflejada con la luz devolver solo la reflectancia. En [26] se propuso un algoritmo
que cae sobre la superficie (color). Por ejemplo, la de mejoramiento de imágenes usando operaciones de centro-
reflectancia de una superficie negra puede ser de 0.10 vecindad, considerando la operación entre la reflectancia e
(10 % de la luz incidente es reflejada), mientras que iluminancia como un producto, luego se aplica logaritmo a
la reflectancia de una superficie blanca puede ser de cada lado:
0.85 (85 % de la luz incidente es reflejada).
log(I(x, y)) = log(L(x, y) × R(x, y))
La región B esta en la sombra del cilindro verde de manera que
la iluminación de la región A es más fuerte que en la región B, log(I(x, y)) = log(L(x, y)) + log(R(x, y))
entonces L(A) > L(B). Además, la reflectancia de la región A log(R(x, y)) = log(I(x, y)) − log(L(x, y))
es menor que la de la región B, R(A) < R(B) para asegurarse de
que I(A) = I(B). La constancia de color nos ayuda a identificar El primer algoritmo definido es el SSR el cual toma como
los objetos, en este caso el HVS discrimina la iluminancia L de entrada una imagen digital I para producir una imagen de
modo que solo es percibida la reflectancia R, esta es la razón salida producto de aplicar el logaritmo de la reflectancia R.
de que la región A aparenta ser más oscura.
FSSRi (x, y) = log(Ii (x, y)) − log[Gi (x, y, σ ) ∗ Ii (x, y)]

F. Algoritmo Retinex donde i es el canal, i ∈ R, G, B, aplicado a cada canal en la


imagen RGB y ∗ es la operación de convolución. Gi (x, y, σ )
Una imagen I se forma a partir de los componentes iluminancia es el kernel gaussiano 2D donde el valor de σ define el valor
y reflectancia, según la teoría retinex la imagen se forma a de suavizado que se aplica a la imagen aumentando con su
partir de una operación entre los dos como se muestra en (1). valor. Luego se introduce la utilización de diferentes escalas o
Si consideramos una imagen como una función de dos dimen- valores σ usando un factor de ponderación Wn en cada escala
siones I(x, y), donde cada punto (x, y) es equivalente a un píxel n, este algoritmo se denomina MSR:
en la imagen, el valor de la función I = I(x, y) representará la
N
intensidad en el píxel (x, y).
FMSRi (x, y) = ∑ Wn FSSRni
n=1
I(x, y) = L(x, y) ∧ R(x, y) (1)
donde i es el canal, N es el numero de escalas y Wn se
Para simular el mecanismo del HVS necesitamos recuperar la distribuye equitativamente para cada escala.
reflectancia R de la imagen I. Según [24] los algoritmos retinex A partir de esto se propuso el algoritmo Multi Scale Retinex
están categorizados como: with Color Restoration propuesto en [35]. Este algoritmo
trata de multiplicar cada píxel por un factor de restauración
• Basados en rutas (path-based) Ci (x, y), luego:
• Recursivos (recursive) FMSRCRi (x, y) = Ci (x, y) × FMSRi (x, y), i ∈ R, G, B
• Algoritmos basados en Ecuaciones Diferenciales Par- este factor de restauración definido en [36], se encuentra
ciales (PDE-based algorithms) calculando coordenadas de cromaticidad en cada canal:
• Algoritmos variacionales (variational algorithms) S
Ii′ (x, y) = Ii (x, y) / ∑ Ii (x, y)
• Centro-vecindad (center-surround) i=1
2014 XL Latin American Computing Conference (CLEI)

Figura 2: Esquema general del sistema donde cada rectángulo representa una etapa, se detalla la etapa de pre-procesamiento con
el algoritmo MSRCR.

donde i ∈ R, G, B y S es el número de canales espectrales que Extracción de Características usando Matrices de Co-
en este caso es S = 3, luego: ocurrencia para Imágenes de Color (CGLCM)
Ci (x, y) = f [Ii′ (x, y)] Es una técnica de extracción de características por textura
y color en imágenes [38] modificada de la técnica Gray
Ci (x, y) = β log[αIi′ (x, y)] Level Co-ocurrence Matrix realizado por [39], la principal
diferencia entre ambas es el uso de los 3 canales de una imagen
Ci (x, y) = β log[αIi (x, y) / ∑ Ii (x, y)] en formato RGB y la relación entre ellas se resume en lo
donde β es la constante de ganancia y α se denomina fuerza siguiente:
de no linealidad. Este factor de restauración resalta los colores • El pixel referente y vecino pueden pertenecer a un
en la imagen de acuerdo a sus parámetros. solo canal o a canales distintos.

IV. P ROPUESTA DE MEJORAMIENTO DE CLASIFICACIÓN • En total se consideran 9 relaciones RR, RG, RB, GR,
GG, GB, BR, BG, BB entre canales de RGB luego
El trabajo propuesto busca mejorar los resultados de por cada relación se crea una matriz de co-ocurrencia.
clasificación de defectos físicos en granos de café verde
a través de la aplicación de un proceso de mejoramiento La Figura 3 muestra un ejemplo de la relación RG, las
de imágenes previo, en la Figura 2 se muestra el proceso relaciones del tipo RR, GG, BB son muy similares al GLCM
global que se inicia con el ingreso de una imagen de grano debido que el pixel referente y el vecino pertenecen a un solo
de café, esta es dividida en 3 escalas para las cuales se canal, por otro lado el resto de relaciones difieren en que
halla sus coordenadas de cromaticidad en los canales RGB, el pixel referente y el vecino pertenecen a distintos canales
posteriormente a cada coordenada se le aplica el factor brindando una mejor información de la distribución de píxeles
de restauración C para el cálculo de sus reflectancias Ri , en una imagen, adicionalmente debemos de considerar que las
finalmente la ecuación MSRCR es obtenida. El producto de orientaciones o ángulos usados son Θ = {0◦ , 45◦ , 90◦ , 135◦ } a
todos estos pasos origina una imagen con escena mejorada la una distancia dk = 1.
cual será analizada para obtener un vector de características
Clasificación usando Support Vector Machines (SVM)
mediante un extractor CGLCM, luego un proceso de
clasificación a través de SVM es realizado. Es un algoritmo de aprendizaje supervisado que resuelve
problemas de clasificación, en este trabajo es utilizado para la
2014 XL Latin American Computing Conference (CLEI)

Canal R: Pixel Referente Canal G: Pixel Vecino Cada conjunto de imágenes recolectado contiene un conjunto
de granos de café previamente clasificados por nuestro experto
i-1, j-1
catador. Las imágenes fueron obtenidas con una cámara digital
i-1, j-1 i-1, j i-1, j+1 i-1, j i-1, j+1
profesional de 12 Megapixeles.Una imagen de granos de café
resultante de la adquisición se puede apreciar en la Figura 4.
i, j-1 i, j i, j+1 i, j-1 i, j i, j+1 Luego a cada muestra digital se aplica un proceso de segmen-
tación con el objetivo de obtener cada grano en una región
de interés resultando en la Figura 5, donde se puede apreciar
i+1, j-1 i+1, j i+1, j+1 i+1, j-1 i+1, j i+1, j+1
una área de interés rectangular para cada grano sementado
en la imagen. En total se recolectaron 9520 imágenes de

Figura 3: Relación RG en una imagen donde el píxel referente


se toma en el canal R y los píxeles vecinos en el canal G.

clasificación de cada imagen de grano de café en cada una de


las clases presentadas en el Cuadro I, inicialmente propuesto
en [40]. Este algoritmo nos permite obtener estadísticas repre-
sentativas acerca del grado de precisión y efectividad de la tasa
de clasificación mediante el análisis de matrices de confusión.
La matriz de confusión es una herramienta de visualización
que facilita la descripción en el nivel de precisión al clasificar
entre clases.
En este trabajo consideramos la utilización de matrices de
confusión como una medida de evaluación para el proceso
Figura 5: Granos de café segmentados y determinados por una
de mejoramiento de imágenes, una leve comparación entre
región de interés rectangular.
matrices nos permitirá obtener el mejor modelo de clasificación
en base a los resultados de precisión.
granos de café producto de la segmentación en todas las
muestras digitales, este banco de imágenes fue reducido para
V. P RUEBAS nuestras pruebas a 100 granos de café por cada tipo de defecto,
A. Elaboración del banco de Imágenes resultando en 1300 imágenes de granos de café.

Para la realización de pruebas se ha recolectado un conjunto de B. Descripción


imágenes digitales a partir de conjuntos de muestras de granos
de café elaborados por un experto Q-Grader, también se ha Para la realización de las pruebas se elaboraron dos conjuntos
utilizado un entorno con iluminación controlada usando focos de entrenamiento definidos como sigue:
fluorescentes a una distancia fija de la escena considerando
capturar la mayor cantidad de granos dispuestos horizontal- • Grupo de control: Conjunto de imágenes sin ningún
mente en una superficie plana sin brillo. tipo de pre-procesamiento.
• Grupo experimental: Conjunto de imágenes resul-
tante de aplicar una técnica de mejoramiento de
imagen, en este conjunto se tienen 3 tipos: HEiHSV ,
CLAHEiHSV y MSRCR cada uno correspondiente al
resultado de aplicar un algoritmo de mejoramiento de
imágenes.

La pruebas de clasificación fueron realizadas con cada uno


de los conjuntos anteriores, también se tomaron los siguientes
parámetros:

• HEiHSV sin parámetros iniciales.


• CLAHEiHSV con parametros α = 40 y T = 8.
• MSRCR con parametros N = 3, σ1 = 2, σ2 =
45.33, σ3 = 88.66, wn = 0.33, α = 1 y β = 18.
Figura 4: Muestra digital de granos de café dispuestos horizon-
talmente en una bandeja sin brillo y adecuada para la recepción Los resultados visuales del proceso de mejoramiento para
de cada grano. cada conjunto y de cada tipo de defecto en grano de café
se muestran en el Cuadro II.
2014 XL Latin American Computing Conference (CLEI)

Cuadro II: Resultados visuales de mejoramiento utilizando HEiHSV , CLAHEiHSV y MSRCR aplicado a todos los tipos de defectos.

Original

HEiHSV

CLAHEiHSV

MSRCR

Bro. Leve Bro. Severo Cer. Seca Concha DxHongo Flotador Inmaduro MAVinagre Negro N. Parcial Normal Pergamino PMCortado

La evaluación visual depende del nivel de percepción del sujeto • Por cada distancia se han creado 9 matrices de co-
que evalúa, sin embargo podemos apreciar un nivel de resalte ocurrencia ( debido a las 9 relaciones vistas anterior-
de características visuales en las imágenes de granos de café mente) resultando 36 matrices de co-ocurrencia.
procesados con el algoritmo MSRCR.
• Por cada matriz se generaron 3 características: Ener-
gía, contraste y correlación dando un total de 108
características.
• Para obtener las matrices de confusión de cada con-
junto se utilizó el método de validación cruzada con
un valor de k f old = 5.

Cuadro III: Tabla que muestra el tiempo de ejecución de


(a) Sin pre-procesamiento (b) HEiHSV cada algoritmo en una imagen de tamaño 70x50 píxeles y la
exactitud de clasificación del grupo experimental generado con
el algoritmo respectivo.
Tiempo de
Algoritmo de Exactitud de clasificación
ejecución por
mejoramiento de de su grupo experimental
grano de café
imagen ( %)
(ms)
Sin
- 70.9231
pre-procesamiento
HEiHSV 0.205 72.3077
(c) CLAHEiHSV (d) MSRCR
CLAHEiHSV 1.219 74.5385
MSRCR 3.280 79.1538
Figura 6: Representación gráfica de las matrices de confusión
resultantes en la etapa de clasificación. La intensidad de color
representa el nivel de aciertos correctos por clase (tipo de La validación del modelo de clasificación fue realizada de tres
defecto) de cada una de las técnicas de mejoramiento de formas:
imagen, siendo el algoritmo MSRCR el más estable. • Comparando las matrices de confusión resultantes,
descrito en la Figura 6.
Para la etapa de clasificación se extrajeron características me- • Comparando la eficiencia en tiempo de procesamiento
diante matrices CGLCM a partir de cada conjunto de imágenes de un grano de café y exactitud en la clasificación de
descrito anteriormente, estos vectores fueron utilizados en un cada algoritmo, esto descrito en el Cuadro III.
SVM con los siguientes parámetros: • Comparando los valores F-score de cada algoritmo
• Clasificador SVM multiclase, con kernel polinomial para cada tipo de defecto de grano de café, esto
de grado 4. descrito en la Figura 7.
• Extractor de características CGLCM con direcciones En la Figura 6 se observa que las diagonales presentan los
0◦ , 45◦ , 90◦ y 135◦ para distancias de i = 1, 2, 3, 4 . colores de mayor intensidad, esto significa que los resultados
2014 XL Latin American Computing Conference (CLEI)

Diagrama de F−score por cada tipo de grano de café

Sin pre−procesamiento
100 HEiHSV

CLAHEiHSV

MSRCR

90

80

70

60

50

BRL BRS CER CON HON FLO INM MAV NEG NEP NOR PER PMC

Figura 7: Diagrama que muestra la medida F-score alcanzada para cada algoritmo por tipo de defecto en grano de café. Se
muestra que el valor F-score varia por cada tipo de defecto siendo el algoritmo MSRCR el que obtuvo mejores resultados en la
clasificación.

de precisión en la clasificación son robustos para todos los resultados, este trabajo permitió comprobar que la aplicación
conjuntos sin embargo, el conjunto procesado con MSRCR previa de un algoritmo de mejoramiento de imágenes con
presenta valores más intensos que los demás, adicionalmente teoría Retinex produce mejores resultados de clasificación
en el Cuadro III se observa que el grupo procesado con posteriores.
MSRCR obtiene un 79.1538 % de precisión en la clasificación En este trabajo se muestra que para este algoritmo la clasifi-
sin embargo presenta el mayor tiempo computacional de cación de los tipos brocado leve, concha , flotador, pergamino
ejecución. El diagrama de medidas F-score obtenido a partir y partido no mostraron diferencias en clasificación para cada
de la matriz de confusión es descrito en la Figura 7 donde se conjunto de mejoramiento utilizado, esto es debido a que estas
puede apreciar que los valores de MSRCR son los más altos clases son visualmente diferenciables de las otras.
en 8 clases y en el resto posee valores promedios, luego en El tiempo computacional utilizado para cada imagen de grano
ninguna de las clases el valor de F-score está por debajo de de café es calculado, el tamaño de las imágenes segmentadas
los demás. de granos permite realizar el procesamiento, sin embargo la
utilización de un conjunto muy grande de granos originaría un
costo computacional total muy alto, de este modo un enfoque
VI. C ONCLUSIONES Y TRABAJOS FUTUROS de procesamiento en paralelo o en GPU sería recomendable,
En este trabajo se han aplicado un conjunto de técnicas de por otro lado la aplicación de este modelo de mejoramiento
mejoramiento de imágenes a una base de imágenes de granos deimágenes podría ser aplicado a frames en video lo cual
de café con defectos físicos, los experimentos mostraron que podría traer beneficios a tareas de inspección y/o control de
el algoritmo MSRCR mejoraba subjetivamente la visualización calidad similares en tiempo real.
de las imágenes en la base de datos y el clasificador alcanzaba
una tasa de clasificación superior comparada con los otros
métodos.
Se intentó utilizar el algoritmo de pre-procesamiento para cada AGRADECIMIENTOS
imagen en su totalidad, considerando varios granos con distin-
tos defectos en una escena, antes de considerar el proceso de Los autores quisieran agradecer a CECOVASA (Central de
segmentación, sin embargo la presencia de un fondo hizo que Cooperativas Agrarias Cafetaleras de los Valles de Sandia)
los resultados de clasificación disminuyeran, en consecuencia quienes brindaron el soporte y conocimiento necesario para el
consideramos muy importante el proceso de segmentación de desarrollo de la investigación. Este trabajo ha sido parcialmente
cada grano en una muestra digital. subvencionado por los Fondos para la Innovación, Ciencia
En tareas de visión computacional aplicada a la industria se y Tecnología (FINCyT-Perú) mediante contrato 087-FINCyT-
puede considerar modelos que adecuen las imágenes recolecta- FIDECOM-PIPEA-2011 en convenio con la empresa y la
das al problema a resolver, de este modo se obtengan mejores Universidad Nacional de San Agustín.
2014 XL Latin American Computing Conference (CLEI)

R EFERENCIAS [26] Z.-U. Rahman, D. J. Jobson, and G. A. Woodell, “Multi-scale retinex for
color image enhancement,” in Image Processing, 1996. Proceedings.,
[1] SCAA, “Specialty coffe asociation of america,” http://www.scaa.org/, International Conference on, vol. 3. IEEE, 1996, pp. 1003–1006.
2012. [27] C. Solomon and T. Breckon, Fundamentals of Digital Image Proces-
[2] “Asociacion para la Ciencia e Informacion de Cafe,” http://www.asic- sing: A practical approach with examples in Matlab. John Wiley &
cafe.org/. Sons, 2011.
[3] P. Batt, “Expanding the quality concept to satisfy consumer demand,” [28] SCAA, “Cafe Verde Arabica: Manual de Defectos,” 2011.
Lotus Pang Suan Kaeo Hotel, Chiang Mai, Thailand, p. 281, 2007. [29] K. Zuiderveld, “Contrast limited adaptive histogram equalization,” in
[4] N. Montes, G. Osorio, F. Prieto, and F. Angulo, “La visión artificial Graphics gems IV. Academic Press Professional, Inc., 1994, pp. 474–
aplicada al proceso de producción del café.” Dyna, vol. 133, 2001. 485.
[5] Z. L. Sandoval Niño and F. A. Prieto Ortiz, “Caracterización de café [30] S. M. Pizer, E. P. Amburn, J. D. Austin, R. Cromartie, A. Geselowitz,
cereza empleando técnicas de visión artificial/.” Revista de la Facultad T. Greer, B. ter Haar Romeny, J. B. Zimmerman, and K. Zuiderveld,
Nacional de Agronomía (Colombia), vol. 60, pp. 4105–4127. “Adaptive histogram equalization and its variations,” Computer vision,
[6] J. A. B. Acevedo, F. A. P. Ortiz, and G. A. O. Londoño, “Segmentación graphics, and image processing, vol. 39, no. 3, pp. 355–368, 1987.
de frutos de café mediante métodos de crecimiento de regiones,” Rev. [31] W. Ma, J.-M. Morel, S. Osher, and A. Chien, “An l 1-based variational
Fac. Nal. Agr. Medellín. Vol, vol. 59, no. 1, pp. 3311–3333, 2006. model for retinex theory and its application to medical images,” in Com-
[7] M. Habtamu, “Image analysis for ethiopian coffee classification.” puter Vision and Pattern Recognition (CVPR), 2011 IEEE Conference
on. IEEE, 2011, pp. 153–160.
[8] L. A. de Castro and G. G. Franca, “QualiCafe: Selecao de Caracteris-
ticas de Qualidade por Forma,” 2008. [32] E. H. Land, “The retinex theory of color vision,” Scientific American,
vol. 237, no. 6, pp. 108–28, Dec. 1977.
[9] F. Faridah, G. O. Parikesit, and F. Ferdiansjah, “Coffee bean grade
[33] ——, “Recent advances in retinex theory and some implications for
determination based on image parameter,” TELKOMNIKA Telecommu-
cortical computations: color vision and the natural image.” Proceedings
nication, Computing, Electronics and Control, vol. 9, no. 3, pp. 547–
of the National Academy of Sciences of the United States of America,
554, 2013.
vol. 80, no. 16, p. 5163, 1983.
[10] R. Hummel, “Image enhancement by histogram transformation,” Com-
[34] F. Dagostino and J. B. Wujek, Mechanical and Electrical Systems in
puter graphics and image processing, vol. 6, no. 2, pp. 184–195, 1977.
Architecture, Engineering and Construction. Prentice Hall, 2009.
[11] Y.-T. Kim, “Contrast enhancement using brightness preserving bi- [35] R. Zia-ur, J. Daniel J, and W. Glenn A, “A multiscale retinex for color
histogram equalization,” Consumer Electronics, IEEE Transactions on, rendition and dynamic range compression,” 1996.
vol. 43, no. 1, pp. 1–8, 1997.
[36] D. J. Jobson, Z.-U. Rahman, and G. A. Woodell, “Properties and
[12] Q. Wang and R. K. Ward, “Fast image/video contrast enhancement performance of a center/surround retinex,” Image Processing, IEEE
based on weighted thresholded histogram equalization,” Consumer Transactions on, vol. 6, no. 3, pp. 451–462, 1997.
Electronics, IEEE Transactions on, vol. 53, no. 2, pp. 757–764, 2007.
[37] C. Elkan, “Evaluating classifiers,” 01 2012. [Online]. Available:
[13] S. Pichai, B. Krishnasamy, and S. Karuppanagounder, “Bi-level weigh- http://cseweb.ucsd.edu/ẽlkan/250B/classifiereval.pdf
ted histogram equalization for scalable brightness preservation and
contrast enhancement for images.” Int. Arab J. Inf. Technol., vol. 10, [38] M. BENČO and R. Hudec, “Novel method for color textures features
no. 6, pp. 603–609, 2013. extraction based on glcm,” Radioengineering, vol. 4, no. 16, pp. 64–67,
2007.
[14] P. Trahanias and A. Venetsanopoulos, “Color image enhancement
through 3-d histogram equalization,” in Pattern Recognition, 1992. Vol. [39] R. M. Haralick, K. Shanmugam, and I. H. Dinstein, “Textural features
III. Conference C: Image, Speech and Signal Analysis, Proceedings., for image classification,” Systems, Man and Cybernetics, IEEE Tran-
11th IAPR International Conference on. IEEE, 1992, pp. 545–548. sactions on, no. 6, pp. 610–621, 1973.
[40] C. Cortes and V. Vapnik, “Support-vector networks,” Machine learning,
[15] N. Bassiou and C. Kotropoulos, “Color image histogram equalization
vol. 20, no. 3, pp. 273–297, 1995.
by absolute discounting back-off,” Computer Vision and Image Unders-
tanding, vol. 107, no. 1, pp. 108–122, 2007. [41] C.-C. Chang and C.-J. Lin, “Libsvm: a library for support vector
machines,” ACM Transactions on Intelligent Systems and Technology
[16] R. N. Strickland, C.-S. Kim, and W. F. McDonnell, “Digital color image
(TIST), vol. 2, no. 3, p. 27, 2011.
enhancement based on the saturation component,” Optical Engineering,
vol. 26, no. 7, pp. 267 609–267 609, 1987.
[17] S. K. Naik and C. Murthy, “Hue-preserving color image enhancement
without gamut problem,” Image Processing, IEEE Transactions on,
vol. 12, no. 12, pp. 1591–1598, 2003.
[18] C.-L. Chien, D.-C. Tseng et al., “Color image enhancement with
exact hsi color model,” International Journal of Innovative Computing,
Information and Control, vol. 7, no. 12, pp. 6691–6710, 2011.
[19] C.-L. Chien, D.-C. Tseng, C.-Y. Kuo, and C.-H. Wu, “Color Image
Enhancement with the Improved HSV (iHSV) Color Model,” 23th IPPR
Conf. on Computer Vision, Graphics and Image Processing, Kaohsiung,
Taiwan, 2010.
[20] I. Pitas and P. Kiniklis, “Multichannel techniques in color image
enhancement and modeling,” Image Processing, IEEE Transactions on,
vol. 5, no. 1, pp. 168–171, 1996.
[21] E. H. Land and J. McCann, “Lightness and retinex theory,” JOSA,
vol. 61, no. 1, pp. 1–11, 1971.
[22] E. H. Land, “Recent advances in Retinex theory,” 1986.
[23] R. Kimmel, M. Elad, D. Shaked, R. Keshet, and I. Sobel, “A variational
framework for retinex,” 2003.
[24] J. M. Morel, A. B. Petro, and C. Sbert, “A pde formalization of retinex
theory,” Image Processing, IEEE Transactions on, vol. 19, no. 11, pp.
2825–2837, 2010.
[25] W. Ma and S. Osher, “A tv bregman iterative model of retinex theory,”
UCLA CAM Report, pp. 10–13, 2010.