Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Fig. 2. Muestra fotogramas de video de frutas de manzana Fuji (Malus M. pumila) en varias
etapas de maduración en huertos al aire libre. (A): inmaduro, (B): medio maduro, (C): maduro, y
(D): demasiado maduro.
2.5. Definiciones de criterios para la evaluación del desempeño del clasificador ANN-SA en
estimación automática de manzanas en las etapas de maduración.
El rendimiento del clasificador se midió utilizando tres tipos de criterios: 1) matriz de confusión,
error de clasificación por clase y tasa de clasificación correcta (CCR); 2) recuerdo, precisión,
especificidad, precisión y medida F; 3) receptor en funcionamiento
Fig. 3. Gráfico espectral de diferentes muestras de manzana Fuji; (A): Gráfico espectral de
reflectancia. Gráfico pre procesado que incluye tres pasos principales (B): 1er paso: conversión
de datos espectrales de reflectancia a absorción; (C): 2do paso: dispersión de luz y línea de base
correcciones mediante un algoritmo de eliminación de tendencia de ondículas; (D): 3er paso:
suavizado mediante un filtro de mediana.
característica (ROC) y área bajo la curva (AUC) Sabzi, Abbaspour-Gilandeh, y Javadikia (2017),
Sabzi, Abbaspour-Gilandeh, Garcı´a-Mateos, Ruiz-Canales, y Molina-Martı´nez (2018), y
Pourdarbani, Sabzi, Hernandez- Hernandez, Hern andez-Hern andez, y Garcı ´a-Mateos (2019).
Como se menciona en la sección 2.4, la clasificación se realizó utilizando un método híbrido ANN-
SA; después de extraer el color y características espectrales, los datos se dividen aleatoriamente
en tres conjuntos: El 60% de las muestras de entrada van al conjunto de trenes, el 10% de los
datos se utilizado para la validación, y el 30% restante de datos se utilizó para probar el
rendimiento del clasificador, siendo esos tres conjuntos disjuntos. Cabe señalar que la validación
interna del modelo
se realizó. La siguiente es una descripción detallada de cada criterio de desempeño utilizado.
2.5.1. Matriz de confusión, tasa de clasificación correcta de clase y tasa de clasificación correcta
total
Una matriz de confusión es una matriz cuadrada con número de filas y columnas iguales al número
de clases de clasificador de salida. Por ejemplo, en este estudio debido a la existencia de cuatro
clases de maduración para la clasificación, la matriz de confusión tiene cuatro filas y cuatro
columnas (4x4). Filas en matriz de confusión representar las clases y columnas de maduración
prevista de ANN-SA representan clases de maduración verdaderas (reales). La tasa de clasificación
correcta de clase (CCR) se define como el número de muestras en el diagonal principal de cada fila
dividida por el número total de muestras en esa fila de matriz. Finalmente, el CCR total se define
como la traza (suma de los elementos en la diagonal principal de la matriz) dividido por el número
total de muestras en la matriz de confusión.
2.5.2. Diferentes criterios de rendimiento de clasificación: recuperación, exactitud, especificidad,
precisión y medida-F.
En la Tabla 1, varios índices de desempeño de clasificación binaria (de dos clases, positiva o
negativa), incluida la recuperación, exactitud, especificidad, precisión y medida F, son
formalmente
definido.
Un verdadero positivo (TP) es igual a la fracción de clase positiva, muestras que se están
clasificando adecuadamente como tales. A la verdad
negativo (TN) es igual a la fracción de muestras negativas que están siendo correctamente
clasificados como tales. Un falso positivo (FP) es la fracción de muestras negativas clasificadas
erróneamente como positivas muestras de clase. Finalmente, un falso negativo (FN) es igual a la
fracción de muestras positivas clasificadas erróneamente como clase negativa muestras.
2.5.3. Característica operativa del receptor (ROC) y área bajo la curva ROC (AUC):
El diagrama ROC se utiliza para evaluar el desempeño de los clasificadores. Uno de esos diagramas
se puede trazar para cada clase, en un contexto "binarizado" (una clase frente a las demás clases).
ROC las curvas se trazan dentro del {FPF, TPF} o plano de {1- especifidad, sensibilidad}, siendo:
FP TP
FPF ≜ y TPF ≜ .
(TN + FP) ( FP+ FN )
Cuanto más cerca esté el área bajo las curvas ROC (AUC) del valor de uno, mejor se desempeña el
clasificador. Cuanto más cerca la gráfica ROC es a la sensibilidad = 1 – especifidad línea recta
1
( AUC= ), cuanto más pobre es la clasificación, estando en el peor caso posible igual al
2
lanzamiento de una moneda. Esta curva es independiente del número de muestras en cada clase y
solo considera el rendimiento de las clases en función del número de muestras clasificadas
incorrectamente. Por lo tanto, el área debajo de ROC curvas está numéricamente dentro de la
AUC ∈ {12 , 1} rango, AUC = 1, significa que la curva ROC es vertical pasando por {FPR=0, TPR=1}
1
punto en el plano de {1-especifidad, sensibilidad} y así siendo óptimo, mientras AUC= , hace
2
una clasificación equivalente al lanzamiento aleatorio de una moneda.
muestras. Como puede verse en la Fig.3 (B), un preprocesado el espectro tiene varios picos, cada
uno de los cuales contiene importante información espectral que permite estimar las diferentes
etapas de madurez de las muestras de manzanas. Espectrales datos de tres rangos de longitud de
onda, 535e560 nm, 835e855 nm y 950e975 nm, se utilizaron en la madurez estimación de la
etapa. En los gráficos espectrales, cada pico contiene información útil sobre la base de la cual la
clasificación puede ser realizado. Como puede verse en la Fig.3 (B) con la conversión de datos
espectrales de reflectancia a absorción, en la Fig.3 (C) con la dispersión de la luz y las correcciones
de la línea base por un algoritmo de eliminación de tendencia de wavelet, y en la Fig.3 (D) con
suavizado por un filtro mediano, diferentes picos en espectros han ocurrido en los distintos
valores de longitud de onda (nm). Basado en prueba y error, tres picos que tenían altos se
seleccionó la precisión de clasificación. Ellos tenían la ventaja de un rango espectral estrecho que
podría aumentar la velocidad del análisis y, por lo tanto, proporcionar una rápida detección de las
etapas de maduración de la manzana. Sin embargo, Cabe señalar que solo los mejores resultados
de datos espectrales deben utilizarse para la detección y clasificación de frutas en línea.
3.3. Evaluación del desempeño del clasificador ANN-SA en determinar las diferentes etapas de
madurez de las manzanas Fuji usando características de color de rango visible
Después de examinar las características de color a *, b *, L y C, fue determinó que con solo usar las
entradas de color a * y C fue la precisión del híbrido ANN-SA mayor. Por lo tanto, se seleccionaron
dos características como entradas del clasificador. Tabla 3 comparar el rendimiento del clasificador
híbrido ANN-SA con las entradas a * y C usando una matriz de confusión, error de clasificación por
clase y tasa de clasificación correcta total (CCR) para el conjunto de prueba después de 1000
iteraciones (conjunto de prueba). Ya que se estudiaron 170 muestras de manzana y el 30% (51
muestras) fueron seleccionados al azar de manera uniforme en cada iteración, por tanto, se
ejecutaron 51.000 iteraciones. De acuerdo a matriz de confusión, se puede ver que 3432 de un
total de 51.000 las muestras se clasificaron incorrectamente, lo que resultó en un CCR del 93,27%
(ver Tabla 3).
La Tabla 4 representa el desempeño de clasificación del ANN-SA con entradas de a * y C para datos
del conjunto de prueba después de 1000 iteraciones utilizando cinco criterios de rendimiento:
recuperación, precisión, especificidad, precisión y medida F. Desde el retiro de 100 significa que
ninguna de las muestras de las otras clases es clasificado incorrectamente en la clase de destino,
se puede inferir que la mayoría de las muestras clasificadas incorrectamente pertenecían a los
inmaduros. Esta tabla muestra que la precisión de la clase sobre madura fue más alta que los
otros, lo que implica que más muestras fueron categorizadas correctamente en comparación con
otras clases. Además, la especificidad de la clase sobre madura es del 98,66%, fue mayor que la
otra clase. La precisión de la clase medio madura fue del 91,21%, el más bajo entre las cuatro
clases estudiadas, lo que demuestra que las muestras de esta clase se clasificaron erróneamente
en otras
clases. Finalmente, dado que la medida F es un promedio geométrico de valores de recuperación y
precisión, se puede concluir que la clase madura era una clase mejor equilibrada en comparación
con otras. La Figura 4 ilustra el desempeño del clasificador ANN-SA en 1000 iteraciones para el
conjunto de prueba utilizando diagramas de diagrama de caja para ambos CCR y AUC. Estas cifras
investigan el desempeño de Método híbrido ANN-SA en diferentes iteraciones utilizando la tasa de
clasificación correcta (CCR) y el área bajo la curva ROC (AUC) de las cuatro clases de etapas de
maduración diferentes consideradas: inmaduro, medio maduro, maduro y sobre maduro. La
validez del método propuesto se examinó utilizando estas cifras. Por ejemplo, la Fig.4 (A) muestra
que, entre 1000 iteraciones, solo 9 de las iteraciones tenían una CCR por debajo del 80%. Por lo
tanto, se puede reclamar que el método propuesto presentó resultados cercanos en diferentes
iteraciones, lo que indica que el método propuesto fue robusto. La Figura 4 (B) también muestra
que el AUC de la clase sobre madura era más compacto que otras clases, lo que significa que el
método propuesto fue capaz de clasificar las muestras pertenecientes a la clase sobre madurada
más correctamente que los pertenecientes a otras clases.
3.4. Evaluación del desempeño del híbrido ANN-SA clasificador en la determinación de las
diferentes etapas de madurez de Fuji manzanas utilizando datos espectrales NIR
La Tabla 5 representa el desempeño del clasificador ANN-SA con rango de datos espectrales de
535e560 nm usando matriz de confusión, precisión y error de clasificación por clase. Como puede
verse, las clases medio maduras y demasiado maduras tenían el porcentaje más bajo de
clasificación errónea. El CCR general para datos espectrales de 535e560 nm fue más del 99,62%, lo
que indica un alto rendimiento del método propuesto. La Tabla 6 evalúa el desempeño del
clasificador usando cinco diferentes criterios. Como puede verse, el valor de estos criterios en
todas las clases fue superior al 99%, lo que indica una muy buena generalización de la ANN.
Finalmente, la Fig.5 (A) muestra que el CCR general es 100% en el 99,1% de las iteraciones y los
valores del AUC eran iguales a 1, para todas las clases de salida, consulte la Fig. 5 (B).
La Tabla 9 representa el desempeño del clasificador ANN-SA con longitud de onda de datos
espectrales en el rango de 950e975 nm usando matriz de confusión, CCR y el error de clasificación
de clases,
Tabla 3 - Matriz de confusión y CCR para ANN-SA híbrido con características de color
a * y C (conjunto de prueba, después de 1000 iteraciones).
Verdadero 1 2 3 4 Error de clasificación Tasa de clasificación
est. por clase (%) correcta (%)
1 10.418 870 24 4 7.93 93.27
2 1056 11.165 15 5 8.79
3 2 46 13.682 930 6.67
4 0 0 480 12.303 3.75