Está en la página 1de 4

Lu, T., Yu, F., Xue, C., & Han, B. (2021).

Identification, classification, and quantification of


three physical mechanisms in oil-in-water emulsions using AlexNet with transfer
learning. Journal of Food Engineering, 288, 110220.
Objetivos
General
 Usar la red entrenada AlexNet con transferencia de aprendizaje como punto de referencia
para identificar, clasificar y cuantificar automáticamente los tres diferentes mecanismos
físicos de las emulsiones (Floculación, Coalescencia, y Gotas cinéticamente estables).
Específicos
 Estudiar el progreso del entrenamiento de la red AlexNet con transferencia de aprendizaje
 Evaluar el desempeño y aplicación de la red propuesta.
 Investigar la visualización de características de cada mecanismo.
 Analizar la entropía de información de las imágenes características.
 Determinar las activaciones más fuertes de las sub-imágenes de muestra de cada
mecanismo.
Metodología
Preparación de emulsiones aceite en agua (O/W):
Se prepararon 27 emulsiones con diferentes relaciones núcleo/coraza, presiones de
homogeneización y número de ciclos. Cada emulsión fue preparada en un beaker de 150 mL. Se
utilizó polvo de suero de queso (WP) y maltodextrina (MD) como material para las paredes,
Ester de astaxantina obtenido a partir de Haemotococcus pluvialis con 10% de astaxantina (AE)
como material para el nucleo, y Éster de ácido diacetiltartárico de monoglicéridos (DATEM)
como emulsificante. Las relaciones núcleo coraza fueron 1:1, 1:2, y 1:3, respectivamente, y la
adición de DATEM fue 2.5% de la masa de AE. La solución de WP-MD fue preparada
disolviendo 5g de WP y 5g de MD en 75 g de agua destilada y usando un agitador magnético por
30 min a temperatura ambiente. El DATEM fue disuelto en 10g de agua destilada para formar
soluciones usando un agitador magnético por 30 min a 60 °C. Entonces, la solución de WP-MD,
DATEM y AE fueron mezcladas a temperatura ambiente. Seguidamente, se pre-emulsificaron
las mezclas para obtener una emulsión gruesa usando un dispersor digital (Ultra-turrax IKA T18
basic, Alemania) a 15000 rpm por 3 min, y la emulsión gruesa fue homogeneizada usando un
homogeneizador de alta presión AH-1500 (ATS Engineering Inc, Canada) a una presión
diferente (desde 500 a 700 bar) con diferentes ciclos (de 2 a 4 veces). Cada una de las
emulsiones frescas fue usada inmediatamente para observación mediante un microscopio óptico.
Adquisición de datos:
Se capturaron micrografías de las emulsiones usando un microscopio óptico (Olympus BX 41,
Japón) equipado con una cámara digital (Olympus DP 70, Japón). Se usó una pipeta plástica de 3
mL para tomar una muestra cuidadosamente del centro de cada emulsión fresca, y luego cada
gota fue colocada inmediatamente en un portaobjetos de vidrio y cubierta suavemente con ún
cubreobjetos para su observación. Todas las imágenes fueron capturadas con un ocular de 10X y
un lente objetivo de 40X. Se tomó una imagen para cada emulsión, y un total de 27 imágenes
originales de microscopía fueron obtenidas. Las propiedades de las imágenes fueron 4080 x 3072
pixeles (Imagen de 3 canales RGB), la resolución horizontal y vertical fue de 432 dpi, y
profundidad de 24 bits por pixel.
Segmentación de Imágenes:
Cada micrografía original contiene miles de gotas con diferentes morfologías y no puede ser
utilizada directamente para clasificación, por lo tanto, la técnica de segmentación de imágenes
fue usada para particionar cada micrografía original en 221 sub-imágenes y se obtuvieron un
total de 5967 sub-imágenes. Las propiedades de las sub-imágenes fueron 227 x 227 pixeles
(imagen de 3 canales RGB), la resolución horizontal y vertical fue de 96 dpi, y una profundidad
de 24 bits por pixel. El propósito de la segmentación es cambiar la representación de la imagen a
un formato más significativo y fácil de analizar, mientras se cambia la escala de la sub-imagen
para ajustarse a AlexNet.
Etiquetado de Imágenes:
Los mecanismos físicos de las emulsiones fueron clasificados en tres clases basadas en la
literatura. La Floculación (FL) es el proceso en el que dos o más gotas se acercan para formar un
clúster en el que las gotas mantienen su integridad individual. La coalescencia (CL) es el proceso
en el que dos o más gotas se unen para formar una gota individual más grande. Las gotas
cinéticamente estables (KSD) se forman cuando las gotas relativamente pequeñas mantienen una
cierta distancia dinámica entre ellas. Las imágenes de microscopía de las 9 emulsiones
preparadas homogeneizando 2 veces fueron usadas para ilustrar el comportamiento de la
aplicación de la red entrenada. Se seleccionaron 300 sub-imágenes de cada clase de las restantes
18 emulsiones para su etiquetado manual y luego fueron usadas para entrenamiento y prueba.
Para asegurar la fiabilidad y estabilidad del método propuesto, los conjuntos de datos de
entrenamiento y prueba fueron completamente independientes. Es inevitable que una sub-imagen
contenga una morfología múltiple de las gotas, así que se utilizó el mecanismo dominante en la
sub-imagen para etiquetado y clasificación.
Arquitectura de la red AlexNet
La red AlexNet fue desarrollada en 2012. Es una gran red neuronal con 60 millones de
parámetros y 650 000 neuronas, consistente en 5 capas convolucionales, algunas de las cuales
son seguidas de capas de agrupación y 3 capas completamente conectadas con una función
softmax final. Esta red se ha convertido en la arquitectura de redes neuronales convolucionales
más popular debido a su desempeño en la clasificación de imágenes.
Transferencia de Aprendizaje
Para evitar el sobreajuste de la red, se empleó transferencia de aprendizaje para reemplazar las
últimas 3 capas de AlexNet. La estructura de la red propuesta se dividió en dos partes: La red pre
entrenada y la red transferida. Los parámetros de la red pre entrenada fueron previamente
obtenidos en ImageNet, así que pueden ser adaptados para extraer características de las
micrografías. Debido a que los parámetros de la red transferida representan solo una pequeña
fracción de la red neuronal completa, es suficiente con un pequeño conjunto de datos de
entrenamiento para cumplir los requerimientos de la transferencia de aprendizaje.
Para el procesamiento de imágenes y análisis de datos se usó MATLAB versión R2019a. La red
propuesta se desarrolló en un computador personal con un procesador Intel ® Core i7-9700k5 y
una tarjeta de video NVIDIA ® GeForce RTX 2060 SUPER. La parte transferida de la red
AlexNet fue entrenada con Estimación Adaptativa de Momento (ADAM). En esta red, la
velocidad inicial de aprendizaje fue 0.0003, el factor de descenso en la velocidad de aprendizaje
y el período fueron 0.1 y 10, respectivamente, el tamaño del minibatch (cantidad de datos que
pasan a través del algoritmo en una iteración) fue 25, y el número máximo de veces que todo el
conjunto de datos pasa a través del algoritmo (max epoch) fue 50.
Visualización de Características
Las redes neuronales convolucionales aprenden características durante el proceso de
entrenamiento para clasificar imágenes. Por tanto, la visualización de características se usa para
interpretar como las redes neuronales entienden las imágenes. Las imágenes de la visualización
de características fueron generadas usando la técnica deepDreamImage, función en MATLAB
que genera un arreglo de imágenes que activan los canales de la red.
Entropía de Información
La entropía de información (IE) es una medida estadística de la aleatoriedad o incertidumbre que
puede ser usada para calcular el nivel de desorden de las imágenes características de entrada en
aprendizaje profundo. Los valores de IE fueron obtenidos usando el método “Entropy” en
Mathworks.
Activaciones más Fuertes
Las imágenes de las activaciones más fuertes fueron obtenidas siguiendo el enfoque de
“Visualizar Activaciones de una Red Neuronal Convolucional” en Mathworks. Las sub-
imágenes de muestra en cada clase fueron seleccionadas aleatoriamente del conjunto de datos de
prueba, y luego fueron alimentadas en la red entrenada para mostrar las activaciones más fuertes
de la última capa convolucional.
Conclusiones
La red AlexNet corre de forma rápida tanto en entrenamiento como en pruebas.
La red propuesta tuvo un excelente desempeño y una alta exactitud de clasificación.
La visualización de características de la última capa completamente conectada mostró las
características comunes y de alto nivel de cada mecanismo aprendido por la red entrenada.
La entropía de información calculó el nivel de desorden en las imágenes características de cada
mecanismo.
Las activaciones más fuertes demostraron que la red propuesta aprendió las características
correctas de cada mecanismo.
La red propuesta fue usada exitosamente como un punto de referencia para identificar y calcular
los porcentajes de cada mecanismo en micrografías de emulsiones, sugiriendo que la misma es
efectiva y apropiada para analizar los mecanismos físicos de emulsiones y tiene aplicaciones
prometedoras en el campo de los alimentos.

También podría gustarte