Está en la página 1de 12

Machine Translated by Google

Ciencia del Medio Ambiente Total 903 (2023) 166218

Listas de contenidos disponibles en ScienceDirect

Ciencia del Medio Ambiente Total

página de inicio de la revista: www.elsevier.com/locate/scitotenv

Identificación de múltiples contaminaciones del suelo de sitios potencialmente contaminados basándose


en una red de combinación de expertos de múltiples puertas

a,*
Xiaosong Lu a, Junyang Du a, Guoqing Wang , Xuzhi Li a, Li Sol a , Liping Zheng a,
Huang Xinghua b
a
Laboratorio Estatal de Protección Ambiental Clave de Gestión Ambiental del Suelo y Control de la Contaminación, Instituto de Ciencias Ambientales de Nanjing, Ministerio de

Ecología y Medio Ambiente, Nanjing 210042, China b


Facultad de Ingeniería y Ciencias Ambientales, Universidad de Yangzhou, Yangzhou 225127, China

REFLEJOS GRÁFICAMENTE ABSTRACTO

• Modelamos por primera vez la predicción de la


contaminación del suelo como un problema de
aprendizaje multitarea.

• Propuso un sistema de índice de fuentes y vías de


contaminación del sitio. • El modelo
MMoE tiene mayor precisión en la identificación de
múltiples contaminaciones del suelo. • Se identificaron
los factores impulsores de la contaminación del suelo del
sitio con el marco SHAP.

INFORMACIÓN DEL ARTÍCULO ABSTRACTO

Montaje: Deyi Hou Con el rápido aumento de la cantidad y las fuentes de big data, el uso de big data y métodos de aprendizaje automático para identificar la contaminación
del suelo se ha convertido en un punto de investigación. Sin embargo, estudios previos que utilizaron información básica de sitios como índices de
Palabras clave: identificación de contaminación tuvieron principalmente problemas de baja precisión y eficiencia al realizar predicciones de modelos complejos para
Aprendizaje multitarea
múltiples tipos de contaminación del suelo. En este estudio, recopilamos datos ambientales de 199 sitios en 6 industrias típicas que involucran
Red de mezcla de expertos de puertas múltiples
contaminación orgánica y de metales pesados. Después de la fusión y selección de características, se utilizaron 10 índices basados en fuentes y vías de
Interpretabilidad del modelo del marco SHAP.
contaminación para establecer el sistema de índice de identificación de la contaminación del suelo. La red Multi­gate Mixture­of­Experts (MMoE) se
Identificación de sitios de contaminación del suelo.
construyó para llevar a cabo múltiples tareas de identificación de la contaminación por metales pesados del suelo, COV y SVOC simultáneamente. El
Análisis de factores impulsores
marco SHAP se utilizó para revelar la importancia de los índices de identificación de la contaminación en los múltiples resultados del MMoE y obtener
sus factores determinantes. Los resultados mostraron que las precisiones del modelo MMoE fueron 0,600, 0,783 y 0,850 para las identificaciones de
contaminación de metales pesados del suelo, COV y SVOC, respectivamente, que fueron entre un 0 y un 20 % superiores a las precisiones de las redes
neuronales de BP de tareas individuales. Los índices de materia prima que contienen compuestos orgánicos, la escala empresarial, los rastros de
contaminación del suelo y los tipos de industrias tienen una importancia significativa diferente en la contaminación del suelo del sitio. Este estudio
propuso una forma más eficiente y

* Autor para correspondencia en: Instituto de Ciencias Ambientales de Nanjing, Ministerio de Ecología y Medio Ambiente, calle Jiangwangmiao #8, Nanjing 210042, China.
Dirección de correo electrónico: nies.sepa@163.com (G. Wang).

https://doi.org/10.1016/j.scitotenv.2023.166218 Recibido el 6 de abril


de 2023; Recibido en forma revisada el 27 de mayo de 2023; Aceptado el 8 de agosto de 2023 Disponible en línea el 10
de agosto de 2023
0048­9697/© 2023 Elsevier BV Todos los derechos reservados.
Machine Translated by Google

X. Lu y col. Ciencia del Medio Ambiente Total 903 (2023) 166218

método preciso para identificar la contaminación del suelo del sitio y sus factores determinantes, que ofrece un paso hacia la realización de una
identificación inteligente y un control de riesgos de la contaminación del suelo del sitio a nivel mundial.

1. Introducción Modelo de red de expertos (MMoE), que divide las capas de red compartidas
subyacentes en múltiples redes de expertos compartidas y aprende sus contribuciones
Con el rápido desarrollo de la tecnología de big data y de inteligencia artificial, los a las diferentes tareas. Debido al intercambio flexible de parámetros en el caso del
métodos de aprendizaje automático se han aplicado ampliamente a la identificación de aprendizaje multitarea, la precisión y estabilidad del modelo MMoE son relativamente
la contaminación en el campo del entorno ecológico debido a sus excelentes mejores que los modelos de tarea única cuando los nodos de sus redes son similares
capacidades de reconocimiento de clasificación y computación de regresión (Janeck y (Yan et al., 2023) .
´
Monica, 2022; Zhang et al . ., 2021). Algunos investigadores han creado modelos de El análisis de la importancia del índice de identificación en la contaminación del
aprendizaje automático para identificar rápidamente la contaminación del suelo a suelo del sitio es de gran importancia para las causas de múltiples tipos de contaminación
escalas regionales mediante la construcción del sistema de índice de identificación del suelo, lo que es útil para guiar la dirección de la recopilación de big data ambientales
relacionado con la geografía e información básica como la economía regional, los tipos del sitio y la toma de decisiones sobre el control de la contaminación del sitio. En la
de industria, los años de uso industrial y las propiedades del suelo, para reducir el actualidad, la investigación sobre métodos de aprendizaje automático se centra
costo. de investigación, evaluación y gestión ambiental del sitio (Rampanelli et al., 2021; principalmente en la contaminación del suelo y la predicción de riesgos ambientales,
Lakshmi et al., 2021). Wang y cols. (2022a) obtuvieron la información de producción de pero carece de un análisis de las causas y los factores impulsores de la contaminación
las empresas de pesticidas de la Red de Información sobre Pesticidas de China para del suelo. Algunas investigaciones clasifican la importancia de los índices de
construir un sistema de índice para la identificación rápida de la contaminación del contaminación del suelo utilizando medidas de importancia variable de modelos de
suelo en sitios potencialmente contaminados (PCS). Jia et al. (2019) obtuvieron árboles como el árbol de decisión, el bosque aleatorio y XGboost. Sin embargo, aún
información básica, como nombres de empresas y ubicaciones geográficas de más de falta la interpretación de modelos de “caja negra” como SVM y redes neuronales
7000 empresas en el delta del río Yangtze, basándose en la API del motor de búsqueda artificiales (ANN), así como las tasas de contribución positiva y negativa de los índices
de Google. Luego, se utilizaron modelos de aprendizaje automático de máquina de sobre la contaminación del sitio (Li et al., 2022). Lundberg y Lee (2017) propusieron el
vectores de soporte (SVM) y perceptrón multicapa (MLP) para predecir los tipos de marco SHApley Additive ex­Planations (SHAP), que da cuenta de la contribución
industrias y los riesgos de contaminación de sitios potencialmente contaminados. Sin marginal de cada participante en un proceso de cooperación y proporciona una
embargo, debido a la falta de índices clave de las fuentes y vías de contaminación del distribución objetiva de los beneficios. En el aprendizaje automático, si las características
suelo del sitio, como los tipos de contaminantes contenidos en las materias primas, el se consideran como cada participante, el problema en sí se convierte en una tarea y, al
nivel de control de la contaminación, la información del estrato del sitio, etc., los estudios combinarlo con el aprendizaje automático, la magnitud de la contribución de cada
anteriores tuvieron problemas de baja precisión y cientificidad insuficiente. Por lo tanto, característica es la importancia de la característica y se puede calcular (Bi et al . ,
es de gran importancia establecer un sistema de índice más completo basado en 2020). En comparación con el método de interpretación intrínseca de los métodos de
fuentes y vías de contaminación para mejorar la precisión de la identificación de la incrustación de modelos lineales y de árbol, el marco SHAP es un marco de
contaminación del suelo y explorar sus factores impulsores. interpretación ex post clásico. Puede proporcionar un valor SHAP para SVM, MLP y
redes neuronales para estimar la contribución de cada característica. El marco SHAP
Debido a las diferentes materias primas y contaminantes particulares de las también presenta predictores con relaciones positivas o negativas con la variable
empresas en diversas industrias, puede haber tipos complejos de contaminación del objetivo para proporcionar explicaciones locales y globales (Marcílio y Eler, 2020; Xu et
suelo, como metales pesados, compuestos orgánicos volátiles (VOC) y compuestos al., 2022).
orgánicos semivolátiles (SVOC) en los PCS (Yan et al . al., 2022). Para múltiples tipos En este estudio, se construyó un sistema de índice de identificación de la
de contaminación, las especificaciones técnicas actuales para la remediación de la contaminación del suelo que incluía información básica, potencial de contaminación de
contaminación del suelo recomendarían diferentes tecnologías aplicables según su la materia prima, nivel de control de la contaminación y capacidad de migración de los
volatilización y descomposición (Zhang et al., 2021). Además, la contaminación orgánica contaminantes del suelo. El modelo de aprendizaje multitarea de la red MMoE se
del suelo, especialmente los COV, provocará olores graves, lo que es un factor construyó para mejorar la precisión y eficiencia de las predicciones de contaminación
importante para la gestión ambiental del sitio (Zhou et al., 2023). Por lo tanto, la por metales pesados del suelo, COV y SVOC. El marco de interpretabilidad de SHAP
identificación rápida e inteligente de la contaminación del suelo del sitio en función de se utilizó para calcular la importancia de las características de los índices de
los diferentes tipos de contaminación es útil para proporcionar una base científica para identificación de la contaminación del suelo en los tres resultados de las tareas de
el control de la contaminación del suelo y la remediación de PCS. MMoE, así como para revelar los factores impulsores de múltiples tipos de contaminación
del suelo. El propósito de este estudio es (1) construir un modelo de aprendizaje
Investigaciones anteriores sobre la identificación de la contaminación del suelo en multitarea de la red MMoE para identificar múltiples contaminaciones del suelo según
un sitio se centran principalmente en un determinado tipo de contaminación en el el sistema de índice relacionado con las fuentes y vías de contaminación del sitio. (2)
escenario de una sola tarea, que no puede cumplir con el escenario de aprendizaje de confirman que la precisión del modelo MMoE para la predicción de la contaminación
tareas múltiples con tipos de PCS complejos y diversos de contaminación del suelo. del suelo es mayor que la de la red neuronal BP de tarea única. (3) explorar un método
Ante problemas complejos, las tareas generalmente se dividían en múltiples subtareas para identificar los factores impulsores de múltiples contaminaciones del suelo
independientes y se entrenaban múltiples modelos, lo que provocaba altos costos de combinando el modelo de red MMoE y el marco SHAP. Este estudio espera proporcionar
mantenimiento y baja eficiencia de predicción de los modelos. El aprendizaje multitarea un método eficiente y preciso para la identificación inteligente de la contaminación del
(MTL) es un tipo de algoritmo de aprendizaje automático que tiene como objetivo suelo en un sitio, así como una base científica para la gestión ambiental y el control de
combinar varias piezas de información de múltiples tareas para mejorar el rendimiento la contaminación de empresas en industrias contaminantes clave.
del modelo y la capacidad de generalización (Zhu et al., 2022; Kendall et al., 2018 ) . .
La idea básica de MTL es que diferentes tareas pueden compartir una representación 2. Materiales y métodos
de características común y, por tanto, entrenarlas de forma conjunta (Zhao et al., 2017;
Kim y Sohn, 2021). El MTL original del modelo de fondo compartido utiliza el intercambio 2.1. Construcción de conjuntos de datos y etiquetas.

estricto de parámetros para realizar el intercambio de información entre diferentes


tareas. Cuando todas las tareas en el modelo de fondo compartido comparten 2.1.1. Adquisición de datos de investigación ambiental en sitios.
parámetros del modelo, problemas como la distribución de datos y las diferencias El marco de este estudio se muestra en la Fig. 1. De marzo a junio de 2022, se
entre tareas son muy sensibles al modelo multitarea. Como resultado, el rendimiento obtuvo un total de 199 informes de investigación ambiental sobre sitios de empresas
del modelo a menudo no puede lograr el rendimiento de un modelo de tarea única industriales ubicadas en 24 provincias o municipios de China del sitio web de Lvwang
(Wang et al., 2022b). Para resolver los problemas anteriores, Ma et al. (2018) propusieron unaGreen
mezcla
Data,
de múltiples
una organización
puertas no gubernamental. ganancia

2
Machine Translated by Google

X. Lu y col. Ciencia del Medio Ambiente Total 903 (2023) 166218

organización de protección ambiental (http://v2.lvwang.org.cn). Todos los sitios Hay 8 índices en la especificación técnica del CMEE seleccionados como índices de
pertenecen a las seis industrias contaminantes clave, incluyendo el procesamiento de identificación de la contaminación del suelo del PCS (Tabla 1). Además, se
combustibles, la fabricación de materias primas y productos químicos, la fabricación complementaron como índices de identificación de la contaminación del suelo los tipos
farmacéutica, la fundición de metales ferrosos, la fundición de metales no ferrosos y la industriales de empresas, la escala empresarial y las materias primas que contienen
fabricación de productos metálicos. Debido a las diferentes fuentes y vías de metales pesados y compuestos orgánicos. Hay 15 índices originales que cubren cuatro
contaminación de las industrias manufactureras, los sitios industriales mineros no se categorías de información básica sobre empresas; se seleccionaron como índices de
utilizaron para la identificación y análisis de la contaminación del suelo en este estudio. identificación de la contaminación del suelo el potencial de contaminación de las
La información ambiental relacionada con la contaminación del suelo del sitio se materias primas, el nivel de control de la contaminación y la capacidad de migración
obtuvo mediante extracción artificial para establecer el sistema de índice de de los contaminantes del suelo (Tabla 1). Para el índice discontinuo se asignan valores
identificación de la contaminación del suelo. Para cada extracción de información del entre 0 y 1 según su relación lógica. Además, los seis tipos de industrias empresariales
sitio, se creó un documento específico para registrar las fuentes de todos los datos del se procesaron en modo de codificación One­Hot porque no existe una relación lógica
índice, además de ser verificado por otro personal de recolección de datos para o cuantitativa. Para reducir las características redundantes y mejorar la precisión y
garantizar la calidad de los datos. La información básica, como el tiempo de inicio y la eficiencia de los modelos, fusionamos índices similares para producir los nuevos
escala de la empresa, que faltaba en algunos informes de investigación ambiental del índices Byears y Cscore (ecuaciones (1) y (2)). Finalmente, en este estudio se utilizaron
sitio, se obtuvo y complementó a través del sitio web de consulta de información el un total de 10 índices de identificación de tiempo y contaminación del suelo para
empresarial. entrenamiento del modelo y el análisis de factores impulsores (Tabla 2).

2.1.2. Procesamiento de datos de índices de identificación de contaminación del suelo del sitio.
Por años tiempo = Yu / Ts × 100 (1)
El sistema de índice de identificación de contaminación del suelo de este estudio
se refiere a la “Especificación técnica sobre evaluación y clasificación de riesgos para
donde Yu representa el número de años de utilización industrial de la empresa; Ts
parcelas empresariales en producción (prueba)”, que consta de 19 índices de detección
representa el tiempo de puesta en marcha de la empresa; Baños _tiempo representa
de riesgo de contaminación del suelo, que cubren las cuatro categorías de nivel de
la puntuación de utilización industrial/tiempo de puesta en marcha de la empresa; y
gestión de riesgo ambiental de empresas, estado de contaminación, ruta de migración
100 es el coeficiente de amplificación.
de contaminantes y receptores sensibles (CMEE Ministerio de Medio Ambiente
Ecológico de China, 2017). Dado que el objetivo de este estudio es identificar la Puntuación C = Cw + Cs + Ch (2)
contaminación del suelo por PCS, no se consideraron los índices relacionados con la
En la ecuación, Cw, Cs y Ch representan las puntuaciones de peligro oculto de las
evaluación del riesgo de contaminación del sitio, como los receptores sensibles y las
medidas de tratamiento de aguas residuales, desechos sólidos y desechos peligrosos.
propiedades fisicoquímicas de los contaminantes en la especificación técnica. Allá

Fig. 1. Un marco para identificar múltiples contaminaciones del suelo de PCS basado en el modelo de aprendizaje multitarea de la red MMoE.

3
Machine Translated by Google

X. Lu y col. Ciencia del Medio Ambiente Total 903 (2023) 166218

tabla 1

Índice de identificación de la contaminación del suelo del sitio original de este estudio. Índices de identificación de la contaminación seleccionados de las directrices técnicas; Índices seleccionados de directrices
técnicas y excluyendo los factores relacionados con el riesgo para la salud de la información relacionada con los contaminantes. *Índices adicionales más allá de las especificaciones técnicas.

Categoría de índice Índice Valor del índice Método de preprocesamiento


de datos

Información básica Categoría industrial* Seis industrias clave de este estudio 0 y 1 después de la

Hora de inicio de la empresa* 1919­2015 codificación One­Hot Rango de


0 a 1 después de

Tiempo de inactividad de la empresa* 1990­2022 la normalización Rango de 0 a


1 después de la

Años de utilización de la industria 1–91 normalización Rango de 0 a 1


después de la

Escala empresarial* Micro, pequeño, mediano, grande normalización Asignado como


0,1, 0,3,
Nivel de control de la contaminación Nivel de tratamiento de aguas residuales Sin aguas residuales, eliminación adecuada, eliminación inadecuada 0,7 y 1,0 Asignado como 0, 0,3 y
Nivel de tratamiento de residuos sólidos Sin residuos sólidos, disposición adecuada, disposición inadecuada 1,0 Asignado como 0, 0,3 y 1,0
Nivel de tratamiento de residuos Sin residuos peligrosos, eliminación adecuada, eliminación inadecuada, eliminación causal Asignado como 0, 0,5, 1,2 y
peligrosos 2,0

Huellas de contaminación del suelo No si Asignado como 0 y 1,0


Cobertura de suelo reforzada en áreas Cobertura completa del terreno, grieta en parte del suelo, incertidumbre, muchas grietas. Asignado como 0,2, 0,6, 0,8 y
clave 1,0

Medidas anti­filtración subterráneas Sin instalaciones subterráneas, instalaciones subterráneas con prevención perfecta, instalaciones subterráneas con Asignado como 0, 0,5, 0,8 y
prevención imperfecta, instalaciones subterráneas sin prevención 1,0

Potencial de contaminación de Materias primas que contienen Contiene metales pesados, no contiene metales pesados. Asignado como 1,0 y 0
la materia prima. metales pesados*
Materias primas que contienen Contiene compuestos orgánicos, no contiene compuestos orgánicos. Asignado como 1.0 y 0
compuestos orgánicos*
Capacidad de migración de Profundidad del agua subterránea* 0,3–90 Rango de 0 a 1 después de la
contaminantes del suelo. normalización

Permeabilidad del suelo en Arcilla, Ranura, Arena, Grava Asignado como 0,1, 0,3, 0,7 y
vadose 1,0

Tabla 2

Índices de identificación de contaminación del suelo después de la fusión de características. Los valores originales de los índices se pueden encontrar en la Tabla 1. Yu y Ts en la ecuación. (1) representan los años de
utilización industrial y el tiempo de puesta en marcha de la empresa; Cw, Cs y Ch en la ecuación. (2) son los niveles de tratamiento de aguas residuales, residuos sólidos y residuos peligrosos, respectivamente.

Categoría de índice Índice Abreviatura tipo numérico Valores de índice después del preprocesamiento de datos

Información básica del sitio Tipos de industria Bindustria Discontinuo 0 y 1 después de la codificación One­

Años de utilización industrial/Tiempo de puesta en marcha años _tiempo Continuo Hot Calculado por la ecuación. (1)
Susto empresarial Benter_scare Discontinuo Asignado como 0,1, 0,3, 0,7 y 1,0 Asignado
Potencial de contaminación de las materias primas. Materias primas que contienen metales pesados. pesado Discontinuo como 0 y 1 Asignado
Materias primas que contienen compuestos orgánicos. porgánico Discontinuo como 0 y 1 Asignado
Nivel de control de la contaminación Rastros de contaminación del suelo. traza Discontinuo como 0 y 1 Calculado por
Puntuación de riesgo de control de la contaminación puntuación c Continuo la ecuación. (2)
Cobertura de suelo endurecida en áreas clave cubierta Discontinuo Asignado como 0,2, 0,6, 0,8 y 1 Asignado
Medidas antifiltración para el subsuelo. Cseepage Discontinuo como 0, 0,5, 0,8 y 1 Asignado como
Capacidad de migración de contaminantes del suelo. Permeabilidad del suelo en vadosa. MPerme Discontinuo 0,1, 0,3, 0,7 y 1,0

respectivamente. Cscore representa la puntuación de riesgo de control de la contaminación y cuanto 2.2. Entrenamiento y optimización de modelos.
mayor sea el valor, menos adecuadas serán las medidas de control de la contaminación (Tabla 2).
2.2.1. Construcción de un modelo MMOE de aprendizaje multitarea.
2.1.3. Objetivo de identificación de contaminación y construcción de etiquetas.
Este estudio construyó etiquetas de categorías y modelos de clasificación para cumplir con los (1) La estructura de la red neuronal BP de tarea única
requisitos de predicción cualitativa de la contaminación del suelo del sitio.
Teniendo en cuenta las necesidades de migración y gestión de la contaminación del suelo, se La red neuronal BP es una red feedforward multicapa entrenada utilizando el algoritmo BP, que
establecieron tres tipos de contaminación de metales pesados del suelo, COV y SVOC, como es uno de los modelos de redes neuronales más utilizados (Zhou, 2016). La estructura de la red
objetivos de predicción en este estudio. Según los resultados de detección de los 199 informes de neuronal BP se divide principalmente en tres capas: la capa de entrada, la capa oculta y la capa de
investigación del sitio, se detectaron un total de 13 metales pesados, 42 compuestos orgánicos salida (Deng et al., 2021). La muestra se transmite desde la capa de entrada, la procesa la capa
volátiles (COV) y 88 compuestos orgánicos semivolátiles (SVOC). Los valores nacionales de oculta y luego se transmite a la capa de salida. Si la salida real no es consistente con la salida
detección de riesgos para contaminantes del suelo en la “Calidad ambiental del suelo: estándar de esperada, el error entre la salida real y la salida esperada se propaga de regreso a la capa de
control de riesgos para la contaminación del suelo en terrenos de desarrollo” se utilizaron para entrada a través de la capa oculta, y los pesos de conexión y umbrales de cada neurona se corrigen
determinar si el suelo está contaminado. Para los contaminantes del suelo para los cuales no se capa por capa ( Ketkar , 2017). Teóricamente, una red neuronal BP de tres capas puede lograr
especificaron valores de detección nacionales, se utilizaron como suplementos los valores de cualquier precisión y aproximarse a cualquier función continua (Wen y Yuan, 2020; Zarra et al., 2019).
detección de riesgos del Nivel de detección regional (RSL) publicados por la Agencia de Medio
Ambiente de EE. UU. De acuerdo con si el contenido de contaminantes de los tres tipos de
contaminación anteriores excedió el valor de detección del suelo, los valores de los atributos de la
contaminación por metales pesados, COV y SVOC del suelo en las tres tareas de predicción se
etiquetaron como Sí o No y se codificaron como 1 o 0 respectivamente. .
(2) La estructura del modelo de aprendizaje multitarea de la red MMoE

4
Machine Translated by Google

X. Lu y col. Ciencia del Medio Ambiente Total 903 (2023) 166218

probabilidad de la etiqueta y de la i­ésima subtarea. La pérdida es la suma de todos los resultados del
cálculo de las funciones de pérdida de subtareas.

2.2.2. Búsqueda y optimización aleatoria de hiperparámetros del modelo.


Para probar el rendimiento del modelo, el 70 % de las muestras del conjunto de
datos se utilizaron para entrenamiento y el 30 % restante se utilizó como datos de
prueba. En este trabajo, se utilizaron 5 redes expertas con 150 nodos para construir la
red MMoE. Las épocas de entrenamiento de modelos se establecieron en 2000 y se
utilizó ReduceLROnPlateau de tensorflow como función de devolución de llamada. El
optimizador de los modelos MMoE es Adam con una tasa de aprendizaje inicial de 0,001.
Cuando el valor de pérdida del conjunto de datos de verificación (val_loss) en el proceso
de entrenamiento comenzara a aumentar, la tasa de aprendizaje evitaría la reducción
6 se reduce a 1 × 10− del rendimiento del modelo. Para analizar el mecanismo de
MMoE, se utilizó la función Softmax para extraer los vectores de las redes de compuerta
y obtener sus distribuciones de peso.
Fig. 2. La estructura de la red MMoE basada en tres tareas para la identificación de la
contaminación del suelo.
La optimización de los hiperparámetros de la red neuronal BP mediante métodos de
búsqueda manual, de cuadrícula y aleatoria es beneficiosa para acelerar el proceso de
En este trabajo, se construyó un modelo de aprendizaje multitarea de la red MMoE
convergencia y mejorar el rendimiento del modelo. Bergstra y Bengio (2012) sugirieron
para la identificación de la contaminación por metales pesados del suelo, COV y SVOC.
que la búsqueda aleatoria tiene más combinaciones de parámetros y una mayor
La estructura de MMoE contiene 5 redes expertas y 3 redes de activación (Fig. 2). Cada
eficiencia que la búsqueda en cuadrícula cuando el número de búsquedas es el mismo.
experto es una red de retroalimentación con una capa oculta completamente conectada.
Por lo tanto, Keras Tuner controló la búsqueda aleatoria durante 100 sesiones de
Las tres redes de control corresponden a las ramas de las tres tareas de identificación
entrenamiento para obtener los hiperparámetros óptimos de cada red neuronal BP de
de contaminación por metales pesados del suelo, COV y SVOC, respectivamente. La
tarea única, lo que hizo que su val_loss fuera mínimo (Fig. 3). Para confirmar que el
red de activación es esencialmente un vector de peso, que se utiliza para representar el
modelo MMoE funciona mejor que la red neuronal BP de tarea única, los nodos de las
peso de la salida de cada subred experta como entrada del modelo de subtarea, de modo
capas Tower se establecieron en 38, que es el número mínimo de tres tareas para la red
que el modelo de predicción de subtarea pueda seleccionar características compartidas neuronal BP (Tabla 3 ) .
fuertemente correlacionadas para el entrenamiento (Ec. (3)). La red de activación asigna
las características de entrada a n dimensión a través de una transformación lineal y
obtiene el coeficiente de peso de cada red experta a través de la función de activación 2.2.3. Evaluación del modelo
Softmax, logrando así un control flexible de las salidas de la red experta en las tareas
La exactitud (Acc) y la precisión (Pre) se utilizaron como métricas de evaluación para
(Ec. (4)) .
la identificación de la contaminación del suelo de los sitios (ecuaciones (6) y (7)). Al
Finalmente, las salidas de la red de expertos con diferentes combinaciones de peso se
comparar las métricas de evaluación de la red neuronal BP y el modelo MMoE, se
tomaron como entradas de las tres capas de la torre. En este estudio, las tres capas de
determina el rendimiento del modelo MMoE. La precisión era la proporción de muestras
la torre de identificación de la contaminación del suelo son todas una red de alimentación
predichas correctamente en todas las muestras e indicaba la confiabilidad de un modelo
directa con una capa oculta completamente conectada.
para predecir si había contaminación del suelo en un sitio determinado.

(3) La precisión fue el grado de exactitud de la predicción en resultados de muestras


gk i(x) = softmax( Semanak,ix ) gramo

positivas e indicó la confiabilidad de la predicción de un modelo para la contaminación


del suelo en un sitio.

yk = ∑n gk i(x)fi(x) (4) TP + TN
yo=1
Precisión (Acc) = (6)
TP + TN + FP + FN

donde n representa el número de redes de expertos en el modelo, k representa TP


k (7)
representa el número de tarea, x representa las características de entrada del modelo. soldado americano precisión (Pre) =
TP + FP
(x) representa el peso de la i­ésima red de expertos en la k­ésima tarea, fi (x) k,i es el
la salida de la i­ésima red de expertos. Wg lineal que representa En las ecuaciones, TP es el número de clases positivas predichas como clases
matriz de transformación del i­ésimo experto correspondiente a la k­ésima red de positivas, TN es el número de clases negativas predichas como clases negativas, FP es
activación. Softmax () representa la función de activación de softmax. el número de clases negativas predichas como clases positivas y FN es el número de
clases positivas. predichos como clases negativas.
(3) Función de pérdida de tareas de clasificación de tarea única y MMoE
redes
2.3. Análisis interpretativo de los resultados del modelo MMoE.
La predicción de tres tipos de contaminación del suelo es una tarea de clasificación
con dos categorías de etiquetas en este estudio. Por lo tanto, utilizamos la entropía El marco SHAP se basa en el cálculo del valor de Shapley para medir cómo las
cruzada binaria como función de pérdida para tres subtareas por separado. Cada características afectan a la variable dependiente. En la tarea de selección de
subtarea utilizó la función Softmax para generar sus valores de probabilidad. Para estas características, el valor SHAP se puede utilizar para calcular el valor de contribución
tareas de clasificación, se supone que las salidas obedecen a una distribución gaussiana marginal de cada característica y medir la importancia de la característica. En primer
y la función de pérdida podría representarse mediante una probabilidad logarítmica. lugar, el conjunto de datos original se ingresa en el modelo y el marco SHAP asigna el
Sus funciones de pérdida se definen de la siguiente manera: valor SHAP a cada característica de cada punto de datos, es decir, la contribución
correspondiente a la salida del modelo.
(5) Por tanto, el cálculo del valor SHAP depende del modelo. El valor SHAP j de la
Pérdida = ∑n yi • log(p(yi)) + (1 − yi) • log(1 − p(yi))
yo=1
característica j se define de la siguiente manera:

1
donde i y n representan la i­ésima subtarea y el número de subtareas, respectivamente. (8)
j = |S|!(|N| −∑|S| − 1 )![f(S {j} )− f(S)]
Para redes neuronales de tarea única y MMoE, n es 1 y 3 respectivamente. y es la |N|! S Nizquierda{j}
etiqueta binaria 0 o 1, y p(yi) es la salida

5
Machine Translated by Google

X. Lu y col. Ciencia del Medio Ambiente Total 903 (2023) 166218

Fig. 3. Hiperparámetros óptimos de modelos de tarea única mediante el método de búsqueda aleatoria utilizando Keras Tuner.

Tabla 3
Espacios de búsqueda aleatoria y valores óptimos de hiperparámetro de redes de tarea única y MMoE.

Hiperparámetro Espacio de búsqueda aleatoria Modelo de tarea única MMOE

Número de nodos de capa ocultos 10–100; intervalos de 2 Tarea 1: 98 Red de expertos: 150
Tarea 2: 84 Capa de torre: 38
Tarea 3: 38
Tasa de aprendizaje 1e­5 – 1e­1; intervalos de diez veces. 0,01 0.001

donde |norte| representa el número de elementos en el subconjunto de características y N 3. Resultado


representa el conjunto de características original. El |N|! es la secuencia completamente
permutada formada por el conjunto completo de características N. S representa cualquier 3.1. Análisis de correlación entre los tipos de contaminación del suelo y los
subconjunto de características en N, y Nleft{j} representa un subconjunto de todos los índices de identificación.
elementos excepto la característica j. f (S) representa la salida del modelo de aprendizaje
automático del subconjunto de características S. El término f(S {i})­ f(S) representa el El resultado del análisis de correlación mostró que no había una correlación
valor de contribución acumulativo de la característica j, y j es el atributo de característica significativa entre los seis tipos de industrias y la contaminación del suelo por metales
aditiva. función de la característica j, es decir, el valor SHAP. pesados, COV y SVOC (p > 0,05). Ambos índices de Byears _time y Benter_scare tuvieron
una correlación significativa con la contaminación del suelo por COV y SVOC (p < 0,05).
Entre los índices de potencial de contaminación de las materias primas, hubo una
2.4. Plataforma software de análisis de datos. correlación negativa significativa entre Porganic y los metales pesados del suelo (p < 0,01),
y una correlación positiva significativa entre la contaminación por COV del suelo y Porganic
Todos los modelos de MMoE y redes neuronales BP de tarea única se construyeron y la contaminación por COVS (p < 0,05).
en el paquete de programa TensorFlow Keras (https://tensorflow.google.cn ) con Python Entre los índices del nivel de control de la contaminación, los índices de Ccover, Cseepage
3.8 (https://www.python.org). El sintonizador de Keras (https://keras.io/keras_tuner) se se correlacionaron significativamente con la contaminación del suelo por metales pesados
utilizó para búsqueda aleatoria para optimizar los hiperparámetros de las redes neuronales y SVOC, respectivamente (p < 0,05). El Cscore también tuvo una correlación significativa
de BP. El resultado de la búsqueda aleatoria se mostró mediante el paquete HiPlot (https:// con los COV del suelo (p < 0,05). Como índice importante, Ctrace se correlacionó
github.com/facebookresearch /hiplot). Los valores SHAP para determinar la importancia significativamente con la contaminación del suelo por metales pesados y SVOC (p <
de las características se calcularon utilizando el paquete del programa SHAP (https:// 0,01). No hubo correlación significativa entre el MPerme en la zona vadosa y los tres tipos
github.com/slundberg/shap ). Otros análisis de datos y gráficos se realizaron utilizando el de contaminación del suelo (p > 0,05) (Fig. 4).
software Origin (OriginLab Corp., Northampton, EE. UU.).

6
ycol
Machine Translated by Google

Lu
X.
Cienc
1662
Ambi
Total
Medi
(202
903
del
7

Fig. 4. Correlaciones entre índices de identificación de contaminación del suelo y diferentes tipos de contaminación. *p < 0,05; **p < 0,01.
Machine Translated by Google

X. Lu y col. Ciencia del Medio Ambiente Total 903 (2023) 166218

Fig. 5. Exactitudes y valores de val_loss de redes neuronales MMoE y de tarea única en el proceso de entrenamiento del modelo. Las tareas 1, 2 y 3 son la identificación de la contaminación del suelo
por metales pesados, COV y SVOC, respectivamente.

Fig. 6. Comparación de exactitudes y precisiones de modelos de redes neuronales MMoE y de tarea única.

3.2. Rendimiento del modelo de red MMoE que identifica múltiples contaminaciones mayores o iguales a los de la red neuronal BP de tarea única (Fig. 6).
del suelo
En este trabajo, se utilizó la función Softmax para extraer los vectores de las redes de
Todas las subtareas para predicciones de metales pesados del suelo, COV y SVOC control y obtener sus distribuciones de peso. Los resultados mostraron que el resultado de
lograron una convergencia después de 500 pasos de entrenamiento del modelo, la cuarta red de expertos fue mayor que el de las otras redes de expertos, lo que indica
respectivamente. Las precisiones del modelo MMoE para predecir la contaminación del que las características compartidas aprendidas por la cuarta subred de expertos podrían
suelo por metales pesados, COV y SVOC fueron 0,60, 0,78 y 0,85, respectivamente. En ser más útiles para la identificación de la contaminación del suelo por metales pesados.
cuanto a los modelos de redes neuronales de BP, las precisiones de la predicción de tres Las tareas de identificación de contaminación de COV y SVOC del suelo fueron las más
subtareas fueron 0,50, 0,73 y 0,85 (Fig. 5). Los resultados muestran que el uso del modelo inclinadas hacia la tercera y segunda red de expertos, respectivamente (Fig. 7). En
MMoE puede mejorar efectivamente la precisión de la identificación de la contaminación comparación con el modelo de red neuronal BP, MMoE puede utilizar de manera flexible
del suelo cuando la precisión del modelo de tarea única para identificar la contaminación funciones compartidas de acuerdo con las características de las tareas, para mejorar la
del suelo es baja. Además, la precisión del modelo MMoE para identificar los tres tipos de precisión de todas las subtareas. El uso del modelo MMoE en lugar de redes neuronales
contaminación fue de 0,74, 0,64 y 0,78, respectivamente, que fueron BP de tarea única para identificar la contaminación del suelo del sitio no solo puede
mejorar la eficiencia del modelado, sino también mejorar significativamente el rendimiento
general de la predicción del modelo.
0,4

Puerta 1 Puerta 2 Puerta 3

3.3. Análisis de la importancia de múltiples tipos de contaminación del suelo.


0.3

0,24 0,25
0,23 0,23 Los resultados del análisis explicativo muestran que los valores SHAP medios de
0,21 0,21 0,23
0,19 Porganic, Benter_scare, Ctrace y la industria química (Bindustry_chemical) para la
0,2 0,18 0,18 0,18
0,17 0,17 0,16
sotsroespeexP
d
e

0,17 contaminación del suelo por metales pesados son 0,190, 0,130, 0,080 y 0,075,
respectivamente, que son significativamente más altos que otros índices. Entre ellos, el
0.1 producto químico Porganic y Bindustry_ tienen un impacto negativo en la contaminación
del suelo por metales pesados, mientras que Benter_scare y Ctrace tienen un impacto
positivo en la contaminación del suelo por metales pesados. En cuanto a la contaminación
0
significativos. del suelo por COV y SVOC, tanto el como Porganic tienen efectos positivos
12345
Los valores medios de Baños _tiempo SHAP de Baños _tiempo en COV y SVOC del suelo
Identificación de experto

fueron 0,127 y 0,097, respectivamente. El Porganic fue el segundo índice importante para
Fig. 7. Distribuciones de peso de redes de control para múltiples subtareas extraídas por la función la contaminación del suelo por COV y SVOC, que tienen valores SHAP medios de 0,070 y
Softmax. 0,090 respectivamente (Fig. 8). Los resultados anteriores muestran que algunos índices de

8
Machine Translated by Google

X. Lu y col. Ciencia del Medio Ambiente Total 903 (2023) 166218

Fig. 8. Importancia de los índices sobre la contaminación del suelo. Los paneles A, B y C son los valores SHAP de los índices de contaminación del suelo por metales pesados, COV y SVOC basados en todas las muestras.
Los paneles D, E y F son los rangos de importancia (SHAP medio) de los índices.

La información básica, el potencial de contaminación de las materias primas y el nivel de control de la La bindustria es el factor más importante en los tres tipos de contaminación del suelo, que tienen
contaminación tienen diferentes impactos significativos en la contaminación del suelo. impactos positivos y negativos en la contaminación orgánica y de metales pesados del suelo,
Sin embargo, los índices de capacidad de migración de contaminantes del suelo tuvieron el menor respectivamente (Fig. 9C). Al calcular los valores SHAP de cada índice para los resultados de tres
efecto en la tarea de clasificación de la identificación de la contaminación del suelo de PCS. Los subtareas del modelo MMoE, es posible identificar los factores impulsores de múltiples contaminaciones
valores SHAP de la escala empresarial se correlacionaron negativamente con la contaminación del del suelo en sitios individuales, además de ser útiles para la prevención y el control de la contaminación
suelo, lo que indicó que las empresas medianas y grandes tenían más probabilidades de causar del suelo en el PCS.
contaminación del suelo que las micro y pequeñas empresas. Además, debido a las numerosas
subcategorías y los complejos tipos de materias primas de la industria química, Bindustry_chemical

es menos sensible a la identificación de la contaminación que Porganic. Por lo tanto, es necesario 4. Discusión

obtener información detallada sobre las materias primas en lugar de los tipos de industrias
empresariales como un índice importante para la identificación de la contaminación del suelo del sitio. 4.1. Efecto y perspectiva del modelo MMoE en la identificación de la contaminación
del suelo del sitio.

3.4. Análisis de los factores impulsores de la contaminación del suelo del sitio. En los últimos años, los departamentos de gestión ambiental de algunas provincias de China han
diseñado y desarrollado plataformas de gestión de información para respaldar el estudio de la
Este estudio presentó los resultados del análisis de factores impulsores de tres sitios individuales contaminación del suelo de los PCS (Lu et al., 2022). Sin embargo, todavía falta la aplicación de
con diferentes industrias según el marco SHAP. métodos de aprendizaje automático en plataformas de información para identificar la contaminación
método. Los resultados mostraron que la importancia total de los índices de impacto del suelo del sitio.
negativo sobre la contaminación del suelo por metales pesados, como Porganic, Las herramientas API de aprendizaje automático y aprendizaje profundo eficientes y de código abierto
Bindustry_chemical, Ctrace (0), etc., es más significativa que la de los índices de impacto positivo.
existentes, como sk­learn, Keras y pytorch, se pueden implementar en la plataforma de información
Por lo tanto, la probabilidad de predicción de la contaminación del suelo por metales pesados es para realizar rápidamente la construcción de modelos de aprendizaje automático (Abdallah et al.,
0,13, lo que da como resultado la predicción de que no habrá contaminación del suelo por metales 2022; Daly et al. , 2022 ; Jiang et al., 2022).
pesados en este sitio. Debido al impacto positivo significativo de dos índices de Byears _time (1.03) Sin embargo, utilizar el método tradicional de modelado de plataformas de aprendizaje automático

y Porganic (1.0), se predijo que el sitio tendría contaminación del suelo por VOC y SVOC con para identificar diferentes tipos de contaminación del suelo requiere entrenar múltiples modelos
resultados de probabilidad de 0.76 y 1.0, respectivamente (Fig. 9A). En el sitio de la industria de simultáneamente (Kia et al., 2017). Conducirá a mayores costos de mantenimiento de modelos para
procesamiento de combustible, el impacto de los índices negativos sobre la contaminación del suelo plataformas de aprendizaje automático, incluida la optimización de los hiperparámetros del modelo
por metales pesados es más significativo que el de los índices positivos, que resultan en la predicción para múltiples tareas. El aprendizaje multitarea tiene como objetivo realizar la transferencia de
de que no habrá contaminación del suelo por metales pesados. En cuanto a la contaminación del conocimientos y mejorar el desempeño mediante el uso de relaciones entre tareas y ha mostrado un

suelo por VOC y SVOC, Byears _time, Benter_scare, Bindustry y Ctrace tienen impactos positivos desempeño prometedor en muchas aplicaciones (Ma y Tan, 2021). Este estudio también confirmó

significativos, que tienen una importancia total mayor que la de los índices de impacto negativos (Fig. que el uso de redes de múltiples expertos que combinan y el mecanismo subyacente de intercambio
9B). En el lugar de fundición de metales no ferrosos, el de información del modelo MMoE puede capturar las diferencias de tareas de los tres.

9
Machine Translated by Google

X. Lu y col. Ciencia del Medio Ambiente Total 903 (2023) 166218

Fig. 9. Análisis de los factores impulsores de múltiples tipos de contaminación del suelo en sitios individuales según los valores SHAP. Los paneles A, B y C representan las tasas de contribución de
varios índices a la producción de probabilidad de las predicciones de contaminación del suelo. f(x) es el resultado de probabilidad del modelo MMoE para predecir las tres contaminaciones del suelo.
El valor base es el valor promedio de la predicción del modelo según el conjunto de datos. El rojo y el azul indican que el índice empuja el valor previsto hacia arriba o hacia abajo desde el valor base
hasta f(x).

tareas de predicción y mejorar su precisión de predicción. En trabajos destacados, al implementar el reciben más atención porque tienen más probabilidades de contaminar el suelo. Además, la
modelo MMoE en la plataforma de identificación de la contaminación del suelo del sitio, se pueden interpretación parcial del marco SHAP es útil para identificar los factores impulsores en cada PCS,
reducir efectivamente los costos de gestión del modelo y facilitar la aplicación en escenarios de así como para llevar a cabo la decisión de control de la contaminación específica (Jas y Dodagoudar,
ingeniería (P. Wu et al., 2022). 2023).
Debido al conjunto de datos limitado en este estudio, los modelos de clasificación para la Según las métricas del modelo MMoE, la precisión de la predicción de la contaminación por
identificación de la contaminación del suelo del sitio se construyeron en lugar de modelos de regresión, metales pesados fue menor que la de los COV y SVOC del suelo.
lo que indica que no se pudo establecer la relación entre varios índices y el contenido de Estudios anteriores han demostrado que las fuentes de contaminación del suelo por metales pesados
contaminantes del suelo. Además, las etiquetas de categorías y los modelos de clasificación conducen son más complejas que los contaminantes orgánicos del suelo, incluida la descarga de aguas
al efecto insignificante de los índices relacionados con la migración de la contaminación del suelo residuales industriales y la deposición de polvo de empresas en las industrias de minería, fundición y
sobre las múltiples contaminaciones del suelo. En el futuro, con datos disponibles en más de 100.000 galvanoplastia, así como el material original del suelo y un alto fondo geológico ( Liu et al., 2023;
sitios obtenidos del estudio nacional de contaminación del suelo de empresas industriales clave Wang et al., 2022; YF Wu et al., 2022). Los factores anteriores conducen a la dificultad de dominar
realizado entre 2017 y 2020, se podrán construir modelos de aprendizaje automático para tareas de los índices sensibles de identificación de la contaminación por metales pesados del suelo y a una baja
regresión para predecir el contenido de contaminantes del suelo del sitio, así como las tasas de precisión de la predicción del modelo. Por lo tanto, es necesario complementar índices más sensibles
contribución a la producción. de los índices de migración y degradación de la contaminación del suelo en las especificaciones técnicas del CMEE para mejorar la precisión de la identificación de la
(Jiang et al., 2021). contaminación por metales pesados del suelo. Además, para áreas con un alto nivel geológico, se
deben adoptar criterios de evaluación de la contaminación más apropiados para identificar la
contaminación del suelo mediante el uso del aprendizaje automático. Estos métodos serían útiles
para mejorar la precisión de la identificación de la contaminación del suelo por metales pesados en
4.2. Factores impulsores de diferentes tipos de contaminación del suelo del sitio.
los sitios.

El resultado del análisis de factores impulsores mostró que utilizar tipos de industrias como índice
clave para identificar la contaminación del suelo es inexacto porque muchas industrias tienen
diferencias significativas en subcategorías y materias primas (Yang et al., 2022). Es más preciso
identificar la contaminación por COV y SVOC del suelo analizando si las materias primas contienen 4.3. Uso de la tecnología de la información para mejorar la eficiencia y la
compuestos orgánicos (Li et al., 2021). Además, el índice de escala empresarial, que no está incluido estandarización de la recopilación de datos ambientales del sitio.
en la especificación técnica, también tuvo un efecto muy significativo en los resultados de predicción
del modelo. Por lo tanto, las empresas lager con una larga historia de producción y establecimiento La información básica de una empresa, la posibilidad de contaminación de las materias primas,
temprano deberían el nivel de control de la contaminación y otros datos generalmente deben obtenerse mediante
investigación, recopilación de datos y personal en el sitio.

10
Machine Translated by Google

X. Lu y col. Ciencia del Medio Ambiente Total 903 (2023) 166218

entrevistas. Luego, esa información se convierte en una tabla de datos estructurados mediante Agradecimientos
extracción y resumen manuales. El método tradicional de registro y resumen manual para obtener
datos tiene problemas como baja eficiencia y mala estandarización (Wang, 2019). En los últimos Este estudio cuenta con el apoyo financiero de National Key Research y
años, la tecnología de gestión de la información de los estudios de sitio se ha desarrollado Programa de Desarrollo de China (Nº 2018YFC1800202).
rápidamente. En el estudio nacional de contaminación del suelo de tierras agrícolas y sitios de
empresas industriales clave realizado entre 2017 y 2020 en China, se utilizó una terminal móvil y Referencias

una plataforma de gestión de información para recopilar, almacenar y gestionar datos del estudio
Abdallah, AM, Rheinheimer, DE, Rosenberg, DE, Knox, S., Harou, JJ, 2022. Un ecosistema de software interoperable
(Lu et al., 2022) . Además, los departamentos ecológicos y ambientales de algunas provincias de
para almacenar, visualizar y publicar datos de modelado de sistemas de recursos hídricos. Reinar. Modelo.
China han diseñado y desarrollado sucesivamente plataformas de gestión de información para Software. 151, 105371.
respaldar los estudios de contaminación del suelo de los PCS de empresas cerradas y parques Bergstra, J., Bengio, Y., 2012. Búsqueda aleatoria para optimización de hiperparámetros.

químicos (Yan et al., 2023). J. Mach. Aprender. Res. 13, 281–305.


Daly AJ, Visscher LD, Baetens JM, Baets BD, Quo vadis, modelado basado en agentes
¿herramientas? Reinar. Modelo. Software, 157, 105514.
Bi, Y., Xiang, D., Ge, Z., Li, F., Jia, C., Song, J., 2020. Un modelo de pedición iterpretable para identificar sitios de N7­

La investigación y aplicación actuales sobre la recopilación de big data ambientales sugirieron metilguanosina basado en XGBoost y SHAP. Mol. El r. ­Nuclé.
Ácidos. 22, 362–372.
que la tecnología de información terminal basada en Internet móvil y el sistema de posicionamiento
CMEE (Ministerio de Medio Ambiente Ecológico de China), 2017. Especificación técnica sobre detección de riesgos y
global podrá recopilar información del sitio de manera precisa y eficiente (Wang, 2019) . Se podría clasificación de riesgos de parcelas de tierra de empresas en producción (prueba). https://www.mee.gov.cn/gkml/

usar una terminal portátil para ingresar información preestablecida, en lugar del método de registro hbb/bgt/201708/W0201708185813701 30828.pdf.

tradicional, para mejorar efectivamente la eficiencia, estandarización y precisión de la recopilación


Deng, Y., Zhou, XL, Shen, J., Xiao, G., Hong, HC, Lin, HJ, Wu, FY, Liao, BQ, 2021.
de datos, así como facilitar la formación de conjuntos de datos estructurados de los sitios Nuevos métodos basados en redes neuronales artificiales (ANN) de retropropagación
investigados (Suzuki et al . , 2022; Liu et al., 2022). En el futuro, el desarrollo de una plataforma de (BP) y función de base radial (RBF) para predecir la aparición de halocetonas en el agua del
grifo. Ciencia. Medio ambiente total. 772, 145534.
identificación inteligente ampliará en gran medida la cantidad de datos ambientales y mejorará ´
Janeck, JSF, Monica, JBA, 2022. Uso del aprendizaje automático para hacer que los nanomateriales sean
fundamentalmente la precisión y aplicabilidad de la identificación de la contaminación del suelo en sostenibles. Ciencia. Medio ambiente total. 859, 160303.
el sitio. Jas, K., Dodagoudar, GR, 2023. Modelo de aprendizaje automático explicable para la evaluación del potencial de
licuefacción de suelos utilizando XGBoost­SHAP. Din. del suelo. Tierraq. Ing. 165, 107662.

Jia, XL, Hu, BF, Marchant, BP, Zhou, LQ, Shi, Z., Zhu, Y., 2019. Un marco metodológico para identificar fuentes
potenciales de contaminación del suelo por metales pesados basado en el aprendizaje automático: un estudio de
5. Conclusión caso en el Delta del Yangtsé, China. Reinar. Contaminación. 250, 601–609.

Jiang, YF, Wang, HL, Lei, M., Hou, DY, Chen, SC, Hu, BF, Huang, MX, Song, W.
En este trabajo, se construyó una red MMoE de aprendizaje multitarea para múltiples W., Shi, Z., 2021. Una metodología de evaluación integrada para la gestión de sitios potencialmente

predicciones de la contaminación del suelo por metales pesados, COV y SVOC basada en el contaminados basada en datos públicos. Ciencia. Medio ambiente total. 783, 146913.
Jiang, ZW, Yang, SH, Liu, ZY, Xu, Y., Xiong, YJ, Qi, ST, Pang, QQ, Xu, JZ, Liu, F.
sistema de índice relacionado con las fuentes y vías de contaminación del sitio. Confirmamos que la
Q., Xu, T., 2022. Combinación del aprendizaje automático y la previsión meteorológica para predecir
combinación de redes de múltiples expertos y el mecanismo subyacente de intercambio de desastres por inundaciones en tierras agrícolas: un estudio de caso en la cuenca del río Yangtze. Reinar. Modelo.

características del modelo MMoE pueden mejorar la precisión de las múltiples tareas para la Software. 155, 105436.
Kendall, A., Gal, Y., Cipolla, R., 2018. Aprendizaje multitarea mediante la incertidumbre para sopesar las pérdidas en
identificación de metales pesados del suelo y contaminación orgánica. La combinación de modelos
geometría y semántica de escenas. En: Actas de la Conferencia IEEE sobre visión por computadora y
MMoE y SHAP
reconocimiento de patrones, págs.
reveló la importancia y las tasas de contribución de varios índices sobre la contaminación del suelo Ketkar, N., 2017. Feed Forward Neural Networks. Aprendizaje profundo con Python, primera ed.
Apress, Berkeley, CA, págs. 15­31.
por metales pesados, COV y SVOC. En trabajos futuros, el uso de terminales portátiles y plataformas
Kia, SM, Pedregosa, F., Blumenthal, A., Passerini, A., 2017. Recuperación de patrones espacio­temporales a nivel de
de información inteligentes basadas en el modelo MMoE conducirá a la rápida recopilación de grupo en la decodificación MEG mediante el aprendizaje conjunto de funciones multitarea.
información ambiental del sitio y a la identificación inteligente de la contaminación del suelo. Este J. Neurosci. Metanfetamina. 285, 97­108.
Kim, TS, Sohn, SY, 2021. Aprendizaje multitarea para la identificación de condiciones de salud y la predicción de la
estudio propuso un método más eficiente y preciso para identificar la contaminación del suelo del
vida útil restante: enfoque de red neuronal convolucional profunda.
sitio y sus factores determinantes, lo que ofrece un paso hacia la realización de una identificación J. Intel. Fabricante. 32, 2169–2179.
inteligente y un control de riesgos de la contaminación del suelo del sitio a nivel mundial. Lakshmi, D., Akhil, D., Kartik, A., Gopinath, KP, Arun, J., Bhatnagar, A., Rinklebe, J., Kim, W., Muthusamy, G., 2021.
Inteligencia artificial (IA ) aplicaciones en adsorción de metales pesados utilizando biocarbón modificado. Ciencia.
Medio ambiente total. 801, 149623.
Li, TK, Liu, Y., Bjerg, PL, 2021. Priorización de sitios potencialmente contaminados: a
Declaración de contribución de autoría CRediT comparación entre la aplicación de un modelo de transporte de solutos y un método de detección de riesgos en
China. J. Medio Ambiente. Gestionar. 281, 111765.
Li, XZ, Jiang, R., Wang, GQ, Chen, YD, Long, T., Ling, YS, 2022. Una comparación
Xiaosong Lu: conceptualización, metodología, software, visualización, análisis formal, escritura
estudio de normas ambientales de suelos para terrenos agrícolas entre diferentes. Reinar.
­ borrador original. Junyang Du: investigación, curación de datos, redacción: revisión y edición. Ciencia. 43, 577–585. https://doi­org­443.webvpn.las.ac.cn/10.13227/j.hjkx.2021062 03.

Guoqing Wang: conceptualización, supervisión, administración de proyectos, adquisición de fondos,


Liu, T., Chen, SR, Ruan, K., Zhang, SX, He, KQ, et al., 2022. Una computadora de mano
redacción: revisión y edición. Xuzhi Li: análisis formal, redacción: revisión y edición. Li Sun: análisis
Plataforma de teléfono inteligente multifuncional integrada con un dispositivo portátil de impresión 3D: evaluación
formal, redacción: revisión y edición. in situ de glutatión y azodicarbonamida con aprendizaje automático.
J. Peligro. Madre. 426, 128091.
Liu, JW, Kang, H., Tao, WD, Li, HY, He, D., Ma, LX, Tang, HJ, Wu, SQ, Yang, KX, Li, XX, 2023. Una distribución espacial:
Liping Zheng: investigación, curación de datos. Xinghua Huang: investigación, curación de datos.
componente principal Modelo de análisis (SD­PCA) para evaluar la contaminación de metales pesados en el suelo.
Ciencia. Medio ambiente total. 859, 160112.
Lu, XS, Wang, GQ, Li, XZ, Du, JY, Sun, Li, 2022. Investigación Progreso de la adquisición de big data y métodos de
aprendizaje automático en la identificación de la contaminación de sitios contaminados . J. Ecología.
Declaración de intereses contrapuestos
Entorno rural. 38, 1101–1111.
Lundberg, S., Lee, SI, 2017. Un enfoque unificado para interpretar las predicciones de los modelos. 31ª conferencia
Los autores declaran que no tienen intereses financieros en competencia ni relaciones sobre sistemas de procesamiento de información neuronal (eds). En: Playa Larga.
NIPS'17: Actas de la 31ª Conferencia Internacional sobre Sistemas de Procesamiento de Información Neural,
personales conocidas que pudieran haber influido en el trabajo presentado en este artículo.
págs. 4768–4777. https://doi.org/10.48550/arXiv.1705.07874.
Ma, T., Tan, Y., 2021. Aprendizaje automático y descubrimiento de conocimiento en bases de datos.
pista de investigación (eds). En: Conferencia Europea, ECML PKDD 2021, Bilbao, España,
Disponibilidad de datos septiembre, págs. 13­17.
Ma, J., Zhe, Z., Yi, X., Chen, JL, Hong, LC, Chi, EH, 2018. Modelado de relaciones entre tareas en el aprendizaje
multitarea con una combinación de expertos de múltiples puertas. JCA 1930­1939. https://doi.org/
Los datos estarán disponibles previa solicitud. 10.1145/3219819.3220007 .

11
Machine Translated by Google

X. Lu y col. Ciencia del Medio Ambiente Total 903 (2023) 166218

Marcílio, WE, Eler, DM, 2020. De las explicaciones a la selección de funciones: evaluación del valor SHAP como Xu, YR, Zeng, XH, Bernard, S., He, Z., 2022. Predicción basada en datos del pH del neutralizador y la posición de
mecanismo de selección de funciones (eds). En: 2020 33a Conferencia SIBGRAPI sobre Gráficos, Patrones la válvula para un control preciso de la dosificación de productos químicos en una planta de tratamiento
e Imágenes, Brasil, págs. de aguas residuales. J. Limpio. Pinchar. 96, 101845.
Rampanelli, GB, Braun, AB, Visentin, C., et al., 2021. El proceso de selección de un método para identificar Yan, K., Wang, HZ, Lan, Z., Zhou, JH, Fu, HZ, Wu, LS, Xu, JM, 2022. Contaminación por metales pesados en el
sitios potencialmente contaminados: un estudio de caso en un municipio del sur de Brasil. suelo de sitios contaminados en China: estado de la investigación y evaluación de la contaminación durante
Encuesta Agua Aire Suelo. 232, 26. las últimas dos décadas. J. Limpio. Pinchar. 373, 133780.
Suzuki, SN, Kameyama, R., Yamaguchi, M., Okada, A., Hirata, K., et al., 2022. Yan, JH, He, Z., He, SG, 2023. Aprendizaje multitarea de evaluación del estado de salud y
Desarrollo de creador de contenidos para terminales móviles en sistema de libros de texto activo y examen Predicción de la vida útil restante de máquinas equipadas con sensores. Confiable. Ing. Sistema. Seguro.
de servidor de contenidos basado en la nube. Proc. Computadora. Ciencia. 207, 1408­1416. 234, 109141.
Wang, XH, 2019. Identificación inteligente y control preciso del riesgo de contaminación del sitio. Yang, J., Li, LY, Liang, YH, Wu, JH, Wang, ZQ, Zhong, QM, Liang, S., 2022.
impulsado por el Big Data. Reinar. Prot. 47, 13­16. Desempeño de sostenibilidad de la industria química global basado en la productividad total de factores
Wang, ZM, Zhou, W., Jiskani, IM, Luo, HT, Ao, ZC, Mvula, EM, 2022. Características anuales de la contaminación verdes. Ciencia. Medio ambiente total. 830, 154787.
por polvo y su prevención y control para la protección ambiental en minas a cielo abierto. Ciencia. Medio Zarra, T., Galang, MG, Ballesteros, F., Belgiorno, V., Naddeo, V., 2019. Gestión de olores ambientales mediante
ambiente total. 825, 153949. redes neuronales artificiales: una revisión. Reinar. En t. 133,
Wang, X., Yu, DS, Ma, LX, Lu, XS, Song, J., Lei, M., 2022a. Uso de búsqueda de big data y aprendizaje automático 105189.
para predecir la probabilidad de riesgo para la salud humana a partir de suelos de sitios de pesticidas en Zhang, QL, Huang, GX, Wang, XH, et al., 2021. Tecnología de construcción para el sitio
China. J. Medio Ambiente. Gestionar. 320, 115798. Sistema de recomendación de planes de remediación y control de riesgos de contaminación respaldado por
Wang, SX, Zhang, S., Guo, LY, Rong, CY, Chai, LJ, 2022b. Una compresión con pérdida razonamiento basado en casos y aprendizaje automático. J. Medio Ambiente. Ing. Tecnología. 10,
Algoritmo para datos de PMU basado en una combinación de expertos de puertas múltiples y unidad 1012­1021.
recurrente de puertas. Proceder. CSU­EPSA. https://doi.org/10.19635/j.cnki.csu­epsa.000969. Zhao, L., Sun, Q., Ye, J., Chen, F., Lu, CT, Ramakrishnan, N., 2017. Presentan modelos de aprendizaje multitarea
Wen, L., Yuan, XY, 2020. Previsión de emisiones de CO2 en el departamento comercial de China, a través de la restringidos para la predicción de eventos espaciotemporales. Traducción IEEE. Conocimiento.
red neuronal de BP basada en bosque aleatorio y PSO. Frente. Ecológico. Reinar. 718, 137194. Ing. de datos. 29, 1059­1072.
Zhou, ZH, 2016. Aprendizaje automático, primera ed. Prensa de la Universidad de Tsinghua, Beijing,
Wu, YF, Li, X., Yu, L., Wang, TQ, Wang, JN, Liu, TT, 2022a. Revisión de la contaminación del suelo por págs. 97­108.
metales pesados en China: distribución espacial, fuentes primarias y alternativas de remediación. Zhou, XH, Zhou, X., Wang, CM, Zhou, HD, 2023. Impactos ambientales y de salud humana de los compuestos
Recurso. Conservar. Recibe. 181, 106261. orgánicos volátiles: una revisión en perspectiva. Quimiosfera 313, 137489.
Wu, P., Yuan, W., Ji, L., Zhou, L., Zhou, Z., Feng, WB, Gao, YK, 2022b. Misil
Diseño de optimización de formas aerodinámicas utilizando redes neuronales profundas. Aerosp. Ciencia. Zhu, Y., Wu, XD, Qiang, JP, Hu, XG, Zhang, YH, Li, PP, 2022. Representación
Tecnología. 126, 107640. aprendizaje con codificador automático disperso y profundo para el aprendizaje multitarea. Reconocimiento de patrones.
129, 108742.

12

También podría gustarte