Está en la página 1de 15

Traducido del inglés al español - www.onlinedoctranslator.

com

sensores

Artículo

Un estudio comparativo del diagnóstico de fallas para el sistema de


puertas de tren: tradicional versus profundo
Enfoques de aprendizaje

Jamón Seokju 1, Seok-Youn Han 2, Seokgoo Kim 1 , Parque Hyung Jun 1 , Parque Kee-Jun 2
y Joo-Ho Choi 3,*
1 Departamento de Ingeniería Mecánica y Aeroespacial, Universidad Aeroespacial de Corea, Ciudad de Goyang
10540, Corea; tjrwn8098@naver.com (SH); sgkim@kau.kr (SK); phj921029@kau.kr (HJP)
2 Grupo de Investigación de Tránsito Urbano, Instituto de Investigación de Ferrocarriles de Corea, Uiwang-City
16105, Corea; syhan@krri.re.kr (S.-YH); kjpark@krri.re.kr (K.-JP)
3 Escuela de Ingeniería Mecánica y Aeroespacial, Universidad Aeroespacial de Corea, Ciudad de Goyang 10540, Corea
* Correspondencia: jhchoi@kac.ac.kr ; Tel .: + 82-2-300-0117

Recibido: 2 de octubre de 2019; Aprobado: 22 de noviembre de 2019; Publicado: 25 de noviembre de 2019

Abstracto: El diagnóstico de fallas de un sistema de puerta de tren se realiza mediante la señal de corriente del
motor que opera la puerta. Se prepara un banco de pruebas, en el que se examinan varios modos de falla aplicando
condiciones extremas, así como el desgaste natural y artificial de componentes críticos. Se llevan a cabo dos
enfoques hacia la clasificación de fallas con fines comparativos: uno es el método tradicional basado en
características que requiere varios pasos para las características de procesamiento, como la segmentación de
señales, la extracción de características en el dominio del tiempo, la selección por discriminación de Fisher y K-más
cercano. vecino. El otro es el enfoque de aprendizaje profundo mediante el empleo de la red neuronal convolucional
(CNN) para omitir el proceso de extracción de características hechas a mano. En el enfoque tradicional, La buena
precisión se encuentra solo después de que la señal actual se segmenta en los tres regímenes de velocidad, lo que
mejora la capacidad de discriminación. En la CNN, se obtiene una precisión superior incluso con la señal sin procesar
original, que es más conveniente en términos de implementación. Sin embargo, en vista de las aplicaciones
prácticas, el enfoque tradicional es más útil ya que el procesamiento de características se puede aplicar fácilmente
para evaluar el estado de salud de cada falla y monitorear la progresión a lo largo del tiempo en la operación real,
que no está habilitada por el aprendizaje profundo. Acercarse.

Palabras clave: puerta del tren; diagnóstico erroneo; extracción de características tradicionales; red neuronal convolucional

1. Introducción

El sistema de trenes de metro, que es un medio principal de transporte de la ciudad, se compone de muchos
subsistemas para mantener la operación del tren segura y confiable, pero a menudo son propensos a fallas durante su
operación. Entre estos, la puerta del tren es uno de los subsistemas críticos que pueden causar retrasos o averías en el
servicio, lo que lleva a un mayor costo de operación y mantenimiento [1]. Según los comentarios sobre la experiencia de
Bombardier, entre el 30% y el 40% de las fallas de los trenes operativos se producen en los sistemas de puertas del tren [2].
Para prevenir estos fallos, se está estudiando recientemente la detección y el diagnóstico de fallos aprovechando las señales
del sensor medidas durante su funcionamiento. En esta área, ha habido dos enfoques: basado en modelos y basado en
datos. En el enfoque basado en modelos, que utiliza un modelo matemático que describe la dinámica de la puerta, se han
intentado varios estudios, como modelar el mecanismo de la puerta mediante una simple mesa de husillo de bolas [3],
modelando la dinámica del motor mediante ecuaciones diferenciales ordinarias [4] y modelado de gráficos de enlace para
describir los subsistemas mecatrónicos de la puerta de un tren [5]. Sin embargo, el sistema de puertas del tren contiene
muchos componentes interconectados con diversas incertidumbres, lo que hace que el enfoque de modelado tenga un valor
limitado en el diagnóstico.

Sensores 2019, 19, 5160; doi: 10.3390 / s19235160 www.mdpi.com/journal/sensors


Sensores 2019, 19, 5160 2 de 15

Para superar estos problemas, los enfoques basados en datos se han investigado de manera más predominante. Sin
embargo, en la aplicación de la puerta del tren, se encuentran muy pocos estudios en la literatura. Para la puerta del enchufe
del tren, las señales del sensor de audio se utilizan para clasificar las fallas mediante la descomposición en modo empírico
(EMD) y la máquina de vectores de soporte (SVM) [6]. El método de monitoreo de salud se propone mediante el análisis de
resistencia de las señales de corriente del motor durante el movimiento de la puerta para los dos casos: falla interna por
tornillo doblado y lubricación insuficiente, y falla externa por empuje de pasajeros y obstrucción. El análisis de componentes
principales (PCA) se emplea para construir los indicadores de salud [7]. Ampliando la encuesta a los sistemas similares con
mecanismos eléctricos alternativos, se encuentran más trabajos en la literatura. En el diagnóstico de la puerta de un
ascensor, se utilizan varios tipos de señales que van desde la corriente del motor, el codificador, cuatro interruptores y la
vibración para extraer varias características y clasificar fallas aplicando la descomposición de paquetes de ondas (WPT) y la
regresión logística [8]. En el estudio de una máquina de punto de ferrocarril, la señal de corriente del motor se utiliza para la
evaluación del estado de varios modos de falla mediante el empleo de mapas autoorganizados (SOM) [9] o una serie de pasos
que incluyen extracción de características estadísticas, análisis de componentes principales (PCA) y SOM [10]. En referencia [10
], los sensores de audio se utilizan para extraer características dadas por los coeficientes de cepstrum de frecuencia mel
(MFCC), y se aplican SVM para diagnosticar condiciones defectuosas. En la otra literatura, la similitud de la señal de corriente
del motor entre la normal y la falla se utiliza para el diagnóstico de fallas, en el cual el tiempo dinámico de deformación [11] o
función de similitud y c-significa difusa [12] se emplean para detectar formas anormales e identificar tipos de fallas. Como tal,
los enfoques basados en datos generalmente involucran el proceso de extracción y selección de características, lo que
requiere un buen nivel de experiencia en el dominio. En cuanto a la selección de funciones, se puede encontrar más
información en la referencia [13].

Recientemente, un nuevo enfoque de las técnicas de aprendizaje profundo, como la red neuronal convolucional (CNN),
ha recibido gran atención debido al uso directo de la señal sin procesar con un compromiso mínimo de habilidades
específicas de dominio. Entre muchos otros, la CNN ha mostrado un buen desempeño en el reconocimiento de acciones de
video [14]. La CNN también tiene amplias aplicaciones en la supervisión del estado de la máquina, como se describe en [15].
Sin embargo, las aplicaciones a la puerta del tren o máquinas similares son raras en la literatura. El diagnóstico de fallas de
las máquinas de punto de ferrocarril de alta velocidad se lleva a cabo utilizando las imágenes 2D convertidas de las señales
de corriente en la CNN [dieciséis].
Como se ve en lo anterior, el enfoque principal de la investigación del enfoque tradicional basado en
datos ha sido encontrar buenas características para la clasificación de fallas mediante el uso de sensores
adicionales externos como sonido o vibración o señales internas adquiridas durante el control de operación.
Esto plantea dos desafíos: uno es la incorporación de sensores, que no resulta atractiva por el aumento de
costo y complejidad, y el otro es la búsqueda de buenas características, lo que generalmente requiere en gran
medida el conocimiento y experiencia en procesamiento y análisis de señales. . En este estudio, motivado por
estos temas, se propone un enfoque basado en datos para el diagnóstico de fallas de puertas de trenes
eléctricos utilizando las señales de corriente del motor que se utilizan para activar el funcionamiento de la
puerta. Se prepara un banco de pruebas para la puerta, en el que varios modos de falla que ocurren en el tren
están incrustados artificialmente, y el puerto de comunicación recopila datos del motor durante el movimiento
de la puerta. Se consideran dos enfoques para los análisis comparativos en el estudio: uno es la extracción de
características tradicionales y el otro es el aprendizaje profundo sin recurrir a la extracción manual de
características. En el enfoque tradicional, se extraen varias características en el dominio del tiempo utilizando
la señal actual, a partir de la cual se seleccionan las características óptimas mediante el uso combinado del
valor discriminante de Fisher (FDV) y el coeficiente de correlación de Pearson. Luego, se emplea el algoritmo
del vecino más cercano K (KNN) para clasificar los modos de falla. En el enfoque de aprendizaje profundo, la
red neuronal convolucional (CNN) se aplica a la señal de corriente del motor,17]. Finalmente, los rendimientos
de clasificación de los dos enfoques se evalúan mediante la matriz de confusión, en la que ambos muestran
buenas precisiones en la clasificación. En este sentido, el enfoque de aprendizaje profundo parece ser superior
al enfoque tradicional, ya que no pasa por el procesamiento de características complejas. Sin embargo, en
vista de las aplicaciones prácticas, es menos útil, como se explicará en la Sección5: Práctico
Sensores 2019, 19, 5160 3 de 15

Aplicación, que aborda cómo se seleccionan y utilizan las funciones para monitorear el estado de salud a lo largo del
tiempo durante la operación en línea.

2. Adquisición de datos

En este estudio, se considera una puerta eléctrica, que consta de la unidad de control de la puerta (DCU),
motor, cojinetes del seguidor de leva, rodillos y husillos, como se muestra en la Figura 1. El conjunto de la
tuerca del husillo se mueve linealmente a lo largo del husillo, en el que el cojinete del seguidor de leva se
desliza dentro de la pista del marco base para evitar la rotación del conjunto. El conjunto de suspensión, que
cuelga la puerta, se mueve a lo largo de la pista de rodillos mediante los rodillos. El conjunto de suspensión y
el conjunto de la tuerca del husillo se sujetan para moverse linealmente como una sola unidad a lo largo del
husillo. Tenga en cuenta que hay un rodillo excéntrico en el conjunto de suspensión para evitar vibraciones
durante el movimiento de la puerta. El banco de pruebas de puertas lo proporciona la empresa fabricante de
puertas, que se utilizó para realizar pruebas de durabilidad. Para extraer características indicativas de modos
de falla, se utilizó la señal de corriente y codificador del motor para controlar el funcionamiento de la puerta,

Figura 1. Componentes del banco de pruebas de la puerta del tren.

Tenga en cuenta que la señal de corriente se ha utilizado típicamente en el diagnóstico de fallas de mecanismos
electromecánicos alternativos como se encuentran en los sistemas de puertas de ascensores [8], máquinas de punta
ferroviaria [9], y sistemas motores [17]. En la Figura se muestra un ejemplo del perfil de la señal.2 durante la
operación de apertura y cierre, en la que se suministra corriente para mover la puerta bajo un perfil de velocidad
dado, y el codificador mide el ángulo de giro para controlar la señal de corriente durante el movimiento. Como se
muestra en la figura, la señal de corriente se puede segmentar en tres partes en términos de régimen de velocidad:
aceleración, constante y desaceleración, cada una de las cuales se puede identificar utilizando la señal del codificador.
Se consideran un total de ocho casos para el diagnóstico como se muestra en la Tabla 1, que han sido
identificado como importante después de consultar con el fabricante. La condición extrema representa las
condiciones severas que puede encontrar la puerta durante la operación. Se impone un eje torcido de modo que
haya una delgada hoja de hierro en ambos extremos de cada eje y no estén paralelos al marco de la base. Se
introduce un banco de pruebas inclinado para replicar la inclinación de un tren cuando el tren pasa por la sección
curva. Se impone un elemento extraño insertando una placa de acero entre la puerta y el riel inferior. El rodamiento y
el rodillo sufren un desgaste natural como resultado de una prueba de durabilidad durante más de un millón de
ciclos de operación de la puerta. También se fabrican prendas artificiales como se muestra en la Figura3
imponer una mayor severidad al rodamiento del seguidor de leva reduciendo el diámetro en 0.5 mm en la
puerta izquierda y cortando en forma triangular en la puerta derecha, que se muestran en las imágenes del
medio y la derecha de la Figura 3a respectivamente, y al rodillo reduciendo el diámetro del eje en 1,0 mm, lo
que crea el espacio entre el rodillo y el eje, como se muestra en la Figura 3B. Para cada caso, se obtienen varios
datos mediante operaciones repetidas, con el número de datos resultante dado en la Tabla1. El número total
de datos es 626.
Sensores 2019, 19, 5160 4 de 15

Figura 2. Corriente del motor y señal del encoder para la operación de apertura y cierre.

Tabla 1. Datos experimentales.

Condición de falla Numero de datos Identificador de clase

Normal 82 1
Husillo torcido 46 2
Condición extrema
Husillo retorcido e inclinado probado 88 3
Inserción de elementos extraños 66 4
Desgaste natural Rodamiento y rodillo 46 5
Soportando 170 6
Desgaste artificial
Rodillo 68 7
Rodamiento y rodillo 60 8

(a) (B)

Figura 3. Desgaste artificial en (a) cojinete y (B) rodillo.

3. Diagnóstico basado en extracción de características

El proceso de diagnóstico basado en la extracción de características tradicionales generalmente se compone de


cuatro pasos, como se ilustra en la Figura 4, que son el procesamiento de señales (si es necesario), extracción de
características, selección de características y clasificación. Dado que las características de la señal en la operación de
apertura y cierre son diferentes, es más apropiado tratarlas por separado en el proceso de diagnóstico. Se consideran
dos casos para la señal hacia la extracción de características: uno es utilizar la señal original para la operación de
apertura y cierre, respectivamente. El otro es dividir aún más la señal en tres segmentos por los regímenes de
velocidad: aceleración, constante y desaceleración, utilizando la señal del codificador, como se muestra en la Figura2.
Las características se extraen posteriormente para cada señal segmentada. El límite de los segmentos se identifica
aplicando la media móvil de la derivada en el tiempo de la señal del codificador. En las siguientes secciones, el
procedimiento de diagnóstico se ilustra mediante la señal de corriente original. En el caso de la
Sensores 2019, 19, 5160 5 de 15

señal segmentada, el procedimiento es el mismo, diferenciándose solo por el número total de características aumentado en
tres veces.

Figura 4. Procedimiento de diagnóstico basado en extracción de características tradicionales.

3.1. Extracción de características

En este estudio, las características del dominio del tiempo, que son una de las formas más representativas de
identificar fallas, se extraen de la señal actual. Se extrajeron un total de 13 características [18,19], que se dan en la
Tabla 2.

Tabla 2. Funciones extraídas del dominio del tiempo.

ID de función 1 2 3 4
Nombre de la función Significar Amplitud de la raíz Cuadrados medios de raíz Desviación Estándar
∑ ( ∑ √ )2 √∑ √∑
Ecuación XI |XI| XI 2 (XI-X)
2

norte norte norte norte−1

ID de función 5 6 7 8
Nombre de la función Cima Oblicuidad Curtosis factor de cresta

(XI-X)3 1∑ ∣∣ ∣∣
(√ ∑ )3 (X I-X)4 ∣Xcima∣
Ecuación max (X) (xi-X) 2 1∑
norte

22
(norte−1)
norte−1
( norte (XI-X)) Xrms

ID de función 9 10 11 12
Nombre de la función Factor de liquidación Factor de forma Factor de impulso Pico a pico
Xcima
( ∑√ )2 Xr X∑pag
Ecuación |xi| 1
∑Sra comer

max (X) -min (X)


norte
|XI | 1
X
norte | I|
norte

ID de función 13
Suma raíz de
Nombre de la función
cuadrícula
√∑
Ecuación XI 2
Sensores 2019, 19, 5160 6 de 15

3.2. Selección de características

A continuación, se seleccionó un número menor de características de las características extraídas. Esto es


necesario, ya que demasiadas funciones aumentan los cálculos y provocan un ajuste excesivo. Además, pueden
existir características duplicadas con alta correlación, que deben eliminarse para obtener un buen rendimiento de
separabilidad. Para lograr esto, las características se normalizan primero por su media y varianza. Luego, se calcula el
valor discriminante de Fisher (FDV), que es una medida de separabilidad [20]:

() 2
µI -µj
FDVl(I, j) = (1)
σI 2+ σ 2 j

dónde µ y σ2 denotar la media y la varianza de los datos para la clase I y j de la característica l. El FDV se calcula para
dos clases de ocho, lo que equivale a 28 combinaciones. Esto se obtiene para cada una de las 13 funciones. Los
resultados se dan en la Tabla3. De la tabla, se elige la función con el FDV mejor clasificado para cada combinación de
clases, como se indica en la primera fila con el título "Mejor". A continuación, se elige la segunda característica con
respecto a la primera de manera que el FDV sea más alto pero con la menor correlación para evitar las características
duplicadas. Esto se busca mediante los siguientes criterios.
{∣∣ ∣∣}
k2 = argαFDV máx.metro(I, j) - (1 −α)∣ρk1metro∣, Fo todos m , k1 (2)
metro

∑norte

Xk1,norteXmetro,norte

(3)
norte= 1
ρk1metro = √
∑norte

2
∑norte

2
Xk1,norte Xmetro,norte
norte= 1 norte= 1

dónde k1 denota el ID de la primera característica, metro es la ID diferente a k1, norte es la suma de datos de dos clases
cualesquiera I y j, y Xk1,norte y Xmetro,norte son los valores de características individuales que contienen las dos clases con ID k1 y
metro respectivamente. α es el peso que representa la importancia relativa de la FDV frente a la correlación y se establece en
0,5 en este estudio. El ρk,metro es el coeficiente de correlación cruzada para dos características con ID k1 y metro.

Una vez que se eligen las dos características de cada combinación, se recopilan todas para obtener un solo grupo de
características, que se muestra en la fila inferior de la Tabla. 3 para la operación de apertura y cierre, respectivamente. Si bien
algunos pueden superponerse con otros entre las características elegidas, el grupo representa la colección de características
con un FDV alto y menos correlación en términos de separabilidad de dos clases. Estos se utilizan como las características
seleccionadas para la clasificación en el siguiente paso. El proceso de selección de características se resume en la Figura5.

Tabla 3. Funciones seleccionadas para cada operación.

Operación abierta
Orden de clase Clase Clase Clase Clase Clase Clase Clase
(Combinación) 1y2 1y3 1y4 1y5 1y6 1y7 1y8
Característica mejor 3 3 1 2 3 3 1
ID 2nd Mejor 13 13 13 1 13 13 13
Orden de clase Clase Clase Clase Clase Clase Clase Clase
Combinación) 2y3 2y4 2y5 2y6 2y7 2y8 3y4
Característica mejor 3 4 10 3 10 10 1
ID 2nd Mejor 13 3 4 13 2 2 2
Orden de clase Clase Clase Clase Clase Clase Clase Clase
(Combinación) 3y5 3y6 3y7 3y8 4y5 4y6 4y7
Característica mejor 2 2 3 1 2 1 13
ID 2nd Mejor 1 1 13 13 10 2 3
Sensores 2019, 19, 5160 7 de 15

Tabla 3. Cont.

Operación abierta
Orden de clase Clase Clase Clase Clase Clase Clase Clase
(Combinación) 4y8 5y6 5y7 5y8 6y7 6y8 7y8
Característica mejor 1 2 13 13 3 1 3
ID 2nd Mejor 13 1 3 3 13 13 13
Funciones reunidas 1, 2, 3, 4, 10, 13
Cerrar Operación
Orden de clase Clase Clase Clase Clase Clase Clase Clase
(Combinación) 1y2 1y3 1y4 1y5 1y6 1y7 1y8
Característica mejor 6 10 2 2 2 2 2
ID 2nd Mejor 9 9 1 1 1 1 1
Orden de clase Clase Clase Clase Clase Clase Clase Clase
(Combinación) 2y3 2y4 2y5 2y6 2y7 2y8 3y4
Característica mejor 6 6 11 6 6 6 1
ID 2nd Mejor 1 9 6 11 11 11 2
Orden de clase Clase Clase Clase Clase Clase Clase Clase
(Combinación) 3y5 3y6 3y7 3y8 4y5 4y6 4y7
Característica mejor 1 10 1 1 2 2 2
ID 2nd Mejor 2 4 2 2 1 1 1
Orden de clase Clase Clase Clase Clase Clase Clase Clase
(Combinación) 4y8 5y6 5y7 5y8 6y7 6y8 7y8
Característica mejor 2 2 2 2 1 1 6
ID 2nd Mejor 1 1 1 1 2 2 7
Funciones reunidas 1, 2, 4, 6, 7, 9, 10, 11

Figura 5. Procedimiento de selección de características mediante el uso del valor discriminante de Fisher (FDV).

3.3. Clasificación

Para la clasificación se aplica el algoritmo KNN, que es el más simple y eficiente de los algoritmos de aprendizaje
automático. El algoritmo KNN calcula el vecino K más cercano de los datos de una prueba en el conjunto de datos de
entrenamiento de acuerdo con la medida de distancia y asigna la etiqueta con la más frecuente. El rendimiento de la
clasificación depende del valor de K, de modo que el modelo está desajustado para valores de K más grandes,
mientras que está sobreajustado para valores de K más pequeños. El rendimiento también depende de la forma en
que se defina la medida de distancia, en la que la distancia euclidiana y de Mahalanobis son las más comunes:

DEuclidianax, y) = (X - y)T(X - y) (4)

DMahalanobis (x, y) = (X - y)TΣ−1(X - y) (5)
Sensores 2019, 19, 5160 8 de 15

dónde X y y son los datos de las características seleccionadas del conjunto de prueba y entrenamiento, y Σ
denota la matriz de covarianza hecha a partir del conjunto de entrenamiento. Definamos el valor K y la medida
de distancia como los dos hiperparámetros. Luego, se lleva a cabo la validación cruzada (CV) de k veces para
explorar los hiperparámetros adecuados. Con este fin, los datos en cada condición en la Tabla1 se dividen en
entrenamiento y prueba en una proporción de 7: 3. Como resultado, se eligen 440 números para el
entrenamiento, mientras que los 186 restantes se eligen para la prueba. Los datos de entrenamiento se
dividen a su vez en k subconjuntos de igual tamaño con k = 5 (tenga en cuenta que las letras K y k mayúsculas
y minúsculas se utilizan para distinguir). Luego, el CV de k-pliegues es entrenar al clasificador para los pliegues
(k - 1) usando los parámetros candidatos y evaluar el desempeño del clasificador en el pliegue restante. Esto se
repite para cada pliegue y se promedian los rendimientos resultantes. Los hiperparámetros candidatos son el
número de vecinos K de 3 a 11 con el incremento de 2, y la medida de distancia es Euclidiana y Mahalanobis.
Como resultado, los mejores parámetros son K = 5 y la distancia euclidiana para las operaciones de apertura y
cierre.6. Luego, se aplica el clasificador KNN al conjunto de datos de prueba y se evalúa el rendimiento de
clasificación para cada operación de puerta utilizando la matriz de confusión.

Figura 6. procedimiento de validación cruzada (CV) de k-fold.

3.3.1. Clasificación sin segmentación actual

En el caso de una señal de corriente sin segmentación, las matrices de confusión se dan en la Figura 7,
en el que los ID de la fila y la columna representan las clases de salida (predichas) y objetivo (verdaderas),
respectivamente. El número en cada celda es la predicción de la clase verdadera. El valor a continuación es la relación
con el número total de datos. Los puntajes en el extremo derecho y en el extremo inferior son la precisión y el
recuerdo, que representan la proporción de clasificación correcta al número total de predicciones en la fila y al
número total de clases verdaderas en la columna, respectivamente. La mayor precisión y recuperación indican una
mejor calidad de reducción de clasificación errónea y detección errónea de cada modo de falla. Finalmente, el valor en
la esquina inferior derecha es la precisión, lo que indica la relación entre el total de clasificaciones correctas y el
número total de datos. En este estudio, este valor se adopta para la evaluación del desempeño. Los resultados indican
que la precisión de la operación abierta es buena con un 95,2% frente al 88,7% de la operación cerrada. La razón de la
poca precisión de este último se debe al pico alto de la corriente al final, como se muestra en la Figura2, que es para
asegurar que la puerta esté completamente cerrada. Esto puede haber causado un rendimiento de clasificación
deficiente en la operación de cierre.
Sensores 2019, 19, 5160 9 de 15

(a) (B)

Figura 7. Las matrices de confusión resultaron para la no segmentación: (a) resultado de la operación de apertura; (B)
resultado de la operación de cierre.

3.3.2. Clasificación con segmentación actual

En el caso de la señal actual con segmentación, en la que las características extraídas se multiplican por tres, las
matrices de confusión se dan en la Figura 8. Los resultados indican que la precisión de la operación de apertura es del
100% y del 98,9% para la operación de cierre, lo que muestra una mejora notable como resultado de la segmentación.
Al utilizar las características múltiples en los segmentos divididos en lugar de una sola característica en todo el
período, se obtiene una precisión mucho mejor. En la operación de cierre, se encuentran dos clasificaciones erróneas
para el 'Rodillo' (ID 7) y el 'Rodillo y cojinete' (ID 8), lo que significa que la falla del rodillo puede no detectarse
fácilmente con este enfoque. Sin embargo, esto es solo dos de los 186 datos de prueba completos, que es el 1%. Salvo
estos, todas las clases están perfectamente clasificadas.

(a) (B)

Figura 8. Las matrices de confusión resultaron para la segmentación: (a) resultado de la operación de apertura; (B) resultado de la
operación de cierre.
Sensores 2019, 19, 5160 10 de 15

4. Diagnóstico basado en aprendizaje profundo

CNN se ha aplicado ampliamente a varios campos como el procesamiento de imágenes, el


reconocimiento de sonido y el diagnóstico de fallas debido a la ventaja de que el clasificador está
entrenado con parámetros más bajos que la red neuronal clásica completamente conectada. La
arquitectura básica de CNN se compone de dos partes principales: extracción de características y
clasificación. En la extracción de características, las características se aprenden automáticamente a partir
de los datos sin procesar de entrada. Consta de dos capas: convolución y agrupación. La capa de
convolución realiza una operación convolucional mediante el uso de una matriz de núcleo, que debe
entrenarse para la extracción automática de características. Luego, la capa de agrupación, también
conocida como capa de submuestreo, reduce la dimensión de salida de las capas de convolución
reemplazando la salida del filtro con una estadística de las salidas cercanas. En la clasificación,
Dado que la CNN ha sido eficaz en el procesamiento de imágenes 2D, la mayoría de los estudios de investigación de la
CNN en el diagnóstico de fallas se han ocupado de datos de imagen como la transformada de Fourier de tiempo corto (STFT)
o la transformada de ondas continuas (CWT). Sin embargo, la CNN se emplea con éxito para datos 1D reemplazando una
matriz de núcleo 2D con una matriz 1D. En este estudio, 1D CNN se aplica para el diagnóstico de fallas de puertas de tren
usando las señales de corriente del motor, como se muestra en la Figura9. Se pueden encontrar más detalles de 1D CNN y su
arquitectura en la referencia [21]. En la CNN, la función de Unidades Lineales Rectificadas (ReLU) se emplea como función de
activación, que determina si la salida de cada nodo está activada o no. Además, la agrupación máxima con los 2× 1 tamaño de
bloque rectangular (2 × 1) se utiliza como función de agrupación. Para construir una arquitectura CNN adecuada, se
consideran tres parámetros para la optimización del modelo: tamaño de convolución (5, 10, 25, 50), el número de filtros de
convolución (3, 6) y el número de neuronas en capas completamente conectadas ( 50, 100). Al igual que en el enfoque
tradicional, el CV de k veces se realiza utilizando el conjunto de entrenamiento para encontrar los parámetros con el mejor
rendimiento. Como resultado, se encuentran en la Tabla4. Luego, la CNN entrenada se aplica al conjunto de datos de prueba
y los resultados se obtienen mediante las matrices de confusión en la Figura10. Las precisiones de cada operación de puerta
son del 100% para la operación de apertura y del 99,5% para la operación de cierre. Como en el enfoque tradicional, se
produce una sola clasificación errónea en la operación de cierre para la clase ID 7, que se malinterpreta como 8.

Figura 9. Arquitectura de red neuronal convolucional (CNN) unidimensional (1D) con una entrada de corriente.

Cuadro 4. Parámetros óptimos de la arquitectura CNN.

Abierto Cerrar

Tamaño de convolución 25 50
Número de filtro de convolución Número de 6 6
neuronas en capas completamente conectadas 100 100
Sensores 2019, 19, 5160 11 de 15

(a) (B)

Figura 10. Las matrices de confusión resultaron de CNN: (a) resultado de la operación de apertura; (B) resultado de la
operación de cierre.

5. Aplicación práctica

Al comparar las precisiones de clasificación de la CNN y el enfoque tradicional, la CNN


encuentra una precisión superior en el resultado, incluso con la señal de corriente original sin
procesamiento de características, que es la mayor ventaja en términos de implementación. En el
enfoque tradicional, que pasa por varios pasos hacia la clasificación, se logra una precisión
comparable solo después de que la señal es segmentada por los regímenes de velocidad. Sin
embargo, la CNN tiene algunos inconvenientes. La formación requiere mucho tiempo y la
aplicación es limitada; solo clasifica las fallas para los mismos modos y configuraciones de falla; lo
más importante, carece de percepción física. Por otro lado, el enfoque tradicional tiene las ventajas
en la aplicación práctica a través de las características seleccionadas, que son representativas de
las fallas. Una vez establecido,
Por ejemplo, considere la clasificación que se ocupa de las fallas de 'inserción de elementos extraños' (ID 4) y de
'cojinete' (ID 6) contra el estado normal (ID 1), que son los dos modos de falla más frecuentes que se encuentran en la
práctica, entre los que se encuentran en Mesa 1. La identificación correcta del modo de falla es crítica, ya que
prescribe diferentes acciones: remover los elementos extraños versus reemplazar el componente del rodamiento.
Siguiendo el mismo procedimiento, las características seleccionadas se dan en la Tabla5, en el que las letras del
alfabeto A, C y D denotan el régimen de aceleración, velocidad constante y desaceleración, respectivamente. Después
de examinar los resultados, el número de características se reduce aún más a dos, que son 2C y 10C, que representan
los 'Cuadrados medios de la raíz' y el 'Factor de forma' a velocidad constante en la operación de apertura, y 10C y 10D,
que representan la 'Forma factor 'a velocidad constante y desaceleración en la operación de cierre, respectivamente.
Las matrices de confusión de estos se dan en la Figura11, lo que da como resultado una alta precisión del 98,9%. Los
datos de características de la normal y las dos fallas se representan en la Figura12a, b para la operación de apertura y
cierre, respectivamente. Evidentemente, las figuras distinguen los dos estados de falla: elementos extraños (ID 4) y
rumbo (ID 6) frente a la normal (ID 1) por las diferentes direcciones como se indica mediante las flechas en las figuras.
Sensores 2019, 19, 5160 12 de 15

Cuadro 5. Funciones seleccionadas para clase 1, 4 y 6 en cada operación de puerta.

Operación abierta Cerrar Operación

Orden de clase Clase Clase Clase Orden de clase Clase Clase Clase

(Combinación) 1y4 1y6 4y6 (Combinación) 1y4 1y6 4y6

Mejor 3C 2C 2C Mejor 10C 3C 10C


ID de función ID de función
2do mejor 10C 5D 12C 2do mejor 10D 1C 6D
Funciones reunidas 2C, 3C, 10C, 12C, 5D Funciones reunidas 1C, 3C, 10C, 6D, 10D

(a) (B)

Figura 11. Matrices de confusión para tres clases por dos características: (a) 2C y 10C para la operación abierta; (B
) 10C y 10D para la operación de cierre.

(a) (B)

Figura 12. Gráficos de dispersión para tres clases por dos características: (a) 2C y 10C para la operación abierta; (B) 10C y
10D para la operación de cierre.

Las dos características se pueden aplicar para monitorear el desarrollo de cada modo de falla a lo largo del tiempo en la
operación real. Con este objetivo, un índice de salud (HOLA) se establece mediante un modelo de regresión lineal para cada modo de
falla durante las operaciones de apertura y cierre, respectivamente, de la siguiente manera.

HOLAij(X) = αij + β1,ijXj1 + β2,ijXj2 (6)

dónde I es el índice de modo de falla de ID 4 e ID 6, j indica la operación de apertura o cierre,


Xj1, Xj2 denotar las dos características seleccionadas en cada operación, y αij, β1,ij, β2,ij son los coeficientes de
HOLAs para el Ila culpa en ja operación. Tomando los datos de las características en las condiciones normales y de falla
Sensores 2019, 19, 5160 13 de 15

y asignando el correspondiente HOLAs con 0 y 1 respectivamente, los coeficientes se determinan por regresión para
construir el HOLA modelo para cada modo de falla. Los resultados se dan en la Tabla5. Ya que tenemos dosHOLAs,
uno puede elegir el más alto HOLAs para propósitos conservadores o tome el promedio de los dos para estimar el
estado de salud actual por un solo valor. En este ejemplo, el promedio de los dosHOLASe utiliza s. Una vez elHOLA se
obtiene, se puede utilizar para monitorear la salud contra cada modo de falla en línea, que varía entre alrededor de 0
(normal) y 1 (falla). Los pasos generales se resumen a continuación.
Desarrollo fuera de línea de HOLA desde el banco de pruebas:

1. Adquirir datos actuales para fallas normales (ID 1) y sembradas (ID 4 y 6) en el banco de pruebas.
2. Explore dos características que pueden clasificar las fallas para la operación de apertura y cierre, respectivamente.
3. Establecer un modelo de regresión para HOLA de cada modo de falla por las dos características.

Aplicación en línea de HOLA al funcionamiento real:

1. Adquirir datos actuales durante la operación.


2. Calcule el HOLA de cada modo de falla a partir de los datos actuales utilizando el modelo de regresión.
3. Tome medidas basadas en el estado entre 0 (normal) y 1 (falla) para cada falla.

Sin embargo, la implementación de esto en la operación real está más allá del alcance de este documento
debido a la incapacidad de recopilar los datos en línea. En cambio, se presenta un ejemplo virtual como ilustración.
Suponga que hemos adquirido una señal de corriente durante la operación, cuyos valores de característica 2C y 10C
son −0.7, 0.7 para la operación de apertura, y 10C y 10D son 1.2, 0.2 para la operación de cierre. Se dan como una
estrella en la figura.12. Aplicando los valores de las características al modelo de regresión (5), obtenemosHOLA
valores de 0.5572 y 0.5067 para la falla ID 4 y 0.3767 y 0.2152 para la falla ID 6, respectivamente. Toma el promedio de
los dosHOLAs para estimar el estado de salud actual para cada modo de falla, que son
0,5319 y 0,2959 para ID 4 y 6, respectivamente. El procedimiento también se puede aplicar a todos los datos de la
normal de (ID 1) y cada defecto sembrado de (ID 4 y 6) para obtener laHOLA valores, que se trazan en forma de
histograma para cada modo de falla en la Figura 13. El estado de salud actual se agrega como marca de estrella en
esta figura. El valor representa que si está más cerca de 1, es muy probable que ocurra la falla correspondiente, y el
operador o mantenedor del tren debe tomar las acciones apropiadas. Es por eso que se aboga por el enfoque
tradicional sobre el enfoque de aprendizaje profundo.

Figura 13. Histograma de índice de salud para cada falla; (a) para los ID de clase 1 y 4; (B) para las ID de clase 1 y 6.

6. Conclusiones

En este estudio, el diagnóstico de fallas se llevó a cabo con los conjuntos de datos adquiridos al operar un sistema de puertas
de tren de un banco de pruebas, en el cual los conjuntos de datos incluían ocho modos de falla diferentes a los normales.
Sensores 2019, 19, 5160 14 de 15

y condiciones extremas, y el desgaste natural y artificial de algunos componentes críticos. En el diagnóstico de fallas, las clasificaciones se

llevaron a cabo dividiendo todos los datos en los datos de entrenamiento y de prueba. En el entrenamiento, se utilizó la validación cruzada de k-

fold para encontrar la arquitectura óptima del clasificador. Luego, se aplicó el clasificador entrenado al conjunto de datos de prueba y se evaluó

su precisión, que es la proporción de clasificaciones correctas entre todo el conjunto. Se llevaron a cabo dos enfoques con fines comparativos:

uno es la extracción de características tradicionales y el otro es la CNN. En el enfoque tradicional, se buscan características útiles para la

clasificación aplicando la correlación FDV y Pearson de las diversas características estadísticas de tiempo de la señal actual. Luego, se emplea el

algoritmo KNN para clasificar los modos de falla. Se consideran dos casos en términos de características: uno es usar la señal de corriente

original y el otro es dividir aún más la señal en los tres regímenes de velocidad para usar las señales tres veces más grandes. Como resultado, en

la operación cercana, la mejor precisión del 98,9% se obtiene mediante la segmentación de la señal en comparación con el 88,7% sin ella debido

a la mayor capacidad de discriminación en cada régimen. En la CNN, la mejor precisión del 99,5% se encuentra incluso utilizando la señal de

corriente original sin ninguna intervención. 7% sin ella debido a la mayor capacidad de discriminación en cada régimen. En la CNN, la mejor

precisión del 99,5% se encuentra incluso utilizando la señal de corriente original sin ninguna intervención. 7% sin ella debido a la mayor

capacidad de discriminación en cada régimen. En la CNN, la mejor precisión del 99,5% se encuentra incluso utilizando la señal de corriente

original sin ninguna intervención.

La CNN tiene aplicaciones crecientes en el diagnóstico de fallas; Sin embargo, no debe emplearse sin una buena
razón, ya que tiene algunos inconvenientes que los hacen menos útiles en la implementación en tiempo real: el
entrenamiento lleva mucho tiempo, solo clasifica las fallas para los mismos modos y configuraciones de falla, y carece
de características físicas. conocimiento. Por otro lado, el enfoque tradicional tiene la ventaja de que se pueden
seleccionar algunas características y utilizarlas para construir el índice de salud (HOLA) de cada modo de falla para
monitorear su progresión a lo largo del tiempo y diagnosticar durante las operaciones en línea, como se ilustra en la
Sección 5: Aplicación práctica. Por lo tanto, qué enfoque elegir debe determinarse con discreción de acuerdo con las
aplicaciones deseadas El estudio futuro debe recopilar los datos actuales reales durante la operación en línea a lo
largo del tiempo, use el propuestoHOLAs que se aplicaron para evaluar el estado de salud de la puerta frente a cada
falla, y validar la precisión examinando el estado predicho frente a la ocurrencia real de la falla.

Contribuciones de autor: SH, SK, HJP y J.-HC contribuyeron al procesamiento de datos y la redacción de papel; S.-YH y K.-JP
contribuyeron a la recopilación de datos.

Fondos: Esta investigación fue apoyada por una subvención del Programa de I + D del Instituto de Investigación Ferroviaria de Corea, República de Corea y
una subvención de investigación de la Facultad de la Universidad Aeroespacial de Corea de 2019.

Conflictos de interés: Los autores declaran no tener ningún conflicto de intereses.

Referencias

1. Bai, H. Un enfoque genérico de detección y diagnóstico de fallas para activos ferroviarios neumáticos y eléctricos. Doctor.
Disertación, Universidad de Birmingham, Birmingham, Reino Unido, 2010.
2. Cauffriez, L .; Copin, R .; Caouder, N .; Loslever, P .; Turgis, F. Diseño de un banco de pruebas para la simulación de
condiciones de funcionamiento reforzadas del acceso de pasajeros del tren. EnFiabilidad, riesgo y seguridad: teoría y
aplicaciones; Taylor & Francis Group: Abingdon, Reino Unido, 2010; págs. 2279–2284.
3. Lin, S .; Jia, L .; Qin, Y .; Yu, B .; Wang, Y. Investigación sobre el diagnóstico de fallas del sistema de puertas de pasajeros de trenes ferroviarios urbanos

utilizando pca y un conjunto aproximado.Abrir Mech. Ing. J.2014, 8, 340–348.

4. Dassanayake, H .; Roberts, C .; Goodman, CJ; Tobias, AM Uso de la estimación de parámetros para la detección y
diagnóstico de fallas en los sistemas de puertas de trenes eléctricos.Proc. Inst. Mech. Ing. Parte O J. Riesgo Reliab.2009,
223, 271–278. [CrossRef]
5. Cauffriez, L .; Grondel, S .; Loslever, P .; Aubrun, C. Modelado de gráficos de enlace para la detección de fallas y el aislamiento de un
sistema mecatrónico de puertas de tren.Control Ing. Pract.2016, 49, 212–224. [CrossRef]
6. Sun, Y .; Xie, G .; Cao, Y .; Wen, T. Estrategia para el diagnóstico de fallas en las puertas de los tapones de trenes mediante sensores de audio.Sensores

2019, 19, 3. [CrossRef] [PubMed]


7. Long, J .; Zhu, S .; Zhang, S .; Xu, Z .; Colgar.; Lu, N. Monitoreo de la salud del sistema de puertas de vehículos ferroviarios
basado en análisis de resistencia al movimiento. En Actas de la Conferencia de Decisión y Control de China de 2018
(CCDC), Shenyang, China, 9-11 de junio de 2018; págs. 6604–6609.
Sensores 2019, 19, 5160 15 de 15

8. Yan, J .; Lee, J. Evaluación de degradación y clasificación de modos de falla mediante regresión logística.J. Manuf. Sci. Ing.
2005, 127, 912. [CrossRef]
9. Alessi, A .; La-Cascia, P .; Lamoureux, B .; Pugnaloni, M .; Dersin, P. Evaluación de la salud de los desvíos ferroviarios: un
estudio de caso. En Actas de la Conferencia Europea de la Sociedad de Pronósticos y Gestión de la Salud, Dresde,
Alemania, 3 a 6 de octubre de 2016.
10. Lee, J .; Choi, H .; Park, D .; Chung, Y .; Kim, HY; Yoon, S. Detección de fallas y diagnóstico de máquinas de puntos ferroviarios
mediante análisis de sonido.Sensores 2016, dieciséis, 549. [CrossRef] [PubMed]
11. Kim, H .; Sa, J .; Chung, Y .; Park, D .; Yoon, S. Diagnóstico de fallas de máquinas de puntos ferroviarios usando warping dinámico en
el tiempo.Electrón. Letón.2016, 52, 818–819. [CrossRef]
12. Huang, S .; Yang, X .; Wang, L .; Chen, W .; Zhang, F .; Dong, D. Diagnóstico de fallas de desvío de dos etapas basado en la
función de similitud y c-medias difusas.Adv. Mech. Ing.2018, 10, 1–12. [CrossRef]
13. Bommert, A .; Sol, X .; Bischl, B .; Rahnenführer, J .; Lang, M. Benchmark para métodos de filtro para la selección de características
en datos de clasificación de alta dimensión.Computación. Stat. Data Anal.2020, 143, 106839. [CrossRef]
14. Yao, G .; Lei, T .; Zhong, J. Una revisión del reconocimiento de acciones basado en redes convolucionales neuronales.
Reconocimiento de patrones. Letón.2019, 118, 14-22. [CrossRef]

15. Zhao, R .; Yan, R .; Chen, Z .; Mao, K .; Wang, P .; Gao, RX Deep learning y sus aplicaciones para el monitoreo del estado de
la máquina.Mech. Syst. Proceso de señal.2019, 115, 213–237. [CrossRef]
16. Zhang, P .; Zhang, G .; Dong, W .; Sol, X .; Ji, X. Diagnóstico de fallas de la participación de trenes de alta velocidad basado en una
red neuronal convolucional. En Actas de la 24.a Conferencia Internacional sobre Automatización y Computación (ICAC) de 2018,
Newcastle upon Tyne, Reino Unido, 6 al 7 de septiembre de 2018; págs. 1–6.
17. Ince, T .; Kiranyaz, S .; Miembro, S .; Eren, L. Detección de fallas de motor en tiempo real mediante redes neuronales
convolucionales 1-D.IEEE Trans. Ind. Electron.2016, 63, 7067–7075. [CrossRef]
18. Lei, Y. Diagnóstico inteligente de fallas y predicción de la vida útil restante de la maquinaria giratoria; Butterworth-
Heinemann: Oxford, Reino Unido, 2016.
19. Lee, J .; Jin, C .; Liu, Z .; Ardakani, HD Introducción a las metodologías basadas en datos para el pronóstico y la
gestión de la salud. EnPronósticos probabilísticos y gestión de la salud de los sistemas energéticos; Springer:
Cham, Suiza, 2017; págs. 9–32.
20. Obispo, CM Reconocimiento de patrones y aprendizaje automático; Springer: Berlín, Alemania, 2006.
21. Kim, S .; Choi, JH Red neuronal convolucional para el diagnóstico de fallas de engranajes basado en un enfoque de segmentación
de señales.Struct. Health Monit.2019, 18, 1401-1415. [CrossRef]

© 2019 por los autores. Licenciatario MDPI, Basilea, Suiza. Este artículo es un artículo de
acceso abierto distribuido bajo los términos y condiciones de la licencia Creative Commons
Attribution (CC BY) (http://creativecommons.org/licenses/by/4.0/).

También podría gustarte