Está en la página 1de 11

Traducido del inglés al español - www.onlinedoctranslator.

com

JID: NEUCOM
ARTÍCULO EN PRENSA [m5G; 20 de febrero de 2017; 13: 38]

Neurocomputación 000 (2017) 1–11

Listas de contenidos disponibles en ScienceDirect

Neurocomputación

revista Página de inicio: www.elsevier.com/locate/neucom

Clasificación de equipos de excavación basada en características mejoradas de MFCC y


ELM

Jiuwen Cao a,∗, Tuo Zhao a, Jianzhong Wang a, Ruirong Wang B, Yun Chen a
a Laboratorio clave para IOT y tecnología de fusión de información de Zhejiang, Universidad Hangzhou Dianzi, Zhejiang 310018, China
B Facultad de Ciencias de la Información e Ingeniería de Instrumentos, Universidad Hangzhou Dianzi, Zhejiang 310018, China

información del artículo abstracto

Historia del artículo: Un algoritmo eficiente para el reconocimiento de dispositivos de movimiento de tierras es esencial para la protección
Recibido el 30 de septiembre de 2015
de cables subterráneos de alta tensión en China continental. Utilizando señales acústicas generadas por el motor o el
Revisado el 26 de enero de 2016
choque durante las operaciones, en este documento se desarrolla un sistema de clasificación inteligente para cuatro
Aceptado el 24 de marzo de 2016
equipos de excavación representativos (a saber, martillos eléctricos, martillos hidráulicos, máquinas de corte y
Disponible en línea xxx
excavadoras). Primero se establece una base de datos de ondas acústicas de referencia que se recopila de un sitio de
Palabras clave: construcción real. Luego, se desarrolla un enfoque mejorado de extracción de características basado en los
Sistema de vigilancia inteligente Coeficientes Cepstruales de Frecuencia Mel (MFCC) que pueden describir de manera eficiente la dinámica de la onda
Procesamiento de señales acústicas acústica. La reciente máquina de aprendizaje extremo, rápida y eficaz, se emplea como clasificador en el sistema de
- 2MFCC
clasificación propuesto.
Máquina de aprendizaje extrema

© 2017 Elsevier BV Todos los derechos reservados.

1. Introducción ciones. Equipar el pavimento con sensor de fibra óptica junto con los cables
eléctricos para detectar las señales de vibración generadas por los equipos de
Como vía pavimentada económica y segura, el cable eléctrico subterráneo se construcción es otro método ampliamente utilizado para la protección de cables.
ha utilizado ampliamente en China continental debido al rápido desarrollo de la [3]. Pero tiene dos carencias: i) el rango de detección del sensor de fibra óptica es
urbanización. Sin embargo, numerosos informes mostraron recientemente que las demasiado corto para proporcionar protecciones efectivas; y ii) la tasa de falsas
fallas y averías de los cables eléctricos ocurrían casi todos los días en China. Las alarmas es demasiado alta, ya que no puede distinguir si la vibración proviene de
propiedades de la red eléctrica, los fabricantes y la seguridad de las personas se dispositivos de excavación o interferencias, como vehículos que pasan. Los
han visto seriamente afectadas. Estas frecuentes averías de cables provocaron sistemas de vigilancia basados en tecnología de imagen / video son otros
decenas de miles de pérdidas económicas cada año. La falla del cable subterráneo métodos de uso frecuente para la protección de cables.[4,49]. Aunque la detección
se debe a varias razones, que incluyen deterioro natural, daños externos, de dispositivos de excavación basada en imágenes / video funciona bien en
envejecimiento del cable, calidad del cable, etc.[1]. El informe estadístico de State algunas circunstancias, tiene un rendimiento deficiente en la noche o en entornos
Grid revela que más del 50% de las averías de cables de 2009 a 2011 son causadas con poca luz.
por daños externos, como se muestra enFigura 1. Los equipos de excavación son En vista de las desventajas de los métodos anteriores, nuestro objetivo es
las principales fuentes externas de destrucción de cables eléctricos. Por lo tanto, la desarrollar un sistema de vigilancia las 24 horas para la protección de cables
construcción de un sistema de vigilancia que pueda detectar automáticamente los subterráneos en este documento. Salvo vibraciones e imágenes visuales, todos los
posibles daños causados por los equipos de excavación es esencial y urgente dispositivos de excavación generan la señal acústica, ya sea por motor o por
para el sistema de suministro de energía. choque durante las operaciones. Iluminados por esta característica, investigamos
el algoritmo de clasificación basado en el procesamiento de señales acústicas para
Se han prestado muchos esfuerzos y atenciones a la protección de cables eléctricos el reconocimiento de dispositivos de excavación y la protección de cables
por parte de la industria y la comunidad de investigación en las últimas décadas. [2-4]. La subterráneos. La extracción de características juega un papel vital en la
colocación de señales de advertencia junto con las direcciones de los cables subterráneos clasificación de señales acústicas y de voz. Los enfoques existentes incluyen el
puede evitar algunas destrucciones provocadas por el hombre. análisis de frecuencia de tiempo[5], transformación wavelet [6], tasa de cruce por
[2]. Sin embargo, las marcas de advertencia generalmente se pasaban por alto durante el funcionamiento. cero (ZCR) [7], coeficientes cepstrales de predicción lineal (LPCC) [8], Coeficientes
cepstruales de frecuencia Mel (MFCC) [9], etc. También se investigan algoritmos
populares de clasificación estadística e inteligente para la clasificación acústica,
∗ Autor correspondiente. como la red neuronal artificial [10], modelo de Markov oculto (HMM) [11], Modelo
Dirección de correo electrónico: jwcao@hdu.edu.cn (J. Cao). de mezcla gaussiana (GMM)

http://dx.doi.org/10.1016/j.neucom.2016.03.113 0925-2312 / ©
2017 Elsevier BV Todos los derechos reservados.

Cite este artículo como: J. Cao et al., Clasificación de equipos de excavación basada en características mejoradas de MFCC y ELM, Neurocomputing
(2017), http://dx.doi.org/10.1016/j.neucom.2016.03.113
JID: NEUCOM
ARTÍCULO EN PRENSA [m5G; 20 de febrero de 2017; 13: 38]

2 J. Cao y col. / Neurocomputación 000 (2017) 1–11

vector. Para abordar estos problemas, propusimos un algoritmo de clasificación


novedoso en este artículo. Primero, se construye una base de datos acústica de
referencia de los cuatro dispositivos de excavación que se recolectan en diversas
condiciones de operación en un sitio de construcción de metro. Luego, se desarrolla un
enfoque mejorado de extracción de características basado en MFCC que puede
caracterizar de manera eficiente la dinámica de la acústica. Las características de
diferencia de primer y segundo orden de MFCC, denotadas como-MFCC y
- 2MFCC, respectivamente, se extraen para elaborar la característica dinámica de
la acústica entre fotogramas consecutivos. La red neuronal artificial con nodos
ocultos generados aleatoriamente se emplea para construir el clasificador. Las
redes neuronales Feedword (FNN) se benefician mucho de los parámetros
generados aleatoriamente, no solo en la velocidad de aprendizaje sino también en
el rendimiento de generalización. Los FNN representativos que utilizan
parámetros de nodo ocultos generados aleatoriamente incluyen la famosa red de
enlace funcional de vector aleatorio (RVFL)[17,18] y la reciente y popular máquina
Figura 1. Informes sobre las proporciones de fallas de cables recopilados de 2009 a 2011 de State Grid.
de aprendizaje extremo (ELM) [24–31]. ELM se emplea como algoritmo de
entrenamiento en este documento porque su capacidad de procesamiento en
tiempo real es crucial para el reconocimiento de dispositivos de excavación.
También se proporcionan experimentos reales para mostrar la eficiencia de
nuestro método propuesto.
El resto del artículo está organizado de la siguiente manera: Sección
2 presenta una breve introducción sobre los antecedentes del artículo.
Seccion 3 describe el marco propuesto del algoritmo de clasificación
para dispositivos de excavación, incluida una descripción detallada del
algoritmo de extracción de características MFCC, el mejorado -MFCC y -
2Características de MFCC y el clasificador ELM. Sección 4 muestra los
resultados experimentales y las comparaciones. EnSección 4. Las
conclusiones y desafíos de la investigación futura se muestran en
Sección 5.

2. Enunciado del problema

Las destrucciones de cables subterráneos causadas por daños externos en la


parte continental de China recibieron gran atención en los últimos años. Los
dispositivos de excavación utilizados en sitios de operaciones reales, incluidas las
construcciones de subterráneos, desarrollos inmobiliarios, construcciones de
carreteras, etc., son las principales fuentes de destrucciones externas en las fallas
de cables. Es muy deseable un sistema de vigilancia que pueda detectar
automáticamente las fuentes de excavación antes de que se produzcan
destrucciones dentro del alcance de los cables subterráneos. Los enfoques de
protección de cables existentes no pueden adoptarse como un sistema de
vigilancia las 24 horas por una razón u otra. Por lo tanto, nuestro objetivo es
desarrollar un nuevo sistema de vigilancia que pueda funcionar en diversos
Figura 2. Cuatro equipos de excavación representativos. entornos. Se pueden adoptar ondas acústicas generadas por dispositivos de
excavación para diseñar tal sistema de vigilancia.
La recopilación de datos reales, el reconocimiento preciso y la respuesta
[12], etc. Aunque la clasificación acústica se ha estudiado bien en rápida son partes clave en el diseño del sistema de vigilancia. Primero construimos
aplicaciones del lenguaje natural, procesamiento del habla y una base de datos acústica de referencia con cuatro dispositivos representativos
procesamiento del sonido ambiental, consulte [13-15] y referencias allí, de excavación de carreteras en este documento. Todos los datos se recopilan en
se han reportado pocos logros en la clasificación de maquinaria de un sitio de construcción de metro real.Fig. 3 representa las señales acústicas del
construcción. La falta de una base de datos eficaz y los ruidos de fondo martillo hidráulico recogidas a diferentes distancias (3 m, 18 m, 36 m) y Figura 4
del entorno complejo son los dos desafíos principales. muestra las señales acústicas mediante martillo eléctrico, cortadora y excavadora
En este artículo, analizamos cuatro dispositivos de excavación representativos, a una distancia de 15 m, respectivamente. Como se puede observar, las señales
a saber, máquina cortadora, martillo eléctrico, excavadora y martillo eléctrico, acústicas por martillo hidráulico y martillo eléctrico están cerradas a periódicas en
como se muestra en Figura 2. Son los dispositivos más destructivos para los cables general. Mientras que para la máquina cortadora y la excavadora, no exhiben
subterráneos. En el trabajo anterior[1], hemos estudiado el desempeño de la propiedades periódicas en el dominio del tiempo. La señal acústica de la
clasificación con base en el coeficiente cepstral de predicción lineal (LPCC) excavadora consiste en el sonido del motor y el choque generado por el cilindro
[dieciséis] de ondas acústicas y la máquina de vectores de soporte (SVM). Aunque de la cuchara y el cilindro del brazo, que está muy relacionado con los hábitos de
la tasa de clasificación informada es alta, el problema es que el buen rendimiento los manipuladores. Además, para todos estos equipos, la forma de onda de la
se basa en datos relativamente limpios y atenuaciones de señal acústica bajas, ya señal acústica generada depende de la estructura geológica en el tamaño de la
que las adquisiciones se encuentran en un rango cercano. Otra escasez en[1] Es el operación. Trabajar en diferentes medios tiene diferentes características. Además,
problema de alta complejidad computacional del clasificador SVM, especialmente los cables subterráneos suelen estar pavimentados a lo largo de la carretera en las
cuando la base de datos incluye muestras grandes y características de alta ciudades urbanas y también pueden producirse diversas interferencias en el
dimensión. entorno complejo.

Cite este artículo como: J. Cao et al., Clasificación de equipos de excavación basada en características mejoradas de MFCC y ELM, Neurocomputing
(2017), http://dx.doi.org/10.1016/j.neucom.2016.03.113
JID: NEUCOM
ARTÍCULO EN PRENSA [m5G; 20 de febrero de 2017; 13: 38]

J. Cao y col. / Neurocomputación 000 (2017) 1–11 3

Fig. 3. Ondas acústicas del martillo hidráulico recogidas desde diferentes distancias.

Figura 4. Ondas acústicas del martillo eléctrico, cortadora y excavadoras recogidas en 15m.

degradar el rendimiento de la clasificación, como los vehículos que pasan, las papel. Después de generar la base de datos de características, se emplea el método ELM
bocinas, el ruido del viento, etc. Todos estos problemas han planteado desafíos rápido para entrenar una red neuronal de palabras de alimentación para la clasificación.
para la clasificación de los equipos de excavación. Es poco probable que un En este documento también se desarrolla una plataforma de vigilancia en tiempo real
clasificador basado en estadísticas simples funcione bien para tal aplicación. para la clasificación de equipos de excavación.
Con este objetivo, diseñamos un clasificador robusto con la ayuda de un algoritmo
inteligente para el reconocimiento de dispositivos de excavación de carreteras en este 3. El sistema de clasificación propuesto
documento. Para garantizar un rendimiento de clasificación estable y convencido, una
base de datos de ondas acústicas relativamente completa que consta de muestras En esta sección, se proporciona una descripción detallada de nuestro
acústicas recolectadas en diversas condiciones de trabajo es el paso esencial y clave. El algoritmo propuesto. Antes de enunciar el enfoque, se describe un diagrama de
enfoque eficaz de extracción de características y el algoritmo de clasificación flujo del sistema de clasificación enFigura 5. Incluye principalmente dos pasos: En
desempeñan un papel fundamental en el reconocimiento. Para reflejar la característica el primer paso, la señal acústica se pretrata para obtener cuadros cortos. El MFCC
dinámica de la señal acústica, proponemos un enfoque mejorado de extracción de de segundo orden (-2MFCC) se extrae la característica de ondas acústicas para
características MFCC que describe las variaciones de primer y segundo orden entre cuatro equipos de excavación para construir la base de datos de capacitación. El
fotogramas consecutivos en este etiquetado-2Características de MFCC obtenidas de cuadros cortos

Cite este artículo como: J. Cao et al., Clasificación de equipos de excavación basada en características mejoradas de MFCC y ELM, Neurocomputing
(2017), http://dx.doi.org/10.1016/j.neucom.2016.03.113
JID: NEUCOM
ARTÍCULO EN PRENSA [m5G; 20 de febrero de 2017; 13: 38]

4 J. Cao y col. / Neurocomputación 000 (2017) 1–11

El MFCC mejorado se extrae del dominio de frecuencia de la escala Mel.


El dominio de frecuencia de la escala Mel describe las características no
lineales de la frecuencia del oído humano, que se pueden expresar
utilizando la siguiente relación de frecuencia de la señal acústica[21]

Fmel = 2595 lg(1 + f /700) (3)

donde Fmel es la frecuencia de la escala Mel y F es la frecuencia de la señal


acústica. Para describir eficientemente la característica dinámica de las
Figura 5. El diagrama de flujo del sistema de clasificación de dispositivos de excavación.
ondas acústicas entre diferentes cuadros, desarrollamos un algoritmo de
extracción de características MFCC mejorado a continuación. Los pasos de
cálculo detallados son
se utilizan como muestras de referencia para el aprendizaje de
clasificadores. Una red neuronal feedforward se entrena con el algoritmo 1. DFT (transformada discreta de Fourier)
ELM como clasificador. En el segundo paso, el-2La función MFCC se calcula Para derivar el espectro X(k), la transformada discreta de Fourier (DFT) se
en un marco pequeño después del preprocesamiento. La categoría de una realiza en la señal acústica de marco de tiempo corto X(norte) [22,23], es
muestra de prueba se decide utilizando el clasificador ELM previamente decir
entrenado. Cada bloque mostrado enFigura 5 define una operación del
∑1
norte-

algoritmo. Funcionalmente, el algoritmo se puede describir en tres


X (k) = x (n) e- j2πnk / N, (0≤k≤NORTE) (4)
procedimientos, a saber, la fase de preprocesamiento de la señal, la fase de
norte= 0

extracción de características y la fase de clasificación, que se ilustran en


detalle a continuación, respectivamente. norte es el número de muestras en cada fotograma.
2. Cálculo del espectro de potencia

3.1. Preprocesamiento El espectro de poder disperso PAGSmetro para el espectro de la señal X(k) se
obtiene tomando el cuadrado de su módulo de la siguiente manera

El preprocesamiento de la señal acústica es la base de todo el sistema de


PAGSmetro = X (k).∧X (k) (5)
clasificación, incluido el pre-énfasis de la señal, el encuadre de la ventana y la
detección del punto final. La detección de punto final generalmente se aplica a la 3. Filtro de triángulo Mel
señal acústica para determinar los puntos de inicio y finalización de la señal El espectro de Mel se obtiene por PAGSmetro en banco de filtros
acústica. triangular. En cada frecuencia, el producto dePAGSmetro y filtros Hmetro(k)
es calculado. DefiniendoMETRO filtros triangulares en el banco de filtros,
3.1.1. Pre-énfasis estos filtros son lineales en las coordenadas de frecuencia Mel. La
El filtro de preacentuación H(Z) se utiliza para amplificar los amplitud de cada filtro triangular en el banco de filtros es equivalente a
componentes de alta frecuencia de una señal acústica de entrada [19]. la escala Mel. En este artículo, el valor del intervalo se establece en
Después de pasar por el filtro de preacentuación, los ruidos aleatorios se 122,929 Mel en este artículo. La respuesta de frecuencia del filtro
pueden suprimir eficazmente. La siguiente ecuación da la expresión del filtro triangular.Hmetro(k) se determina como
H(Z) ⎧
k <f (m - 1)
H (Z) = 1 - μZ−1 (1) ⎪⎪⎪0,
⎨ 2(k- f (m−1))
f (m - 1) ≤ k ≤ f (m)
( f (m+1)- f (m−1)) ( f (m)- f (m−1)) ,
donde el coeficiente μ suele estar dentro de (0,9, 1). Hmetro(k) =
⎪⎪⎩ ( f (m+1)- f (m2−1f))((m +1)-k)
f (m) ≤ k ≤ f (m + 1)
⎪ ( f (m+1)- f (m)) ,
3.1.2. Marco de ventana 0, k ≥ f (m + 1)
Dado que la señal acústica tiene la variabilidad en el tiempo, la señal acústica
(6)
mecánica suele permanecer estable entre 50 ms y 200 ms. Por lo tanto, la
extracción de características en un marco corto con un tamaño de marco de 50 a donde metro = 1, 2,. . . ,24, F(metro) es la frecuencia central, y k = 1, 2,. . . ,
200 ms es razonable. La característica principal de las señales acústicas generadas NORTE/2 - 1. La curva de respuesta del banco de filtros de paso de banda de
por los equipos de excavación se puede extraer completamente en el marco corto. ventana triangular en frecuencia Mel se muestra en Figura 6. Aquí tenemos
Para realizar una transición suave entre fotogramas, se suelen adoptar
superposiciones del 50% entre fotogramas consecutivos durante la extracción de
características. La función de ventana de HammingW(norte) se elige para el
∑1
METRO-

Hmetro(k) = 1 (7)
encuadre de la señal, ya que tiene un buen rendimiento en resolución de
metro= 0
frecuencia y una fuga espectral aceptable. [20]. La siguiente ecuación proporciona
una descripción detallada de la función de la ventana de Hamming 4. El espectro logarítmico S(metro)
Para que los resultados sean más robustos al ruido y a los errores de
W (n) = (1 - α) - α porque(2πn / (N - 1)), 0 ≤ norte ≤ norte - 1 (2) estimación, el espectro logarítmico S(metro) del espectro de potencia en cada
donde α es un valor empírico y generalmente se establece en 0.46 [48]; norte cuadro se calcula mediante una operación logarítmica como
denota el número de muestras en cada fotograma. ( )
∑1
norte-

2
S (m) = en |PAGS
metro| Hmetro(k) (0 ≤ metro ≤ METRO) (8)
3.2. La extracción mejorada de características de MFCC
k= 0

La extracción de características de la señal acústica es el paso clave del donde Hmetro(k) es el banco de filtros, S(metro) es el espectro logarítmico,
sistema de clasificación, que también juega un papel dominante en el PAGSmetro es el espectro de potencia disperso, y METRO es el número de
desempeño de la clasificación. A continuación, propusimos un algoritmo bancos de filtros.
basado en extracción de características MFCC mejorado para señales 5. Transformada de coseno discreta (DCT)
acústicas de dispositivos de excavación. El procedimiento de cálculo La variación DCT se utiliza principalmente para calcular los componentes
detallado se da a continuación. del espectro de diferentes bandas de frecuencia, lo que hace que el

Cite este artículo como: J. Cao et al., Clasificación de equipos de excavación basada en características mejoradas de MFCC y ELM, Neurocomputing
(2017), http://dx.doi.org/10.1016/j.neucom.2016.03.113
JID: NEUCOM
ARTÍCULO EN PRENSA [m5G; 20 de febrero de 2017; 13: 38]

J. Cao y col. / Neurocomputación 000 (2017) 1–11 5

3.3. El clasificador ELM

ELM fue propuesto por Huang et al. para la red neuronal de alimentación
directa de una sola capa oculta en 2004 y su capacidad de aproximación
universal se demostró en 2006-2008[24-26]. Logros recientes en ELM,
incluido el ELM multicapa, el ELM basado en campos receptivos locales[32–
34], etc. El principal mérito de ELM es que todos los nodos ocultos se
generan aleatoriamente y son independientes de los datos de
entrenamiento. En la etapa de entrenamiento de ELM, solo necesita
determinar el número de nodos ocultos y calcular los pesos de salida
[35]. Los algoritmos ELM basados en poda recientes han demostrado además
que el número de neuronas ocultas de ELM se puede determinar
automáticamente con el1-enfoque de regularización [36,37]. En comparación con
los algoritmos de aprendizaje populares tradicionales, ELM aprende mucho más
rápido y, a menudo, tiene una mejor capacidad de generalización.[38–45].
En este documento, ELM se aplica para entrenar un modelo de
redes de alimentación directa de una sola capa oculta (SLFN) con
múltiples entradas y salidas. DenotarX j = (X j1, X j2,. . .X jm)T como vector
de entrada, y j = (y j1, y j2,. . . ,y jn)T el vector de salida de la red, y t j =
Figura 6. El filtro triangular Hmetro(k). (t j1, t j2,. . .t jn)T como vector de salida objetivo, el modelo de red de un
SLFN es
∑r
vector de dimensión independientes entre sí. Los coeficientes MFCC Fr (X j ) = βIGRAMOI(X j ), j = 1, 2,. . . ,r (12)
basados en la variación DCT se derivan como I= 1

∑1
norte- donde βI = [βI1, βI2 · · · βen] T es el vector de peso que une el Ith
C (n) = S (m) porque(πNuevo Méjico - 0.5) /M), (0 ≤ norte ≤ METRO) (9) capa oculta al nodo de salida, r es el número de neuronas ocultas y
metro= 0 GRAMOI(Xj) es una función aditiva de nodo oculto como

C(norte) son los coeficientes MFCC. GRAMOI(X j ) = GRAMO(aI · X j + BI ) (13)


6. Extracción de características dinámicas Aquí, aI = [aI1, aI2,. . . ,aestoy] es el vector de peso que une la capa de
Con la descripción anterior, se sabe que los coeficientes MFCC solo entrada con la Ila capa oculta. BI es el umbral de Ith neurona oculta. aI ·
extraen la información estática del espectro de la señal acústica. Los X j denota el producto interno de aI y X j .
resultados experimentales muestran que la información dinámica del Se ha demostrado la capacidad de aproximación universal de ELM para
espectro acústico también contiene abundante información acústica, un SLFN estándar. Es decir, para cualquier función de activación
que se puede utilizar para mejorar la tasa de clasificación del sistema de infinitamente diferenciable y parámetros de nodo ocultos generados
clasificación de dispositivos de excavación de carreteras. Para reflejar la aleatoriamente con cualquier distribución de probabilidad continua, el SLFN
información dinámica de la señal acústica, el-MFCC se obtiene por la conr = norte los nodos ocultos pueden aproximarse con probabilidad uno
primera diferencia de MFCC. El cambio del espectro de audio con el norte Muestras distintivas sin error.
tiempo se puede expresar enEq. (10). En este caso, los parámetros ∥ ∥
∥∥∑ r ∥
dinámicos se denominan combinación lineal del fotograma actual y los ∥
lim ∥ I · X j + BI ) - t j∥ = 0, j = 1, 2, · · · , norte (14)
r→ ∞ ∥
I
β GRAMO( a
dos fotogramas anteriores.
I= 1

I=k

1 norte es el número total de muestras. Específicamente, para suficiente ocultación
D (n) = √ I · C (n + I) (10) nodos, la expresión anterior se puede simplificar de la siguiente manera
I=∑k
I2 I= -k Hβ=T (15)
I= -k
H es la matriz de salida de la capa oculta, y su ILa línea representa la salida
C (n + I) es un marco de parámetros acústicos, D(norte) es la primera de la Ila muestra de entrenamiento para todos los nodos ocultos, y el jLa
diferencia de los coeficientes MFCC. k el valor se establece en 2 en este columna indica la salida de todas las muestras de entrenamiento en el jth
documento. nodos ocultos. Es decir
⎛ ⎞
Similar a (10), podemos obtener la segunda diferencia de parámetros GRAMO(a1 · X1 + B1) ··· GRAMO(ar · X1 + Br )
MFCC en el siguiente ⎜ ⎟
H=⎝ ...
...
...
⎠ (dieciséis)

I=k

1 GRAMO(a1 · Xnorte + B1) ··· GRAMO(ar · Xnorte + Br )
D2(norte) = √ I · D (n + I) (11) norte×r

I=∑k I= -k En ELM, aI y BI se puede generar aleatoriamente. Por lo tanto, la matriz de


I2
I= -k
salida de la capa ocultaH es conocida. El proceso de aprendizaje del
algoritmo ELM simplemente se considera para resolverβ, que se puede
Para probar la eficiencia del algoritmo de extracción de características, se utilizan derivar resolviendo el problema de mínimos cuadrados [46,47]
dos combinaciones de las características de MFCC. El primero combina las min ||Decir ah1, a2,. . . ,ar, B1, B2,. . . ,Br ) β - T || (17)
características de MFCC y su primer vector de diferencia en(10) para formar un vector β
de características de 24 dimensiones. El segundo usa las características de MFCC, el llevando a
primer vector de diferencia en(10) y el segundo vector de diferencia en (11) para
construir un vector de características de 36 dimensiones. Los experimentos
β = +HT (18)
muestran que el rendimiento del reconocimiento se puede mejorar Aquí, H+ es la matriz inversa generalizada de Moore-Penrose de la
significativamente con estas combinaciones. matriz de salida H.

Cite este artículo como: J. Cao et al., Clasificación de equipos de excavación basada en características mejoradas de MFCC y ELM, Neurocomputing
(2017), http://dx.doi.org/10.1016/j.neucom.2016.03.113
JID: NEUCOM
ARTÍCULO EN PRENSA [m5G; 20 de febrero de 2017; 13: 38]

6 J. Cao y col. / Neurocomputación 000 (2017) 1–11

Empleando el enfoque mejorado de extracción de características MFCC y tabla 1


Recolección de datos de distancias de cuatro dispositivos.
el clasificador ELM eficaz, proponemos un marco de reconocimiento de
dispositivos de excavación novedoso basado en la clasificación de señales Clase Tipo de equipo de excavación Distancia (m)
acústicas en esta sección. Después de extraer el-2MFCC de la captura de 1 Martillo electrico 5–40
onda acústica en un marco corto, el vector de características se alimentará a 2 Maquina de cortar 5–40
un clasificador ELM previamente entrenado. La salida de la red se utiliza 3 Excavador 5–40
para decidir la categoría de la señal acústica. Para resumir, un pseudocódigo 4 Martillo hidraulico 5–150

que ilustra el algoritmo de clasificación propuesto en detalle se da en


Algoritmo 1. En el pseudocódigo, "Enframe (·) ”
construir la base de datos de referencia. Las señales acústicas generadas por
Algoritmo 1 El algoritmo de clasificación del dispositivo de excavación cuatro dispositivos se recopilan a diferentes distancias de propagación para hacer
propuesto. que la base de datos sea más robusta. Para las pruebas de campo, se desarrolla
una plataforma de software para realizar la clasificación en tiempo real. La interfaz
Aporte: Un conjunto de entrenamiento {(X j, t j )}norte , función de activación G (x), y
j= 1
de usuario y los protocolos de comunicación se establecen utilizando el software
número de nodo oculto L, un conjunto de muestras de señales acústicas de prueba x
LabVIEW. Mientras tanto, el algoritmo de extracción de características
(n)
desarrollado, así como el clasificador, se ejecutan en el entorno Matlab R2014a.
Producción: etiqueta de clase de y
Todos los experimentos se llevan a cabo en una PC normal. La configuración
1: Genere aleatoriamente parámetros de nodo ocultos (WI, BI ), I =
detallada de los experimentos, los resultados y las comparaciones sobre estos dos
1, 2,. . . ,L;
aspectos se describen a continuación.
2: Calcular H (W1, W2,. . . ,WL, X1, X2,. . .Xnorte, B1, B2,. . .BL);
3: Determine la matriz de ponderación de salida β = H+T ;
4.1. Experimentos con datos reales
4: En la etapa de prueba, el filtro de pre-énfasis H (Z) se utiliza para em-
enfatizar los componentes de alta frecuencia de x (n);
Para obtener un algoritmo de clasificación convincente, todas las señales
5: xx = Bordear(x (n),FramLen, FramLen/2);
acústicas se capturan en una condición relativamente ideal en la que no se
6: FramLen es la longitud del marco. xx es la señal acústica después
presentan reflejos significativos ni ruidos de fondo. Las señales acústicas de
enmarcado;
cuatro dispositivos de excavación, a saber, martillo hidráulico, cortadora,
7: por I = 1 a tamaño (xx, 1) hacer
excavadora y martillo eléctrico, se registran para construir la base de datos
8: y = xx (yo : 1)
de referencia. Además, las señales acústicas de los vehículos que pasan
9: después de que el proceso de la ventana de Hamming sea s
también se registran como la quinta categoría para el entrenamiento de
10: PAGS = X (k).∧X (k), P es el espectro de potencia disperso;
clasificadores. Se utilizó una matriz de sensores de micrófono de capa
11: El espectro de Mel se obtiene por PAGS en banco de filtros
cruzada con 8 canales para la recolección de señales acústicas, que tiene una
triangular;
frecuencia de muestreo de 20 kHz y una precisión de muestreo de 16 bits.
12: cc = Melbankm ∗ PAGS;
Las señales de prueba se recogen en un sitio de construcción real durante el
13: Una operación logarítmica para obtener el espectro logarítmico S
día. Además, para hacer el sistema más robusto, señales acústicas de
(m).
martillo hidráulico, cortadora, La excavadora y el martillo eléctrico se
14: Los coeficientes MFCC C (n) basado en la variación de DCT.
capturan a diferentes distancias de propagación. En resumen, enumeramos
METRO∑
-1 la distancia de propagación de los cuatro dispositivos entabla 1. La distancia
15: C (n) = S (m) porque(πNuevo Méjico - 0.5) /METRO), (0 ≤ norte ≤ METRO)
máxima de propagación del martillo eléctrico, la cortadora y la excavadora
metro= 0

dieciséis: final para


es de 40 m. La degradación de la señal aumenta drásticamente cuando la
17: El -MFCC se obtiene por la primera diferencia de MFCC. distancia entre el sensor y las fuentes supera los 40 m para estos tres
∑k
I= dispositivos. Mientras que para el martillo hidráulico, la matriz de sensores
18: D (n) = √ 1 I · C (n + I) aún puede capturar una señal acústica efectiva a más de 150 m de distancia.
∑k
I=
I2 I= -k
I= -k
Para la extracción de características, la longitud del fotograma se establece en 4096
19: La segunda diferencia de parámetros MFCC.
puntos y la superposición del fotograma se establece en un 50% para hacer una
∑k
I=
20: D2(norte) = √ 1 I · D (n + I) transición suave en fotogramas consecutivos. La ventana Hamming se aplica para
∑k I2 I= -k
I=
eliminar los efectos de borde causados por el bloqueo del marco. El MFCC general y las
I= -k
características desarrolladas de MFCC de primer y segundo orden (-MFCC y
21: El -2Las características de MFCC se extraen para construir la prueba.
- 2MFCC) se extraen para la representación de señales acústicas.
Figura 7 muestra el -2MFCC cuenta con señales acústicas recopiladas por
base de datos

22: Calcular la salida o de ELM con respecto a y


el martillo eléctrico, el martillo hidráulico, la cortadora y la excavadora a una
23: Etiqueta(y) = arg max(o)
distancia de propagación de 20 m. Es obvio que el mismo dispositivo
D∈ [1,2, ...,metro]
muestra una distribución similar de la-2Características de MFCC, mientras
que diferentes dispositivos tienen diferentes características de la -2
denota la función que genera un marco corto donde X(norte) es la señal Funciones de MFCC. Además, el martillo eléctrico, el martillo hidráulico y la
original, FramLen significa la longitud de la trama y FramLen / 2 representa cortadora tienen una mayor concentración en-MFCC y -2MFCC que el de la
la superposición de la trama. La función “Melbankm” denota el banco de excavadora.
filtros triangular Mel. Para cada tipo de función, a saber, MFCC, -MFCC y -2MFCC, se extraen 1000
muestras para cada dispositivo, así como el ruido de fondo. Por lo tanto, en este
4. Experimentos experimento se construyen tres bases de datos de características acústicas, donde
cada una contiene 5000 vectores de características. Para validar la eficacia del
Para demostrar la eficacia de nuestro marco de clasificación propuesto, método de extracción de características propuesto y el algoritmo de clasificación,
en esta sección se informan los resultados experimentales realizados con se seleccionan al azar 4000 muestras de la base de datos para el entrenamiento
datos reales recopilados y pruebas de campo. Para los experimentos, la del clasificador y las 1000 restantes se utilizan para las pruebas. Para cada base de
señal acústica de cuatro dispositivos de excavación, así como el ruido de datos, el rendimiento de ELM se compara con la retropropagación convencional.
fondo, se capturan en un sitio de construcción de metro real para

Cite este artículo como: J. Cao et al., Clasificación de equipos de excavación basada en características mejoradas de MFCC y ELM, Neurocomputing
(2017), http://dx.doi.org/10.1016/j.neucom.2016.03.113
JID: NEUCOM
ARTÍCULO EN PRENSA [m5G; 20 de febrero de 2017; 13: 38]

J. Cao y col. / Neurocomputación 000 (2017) 1–11 7

Figura 7. El -2Características del MFCC de cuatro dispositivos de excavación representativos.

Tabla 2
Rendimiento de clasificación con función MFCC.

Clasificador Tiempo / s de entrenamiento Tiempo de prueba / s Exactitud

BP 26.989 0,099 81,51%


OLMO 0,636 0,050 83,51%

Tabla 3
Rendimiento de clasificación con -Característica MFCC.

Clasificador Tiempo / s de entrenamiento Tiempo de prueba / s Exactitud

BP 28.343 0.0914 83,88%


OLMO 0,626 0.033 84,87%

Cuadro 4
Rendimiento de clasificación con -2Característica MFCC.

Clasificador Tiempo / s de entrenamiento Tiempo de prueba / s Exactitud

BP 24.337 0.087 87,01%


OLMO 0,800 0,025 87,02%

Figura 8. Rendimiento de ELM en MFCC, -MFCC y -2MFCC.

(BP) método. Los resultados promedio de 30 ensayos independientes se


informan para comparar el desempeño. ELM para cada muestra de datos de entrada es de aproximadamente 0.03 s, que también
Las tasas de clasificación para diferentes características (MFCC, -MFCC, es menor que BP. Por lo tanto, ELM es más eficaz debido a que adopta los parámetros de
- 2MFCC) se enumeran en Tablas 2-4, que se obtienen mediante clasificadores BP nodo ocultos aleatorios y la estrategia de aprendizaje sin ajustes.
y ELM, respectivamente. Se observa que la tasa de clasificación más alta se obtiene Además, también probamos el rendimiento de clasificación por ELM con
por propuesta-2Características de MFCC que se combinan con el clasificador ELM, respecto a diferentes números de nodos ocultos. Se prueban 11 números
es decir, 87,02%. Al emplear las características mejoradas de MFCC propuestas, el diferentes de nodos ocultos de la siguiente manera
rendimiento de clasificación es generalmente mejor que usar el MFCC original, así
r = {40, 60, 80, 100, 120, 140, 160, 180, 200, 220, 240}.
como-MFCC. El tiempo de entrenamiento de ELM es menos de 1 s, que es más de
30 veces más rápido que el algoritmo BP. Asimismo, el tiempo de prueba calculado Figura 8 muestra la precisión de clasificación en MFCC, -MFCC y
por - 2Características de MFCC, respectivamente. Se puede ver que la clasificación

Cite este artículo como: J. Cao et al., Clasificación de equipos de excavación basada en características mejoradas de MFCC y ELM, Neurocomputing
(2017), http://dx.doi.org/10.1016/j.neucom.2016.03.113
JID: NEUCOM
ARTÍCULO EN PRENSA [m5G; 20 de febrero de 2017; 13: 38]

8 J. Cao y col. / Neurocomputación 000 (2017) 1–11

Figura 9. La plataforma de software desarrollada para la clasificación de dispositivos de excavación.

Cuadro 5
Rendimiento de clasificación con -2MFCC en cuatro dispositivos
de excavación.

Clasificador Prueba (%) Tiempo de prueba / s

Martillo electrico 87.353 0.039


Martillos hidraulicos 88.690 0,016
Maquina de cortar 96.295 0.039
Excavador 74.275 0,012

La tasa de activación aumenta cuando se utilizan más nodos ocultos en ELM


en general. Las tres características muestran la misma tendencia. También
vale la pena señalar que cuando el número de nodos ocultos es superior a
160, la propuesta-2MFCC rinde consistentemente mejor que la característica
original de MFCC, así como -MFCC.
Para verificar aún más la precisión de la propuesta -2En esta sección se
lleva a cabo el MFCC, otro experimento en el que se recolecta un nuevo
grupo de muestras acústicas de prueba de cuatro dispositivos de excavación
en un sitio de construcción diferente. El clasificador ELM entrenado
anteriormente se emplea para probar la solidez del algoritmo de extracción
Figura 10. La señal acústica y los resultados de la predicción del martillo eléctrico.
de características.Cuadro 5 enumera las precisiones de clasificación de los
cuatro dispositivos de excavación obtenidos con -2Características de MFCC,
respectivamente. Como se muestra en la tabla, ELM combinando con el-2 La luz de la categoría correspondiente se encenderá, como se muestra en Figura 9.
MFCC funciona bien en general. La tasa de reconocimiento de la máquina En las pruebas de campo, se utiliza una matriz de sensores de micrófono cruzado
cortadora es superior al 96,295%. La peor es la excavadora. La razón con 8 canales para recolectar las muestras acústicas, que tiene una frecuencia de
principal es que la señal acústica generada por la excavadora decae muestreo de 20 kHz y una precisión de muestreo de 16 bits. La longitud del cuadro
drásticamente cuando aumenta la distancia de propagación. se establece en 4096 puntos. La señal digital muestreada se envía luego a un
portátil que se instaló con nuestra plataforma de software enun previo. Los
4.2. Experimentos en pruebas de campo experimentos de las pruebas de campo se llevan a cabo en un sitio de
construcción real del metro y los resultados se informan a continuación.
Para demostrar la eficacia de nuestro marco de clasificación
desarrollado, también realizamos experimentos en pruebas de campo y Higos. 10-12 mostrar los resultados de clasificación de las pruebas de
mostramos los resultados en esta sección. Nuestro grupo de investigación campo realizadas por nuestra plataforma de software desarrollada. En cada
ha desarrollado una plataforma de software que utiliza LabVIEW para el figura, se da la onda acústica de captura real y la etiqueta correspondiente
desarrollo de protocolos de interfaz y comunicación combinada con Matlab en cada cuadro pequeño. Se reportan los resultados en tres equipos,
para la extracción de características y las implementaciones de algoritmos martillo eléctrico, cortadora y martillo hidráulico donde las longitudes de
de clasificación para pruebas de campo.Figura 9 muestra una captura de captura de estos equipos son 20 s, 20 sy 15 s, respectivamente. Como se
pantalla de la interfaz del software, donde la señal acústica recopilada real demuestra en estas figuras, la plataforma de software desarrollada logra
se desplaza en el lado izquierdo y la categoría estimada correspondiente por resultados de clasificación prometedores durante las pruebas de campo.
nuestro algoritmo propuesto se muestra en el lado derecho de la interfaz. En Para ilustrar aún más la efectividad de la plataforma, también se llevan a cabo
este software, la etiqueta prevista de la señal acústica capturada real está experimentos de pruebas de campo a diferentes distancias para diferentes
restringida a cinco categorías, a saber, máquina cortadora, martillo eléctrico, equipos de excavación en esta sección. En comparación con el uso de la tasa de
excavadora, martillo hidráulico y ruido de fondo. Una vez que se asigna una reconocimiento, la tasa de falsos positivos es más importante para un sistema de
etiqueta a la muestra de prueba, el monitoreo en tiempo real en los dispositivos de excavación que reconocen.

Cite este artículo como: J. Cao et al., Clasificación de equipos de excavación basada en características mejoradas de MFCC y ELM, Neurocomputing
(2017), http://dx.doi.org/10.1016/j.neucom.2016.03.113
JID: NEUCOM
ARTÍCULO EN PRENSA [m5G; 20 de febrero de 2017; 13: 38]

J. Cao y col. / Neurocomputación 000 (2017) 1–11 9

Tabla 6
La tasa de reconocimiento y las comparaciones de MRR en los cuatro dispositivos.

Eléctrico Corte Hidráulico Excavador


martillo (%) máquina (%) martillo (%) (%)

10m 91,46 98,43 95,52 56,32


MRR 1,22 0 0 28,42
20m 88,64 97,52 89,36 53,54
MRR 0 0 0 38,38
30m 85,35 96,00 87,50 44,33
MRR 2.02 1,54 2,78 26,67
40m 76,19 91,18 81,58 23,33
MRR 3,70 2,94 13.16 56,67
50m 70,31 84,68 71,79 10.11
MRR 2,62 8.11 8.33 85,77

Tabla 7
La tasa de reconocimiento y las comparaciones de MRR con la estrategia de voto mayoritario.

Eléctrico Corte Hidráulico Excavador


martillo (%) máquina (%) martillo (%) (%)

10m 98,75 100 100 57,45


Figura 11. La señal acústica y los resultados de la predicción de la cortadora. MRR 0 0 0 38.30
20m 93,75 100 100 51.02
MRR 0 0 0 38,78
30m 89,87 100 92,64 43,24
MRR 2,49 0 2,32 33,78
40m 86,96 97,96 85,47 5.15
MRR 0 0 0 88,66
50m 83,93 96,00 72,73 1,52
MRR 1,79 4,00 0 96,97

Generalmente tienen características similares a los sonidos del motor al


pasar los vehículos. Además, la atenuación de los sonidos del motor a larga
distancia es grave. Por lo tanto, se cree que la característica acústica actual
no es eficiente para identificar la excavadora de los ruidos de fondo, lo que
merece más atención en el futuro.
Vale la pena señalar que todos los resultados informados anteriormente se
basan en un solo marco acústico. Empleando el índice máximo del vector de salida
para la predicción, la tasa de reconocimiento basada en un solo cuadro y la MRR
obtenida por ELM pueden no ser confiables. En lugar de adoptar un solo marco,
empleamos una estrategia de fusión basada en la votación por mayoría utilizando
marcos múltiples para la predicción de dispositivos de excavación en este
Figura 12. La señal acústica y los resultados de la predicción del martillo hidráulico. experimento. Al igual que en el experimento anterior, el-2La función MFCC y el
algoritmo ELM se emplean para la clasificación acústica. Se informa la tasa de
reconocimiento y MRR en señales acústicas en varias distancias. Para una
nición para la protección de cables subterráneos. Es destructivo que los predicción, se utiliza un segmento de señales acústicas con seis fotogramas
dispositivos de excavación se hayan reconocido falsamente como ruidos de fondo. consecutivos y se utiliza el método de votación por mayoría que integra el
Como alternativa al uso del falso positivo, mostramos la tasa de informe faltante resultado de cada fotograma. Para garantizar un rendimiento de reconocimiento
(MRR) en esta sección para realizar comparaciones, lo cual es más apropiado fluido, en el experimento se establecen superposiciones del 40% de la señal
debido a que generalmente existen múltiples dispositivos de excavación en la acústica entre segmentos consecutivos. Tabla 7 muestra las comparaciones sobre
aplicación y solo en el caso de que los dispositivos de excavación hayan sido la tasa de reconocimiento y MRR utilizando nuestro método de fusión con seis
reconocidos falsamente como el el ruido de fondo es crucial para las protecciones fotogramas consecutivos. En comparación con los resultados de las predicciones
de cables subterráneos. El mejorado-2Las características de MFCC se utilizan para con un solo fotograma enTabla 6, es evidente que las tasas de reconocimiento del
la representación de señales acústicas y el algoritmo ELM se adopta como martillo eléctrico, la cortadora y el martillo hidráulico se han mejorado para todas
clasificador en este experimento. Para cada dispositivo, el MRR se define como su las distancias. Mientras tanto, sus MRR correspondientes generalmente se
tasa de reconocimiento falso del ruido de fondo. En aplicaciones reales, es obvio reducen, especialmente para largas distancias. Por ejemplo, la estrategia de
que cuanto más bajo es el MRR, más robusto es el sistema de reconocimiento. votación por mayoría ofrece una mejora del 13,62%, 11,32% y 0,94% en la tasa de
Para cada dispositivo,Tabla 6 muestra la tasa de reconocimiento y las reconocimiento sobre la predicción basada en un solo cuadro (que se muestra en
comparaciones de MRR en señales acústicas recopiladas de 10 ma 50 m. Como se Tabla 6) para martillo eléctrico, cortadora y martillo hidráulico, respectivamente,
muestra en la tabla, aunque la tasa de reconocimiento del martillo eléctrico está cuando la distancia es de 50 m. Además, los MRR se han reducido al 1,79%, 4% y
disminuyendo, su MRR permanece constantemente bajo para todas las distancias 0%, en consecuencia. Sin embargo, la tasa de reconocimiento y MRR son peores
probadas. Para la máquina cortadora y el martillo hidráulico, el MRR es aceptable que los obtenidos mediante la predicción utilizando un solo bastidor para
cuando las distancias entre el sensor y las fuentes no superan los 40 my 30 m, excavadora (como se subraya enTabla 7). Esto se debe principalmente a que el
respectivamente. Sin embargo, para excavadoras, su MRR es alto para todas las MRR de la predicción basada en un solo bastidor es demasiado alto para la
distancias. El MRR generalmente aumenta cuando la distancia aumenta, como se excavadora. En lugar de mejorar el rendimiento del reconocimiento, la estrategia
subraya enTabla 6. Esto se debe principalmente a que los sonidos del motor se de fusión basada en la votación por mayoría que utiliza varios marcos aumenta el
utilizan para el reconocimiento de la excavadora, MRR para la excavadora.

Cite este artículo como: J. Cao et al., Clasificación de equipos de excavación basada en características mejoradas de MFCC y ELM, Neurocomputing
(2017), http://dx.doi.org/10.1016/j.neucom.2016.03.113
JID: NEUCOM
ARTÍCULO EN PRENSA [m5G; 20 de febrero de 2017; 13: 38]

10 J. Cao y col. / Neurocomputación 000 (2017) 1–11

5. Conclusiones y labor futura [10] P. Gao, Estudio sobre la optimización del clasificador de redes neuronales de
retropropagación, Universidad de Ciencia y Tecnología de Huazhong, 2012.
[11] T. Nguyen, A. Khosravi, D. Creighton, Modelos de markov ocultos para la clasificación del
Los cables subterráneos de alta tensión sufrieron graves destrucciones por cáncer mediante perfiles de expresión génica, Inf. Sci. 316 (2015) 293–307.
dispositivos de exacción externos en las ciudades urbanas de muchos países en [12] H. SadeghHohammadi, R. Saeidi, Mejora del rendimiento de la identificación de hablantes
desarrollo. Para construir un sistema de vigilancia eficiente, investigamos el utilizando el modelo de mezcla gaussiana con posprocesador de clasificación GMM, en:
IEEE International Conference on Signal Processing and Communications, 2007, págs. 24–
reconocimiento de equipos de excavación basados en señales acústicas en este
27. Dubai, Emiratos Arabes Unidos
artículo. Se ha desarrollado un algoritmo mejorado de extracción de [13] G. Hinton, Redes neuronales profundas para el modelado acústico en la clasificación del habla: los
características acústicas basado en el popular MFCC, en el que se exploran las puntos de vista compartidos de cuatro grupos de investigación, IEEE Signal Process. revista 29 (6)
(2012) 82–97.
variaciones dinámicas entre fotogramas consecutivos. Luego, el algoritmo de
[14] E. Cambria, B. White, Jumping NLP curves: a review of natural language processing
clasificación se ha construido en la red neuronal artificial utilizando el reciente research, IEEE Comput. Intell. revista 9 (2) (2014) 48–57.
enfoque de máquina de aprendizaje extremo en caliente (ELM). Se han recopilado [15] J. Cao, J. Liu, J. Wang, X. Lai, Sensor de vector acústico: revisiones y perspectivas
futuras, IET Signal Process. 11 (1) (2017) 1–9.
señales acústicas reales de cuatro dispositivos de excavación representativos de
[dieciséis] W. Zhang, Estudio sobre el sistema de clasificación de sonidos objetivo basado en
un sitio de construcción de metro real para probar la efectividad del algoritmo Audiory Bionics, Graduate University of Chinese Academy of Sciences, 2012.
propuesto. Se ha presentado la robustez del algoritmo sobre señales acústicas [17] Y. Pao, G. Park, D. Sobajic, Características de aprendizaje y generalización de la red de
enlaces funcionales de vectores aleatorios, Neurocomputing 6 (2) (1994) 163–180.
capturadas a diferentes distancias. Las comparaciones con el algoritmo BP
[18] Y. Pao, Y. Takefuji, Computación en red de enlace funcional, teoría, arquitectura de sistemas
convencional han demostrado que nuestro algoritmo es superior en precisión de y funcionalidades, IEEE Comput. 25 (5) (1992) 76–79.
reconocimiento y velocidad de aprendizaje. Mientras tanto, se instaló una [19] M. Sarma, k. Dutta, K. Sarma, Speech corpus of assamese numerals extraído usando
plataforma de software basada en nuestro algoritmo propuesto en un sitio de un filtro de pre-énfasis adaptativo para la clasificación del habla, en: The 2010
International Conference on Computer and Communication Technology (ICCCT),
construcción de metro real para el monitoreo en tiempo real. Los resultados de las Allahabad, Uttar Pradesh, 2010, págs. 461–466 .
pruebas reales recopilados mostraron que nuestro algoritmo es capaz de [20] W. Astuti, W. Sediono, A. Aibinu, Análisis adaptativo de la transformada de Fourier de corto
proporcionar un rendimiento prometedor en la clasificación de equipos de tiempo (STFT) de la señal eléctrica sísmica (SES): una comparación de hamming y ventana
rectangular, en: El 2012 IEEE Symposium on Industrial Electronics and Applications (ISIEA) ),
excavación.
Bandung, Indonesia, 2012, págs. 372–377.
Vale la pena señalar las siguientes direcciones futuras de investigación y [21] J. Huang, S. Xiao, Q. Zhou, Un algoritmo robusto de extracción de características para la
desarrollo. Para resolver los problemas de clasificación de los equipos de clasificación de objetivos acústicos en entornos salvajes, Circ. Syst. Proceso de señal. 34 (7)
(2015) 2395–2406.
excavación de carreteras, las bases de datos específicas de la aplicación son
[22] K. Mem, M. Abd, R. Al-Makhlasawy, Reconocimiento automático de modulación en sistemas
urgentes e importantes. Hicimos un esfuerzo por clasificar la acústica de inalámbricos inalámbricos de múltiples portadoras con características cepstrales, Wirel. Persona.
cuatro dispositivos de excavación típicos desde la perspectiva de la Comun. 81 (2015) 1243–1288.
[23] P. Khunarsal, C. Lursinsap, T. Raicharoen, Clasificación de sonido ambiental de muy corto
aplicación. Se necesita un análisis más detallado de estas características
tiempo basada en la coincidencia de patrones de espectrograma, Inf. Sci. 243 (2013) 57–74.
junto con la creciente base de datos. Es fundamental probar el rendimiento
de las funciones especiales en una base de datos común, lo que permite [24] G.-B. Huang, Q. Zhu, C. Siew, Máquina de aprendizaje extrema: un nuevo esquema de
aprendizaje de redes neuronales de retroalimentación, en: Actas de la Conferencia conjunta
obtener funciones de sonido más representativas. El análisis de múltiples
internacional de IEEE sobre redes neuronales, 2004, págs. 985–990.
funciones en un conjunto de datos más grande se puede utilizar para [25] G.-B. Huang, H. Zhou, X. Ding, Máquina de aprendizaje extrema para regresión y
empoderarnos con mejores estrategias de selección. Además, la clasificación multiclase, IEEE Trans. Syst., Hombre Cybern. 42 (2) (2012) 513–529.
investigación actual asume que un solo dispositivo de excavación se [26] J. Cao, W. Wang, J. Wang, R. Wang, reconocimiento de equipos de excavación basado en
características estadísticas acústicas novedosas, IEEE Trans. Cybern. (99) (2016) 1–13, doi:
presenta a la vez. En una aplicación real, se encuentran con frecuencia varios 10. 1109 / TCYB.2016.2609999.
equipos de excavación que operan simultáneamente. Por lo tanto, [27] S. Poria, E. Cambria, G. Winterstein, G.-B. Huang, Patrones semánticos: reglas basadas en la
dependencia para el análisis de sentimientos a nivel de concepto, Knowl. Syst basado. 69
(2014) 45–63.
[28] E. Cambria, P. Gastaldo, F. Bisio, R. Zunino, Un modelo basado en ELM para el razonamiento
Reconocimiento analógico afectivo, Neurocomputing 149 (2015) 443–455.
[29] S. Poria, E. Cambria, A. Hussain, G.-B. Huang, Hacia un marco inteligente para el
Este trabajo fue apoyado por la Fundación Nacional de Ciencias análisis de datos afectivos multimodales, Neural Netw. 63 (2015) 104–116.
[30] E. Principi, S. Squartini, E. Cambria, F. Piazza, Coincidencia de plantillas acústicas para la
Naturales (NNSF) de China (Beca No. 61503104), y en parte por NNSF de detección automática de estados de emergencia: un algoritmo basado en ELM,
China (Grant No. U1509205). Neurocomputing 149 (2015) 426–434.
[31] S. Poria, E. Cambria, N. Howard, G.-B. Huang, A. Hussain, Fusionando pistas de audio,
Referencias visuales y textuales para el análisis de sentimientos a partir de contenido multimodal,
Neurocomputing 174 (2016) 50–59.
[32] J. Tang, C. Deng, G.-B. Huang, máquina de aprendizaje extrema para perceptrón multicapa,
[1] J. Cao, W. Huang, T. Zhao, J. Wang, R. Wang, Un algoritmo de clasificación de equipos de
IEEE Trans. Neural Netw. Aprender. Syst. 27 (4) (2016) 809–821.
excavación mejorado basado en la característica dinámica del espectro acústico,
[33] G.-B. Huang, Z. Bai, LLC Kasun, CM Vong, máquina de aprendizaje extremo basada en
Multidimens. Syst. Proceso de señal. (2015), doi:10.1007 / s11045-015-0374-z.
campos receptivos locales, IEEE Comput. Intell. revista 10 (2) (2015) 18–29.
[2] G. Tian, A. Fu, Z. Yang, Prevención del daño por fuerza externa del cable de alimentación
[34] G.-B. Huang, ¿Qué son las máquinas de aprendizaje extremas? llenando el espacio entre el
urbano, Shandong Dianli Jishu 41 (4) (2014) 66–68.
sueño de frank rosenblatt y el rompecabezas de john von neumann, Cognit. Computación.
[3] J. Li, L. Ping, Estudio sobre el método de extracción de características para eventos anormales típicos
7 (2015) 263–278.
de tuberías enterradas, Chin. J. Sens. Actuat. 23 (7) (2010) 968–972.
[35] X. Li, W. Mao, W. Jiang, Máquina de aprendizaje extremo basada en el aprendizaje de
[4] Y. Wang, J. Li, P. He, El estudio de la tecnología de identificación automática para
múltiples núcleos para el diseño de clasificación, Neural Comput. Apl. 27 (1) (2016) 175–184.
vehículos móviles en la gestión del tráfico rodado, Microcomput. Inf. (2006) 193-195.
[5] P. Pai, H. Deng, J. Sundaresan, Caracterización de frecuencia de tiempo de ondas de cordero
[36] Y. Miche, A. Sorjamaa, P. Bas, O. Simula, C. Jutten, A. Lendasse, OP-ELM: máquina de
para evaluación de materiales e inspección de daños de placas, Mech. Syst. Proceso de
aprendizaje extremo óptimamente podada, IEEE Trans. Neural Netw. 21 (1) (2010)
señal. (2015) 183–206.
158–162.
[6] B. Feizifar, M. Haghifam, S. Soleymani, Aplicación de la transformada de ondas [37] Y. Miche, M. van Heeswijk, P. Bas, O. Simula, A. Lendasse, TROP-ELM: un ELM de
continuas para la localización de fallas en líneas aéreas combinadas y redes de doble regularización usando LARS y regularización tikhonov, Neurocomputing 74
distribución de cables, en: La 7a Conferencia Internacional de Ingeniería Eléctrica y (16) (2011) 2413–2421.
Electrónica (ELECO), Bursa, Turquía, 2011, págs. 142-146. [38] J. Cao, Z. Lin, Máquina de aprendizaje extrema en aplicaciones de gran tamaño y
[7] A. Ghosal, R. Chakraborty, S. Haty, Clasificación de voz / música usando el patrón de datos: una encuesta, Matemáticas. Probl. Ing. 2015 (2015) 1–12, doi:10.1155 /
ocurrencia de ZCR y STEm, en: el Tercer Simposio Internacional de Aplicación de 2015/103796.
[39] J. Cao, Y. Zhao, X. Lai, M. Ong, C. Yin, Z. Koh, N. Liu, Reconocimiento de puntos de referencia
Tecnología de la Información Inteligente de 2009, NanChang, China, 2009, págs.
con clasificación de representación escasa y máquina de aprendizaje extrema, J. Franklin
435–438.
Inst. 352 (10) (2015) 4528–4545.
[8] M. Yusnita, M. Paulraj, S. Bakar, identificación de acentos en inglés malasio mediante
LPC y análisis de formantes, en: IEEE International Conference on Control System, [40] J. Cao, T. Chen, J. Fan, clasificación Landmark con histograma de arco compacto y
Computing and Engineering (ICCSCE), Penang, Malasia, 2011, págs. 472–476. conjunto ELM, Multim. Herramientas Appl. 75 (5) (2016) 2839–2857.
[9] K. Ahmad, A. Thosarz, H. Jagannath, Un enfoque único en la clasificación de hablantes
[41] J. Cao, Z. Lin, detección de señales bayesianas con medidas comprimidas, Inf. Sci. 289
independientes del texto utilizando conjuntos de características MFCC y red neuronal
(2014) 241–253.
[42] J. Cao, L. Xiong, Clasificación de secuencias de proteínas con algoritmos de máquina de
probabilística, en: La Octava Conferencia Internacional sobre Avances en el Reconocimiento
aprendizaje extremos mejorados, BioMed Res. En t. 2014 (2014) 1–12, doi:10.1155 /
de Patrones (ICAPR), 2015. Kolkata, India
2014/103054.

Cite este artículo como: J. Cao et al., Clasificación de equipos de excavación basada en características mejoradas de MFCC y ELM, Neurocomputing
(2017), http://dx.doi.org/10.1016/j.neucom.2016.03.113
JID: NEUCOM
ARTÍCULO EN PRENSA [m5G; 20 de febrero de 2017; 13: 38]

J. Cao y col. / Neurocomputación 000 (2017) 1–11 11

[43] J. Cao, K. Zhang, M. Luo, C. Yin, X. Lai, Máquina de aprendizaje extrema y representación Jianzhong Wang recibió su Licenciatura en la Escuela de Ciencias
escasa adaptativa para clasificación de imágenes, Neural Netw. 81 (2016) 91–102. de la Computación e Ingeniería de la Universidad de XiDian en 1985
[44] A. Akusok, K. Bjork, Y. Miche, A. Lendasse, Máquinas de aprendizaje extremo de alto y la Maestría en la Escuela de Ciencias de la Computación e
rendimiento: una caja de herramientas completa para aplicaciones de big data, IEEE Open Ingeniería de la Universidad de Zhejiang en 1993, respectivamente.
Access 3 (2015). Se incorporó como profesor en la Universidad de Hangzhou Dianzi
[45] G.-B. Huang, X. Ding, H. Zhou, Máquina de aprendizaje extremo basada en el método de desde 1985. Ahora es profesor en la Universidad de Hangzhou
optimización para clasificación, Neurocomputing 74 (2010) 155–163. Dian. Se ha desempeñado como vicedecano de la Escuela de
[46] J. Cao, J. Hao, X. Lai, C.-M. Vong, M. Luo, máquina de aprendizaje extremo Ensemble y Automatización desde 2000 y secretario del Comité de Escuela del
clasificación de representación escasa, J. Franklin Inst. 353 (17) (2016) 4526–4541. Partido desde 2005. Ahora es también el director del instituto de
información y control.
[47] J. Xu, H. Zhou, G.-B. Huang, Reconocimiento rápido de objetos basado en máquinas de
aprendizaje extremo, en: 15ª Conferencia Internacional sobre Fusión de Información
(FUSION), Singapur, 2012, págs. 1490–1496.
[48] H. Trang, T.-H. Loc, H.-B. Hoang, Combinación propuesta de extracción de características PCA
y MFCC en el sistema de reconocimiento de voz, en: Actas de la Conferencia internacional Ruirong Wang recibió su licenciatura y maestría en el Instituto de
de 2014 sobre tecnologías avanzadas para las comunicaciones (ATC), Hanoi, Vietnam, 2014, Tecnología de Harbin y recibió su doctorado en la Universidad de
págs. 697–702. Zhejiang, es profesor (Ciencia y Tecnología de Instrumentación) en
[49] M. Golparvar-Fard, A. Heydarian, J. Niebles, Reconocimiento de acción basado en visión de equipos de la Facultad de Ciencias de la Información de la Vida e Ingeniería de
movimiento de tierras utilizando características espacio-temporales y clasificadores de máquinas de Instrumentos en la Universidad Hangzhou Dianzi, Hangzhou,
vectores de soporte, Adv. Ing. Inf. 27 (4) (2013) 652–663. China. Tiene experiencia laboral de dos años en el MIT como
científico investigador, en el Departamento de Ingeniería Mecánica
Jiuwen Cao recibió el B.Sc. y M.Sc. títulos de la Escuela de y División de Bioingeniería. Ganó el premio de excelente maestro
Matemáticas Aplicadas, Universidad de Ciencia y Tecnología de la Universidad en 2004 y un destacado instructor de diseño de
Electrónica de China, Chengdu, China, en 2005 y 2008, posgrado en 2013. Es miembro del personal del Programa de
respectivamente, y el Ph.D. Licenciado por la Escuela de Ingeniería Capacitación para Científicos Jóvenes Excelentes y del Programa de
Eléctrica y Electrónica de la Universidad Tecnológica de Nanyang Talentos 151 del Nuevo Siglo (tercer nivel) de la provincia de
(NTU), Singapur, en 2013. De 2012 a 2013, fue investigador Zhejiang. Él ha con-
asociado de la NTU. Ha sido profesor asociado en la Universidad de dirigió y supervisó una serie de proyectos de investigación y publicó artículos en revistas
Hangzhou Dianzi, Hangzhou, China, desde 2013. Dos de sus internacionales como Journal of Software, Journal of Sensors and Actuators y Journal of
artículos han sido incluidos en el Top 1% citados por Essential Zhejiang University. Sus principales intereses de investigación incluyen sistemas
Science Indicators en 2016. Sus intereses de investigación actuales integrados en red, tecnología e instrumentos de medición.
incluyen máquinas de aprendizaje extremo, aprendizaje
automático, redes neuronales y procesamiento de señales de
matriz. Dr. Cao ha sido Yun Chen nació en la provincia de Zhejiang, China, en 1976.
se desempeña como Editor Asociado de Sistemas Multidimensionales y Procesamiento de Recibió el título de BE de la Universidad Tecnológica del Sur
Señales desde 2015. Se ha desempeñado como Editor Invitado para un número especial en Central (Universidad Central del Sur), China, en 1999, el título
Sistemas Multidimensionales y Procesamiento de Señales y dos números especiales en de ME y el Ph.D. grado de la Universidad de Zhejiang, China,
Problemas Matemáticos en Ingeniería, y ahora organiza un número especial en la Revista del en 2002 y 2008, respectivamente. Desde agosto de 2009
Instituto Franklin. Se desempeñó como Presidente del Programa de la 5a Conferencia hasta agosto de 2010, fue investigador invitado en la Escuela
Internacional sobre Máquinas de Aprendizaje Extremo, Singapur, en 2014, y Presidente de de Computación, Ingeniería y Matemáticas de la Universidad
Publicaciones de la 6a y 7a Conferencia Internacional sobre Máquinas de Aprendizaje Extremo, de Western Sydney, NSW, Australia. Se incorporó a la
China, en 2015 y Singapur, en 2016, respectivamente. Track Copresidente del IEEE TENCON 2015, Universidad de Hangzhou Dianzi, China, en 2002, donde
y miembro del PC del IEEE CIT 2016 y 2017. actualmente es profesor. Sus intereses de investigación
incluyen sistemas estocásticos, redes neuronales, etc.
Tuo Zhao recibió la licenciatura de la Universidad de Yan'an en junio de
2013. Su dirección de investigación es la ciencia de la información
electrónica. Ahora está cursando la maestría en laboratorio clave para
tecnología de fusión de información de la Universidad de Hangzhou
Dianzi. Sus intereses de investigación incluyen la extracción de
características acústicas y el reconocimiento de patrones.

Cite este artículo como: J. Cao et al., Clasificación de equipos de excavación basada en características mejoradas de MFCC y ELM, Neurocomputing
(2017), http://dx.doi.org/10.1016/j.neucom.2016.03.113

También podría gustarte