Método de Reconocimiento de Las Causas de La Caída de Tensión Basado en La Transformación Bidimensional y Modelo Híbrido de Aprendizaje Profundo

Titulo: Método de reconocimiento de las causas de la caída de tensión basado en la
transformación bidimensional y modelo híbrido de aprendizaje profundo
Abstract: El reconocimiento causado por las caídas de tensión es la base para formular
planes de gobernanza y aclarar las responsabilidades de accidentes La diversificación de
equipos de redes inteligentes, la generación de energía conectada a la red de nuevas fuentes
de energía y la La diferenciación regional de los modos de consumo de energía plantea
nuevos desafíos a los métodos tradicionales. En este estudio, un método Se propone un
modelo híbrido basado en el aprendizaje profundo. La red neuronal convolucional se utiliza
para recibir de manera flexible el voltaje después Transformación bidimensional, para
obtener automáticamente las series de tiempo y las características espaciales de la caída de
tensión. señales. La red de creencias profundas se utiliza para reemplazar las capas
completamente conectadas en la red neuronal convolucional, por lo tanto mejorar la
capacidad de clasificación de etiquetas múltiples del modelo. Los parámetros obtenidos por
el entrenamiento no supervisado del Los codificadores automáticos de eliminación de ruido
dispersos apilados se utilizan para inicializar el peso de la red de creencias profundas,
mejorando así la velocidad de convergencia y rendimiento anti-ruido del modelo.
Entrenamiento iterativo y pruebas repetidas de la red utilizando Los datos de simulación
preprocesados y los datos reales registrados verifican la alta precisión de reconocimiento y
el fuerte rendimiento antirruido del modelo híbrido. En comparación con los métodos
tradicionales, el modelo híbrido también tiene una buena capacidad de generalización y
puede ser aplicado eficazmente en la ingeniería práctica.
Introducción: La caída de voltaje es una perturbación a corto plazo que el valor RMS de
el voltaje cae repentinamente al 90-10% del voltaje nominal y vuelve a la normalidad

después de 0,5 ciclos a 1 min [1]. La caída de voltaje es difícil de evitar y es
extremadamente dañino, causando> 70% de potencia problemas de calidad en los sistemas
eléctricos [2]. Con la red conectada generación de energía de nuevas fuentes de energía en
el marco de la Internet energética, la aplicación diversificada de equipos electrónicos de
potencia en redes, y el uso generalizado de equipos eléctricos sensibles en producción
industrial, el impacto de las caídas de tensión se recibiendo atención en el campo del
electricista. Reconocimiento preciso de las causas de la caída de voltaje ayudarán a resolver
la formulación oportuna de los planes de gobernanza y la clara definición de los
responsabilidades de varios departamentos, que pueden reducir las pérdidas económicas y
resolver las disputas económicas relacionadas. Las principales causas de las caídas de
tensión son la caída de tensión única y la caída de tensión compuesta. Las primeras causas,
incluido el sistema fallo de cortocircuito, arranque de motor de inducción grande,
transformador conmutación, etc. Además, la caída de tensión compuesta provoca creado
por la influencia mutua entre ellos. Las señales de caída de voltaje generados por diferentes
causas tienen significativamente diferentes características [3]. Durante las últimas décadas,
el reconocimiento de los estudiosos de las causas de la caída de voltaje se basa
principalmente en métodos de modelos físicos, incluidos los extracción de características y
reconocimiento de patrones. Característica artificialLa extracción transforma y reconstruye
las señales de caída de tensión.
a través del procesamiento de señales y estadísticas matemáticas, y extractos características

efectivas en el dominio del tiempo, el dominio de la frecuencia y el tiempo dominio de la
frecuencia. Los métodos comunes incluyen la transformada de ondículas [4, 5],
Transformada de Fourier [6], Transformada de Hilbert [7, 8], S transformación [9],
transformación DP [10], etc. El reconocimiento de patrones utiliza un algoritmo de
clasificación para diseñar un clasificador para determinar el Causas de caída de tensión de
las señales de perturbación. Métodos comunesbincluir red neuronal [11-13], máquina de
vectores de soporte [14], reducción del análisis de componentes principales [15],
exhaustivo difuso evaluación [16], propagación de etiquetas [17], etc. Los métodos han
obtenido un buen rendimiento, requieren el ajuste de varios niveles de umbral,
conocimiento experto humano o extracción el componente de frecuencia fundamental, que
dará como resultado una descripción incompleta de los datos. La pérdida de información en
el proceso de extracción de características artificiales y la complejidad excesiva de los
modelos de clasificación hacen que los defectos de los métodos cada vez más prominentes.
Mientras tanto, desde la perspectiva de la generación de energía, la generación de energía
nueva conectada a la red a menudo causa una serie de problemas, como fluctuaciones de
voltaje de la red, armónicos y fluctuaciones de frecuencia. Desde el punto de vista del
poder proceso de transmisión, con el fin de mejorar la calidad de la electricidad energía, se
ponen en uso muchos dispositivos electrónicos de potencia y un gran número de cargas no
lineales y de impacto están conectadas a la alimentación cuadrícula. Desde la perspectiva
del consumo de energía, la generalizada El uso de equipos eléctricos sensibles ha
provocado diferentes leyes de perturbación de la calidad en diferentes regiones debido a sus
diferentes industrias de desarrollo. Todo lo anterior ha causado gran interferencia en el
reconocimiento de las causas de las caídas de tensión. En el mismo tiempo, ya que se
pueden producir diferentes localmente superpuesto por la propagación, entonces es difícil
establecer modelos estadísticos matemáticos precisos y universales para datos de series de
tiempo de la calidad de la energía. Bajo el telón de fondo del poder del big data, el se
favorece el método, el aprendizaje profundo es un método basado en el representación y
aprendizaje de datos. En muchos campos, la máquina el rendimiento de reconocimiento
utilizando funciones de aprendizaje profundo ha superó el rendimiento humano [18]. El
eficiente mecanismo de El aprendizaje autónomo de características y la extracción de
características jerárquicas pueden superar eficazmente los problemas de los métodos
existentes [19]. Entre los trabajos recientes sobre aprendizaje profundo, solo un pequeño
número de trabajos se han publicado sobre métodos de aprendizaje profundo para el
reconocimiento de las causas de la caída de tensión [20, 21]. Balouji y col. [20] propone un
nuevo método de reconocimiento de causas de caída de tensión basado en memoria a largo
plazo a corto plazo (LSTM), [21] muestra que convolucional La red neuronal (CNN) es una
herramienta adecuada para reconocer la caída de voltaje. causas. Todos son intentos útiles
de aprendizaje profundo para reconocer las causas de las caídas de tensión y han logrado
cierto éxito. Sin embargo, no han aprovechado plenamente las ventajas del algoritmo de
aprendizaje, ni han considerado completamente el ajuste entre las características de los
datos de caída de tensión y las ventajas del algoritmo de aprendizaje profundo. Por tanto, es
necesario mejorar el efecto de reconocimiento del modelo. Para [20], utilizando los datos
de registro sin procesar en lugar de la secuencia RMS como entrada al LSTM puede ser una
una mejor opción y cómo mejorar el rendimiento del modelo es para estudio adicional. Para
[21], es una forma única de extraer el voltaje característica de hundimiento de la
representación 2D transformada por el espacio modelo fasorial utilizando CNN, pero la
transformación consume una gran cantidad de información original y cómo mejorar la
entrada de los datos originales y aprender de CNN vale la pena estudiarlo. Este artículo
propone un método basado en aprendizaje profundo híbrido modelo para reconocer las
causas de la caída de tensión. Considerando el modo de transmisión trifásico de energía
eléctrica y la señal característica de diferentes causas de caída de voltaje, este documento
presenta CNN, red de creencias profundas (DBN) y eliminación de ruido dispersa apilado
codificador automático (SSDAE) en algoritmo de aprendizaje profundo. De acuerdo a la
diferencia entre los requisitos de la interfaz de datos y los escenarios de aplicación del
algoritmo, el modelo CNN es más adecuado para trabajar con multicanal bidimensional
(2D) secuencias, el modelo DBN es más adecuado para tratar con problemas de secuencia
1D de canal único, y el modelo SSDAE tiene mejores inmunidades al ruido para problemas
de secuencia 1D de un solo canal [22]. Las principales contribuciones del trabajo son: (i) la
caída de tensión las señales se interceptan, se transforman en 2D y se forman en escala de
grises imágenes. No se produjo pérdida de información durante la conversión de la señal
original y la distribución de la perturbación las características están más concentradas para
mejorar la correlación entre los datos periódicos, (ii) el modelo CNN se utiliza para obtener
automáticamente las series de tiempo y las características espaciales de las imágenes en
escala de grises, en lugar de extraer características artesanales. También puede configurar
de manera flexible el número de canales para recibir escala de grises imágenes de voltaje
trifásico, (iii) el modelo DBN se utiliza para
Reemplazar las capas completamente conectadas en CNN para purificar características de

alta dimensión con el fin de mejorar el reconocimiento de la red. capacidad. Además, los
parámetros obtenidos por SSDADE se utilizan para inicializar el peso de DBN para mejorar
la convergencia velocidad y el rendimiento anti-ruido del modelo, (iv) demostrando que el
modelo híbrido de aprendizaje profundo es una herramienta adecuada para reconocer las
causas de la caída de tensión. Resuelve cómo mantener la función la información se pierda
durante el proceso de transformación de datos, y resuelve cómo considerar completamente
el grado de coincidencia entre los ventajas de los algoritmos de aprendizaje profundo y las
características de los datos de caída de voltaje en el proceso de optimización del modelo,
por lo que proporciona una nueva idea de investigación para la aplicación del aprendizaje
profundo algoritmos en el reconocimiento de causas de caída de tensión. Los datos de la
señal de caída de voltaje preprocesados se utilizan para iterativamente entrenar la red
construida. Se espera que el generado El modelo híbrido puede extraer de forma autónoma
la característica abstracta. parámetros de la señal de caída de voltaje y realizan alta
precisión reconocimiento de las causas de la caída de tensión. Mientras tanto, tiene buenas
rendimiento anti-ruido y capacidad de generalización y puede seraplicado eficazmente en la
ingeniería práctica.
2 Análisis de la señal de las causas de la caída de tensión
Considerando que la probabilidad de cortocircuito a tierra falla del circuito en el sistema

de potencia es mucho mayor que la probabilidad de las otras dos fallas de cortocircuito a
tierra, este documento solo estudia tres tipos de causas de caída de voltaje único y cuatro
tipos de las causas de caída de tensión compuesta. La caída de tensión única provoca
incluye falla de cortocircuito de tierra monofásica, gran inducción arranque de motor y
conmutación de transformador. El voltaje compuesto Causas de caída incluyen caída de
voltaje de varios niveles causada por cortocircuito falla, la combinación de falla de
cortocircuito de tierra monofásica y arranque de motor de inducción grande o conmutación
de transformador, y el compuesto de gran motor de inducción de arranque y transformador
traspuesta.
2.1 Causas de caída de tensión única
Para falla de cortocircuito de tierra monofásica, el valor RMS de voltaje
de la señal de caída de voltaje cae y se recupera muy rápidamente durante el
período de transición, y permanece esencialmente sin cambios durante el
hundimiento. La forma de onda de cambio de amplitud del voltaje de fase es
rectangular, y los voltajes de fase restantes permanecen sin cambios o
ligeramente incrementado. Para arranque de motor de inducción grande y conmutación de

transformador, la señal de caída de voltaje tiene una
velocidad de caída. Inmediatamente después de que la amplitud del voltaje caiga al
punto más bajo, comienza la recuperación. Se necesita mucho tiempo para recuperarse y
no hay ningún cambio repentino en el proceso de recuperación. Entre ellos,

la amplitud de la tensión trifásica correspondiente a la gran
El arranque del motor de inducción es el mismo, mientras que la amplitud del
La tensión trifásica correspondiente a la conmutación del transformador es
no es lo mismo y la señal contiene componentes armónicos.
2.2 Causas de la caída de tensión compuesta
Una de las causas de la caída de voltaje de varios niveles es el cambio en el tipo
de fallas de línea. Por ejemplo, después de un cortocircuito a tierra monofásico
falla en la línea, el arco en el punto de falla puede quemar el
equipo y se convierte en una falla de cortocircuito a tierra de dos fases.
Si se pone en marcha un motor de inducción grande o se conmuta el transformador
simultáneamente cuando se produce un cortocircuito a tierra monofásico,
se genera una señal de caída de tensión superpuesta en la monitorización
punto. Del mismo modo, cuando los grandes motores de inducción y transformadores
poner en funcionamiento simultánea o secuencialmente, una superposición
La señal de caída de voltaje también se genera en el punto de monitoreo. Con
la diversificación de los equipos de redes inteligentes, la red conectada
generación de energía de nuevas fuentes de energía y la regional
diferenciación de los modos de consumo de energía, el voltaje compuesto
Las señales de hundimiento son diversificadas y complicadas, por lo que es difícil
extraer características físicas directamente mediante estadística matemática.
3 Implementación concreta del modelo híbrido

La estructura general de la caída de voltaje causa el método de reconocimiento
basado en la transformación 2D y el modelo híbrido de aprendizaje profundo se muestra en
Fig. 1. Primero, el método realiza ruido y normalización
preprocesamiento de los datos de la señal de la tensión trifásica y
realiza una transformación 2D en los datos de la señal de caída de voltaje. Segundo,
las características locales de las caídas de tensión se extraen de la CNN
modelo e integrado para formar características globales. Al mismo tiempo, el
El modelo CNN está preentrenado por los datos de la señal de caída de voltaje etiquetados
para
obtener los parámetros de las capas convolucionales y la completa
capas conectadas en el modelo CNN. En tercer lugar, el totalmente conectado
capas del modelo de CNN se cambian al restringido Boltzmann
capas de máquina (RBM) en el modelo DBN, y la capa Softmax es
sumado para obtener la probabilidad de diferentes causas de caída de voltaje para
clasificación de etiquetas múltiples. Mientras tanto, el entrenamiento sin supervisión de
el modelo SSDAE se realiza mediante los datos de salida del
capas convolucionales para obtener los parámetros del escaso
eliminar el ruido de las capas del codificador automático (SDAE) en el modelo SSDAE, y
utilice estos parámetros para realizar la inicialización de peso en cada RBM
capa en DBN. Luego use los datos de salida de las capas convolucionales
para realizar un entrenamiento previo sin supervisión y un ajuste fino general del
Modelo DBN después de la inicialización del peso, de modo que los parámetros de
se obtienen cada capa de RBM. Finalmente, un ajuste fino supervisado de

toda la red se realiza utilizando la señal de caída de voltaje etiquetada
datos para generar un modelo híbrido entrenado

3.1 método de
transformación 2D
Dado que la señal de caída de voltaje tiene una gran periodicidad, la muestra
El valor de la señal de caída de voltaje se puede normalizar, isométrico

interceptación preprocesada y mapeada en filas o columnas en un
Matriz 2D para realizar la reconstrucción 2D [23]. Mientras tanto, 2D
El mapeo de señales 1D puede reducir efectivamente el tamaño de la señal,
de modo que la distribución de las características de perturbación sea más
concentrado, que es beneficioso para el aprendizaje de funciones y
la caída de voltaje provoca el reconocimiento de CNN. Como se muestra en la Fig.2, el
La señal con la frecuencia fundamental de 50 Hz se muestrea a una
frecuencia de 12,8 kHz y se toma como ejemplo para el mapeo 2D.
En este artículo, cada 64 puntos de muestra de la señal 1D en la Fig.2
se truncan como columna y se obtienen un total de 80 columnas.
El resultado del mapeo es una matriz 1D de 64 filas y 80 columnas en
Fig. 3.
En este artículo, la matriz 2D obtenida se visualiza en gris,
es decir, la matriz 2D de la Fig.3 se asigna al espacio gris discreto
G = {g | 0 ≤ g≤255, g∈Z}, y el resultado de la transformación se muestra en
Figura 4.
Se puede ver en el análisis que la caída de voltaje aparece como un
singularidad lineal singular o punto local en la imagen gris 2D, y
el valor de gris del píxel correspondiente está generalmente en el
intervalo [70, 185], de modo que el contraste sea más débil que el normal
hora. En el mapa 2D, el color es más claro que la parte normal. los
La extracción de estas singularidades es la base para un mayor reconocimiento
de las causas de la caída de tensión [23]. Al mismo tiempo, transformando el

Los datos de la señal de caída de voltaje en una imagen gris 2D para análisis también tiene
la ventaja de que no se dispone de un análisis simple de formas de onda 1D.
La forma de onda 1D solo se puede examinar en una única escala de tiempo,
que no conduce a reconocer directamente las perturbaciones periódicas
eventos. La imagen en escala de grises 2D se puede examinar tanto en la fila
dirección y la dirección de la columna para mejorar la correlación
entre los datos periódicos, lo que es beneficioso para aprovechar al máximo la
características de la señal de diferentes causas de caída de tensión.
3.2 Modelado de CNN
El modelo de CNN generalmente consta de la capa de entrada, la
capa de convolución, la capa de agrupación, la capa completamente conectada y
la capa de salida. La capa de convolución se compone de una pluralidad
de planos 2D, y la capa completamente conectada se compone de un
pluralidad de neuronas independientes. Cada capa convolucional en CNN
tiene una capa de agrupación para reducir la resolución después de la extracción de

características. Esta
La estructura única hace que la red tenga una alta tolerancia a la distorsión.
a las muestras de entrada cuando se reconoce [24], y hace que el
CNN más adecuado para tratar con secuencias 2D multicanal
como la imagen en escala de grises 2D de tres canales de arriba.
Considerando el tamaño de los datos de la señal de caída de voltaje después de 2D
mapeo y el número de causas de caída de voltaje, el modelo de CNN

La estructura construida en este artículo se muestra en la Fig. 5. La red
se compone principalmente de dos capas de convolución C1, C2, dos agrupaciones capas
P1, P2y tres capas FC1 completamente conectadas, FC2, FC3,
que se utilizan para procesar los datos de entrada de tamaño 24px * 24px * 3
obtenido después del mapeo 2D.
Se han realizado numerosas pruebas empíricas para averiguar la La arquitectura CNN más
apropiada asociada con el mejor rendimiento de extremo a extremo para el aprendizaje de
la función de hundimiento y el reconocimiento de hundimiento.
tarea. La Tabla 1 muestra la arquitectura detallada de la arquitectura 2DCNN propuesta.

Como puede verse en la Tabla 1, el convolucional capa C1 utiliza 32 núcleos de
convolución de 5px * 5px * 3, y el capa convolucional C2 utiliza 64 núcleos de
convolución de 5px * 5px * 3, y el tamaño del paso deslizante es de 1 px. Las capas de
agrupación P1 y P2 son todo agrupado por el MISMO método de llenado de borde, y el
paso deslizante la longitud es de 2px. El número de neuronas de todas las capas conectadas
FC1, FC2,FC3 es 1024, 256 y 3. En el modelo CNN de este documento, cada capa
utiliza la función de activación de ReLU no lineal no saturada para
mejorar la capacidad expresiva de la red. Normalización por lotes se agrega después de

cada capa de agrupación para acelerar la tasa de aprendizaje de
la red. Además, el vector de características multidimensional es transformado en un vector

de características 1D por la función Flatten
entre la capa combinada P2 y la capa FC1 completamente conectada, asegurando así la

coherencia de las dimensiones en la red.
El entrenamiento previo supervisado de CNN se divide en dos procesos,
propagación hacia adelante y propagación hacia atrás (BP) [25]. Supongamos que
la red procesa K clases de m muestras de entrenamiento. Una sola entrada
la muestra es (x(yo, y(yo)), donde x(yo)es un vector de entrada n-dimensional yy(yo) es la

categoría a la que pertenece la muestra. La capa actual está representado por l, el vector
propio de entrada de la capa l es x l − 1, el vector propio de salida es x l , el peso y el
desplazamiento de la capa filtro de convolución son wl y Bl. La propagación hacia
adelante es calculado en cada capa como se muestra a continuación
donde f (·) toma la función de activación de ReLU. Para un conjunto {(x(1), y (1)), ...,
(x(metro), y (metro))} que contiene m muestras, la función de costo general del modelo de
CNN se muestra a continuación.
donde λ es el parámetro de atenuación de peso, nl es el numero de capas y s es el número
de nodos en la capa de red l. En el caso de BP, los parámetros de cada capa son
actualizados por el lote método de descenso de gradiente para minimizar la función de
costo, como se muestra debajo de donde α es la tasa de aprendizaje. Cuando el error de
costo de la red se minimiza la estructura, se obtiene un modelo CNN previamente
entrenado.
3.3 Modelado DBN
El modelo DBN es un modelo de generación de probabilidad representativo en
aprendizaje profundo. Al entrenar el peso entre las neuronas en cada
Capa de RBM en la red, toda la red genera entrenamiento
datos de acuerdo con la probabilidad máxima, y forma de alto nivel
características abstractas, mejorando así el rendimiento de clasificación
del modelo [26].
3.3.1 Modelado de RBM:
Se muestra una estructura típica de RBM en
Fig. 6. La capa visible v se utiliza como capa de entrada, la oculta
La capa h se usa como capa de salida, y el desplazamiento w se usa para
controlar los estados de activación de las células en la capa visible y el
capa oculta. Las capas son independientes entre sí [27]. los
peso entre la i-ésima unidad de la capa visible y la j-ésima unidad de
la capa oculta está representada por un parámetro wij, y el desplazamiento de

la capa de visualización es un parámetro b = (b1, b2, ..., bm) y el desplazamiento de
la capa oculta es un parámetro c = (c, c2, ..., cn).
El modelo RBM necesita introducir una función de energía. los
El objetivo de la red es hacer que la función energética alcance el mínimo
estado de valor, es decir, el estado estable óptimo de la red. por
RBM, la función de energía entre el vector de entrada vy el
el vector de salida de capa oculta h es como se muestra en (4).
En el proceso de preentrenamiento no supervisado de RBM, los datos de entrada son
obtenido primero de la capa visible, y luego la función de energía es
utilizado para derivar la probabilidad condicional de la capa visible y
la capa oculta. Entonces la probabilidad de activación de la capa oculta
y se deriva la unidad de capa visible, obteniendo así el sesgo.
Finalmente, el peso w y el offset b se actualizan de acuerdo con la
diferencia de correlación entre la unidad de capa oculta y la visible
unidad de capa, como se muestra en (5).
En la fórmula, el superíndice representa el paso de muestreo, v(0),h(0)
representa el primer muestreo basado en la capa visible y el
capa oculta, y después de repetidas iteraciones, un w adecuado puede ser

obtenido para determinar la información de salida de la capa oculta
correspondiente a la entrada visible.
3.3.2 Entrenamiento del modelo DBN:
El aprendizaje del modelo DBN puededividirse en dos procesos, RBM de entrenamiento

previo capa por capa no supervisado y ajuste fino del algoritmo de BP supervisado. los
combinación de los dos garantiza que los parámetros no son fáciles
caer en el óptimo local y compensar la desventaja de
tiempo de formación prolongado [28]. Teniendo en cuenta el diseño del
capa conectada en el modelo CNN, la estructura del modelo DBN
construido en este documento se compone de tres GBR y una
Capa Softmax apilada en serie, y el mecanismo Dropout es
agregado a cada capa de RBM. El número de unidad de capa oculta del
RBM es 1024, 256 y 7. La capa Softmax mapea la capa oculta
salida del último RBM en el intervalo [0, 1] y obtiene el
probabilidad de cada categoría, realizando de esta manera multi-etiqueta
clasificación. Supongamos que hay categorías K, Si
representa la salida de la i-ésima unidad, y el proceso de cálculo del Softmax
La capa es como se muestra a continuación.

El costo total c del modelo DBN usa una función de entropía cruzada,
asumiendo que yi representa el verdadero resultado de la clasificación, y el
El proceso de cálculo de c se muestra a continuación.
El proceso de entrenamiento del DBN se muestra en la Fig. 7. El DBN primero
entrena el primer RBM para obtener una capa oculta adecuada y utiliza el
probabilidad de activación de las unidades de capa oculta como entrada visible
de la segunda GBR, y el proceso de formación de la segunda y
la tercera RBM es análoga. Usando un solo y compuesto sin etiquetar
datos de la señal de caída de voltaje, el DBN es una capa de entrenamiento no supervisada

por
capa. La salida obtenida al apilar múltiples RBM se considera
como parámetros de características, y los parámetros de características se transmiten a
la capa Softmax para la clasificación de múltiples etiquetas. Finalmente, el
La red es supervisada y ajustada por el etiquetado único y
datos de señal de caída de tensión compuesta y algoritmo de BP. Cuando el costo
de la estructura de la red es el más pequeño, el modelo DBN pre-entrenado
es obtenido.
3.4 modelado SSDAE
SSDAE apila múltiples SDAE a través de su apilamiento único
mecanismo. La salida de la capa oculta de la primera SDAE se utiliza como
la entrada de red de la segunda SDAE, y la parte de mapeo de
se descarta la primera capa oculta de SDAE a la capa de salida. Por
entrenar el peso entre las neuronas de la red, lo oculto
capa de SDAE puede aprender las características abstractas y de baja dimensión
representación de los datos de entrada bajo la interferencia ruidosa, y
utilícelo como el peso de inicialización de cada capa de RBM del DBN,
que puede mejorar eficazmente la velocidad de convergencia del
red y el rendimiento anti-ruido del modelo.
3.4.1 Modelado SDAE:
AE es uno de los aprendizajes no supervisados
campos. Tiene como objetivo reconstruir la información de entrada y automáticamente
aprender sus características de datos y representaciones de baja dimensión, por lo tanto
reduciendo datos irrelevantes y redundantes. Como se muestra en la Fig.8, SDAE
suprime la salida de las neuronas ocultas en la capa oculta al
introducir términos de penalización escasos sobre la base de AE, por lo tanto

reduciendo la dimensión de la capa oculta, lo que es beneficioso para
el aprendizaje de las características más profundas de la red. Mientras tanto, al azar
Se agrega ruido a los datos de entrada para que el AE aprenda y elimine
tal interferencia de ruido, estimando así la entrada original. Este método de entrenamiento
puede reducir efectivamente la sensibilidad del
red a la señal de entrada y hacer que las funciones aprendidas sean más
robusto. Además, puede mejorar la capacidad de generalización del EA
modelo para datos de entrada [29]. Para ser coherente con la DBN,
El número de unidad de SDADE de las capas ocultas es 1024, 256 y 7.
Donde X representa los datos de entrada sin procesar, (X∼= x1
∼, x2∼, x3. . . x∼) representa los datos de entrada con ruido aleatorio, H representa el capa
oculta. La definición de función de costo de SDAE es como se muestra abajo.
El primer término en (8) es el error cuadrático medio, donde hW, b xi ∼
es elsalida de la señal ruidosa x∼. El segundo término es la pena escasa
término, donde γ es el coeficiente de ponderación del término de penalización, ρ es
el parámetro de dispersión (ρ = 0.05), ρ^j es el valor medio de activación
de la j-ésima neurona y su método de cálculo es como se muestra en (9).

KL ρ∥ ρ^jse utiliza para medir la diferencia entre ρ y ρ^j,
que se calcula como se muestra en (10). Para prevenir la
el entrenamiento establece datos de sobreajuste y hace que el modelo sea más amplio
utilizado, se introduce un tercer término regular, entre los cuales λ es el
parámetro de retraso de peso.
3.4.2 Entrenamiento del modelo SSDAE:
Se muestra la estructura de SSDAE
en la Fig. 9. En el proceso de formación, la primera SDAE es la primera
sin supervisión utilizando los datos de la señal sin etiquetar, luego el segundo
SDAE se entrena utilizando la salida de la capa oculta del primer SDAE,
y así. Durante el entrenamiento no supervisado de SDAE, los parámetros son
actualizado como se muestra en (11).
Entre ellos, α es la tasa de aprendizaje. Cuando el error de costo del
red es la más pequeña, se obtiene el modelo SDAE previamente entrenado.
4 Diseño experimental y análisis de resultados
En vista de la gran cantidad de datos de señal de caída de voltaje etiquetados necesarios
para el entrenamiento del modelo híbrido, este trabajo obtiene principalmente datos
a través de experimentos de simulación y combina la caída de voltaje

registro de datos registrados por la calidad de la energía de una compañía eléctrica sistema
de seguimiento para verificar el método basado en fusión híbrida.
4.1 Análisis de experimentos de simulación
4.1.1 Adquisición de datos experimentales:
Refiriéndose al método de simulación propuesto por Tan y Ramachandaramurthy [30]
y Li et al. [31], este documento establece el sistema de simulación
modelo que se muestra en la Fig.10 en la plataforma Matlab / Simulink para
simular las señales correspondientes a las tres caídas de tensión única
causas y las cuatro causas de caída de tensión compuesta. El fundamental
La amplitud de la tensión de alimentación en el modelo es de 110 kV y
la frecuencia es de 50 Hz. Los armónicos tercero, quinto y séptimo cada uno
contienen 5% y los armónicos 9, 11 y 13 contienen cada uno un 2%.
El nivel de tensión está configurado como 110 / 10,5 / 0,4 kV; F es la culpa
punto en la línea; M1 es el punto de seguimiento; K1, K2 es el interruptor trifásico; M cerca

de la carga está el motor de inducción (M1, M2) la capacidad es de 15 kVA); Ambos T1 y
T2 están conectados en el Yn/ Tipo Y, T3 y T4 están cableados en el tipo Y / Y, y T2 tiene
en cuenta el características de saturación del núcleo. En el experimento de simulación, la
duración total de la simulación se establece a 0,2 s, es decir, la duración de grabación del
osciloscopio es de diez ciclos. Por cambiando los parámetros de la carga de línea, la
ocurrencia de la falla posición, la hora de inicio y parada de la falla, el transformador y la
capacidad del motor de inducción, el experimento obtiene 600 datos de muestra
cada uno de la falla de cortocircuito de tierra monofásica C1, El grandearranque del motor
de inducción C2, el transformador de conmutación C3, elcaída de tensión de varios niveles
C4, el cortocircuito de tierra monofásico Fallo combinado con el motor de inducción
grande que arranca C5, el Fallo de cortocircuito a tierra monofásico combinado con el
transformador de conmutación C6 y el gran motor de inducción que arranca
combinado con el transformador de conmutación C7 cuales son los siete tipos de causas de
caída de voltaje.
Dado que el tamaño de la interfaz de entrada del modelo CNN integrado en este
el papel es de 24px * 24px * 3, para que coincida con la entrada de datos
requisitos del modelo, el experimento registra simultáneamente
las tensiones trifásicas del punto de monitorización a través del
osciloscopio y ajuste el osciloscopio a 625 muestras igualmente espaciadas
puntos para cada conjunto de datos de muestra. Al mismo tiempo, porque hay
Puede haber problemas como datos de grabación incompletos y diferentes
punto de partida de la grabación causado por factores como el
funcionamiento de la grabadora, el entorno in situ o operación humana, este papel realiza

una interceptación de igual longitude procesamiento en la señal de simulación original, es
decir, atraviesa el datos originales de 625 puntos de muestreo, utilice la ventana deslizante
mecanismo para seleccionar las primeras 576 muestras de datos a la vez, y
deslice siete pasos hacia adelante para obtener una muestra de datos de tamaño 576 × 7,
que expande efectivamente el conjunto de datos de entrenamiento, haciendo un uso

completo de la capacidad de aprendizaje flexible de la red neuronal profunda para muestras
características tales como datos de grabación incompletos y mejora
la robustez del modelo. Dado que los datos de campo se verán afectados por el ruido, este
documento también superpone el ruido blanco gaussiano con una relación señal / ruido de
40, 30 y 20 dB en la señal de simulación de los datos de prueba originales
para verificar la inmunidad al ruido del método propuesto.

4.1.2 Configuración:
La computadora utilizada para nuestros experimentos es una
estación de trabajo con una CPU Intel i7 a 3,40 GHz, 48 GB de RAM y una
GPU NVIDIA Titan Xp de 128 GB. El programa se implementa en
python, usando la biblioteca de Keras con el backend de TensorFlow.
Tomando la elección de la tasa de aprendizaje y la tasa de abandono como una
ejemplo, al seleccionar parámetros clave, el experimento básicamente
utiliza validación cruzada múltiple para determinar el reconocimiento
precisión (RA) del conjunto de pruebas como objetivo de la búsqueda de cuadrícula. Los
datos del proceso de búsqueda se muestra en la Tabla 2.
Mediante ajustes constantes, los hiperparámetros utilizados para
tren están cuidadosamente ajustados y se dan en la Tabla 3.
4.1.3 Criterios para evaluar el desempeño:
Con el fin de Asegúrese de que el resultado del reconocimiento sea intuitivo y fácil de
entender, este experimento introduce el RA de la caída de voltaje
causas en modelos tradicionales y su método de cálculo es como se muestra abajo
donde T es un conjunto de muestras de prueba correspondiente a una caída de voltaje que

causa categoría, C es el número de muestras en las que todas las tensiones
las etiquetas de causa de pandeo y combinaciones de las mismas se reconocen

correctamente. Para reflejar la estabilidad de reconocimiento de varios
la caída de voltaje causa etiquetas en la categoría de diferentes compuestos
caídas de voltaje, este experimento también introduce el error (fuga)

La tasa (WR) de la caída de voltaje simple causa etiquetas basadas en el RA.
El índice de evaluación de la tasa se calcula como se muestra a continuación
4.1.4 Análisis del proceso de formación: según la formación
idea de este artículo, el experimento primero utiliza los datos del conjunto de entrenamiento
de
procesamiento silencioso para pre-entrenar el modelo CNN para obtener el
Parámetros de las capas convolucionales y los totalmente conectados
capas en el modelo CNN. Como se muestra en la Fig.11, como el número de
iteraciones aumenta, el RA del modelo generado gradualmente
aumenta y hay fluctuación local, y la pérdida de red
disminuye gradualmente y tiende a ser estable. Cuando el número de
iteraciones alcanza 150, el rendimiento de reconocimiento de la
modelo generado tiende a ser estable, y su RA alcanza el 96%, que
refleja la buena capacidad de procesamiento del modelo CNN para datos 2D,
pero es necesario mejorar el RA. El experimento luego fija los parámetros del
convolucional capa del modelo CNN, y utiliza los datos de salida del conjunto de
entrenamiento a través de la capa convolucional para realizar un entrenamiento sin
supervision en el modelo SSDAE y obtener los parámetros de la
capa de cada modelo SDAE. Luego usa estos parámetros para inicializar
el peso del modelo DBN y completar el entrenamiento previo sin supervisión de cada capa
de RBM y el ajuste fino general del DBN modelo. Como se muestra en la Fig.12, a medida
que aumenta el número de iteraciones, el RA del modelo DBN inicializado por el peso del
modelo SDAE
aumenta rápidamente y las fluctuaciones locales se ralentizan, y la
La pérdida de red también disminuye rápidamente y se estabiliza gradualmente en el
proceso general de ajuste fino. Cuando el número de iteraciones alcanza
60, el rendimiento de reconocimiento del modelo generado tiende a ser
estable y la AR alcanza el 98%. El RA de la red es muy mejorado, lo que refleja la buena

capacidad de procesamiento del DBN modelo para datos 1D. Además, se muestra que el
uso de SDADE modelo para inicializar el modelo DBN puede mejorar eficazmente la
velocidad de convergencia de la red. Finalmente, las capas de conexión completas del

modelo CNN son cambiado a las capas RBM del modelo DBN, el convolucional
Parámetros de capa del modelo CNN previamente entrenado y los parámetros
de las capas de RBM en el modelo DBN se migran, y todo La red se supervisa y ajusta con
los datos del conjunto de entrenamiento. Como mostrado en la Fig.13, con el aumento del
número de iteraciones, el RA del modelo generado aumenta rápidamente y el local
las fluctuaciones no son obvias. La pérdida de la red también disminuye
rápidamente y tiende a ser estable. El RA del modelo final generado tiende a ser del 99%.
En comparación con el RA del preentrenamiento del modelo CNN, el RA del modelo
híbrido ha mejorado enormemente.
4.1.5 Análisis de resultados experimentales:
En este experimento, el Los datos del conjunto de prueba se utilizaron para realizar una
validación cruzada de cuatro veces en el modelo generado. Los resultados de la
clasificación se muestran en la Tabla 4.Se puede ver que la tasa de reconocimiento
promedio de los solteros y caídas de voltaje compuesto para un procesamiento silencioso es
del 99,4%, y el La fracción de error de etiqueta (fuga) es de 1,2% en promedio. El
experiment también realiza entrenamiento iterativo en la red construida bajo
diferentes niveles de ruido y prueba el RA del modelo generado. Eso
Puede verse en la Tabla 4 que a medida que aumenta el nivel de ruido, el

la tasa de reconocimiento promedio del modelo híbrido disminuye del 99,4%
al 98,8%, 97,9% y 96,3% y la tasa de error de etiqueta (fuga)
aumenta del 1,2% al 3,0%, 5,7. % y 10,4%. El experiment Verifica razonablemente la

precisión y antirruido de la propuesta. método. Solo la muestra de prueba con una relación
señal / ruido de 20 Db tiene un RA bajo, principalmente porque las señales de caída de
voltaje de C2 y C7. Es difícil distinguirlos bajo ruido, lo que resulta en un
aumento de la tasa de errores de reconocimiento. Sobre la base de la existente
modelo, la red puede ser supervisada incrementalmente entrenada por
más datos después del procesamiento de ruido, para mejorar el RA y
Mejorar el rendimiento anti-ruido del modelo. El experimento superpone aún más el ruido
blanco gaussiano con una relación señal-ruido de 40, 30 y 20 dB en el equipo de
entrenamiento, y utiliza los datos para llevar a cabo una formación incremental supervisada
el modelo existente. Se puede ver en los resultados que el promedio
RA de la caída de tensión que provoca en un entorno silencioso es del 99,4%
y la fracción (de fuga) es de 1,2% en promedio. La AR promedio
después del tratamiento es del 99,2% y la fracción de error de etiqueta (fuga) es
1,6% de media. El modelo tiene un fuerte aprendizaje autónomo
capacidad para diferentes ruidos y verifica la eficacia del
método para el ruido. También muestra que la red mantiene la estabilidad
y plasticidad durante el entrenamiento incremental y se puede aplicar a
aprendizaje incremental.
4.2 Verificación de datos medidos

4.2.1 Conjunto de datos medidos y etiquetas:
Los datos de medición en Este documento se deriva de los eventos de caída de voltaje
reales capturados por el sistema de información inteligente de la calidad de la energía de la
compañía eléctrica. Específicamente de Beijing, Shanghai, Guangzhou, Xiamen, Shanxi
y otras ciudades. El conjunto de datos contiene eventos de caída de voltaje con
diferentes niveles de voltaje (cubre niveles de voltaje de 10, 35, 110 y
220 kV), diferentes duraciones y diferentes distribuciones de voltaje.
El conjunto de datos utilizado en este trabajo consta de 3508 eventos de caída de tensión.
El método de reconocimiento presentado [16, 32] se ha utilizado para
ayudar e inspeccionar el etiquetado manual que consta de siete
clases. La Tabla 5 muestra la distribución de los datos de medición en
las siete clases. En el conjunto de datos, los eventos causados por una sola caída de voltaje
provocan son dominantes, pero los eventos de la caída de tensión compuesta provocan
también se distribuyen aproximadamente de manera uniforme en diferentes categorías. A
al mismo tiempo, para cumplir con los requisitos de entrada de la
modelo, se seleccionaron 576 datos de puntos de muestreo consecutivos en el
experimento, y el proceso normal y el proceso de hundimiento de todos
Los datos de medición se incluyeron tanto como fue posible, y
normalizado y mapeado en 2D.
4.2.2 Análisis de resultados experimentales:
los resultados experimentales de los datos medidos preprocesados se basan en lo anterior
proceso de reconocimiento. Cabe mencionar que, considerando que
la calidad de los datos reales no es tan perfecta como la de los datos de simulación
y el volumen de datos es limitado, con el fin de acelerar la red

aprendizaje característico de los datos medidos, el experimento primero
migra todos los parámetros después del entrenamiento de datos de simulación, ya que
valor inicial de la red. Entonces, la red es iterative incremental entrenado con los datos
medidos, mejorando la validez y rendimiento de reconocimiento del modelo en los datos
medidos. Para evaluar más a fondo el desempeño del esquema propuesto en
cada clase, la Tabla 6 muestra la matriz de confusión en el conjunto de datos de prueba.
Donde C es la etiqueta obtenida del clasificador, C ′ es el ‘suelo
etiqueta de verdad. Basado en la matriz de confusión dada en la Tabla 6, el
Se calcula RA y WR para cada clase y se muestra en la Tabla 7.
Puede verse en la tabla que el método puede reconocer un total de 3508 datos registrados,
que verifican eficazmente la robustez del modelo híbrido a la completa e incompleta
datos grabados causados por factores como el rendimiento de la grabadora, el entorno en el

lugar o el funcionamiento humano inadecuado que pueden existir en la red eléctrica real, y
demostrar la poderosa capacidad de aprendizaje del modelo híbrido para datos medidos,
aprovechando al máximo la capacidad de aprendizaje flexible de
red neuronal.
4.3 Comparación con otros métodos
Idealmente, se deberían hacer comparaciones para sistemas que están diseñados
para reconocer los mismos tipos y número de clases, utilizando el
mismos conjuntos de datos. Sin embargo, tales comparaciones son muy difíciles ya que
Los primeros trabajos sobre el reconocimiento de caídas de tensión rara vez utilizan
grandes conjuntos de datos. También es difícil encontrar sistemas con el mismo tipo y
número de clases como el sistema propuesto. Por tanto, las comparaciones seleccionadas en
este parte sólo puede servir como una indicación de rendimiento relativo, en lugar de
que la comparación absoluta. Como se muestra en la Tabla 8, en comparación con el
tradicional métodos de investigación, el RA del modelo propuesto de la tensión única
las causas del hundimiento son mayores. Como se muestra en la Tabla 9, en comparación
con el tradicional métodos de investigación, el método propuesto logra mejores resultados
para el RA de la caída de tensión compuesta provoca. Mientras tanto, el
Reconocimiento de causa de caída de voltaje compuesto tradicional existente
Los métodos utilizan métodos manuales para extraer las características físicas de las señales
y la estructura de red construida en este documento. puede aprender y extraer de forma
independiente los parámetros característicos de las señales de caída de tensión, evitando la
pérdida de información del proceso de extracción de características artificiales. El modelo
generado también tiene mejor rendimiento anti-ruido y capacidad de generalización, y
puede ser aplicado eficazmente al sistema de energía.
5. Conclusión
Este documento presenta CNN, DBN y SDADE en el aprendizaje profundo
algoritmo y propone un método para el reconocimiento de caídas de tensión
basado en un modelo híbrido de aprendizaje profundo. La transformación 2D tiene
ha sido usado. Transforma los datos de la señal de caída de voltaje en un gris 2D
imagen, de modo que la distribución de las características de perturbación es más
concentrado, lo que es beneficioso para aprovechar al máximo la señal
características de diferentes causas de caída de tensión y la característica
aprendizaje de CNN. El DBN se utiliza para mejorar la etiqueta múltiple
capacidad de clasificación del modelo. Los parámetros obtenidos por el
Los SDADE se utilizan para mejorar la velocidad de convergencia y el rendimiento

antirruido del modelo. El fuerte rendimiento anti-ruido del modelo de fusión se verifica
mediante comparaciones experimentales bajo diferentes niveles de ruido. Al mismo tiempo,
los datos medidos del El sistema de monitoreo de la calidad de la energía se utiliza para
probar la validez de la
modelo híbrido para los datos de registro completos o incompletos en el
red eléctrica real, que es adecuada para la práctica de la ingeniería.
En comparación con el típico reconocimiento de causas de caída de tensión
métodos, el modelo generado por el método puede lograr un reconocimiento de alta

precisión de las causas de los caídas de voltaje. Su capacidad de generalización y aplicación
práctica. valor son mucho más altos que los métodos tradicionales. El método
propuesto en este documento puede adaptarse a la complejidad de la red eléctrica
equipos, la generación de energía conectada a la red de nueva energía
fuentes y la diferenciación regional del consumo de energía
modos. Solo necesita usar la caída de voltaje histórica etiquetada
datos de señal para entrenar iterativamente la red en la ingeniería real
ambiente. Basado en el modelo existente, la red es supervisado incrementalmente entrenado

por más datos, y el generado
El modelo puede lograr un reconocimiento de alta precisión de la caída de voltaje.
causas.

Método de Reconocimiento de Las Causas de La Caída de Tensión Basado en La Transformación Bidimensional y Modelo Híbrido de Aprendizaje Profundo

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Método de Reconocimiento de Las Causas de La Caída de Tensión Basado en La Transformación Bidimensional y Modelo Híbrido de Aprendizaje Profundo

Cargado por

Copyright:

Formatos disponibles

Titulo: Método de reconocimiento de las causas de la caída de tensión basado en la

transformación bidimensional y modelo híbrido de aprendizaje profundo

el voltaje cae repentinamente al 90-10% del voltaje nominal y vuelve a la normalidad

a través del procesamiento de señales y estadísticas matemáticas, y extractos características

Reemplazar las capas completamente conectadas en CNN para purificar características de

2 Análisis de la señal de las causas de la caída de tensión

Considerando que la probabilidad de cortocircuito a tierra falla del circuito en el sistema

2.1 Causas de caída de tensión única

Para falla de cortocircuito de tierra monofásica, el valor RMS de voltaje

de la señal de caída de voltaje cae y se recupera muy rápidamente durante el

período de transición, y permanece esencialmente sin cambios durante el

hundimiento. La forma de onda de cambio de amplitud del voltaje de fase es

rectangular, y los voltajes de fase restantes permanecen sin cambios o

ligeramente incrementado. Para arranque de motor de inducción grande y conmutación de

velocidad de caída. Inmediatamente después de que la amplitud del voltaje caiga al

no hay ningún cambio repentino en el proceso de recuperación. Entre ellos,

El arranque del motor de inducción es el mismo, mientras que la amplitud del

La tensión trifásica correspondiente a la conmutación del transformador es

no es lo mismo y la señal contiene componentes armónicos.

2.2 Causas de la caída de tensión compuesta

Una de las causas de la caída de voltaje de varios niveles es el cambio en el tipo

de fallas de línea. Por ejemplo, después de un cortocircuito a tierra monofásico

falla en la línea, el arco en el punto de falla puede quemar el

equipo y se convierte en una falla de cortocircuito a tierra de dos fases.

Si se pone en marcha un motor de inducción grande o se conmuta el transformador

simultáneamente cuando se produce un cortocircuito a tierra monofásico,

se genera una señal de caída de tensión superpuesta en la monitorización

poner en funcionamiento simultánea o secuencialmente, una superposición

La señal de caída de voltaje también se genera en el punto de monitoreo. Con

la diversificación de los equipos de redes inteligentes, la red conectada

generación de energía de nuevas fuentes de energía y la regional

diferenciación de los modos de consumo de energía, el voltaje compuesto

Las señales de hundimiento son diversificadas y complicadas, por lo que es difícil

extraer características físicas directamente mediante estadística matemática.

3 Implementación concreta del modelo híbrido

basado en la transformación 2D y el modelo híbrido de aprendizaje profundo se muestra en

Fig. 1. Primero, el método realiza ruido y normalización

preprocesamiento de los datos de la señal de la tensión trifásica y

realiza una transformación 2D en los datos de la señal de caída de voltaje. Segundo,

las características locales de las caídas de tensión se extraen de la CNN

modelo e integrado para formar características globales. Al mismo tiempo, el

obtener los parámetros de las capas convolucionales y la completa

capas conectadas en el modelo CNN. En tercer lugar, el totalmente conectado

capas del modelo de CNN se cambian al restringido Boltzmann

capas de máquina (RBM) en el modelo DBN, y la capa Softmax es

sumado para obtener la probabilidad de diferentes causas de caída de voltaje para

clasificación de etiquetas múltiples. Mientras tanto, el entrenamiento sin supervisión de

el modelo SSDAE se realiza mediante los datos de salida del

capas convolucionales para obtener los parámetros del escaso

utilice estos parámetros para realizar la inicialización de peso en cada RBM

se obtienen cada capa de RBM. Finalmente, un ajuste fino supervisado de

datos para generar un modelo híbrido entrenado

El valor de la señal de caída de voltaje se puede normalizar, isométrico

Matriz 2D para realizar la reconstrucción 2D [23]. Mientras tanto, 2D

El mapeo de señales 1D puede reducir efectivamente el tamaño de la señal,

de modo que la distribución de las características de perturbación sea más

concentrado, que es beneficioso para el aprendizaje de funciones y

la caída de voltaje provoca el reconocimiento de CNN. Como se muestra en la Fig.2, el

La señal con la frecuencia fundamental de 50 Hz se muestrea a una

frecuencia de 12,8 kHz y se toma como ejemplo para el mapeo 2D.

En este artículo, cada 64 puntos de muestra de la señal 1D en la Fig.2

se truncan como columna y se obtienen un total de 80 columnas.

El resultado del mapeo es una matriz 1D de 64 filas y 80 columnas en