Está en la página 1de 32

Titulo: Método de reconocimiento de las causas de la caída de tensión basado en la

transformación bidimensional y modelo híbrido de aprendizaje profundo

Abstract: El reconocimiento causado por las caídas de tensión es la base para formular
planes de gobernanza y aclarar las responsabilidades de accidentes La diversificación de
equipos de redes inteligentes, la generación de energía conectada a la red de nuevas fuentes
de energía y la La diferenciación regional de los modos de consumo de energía plantea
nuevos desafíos a los métodos tradicionales. En este estudio, un método Se propone un
modelo híbrido basado en el aprendizaje profundo. La red neuronal convolucional se utiliza
para recibir de manera flexible el voltaje después Transformación bidimensional, para
obtener automáticamente las series de tiempo y las características espaciales de la caída de
tensión. señales. La red de creencias profundas se utiliza para reemplazar las capas
completamente conectadas en la red neuronal convolucional, por lo tanto mejorar la
capacidad de clasificación de etiquetas múltiples del modelo. Los parámetros obtenidos por
el entrenamiento no supervisado del Los codificadores automáticos de eliminación de ruido
dispersos apilados se utilizan para inicializar el peso de la red de creencias profundas,
mejorando así la velocidad de convergencia y rendimiento anti-ruido del modelo.
Entrenamiento iterativo y pruebas repetidas de la red utilizando Los datos de simulación
preprocesados y los datos reales registrados verifican la alta precisión de reconocimiento y
el fuerte rendimiento antirruido del modelo híbrido. En comparación con los métodos
tradicionales, el modelo híbrido también tiene una buena capacidad de generalización y
puede ser aplicado eficazmente en la ingeniería práctica.

Introducción: La caída de voltaje es una perturbación a corto plazo que el valor RMS de

el voltaje cae repentinamente al 90-10% del voltaje nominal y vuelve a la normalidad


después de 0,5 ciclos a 1 min [1]. La caída de voltaje es difícil de evitar y es
extremadamente dañino, causando> 70% de potencia problemas de calidad en los sistemas
eléctricos [2]. Con la red conectada generación de energía de nuevas fuentes de energía en
el marco de la Internet energética, la aplicación diversificada de equipos electrónicos de
potencia en redes, y el uso generalizado de equipos eléctricos sensibles en producción
industrial, el impacto de las caídas de tensión se recibiendo atención en el campo del
electricista. Reconocimiento preciso de las causas de la caída de voltaje ayudarán a resolver
la formulación oportuna de los planes de gobernanza y la clara definición de los
responsabilidades de varios departamentos, que pueden reducir las pérdidas económicas y
resolver las disputas económicas relacionadas. Las principales causas de las caídas de
tensión son la caída de tensión única y la caída de tensión compuesta. Las primeras causas,
incluido el sistema fallo de cortocircuito, arranque de motor de inducción grande,
transformador conmutación, etc. Además, la caída de tensión compuesta provoca creado
por la influencia mutua entre ellos. Las señales de caída de voltaje generados por diferentes
causas tienen significativamente diferentes características [3]. Durante las últimas décadas,
el reconocimiento de los estudiosos de las causas de la caída de voltaje se basa
principalmente en métodos de modelos físicos, incluidos los extracción de características y
reconocimiento de patrones. Característica artificialLa extracción transforma y reconstruye
las señales de caída de tensión.

a través del procesamiento de señales y estadísticas matemáticas, y extractos características


efectivas en el dominio del tiempo, el dominio de la frecuencia y el tiempo dominio de la
frecuencia. Los métodos comunes incluyen la transformada de ondículas [4, 5],
Transformada de Fourier [6], Transformada de Hilbert [7, 8], S transformación [9],
transformación DP [10], etc. El reconocimiento de patrones utiliza un algoritmo de
clasificación para diseñar un clasificador para determinar el Causas de caída de tensión de
las señales de perturbación. Métodos comunesbincluir red neuronal [11-13], máquina de
vectores de soporte [14], reducción del análisis de componentes principales [15],
exhaustivo difuso evaluación [16], propagación de etiquetas [17], etc. Los métodos han
obtenido un buen rendimiento, requieren el ajuste de varios niveles de umbral,
conocimiento experto humano o extracción el componente de frecuencia fundamental, que
dará como resultado una descripción incompleta de los datos. La pérdida de información en
el proceso de extracción de características artificiales y la complejidad excesiva de los
modelos de clasificación hacen que los defectos de los métodos cada vez más prominentes.
Mientras tanto, desde la perspectiva de la generación de energía, la generación de energía
nueva conectada a la red a menudo causa una serie de problemas, como fluctuaciones de
voltaje de la red, armónicos y fluctuaciones de frecuencia. Desde el punto de vista del
poder proceso de transmisión, con el fin de mejorar la calidad de la electricidad energía, se
ponen en uso muchos dispositivos electrónicos de potencia y un gran número de cargas no
lineales y de impacto están conectadas a la alimentación cuadrícula. Desde la perspectiva
del consumo de energía, la generalizada El uso de equipos eléctricos sensibles ha
provocado diferentes leyes de perturbación de la calidad en diferentes regiones debido a sus
diferentes industrias de desarrollo. Todo lo anterior ha causado gran interferencia en el
reconocimiento de las causas de las caídas de tensión. En el mismo tiempo, ya que se
pueden producir diferentes localmente superpuesto por la propagación, entonces es difícil
establecer modelos estadísticos matemáticos precisos y universales para datos de series de
tiempo de la calidad de la energía. Bajo el telón de fondo del poder del big data, el se
favorece el método, el aprendizaje profundo es un método basado en el representación y
aprendizaje de datos. En muchos campos, la máquina el rendimiento de reconocimiento
utilizando funciones de aprendizaje profundo ha superó el rendimiento humano [18]. El
eficiente mecanismo de El aprendizaje autónomo de características y la extracción de
características jerárquicas pueden superar eficazmente los problemas de los métodos
existentes [19]. Entre los trabajos recientes sobre aprendizaje profundo, solo un pequeño
número de trabajos se han publicado sobre métodos de aprendizaje profundo para el
reconocimiento de las causas de la caída de tensión [20, 21]. Balouji y col. [20] propone un
nuevo método de reconocimiento de causas de caída de tensión basado en memoria a largo
plazo a corto plazo (LSTM), [21] muestra que convolucional La red neuronal (CNN) es una
herramienta adecuada para reconocer la caída de voltaje. causas. Todos son intentos útiles
de aprendizaje profundo para reconocer las causas de las caídas de tensión y han logrado
cierto éxito. Sin embargo, no han aprovechado plenamente las ventajas del algoritmo de
aprendizaje, ni han considerado completamente el ajuste entre las características de los
datos de caída de tensión y las ventajas del algoritmo de aprendizaje profundo. Por tanto, es
necesario mejorar el efecto de reconocimiento del modelo. Para [20], utilizando los datos
de registro sin procesar en lugar de la secuencia RMS como entrada al LSTM puede ser una
una mejor opción y cómo mejorar el rendimiento del modelo es para estudio adicional. Para
[21], es una forma única de extraer el voltaje característica de hundimiento de la
representación 2D transformada por el espacio modelo fasorial utilizando CNN, pero la
transformación consume una gran cantidad de información original y cómo mejorar la
entrada de los datos originales y aprender de CNN vale la pena estudiarlo. Este artículo
propone un método basado en aprendizaje profundo híbrido modelo para reconocer las
causas de la caída de tensión. Considerando el modo de transmisión trifásico de energía
eléctrica y la señal característica de diferentes causas de caída de voltaje, este documento
presenta CNN, red de creencias profundas (DBN) y eliminación de ruido dispersa apilado
codificador automático (SSDAE) en algoritmo de aprendizaje profundo. De acuerdo a la
diferencia entre los requisitos de la interfaz de datos y los escenarios de aplicación del
algoritmo, el modelo CNN es más adecuado para trabajar con multicanal bidimensional
(2D) secuencias, el modelo DBN es más adecuado para tratar con problemas de secuencia
1D de canal único, y el modelo SSDAE tiene mejores inmunidades al ruido para problemas
de secuencia 1D de un solo canal [22]. Las principales contribuciones del trabajo son: (i) la
caída de tensión las señales se interceptan, se transforman en 2D y se forman en escala de
grises imágenes. No se produjo pérdida de información durante la conversión de la señal
original y la distribución de la perturbación las características están más concentradas para
mejorar la correlación entre los datos periódicos, (ii) el modelo CNN se utiliza para obtener
automáticamente las series de tiempo y las características espaciales de las imágenes en
escala de grises, en lugar de extraer características artesanales. También puede configurar
de manera flexible el número de canales para recibir escala de grises imágenes de voltaje
trifásico, (iii) el modelo DBN se utiliza para

Reemplazar las capas completamente conectadas en CNN para purificar características de


alta dimensión con el fin de mejorar el reconocimiento de la red. capacidad. Además, los
parámetros obtenidos por SSDADE se utilizan para inicializar el peso de DBN para mejorar
la convergencia velocidad y el rendimiento anti-ruido del modelo, (iv) demostrando que el
modelo híbrido de aprendizaje profundo es una herramienta adecuada para reconocer las
causas de la caída de tensión. Resuelve cómo mantener la función la información se pierda
durante el proceso de transformación de datos, y resuelve cómo considerar completamente
el grado de coincidencia entre los ventajas de los algoritmos de aprendizaje profundo y las
características de los datos de caída de voltaje en el proceso de optimización del modelo,
por lo que proporciona una nueva idea de investigación para la aplicación del aprendizaje
profundo algoritmos en el reconocimiento de causas de caída de tensión. Los datos de la
señal de caída de voltaje preprocesados se utilizan para iterativamente entrenar la red
construida. Se espera que el generado El modelo híbrido puede extraer de forma autónoma
la característica abstracta. parámetros de la señal de caída de voltaje y realizan alta
precisión reconocimiento de las causas de la caída de tensión. Mientras tanto, tiene buenas
rendimiento anti-ruido y capacidad de generalización y puede seraplicado eficazmente en la
ingeniería práctica.

2 Análisis de la señal de las causas de la caída de tensión

Considerando que la probabilidad de cortocircuito a tierra falla del circuito en el sistema


de potencia es mucho mayor que la probabilidad de las otras dos fallas de cortocircuito a
tierra, este documento solo estudia tres tipos de causas de caída de voltaje único y cuatro
tipos de las causas de caída de tensión compuesta. La caída de tensión única provoca
incluye falla de cortocircuito de tierra monofásica, gran inducción arranque de motor y
conmutación de transformador. El voltaje compuesto Causas de caída incluyen caída de
voltaje de varios niveles causada por cortocircuito falla, la combinación de falla de
cortocircuito de tierra monofásica y arranque de motor de inducción grande o conmutación
de transformador, y el compuesto de gran motor de inducción de arranque y transformador
traspuesta.

2.1 Causas de caída de tensión única

Para falla de cortocircuito de tierra monofásica, el valor RMS de voltaje

de la señal de caída de voltaje cae y se recupera muy rápidamente durante el

período de transición, y permanece esencialmente sin cambios durante el

hundimiento. La forma de onda de cambio de amplitud del voltaje de fase es

rectangular, y los voltajes de fase restantes permanecen sin cambios o

ligeramente incrementado. Para arranque de motor de inducción grande y conmutación de


transformador, la señal de caída de voltaje tiene una

velocidad de caída. Inmediatamente después de que la amplitud del voltaje caiga al

punto más bajo, comienza la recuperación. Se necesita mucho tiempo para recuperarse y

no hay ningún cambio repentino en el proceso de recuperación. Entre ellos,


la amplitud de la tensión trifásica correspondiente a la gran

El arranque del motor de inducción es el mismo, mientras que la amplitud del

La tensión trifásica correspondiente a la conmutación del transformador es

no es lo mismo y la señal contiene componentes armónicos.

2.2 Causas de la caída de tensión compuesta

Una de las causas de la caída de voltaje de varios niveles es el cambio en el tipo

de fallas de línea. Por ejemplo, después de un cortocircuito a tierra monofásico

falla en la línea, el arco en el punto de falla puede quemar el

equipo y se convierte en una falla de cortocircuito a tierra de dos fases.

Si se pone en marcha un motor de inducción grande o se conmuta el transformador

simultáneamente cuando se produce un cortocircuito a tierra monofásico,

se genera una señal de caída de tensión superpuesta en la monitorización

punto. Del mismo modo, cuando los grandes motores de inducción y transformadores

poner en funcionamiento simultánea o secuencialmente, una superposición

La señal de caída de voltaje también se genera en el punto de monitoreo. Con

la diversificación de los equipos de redes inteligentes, la red conectada

generación de energía de nuevas fuentes de energía y la regional

diferenciación de los modos de consumo de energía, el voltaje compuesto

Las señales de hundimiento son diversificadas y complicadas, por lo que es difícil

extraer características físicas directamente mediante estadística matemática.

3 Implementación concreta del modelo híbrido


La estructura general de la caída de voltaje causa el método de reconocimiento

basado en la transformación 2D y el modelo híbrido de aprendizaje profundo se muestra en

Fig. 1. Primero, el método realiza ruido y normalización

preprocesamiento de los datos de la señal de la tensión trifásica y

realiza una transformación 2D en los datos de la señal de caída de voltaje. Segundo,

las características locales de las caídas de tensión se extraen de la CNN

modelo e integrado para formar características globales. Al mismo tiempo, el

El modelo CNN está preentrenado por los datos de la señal de caída de voltaje etiquetados
para

obtener los parámetros de las capas convolucionales y la completa

capas conectadas en el modelo CNN. En tercer lugar, el totalmente conectado

capas del modelo de CNN se cambian al restringido Boltzmann

capas de máquina (RBM) en el modelo DBN, y la capa Softmax es

sumado para obtener la probabilidad de diferentes causas de caída de voltaje para

clasificación de etiquetas múltiples. Mientras tanto, el entrenamiento sin supervisión de

el modelo SSDAE se realiza mediante los datos de salida del

capas convolucionales para obtener los parámetros del escaso

eliminar el ruido de las capas del codificador automático (SDAE) en el modelo SSDAE, y

utilice estos parámetros para realizar la inicialización de peso en cada RBM

capa en DBN. Luego use los datos de salida de las capas convolucionales

para realizar un entrenamiento previo sin supervisión y un ajuste fino general del

Modelo DBN después de la inicialización del peso, de modo que los parámetros de

se obtienen cada capa de RBM. Finalmente, un ajuste fino supervisado de


toda la red se realiza utilizando la señal de caída de voltaje etiquetada

datos para generar un modelo híbrido entrenado


3.1 método de
transformación 2D

Dado que la señal de caída de voltaje tiene una gran periodicidad, la muestra

El valor de la señal de caída de voltaje se puede normalizar, isométrico


interceptación preprocesada y mapeada en filas o columnas en un

Matriz 2D para realizar la reconstrucción 2D [23]. Mientras tanto, 2D

El mapeo de señales 1D puede reducir efectivamente el tamaño de la señal,

de modo que la distribución de las características de perturbación sea más

concentrado, que es beneficioso para el aprendizaje de funciones y

la caída de voltaje provoca el reconocimiento de CNN. Como se muestra en la Fig.2, el

La señal con la frecuencia fundamental de 50 Hz se muestrea a una

frecuencia de 12,8 kHz y se toma como ejemplo para el mapeo 2D.

En este artículo, cada 64 puntos de muestra de la señal 1D en la Fig.2

se truncan como columna y se obtienen un total de 80 columnas.

El resultado del mapeo es una matriz 1D de 64 filas y 80 columnas en

Fig. 3.

En este artículo, la matriz 2D obtenida se visualiza en gris,

es decir, la matriz 2D de la Fig.3 se asigna al espacio gris discreto

G = {g | 0 ≤ g≤255, g∈Z}, y el resultado de la transformación se muestra en

Figura 4.

Se puede ver en el análisis que la caída de voltaje aparece como un

singularidad lineal singular o punto local en la imagen gris 2D, y

el valor de gris del píxel correspondiente está generalmente en el

intervalo [70, 185], de modo que el contraste sea más débil que el normal

hora. En el mapa 2D, el color es más claro que la parte normal. los

La extracción de estas singularidades es la base para un mayor reconocimiento

de las causas de la caída de tensión [23]. Al mismo tiempo, transformando el


Los datos de la señal de caída de voltaje en una imagen gris 2D para análisis también tiene

la ventaja de que no se dispone de un análisis simple de formas de onda 1D.

La forma de onda 1D solo se puede examinar en una única escala de tiempo,

que no conduce a reconocer directamente las perturbaciones periódicas

eventos. La imagen en escala de grises 2D se puede examinar tanto en la fila

dirección y la dirección de la columna para mejorar la correlación

entre los datos periódicos, lo que es beneficioso para aprovechar al máximo la

características de la señal de diferentes causas de caída de tensión.

3.2 Modelado de CNN

El modelo de CNN generalmente consta de la capa de entrada, la

capa de convolución, la capa de agrupación, la capa completamente conectada y

la capa de salida. La capa de convolución se compone de una pluralidad

de planos 2D, y la capa completamente conectada se compone de un

pluralidad de neuronas independientes. Cada capa convolucional en CNN

tiene una capa de agrupación para reducir la resolución después de la extracción de


características. Esta

La estructura única hace que la red tenga una alta tolerancia a la distorsión.

a las muestras de entrada cuando se reconoce [24], y hace que el

CNN más adecuado para tratar con secuencias 2D multicanal

como la imagen en escala de grises 2D de tres canales de arriba.

Considerando el tamaño de los datos de la señal de caída de voltaje después de 2D

mapeo y el número de causas de caída de voltaje, el modelo de CNN


La estructura construida en este artículo se muestra en la Fig. 5. La red

se compone principalmente de dos capas de convolución C1, C2, dos agrupaciones capas
P1, P2y tres capas FC1 completamente conectadas, FC2, FC3,

que se utilizan para procesar los datos de entrada de tamaño 24px * 24px * 3

obtenido después del mapeo 2D.

Se han realizado numerosas pruebas empíricas para averiguar la La arquitectura CNN más
apropiada asociada con el mejor rendimiento de extremo a extremo para el aprendizaje de
la función de hundimiento y el reconocimiento de hundimiento.

tarea. La Tabla 1 muestra la arquitectura detallada de la arquitectura 2DCNN propuesta.


Como puede verse en la Tabla 1, el convolucional capa C1 utiliza 32 núcleos de
convolución de 5px * 5px * 3, y el capa convolucional C2 utiliza 64 núcleos de
convolución de 5px * 5px * 3, y el tamaño del paso deslizante es de 1 px. Las capas de
agrupación P1 y P2 son todo agrupado por el MISMO método de llenado de borde, y el
paso deslizante la longitud es de 2px. El número de neuronas de todas las capas conectadas
FC1, FC2,FC3 es 1024, 256 y 3. En el modelo CNN de este documento, cada capa

utiliza la función de activación de ReLU no lineal no saturada para

mejorar la capacidad expresiva de la red. Normalización por lotes se agrega después de


cada capa de agrupación para acelerar la tasa de aprendizaje de

la red. Además, el vector de características multidimensional es transformado en un vector


de características 1D por la función Flatten

entre la capa combinada P2 y la capa FC1 completamente conectada, asegurando así la


coherencia de las dimensiones en la red.
El entrenamiento previo supervisado de CNN se divide en dos procesos,

propagación hacia adelante y propagación hacia atrás (BP) [25]. Supongamos que

la red procesa K clases de m muestras de entrenamiento. Una sola entrada

la muestra es (x(yo, y(yo)), donde x(yo)es un vector de entrada n-dimensional yy(yo) es la


categoría a la que pertenece la muestra. La capa actual está representado por l, el vector
propio de entrada de la capa l es x l − 1, el vector propio de salida es x l , el peso y el
desplazamiento de la capa filtro de convolución son wl y Bl. La propagación hacia
adelante es calculado en cada capa como se muestra a continuación

donde f (·) toma la función de activación de ReLU. Para un conjunto {(x(1), y (1)), ...,
(x(metro), y (metro))} que contiene m muestras, la función de costo general del modelo de
CNN se muestra a continuación.
donde λ es el parámetro de atenuación de peso, nl es el numero de capas y s es el número
de nodos en la capa de red l. En el caso de BP, los parámetros de cada capa son
actualizados por el lote método de descenso de gradiente para minimizar la función de
costo, como se muestra debajo de donde α es la tasa de aprendizaje. Cuando el error de
costo de la red se minimiza la estructura, se obtiene un modelo CNN previamente
entrenado.

3.3 Modelado DBN

El modelo DBN es un modelo de generación de probabilidad representativo en

aprendizaje profundo. Al entrenar el peso entre las neuronas en cada

Capa de RBM en la red, toda la red genera entrenamiento

datos de acuerdo con la probabilidad máxima, y forma de alto nivel

características abstractas, mejorando así el rendimiento de clasificación

del modelo [26].

3.3.1 Modelado de RBM:

Se muestra una estructura típica de RBM en

Fig. 6. La capa visible v se utiliza como capa de entrada, la oculta

La capa h se usa como capa de salida, y el desplazamiento w se usa para

controlar los estados de activación de las células en la capa visible y el

capa oculta. Las capas son independientes entre sí [27]. los

peso entre la i-ésima unidad de la capa visible y la j-ésima unidad de

la capa oculta está representada por un parámetro wij, y el desplazamiento de


la capa de visualización es un parámetro b = (b1, b2, ..., bm) y el desplazamiento de

la capa oculta es un parámetro c = (c, c2, ..., cn).

El modelo RBM necesita introducir una función de energía. los

El objetivo de la red es hacer que la función energética alcance el mínimo

estado de valor, es decir, el estado estable óptimo de la red. por

RBM, la función de energía entre el vector de entrada vy el

el vector de salida de capa oculta h es como se muestra en (4).

En el proceso de preentrenamiento no supervisado de RBM, los datos de entrada son

obtenido primero de la capa visible, y luego la función de energía es

utilizado para derivar la probabilidad condicional de la capa visible y

la capa oculta. Entonces la probabilidad de activación de la capa oculta

y se deriva la unidad de capa visible, obteniendo así el sesgo.

Finalmente, el peso w y el offset b se actualizan de acuerdo con la

diferencia de correlación entre la unidad de capa oculta y la visible

unidad de capa, como se muestra en (5).

En la fórmula, el superíndice representa el paso de muestreo, v(0),h(0)

representa el primer muestreo basado en la capa visible y el

capa oculta, y después de repetidas iteraciones, un w adecuado puede ser


obtenido para determinar la información de salida de la capa oculta

correspondiente a la entrada visible.

3.3.2 Entrenamiento del modelo DBN:

El aprendizaje del modelo DBN puededividirse en dos procesos, RBM de entrenamiento


previo capa por capa no supervisado y ajuste fino del algoritmo de BP supervisado. los

combinación de los dos garantiza que los parámetros no son fáciles

caer en el óptimo local y compensar la desventaja de

tiempo de formación prolongado [28]. Teniendo en cuenta el diseño del

capa conectada en el modelo CNN, la estructura del modelo DBN

construido en este documento se compone de tres GBR y una

Capa Softmax apilada en serie, y el mecanismo Dropout es

agregado a cada capa de RBM. El número de unidad de capa oculta del

RBM es 1024, 256 y 7. La capa Softmax mapea la capa oculta

salida del último RBM en el intervalo [0, 1] y obtiene el

probabilidad de cada categoría, realizando de esta manera multi-etiqueta

clasificación. Supongamos que hay categorías K, Si

representa la salida de la i-ésima unidad, y el proceso de cálculo del Softmax

La capa es como se muestra a continuación.


El costo total c del modelo DBN usa una función de entropía cruzada,

asumiendo que yi representa el verdadero resultado de la clasificación, y el

El proceso de cálculo de c se muestra a continuación.

El proceso de entrenamiento del DBN se muestra en la Fig. 7. El DBN primero

entrena el primer RBM para obtener una capa oculta adecuada y utiliza el

probabilidad de activación de las unidades de capa oculta como entrada visible

de la segunda GBR, y el proceso de formación de la segunda y

la tercera RBM es análoga. Usando un solo y compuesto sin etiquetar

datos de la señal de caída de voltaje, el DBN es una capa de entrenamiento no supervisada


por

capa. La salida obtenida al apilar múltiples RBM se considera

como parámetros de características, y los parámetros de características se transmiten a

la capa Softmax para la clasificación de múltiples etiquetas. Finalmente, el

La red es supervisada y ajustada por el etiquetado único y

datos de señal de caída de tensión compuesta y algoritmo de BP. Cuando el costo

de la estructura de la red es el más pequeño, el modelo DBN pre-entrenado

es obtenido.
3.4 modelado SSDAE

SSDAE apila múltiples SDAE a través de su apilamiento único

mecanismo. La salida de la capa oculta de la primera SDAE se utiliza como

la entrada de red de la segunda SDAE, y la parte de mapeo de

se descarta la primera capa oculta de SDAE a la capa de salida. Por

entrenar el peso entre las neuronas de la red, lo oculto

capa de SDAE puede aprender las características abstractas y de baja dimensión

representación de los datos de entrada bajo la interferencia ruidosa, y

utilícelo como el peso de inicialización de cada capa de RBM del DBN,

que puede mejorar eficazmente la velocidad de convergencia del

red y el rendimiento anti-ruido del modelo.

3.4.1 Modelado SDAE:

AE es uno de los aprendizajes no supervisados

campos. Tiene como objetivo reconstruir la información de entrada y automáticamente

aprender sus características de datos y representaciones de baja dimensión, por lo tanto

reduciendo datos irrelevantes y redundantes. Como se muestra en la Fig.8, SDAE

suprime la salida de las neuronas ocultas en la capa oculta al

introducir términos de penalización escasos sobre la base de AE, por lo tanto


reduciendo la dimensión de la capa oculta, lo que es beneficioso para

el aprendizaje de las características más profundas de la red. Mientras tanto, al azar

Se agrega ruido a los datos de entrada para que el AE aprenda y elimine

tal interferencia de ruido, estimando así la entrada original. Este método de entrenamiento
puede reducir efectivamente la sensibilidad del

red a la señal de entrada y hacer que las funciones aprendidas sean más

robusto. Además, puede mejorar la capacidad de generalización del EA

modelo para datos de entrada [29]. Para ser coherente con la DBN,

El número de unidad de SDADE de las capas ocultas es 1024, 256 y 7.

Donde X representa los datos de entrada sin procesar, (X∼= x1

∼, x2∼, x3. . . x∼) representa los datos de entrada con ruido aleatorio, H representa el capa
oculta. La definición de función de costo de SDAE es como se muestra abajo.

El primer término en (8) es el error cuadrático medio, donde hW, b xi ∼

es elsalida de la señal ruidosa x∼. El segundo término es la pena escasa

término, donde γ es el coeficiente de ponderación del término de penalización, ρ es

el parámetro de dispersión (ρ = 0.05), ρ^j es el valor medio de activación

de la j-ésima neurona y su método de cálculo es como se muestra en (9).


KL ρ∥ ρ^jse utiliza para medir la diferencia entre ρ y ρ^j,

que se calcula como se muestra en (10). Para prevenir la

el entrenamiento establece datos de sobreajuste y hace que el modelo sea más amplio

utilizado, se introduce un tercer término regular, entre los cuales λ es el

parámetro de retraso de peso.

3.4.2 Entrenamiento del modelo SSDAE:

Se muestra la estructura de SSDAE

en la Fig. 9. En el proceso de formación, la primera SDAE es la primera

sin supervisión utilizando los datos de la señal sin etiquetar, luego el segundo

SDAE se entrena utilizando la salida de la capa oculta del primer SDAE,

y así. Durante el entrenamiento no supervisado de SDAE, los parámetros son

actualizado como se muestra en (11).

Entre ellos, α es la tasa de aprendizaje. Cuando el error de costo del

red es la más pequeña, se obtiene el modelo SDAE previamente entrenado.

4 Diseño experimental y análisis de resultados

En vista de la gran cantidad de datos de señal de caída de voltaje etiquetados necesarios

para el entrenamiento del modelo híbrido, este trabajo obtiene principalmente datos

a través de experimentos de simulación y combina la caída de voltaje


registro de datos registrados por la calidad de la energía de una compañía eléctrica sistema
de seguimiento para verificar el método basado en fusión híbrida.

4.1 Análisis de experimentos de simulación

4.1.1 Adquisición de datos experimentales:

Refiriéndose al método de simulación propuesto por Tan y Ramachandaramurthy [30]

y Li et al. [31], este documento establece el sistema de simulación

modelo que se muestra en la Fig.10 en la plataforma Matlab / Simulink para

simular las señales correspondientes a las tres caídas de tensión única

causas y las cuatro causas de caída de tensión compuesta. El fundamental

La amplitud de la tensión de alimentación en el modelo es de 110 kV y

la frecuencia es de 50 Hz. Los armónicos tercero, quinto y séptimo cada uno

contienen 5% y los armónicos 9, 11 y 13 contienen cada uno un 2%.

El nivel de tensión está configurado como 110 / 10,5 / 0,4 kV; F es la culpa

punto en la línea; M1 es el punto de seguimiento; K1, K2 es el interruptor trifásico; M cerca


de la carga está el motor de inducción (M1, M2) la capacidad es de 15 kVA); Ambos T1 y
T2 están conectados en el Yn/ Tipo Y, T3 y T4 están cableados en el tipo Y / Y, y T2 tiene
en cuenta el características de saturación del núcleo. En el experimento de simulación, la
duración total de la simulación se establece a 0,2 s, es decir, la duración de grabación del
osciloscopio es de diez ciclos. Por cambiando los parámetros de la carga de línea, la
ocurrencia de la falla posición, la hora de inicio y parada de la falla, el transformador y la

capacidad del motor de inducción, el experimento obtiene 600 datos de muestra

cada uno de la falla de cortocircuito de tierra monofásica C1, El grandearranque del motor
de inducción C2, el transformador de conmutación C3, elcaída de tensión de varios niveles
C4, el cortocircuito de tierra monofásico Fallo combinado con el motor de inducción
grande que arranca C5, el Fallo de cortocircuito a tierra monofásico combinado con el
transformador de conmutación C6 y el gran motor de inducción que arranca

combinado con el transformador de conmutación C7 cuales son los siete tipos de causas de
caída de voltaje.

Dado que el tamaño de la interfaz de entrada del modelo CNN integrado en este

el papel es de 24px * 24px * 3, para que coincida con la entrada de datos

requisitos del modelo, el experimento registra simultáneamente

las tensiones trifásicas del punto de monitorización a través del

osciloscopio y ajuste el osciloscopio a 625 muestras igualmente espaciadas

puntos para cada conjunto de datos de muestra. Al mismo tiempo, porque hay

Puede haber problemas como datos de grabación incompletos y diferentes

punto de partida de la grabación causado por factores como el

funcionamiento de la grabadora, el entorno in situ o operación humana, este papel realiza


una interceptación de igual longitude procesamiento en la señal de simulación original, es
decir, atraviesa el datos originales de 625 puntos de muestreo, utilice la ventana deslizante

mecanismo para seleccionar las primeras 576 muestras de datos a la vez, y

deslice siete pasos hacia adelante para obtener una muestra de datos de tamaño 576 × 7,

que expande efectivamente el conjunto de datos de entrenamiento, haciendo un uso


completo de la capacidad de aprendizaje flexible de la red neuronal profunda para muestras

características tales como datos de grabación incompletos y mejora

la robustez del modelo. Dado que los datos de campo se verán afectados por el ruido, este
documento también superpone el ruido blanco gaussiano con una relación señal / ruido de

40, 30 y 20 dB en la señal de simulación de los datos de prueba originales

para verificar la inmunidad al ruido del método propuesto.


4.1.2 Configuración:

La computadora utilizada para nuestros experimentos es una

estación de trabajo con una CPU Intel i7 a 3,40 GHz, 48 GB de RAM y una

GPU NVIDIA Titan Xp de 128 GB. El programa se implementa en

python, usando la biblioteca de Keras con el backend de TensorFlow.

Tomando la elección de la tasa de aprendizaje y la tasa de abandono como una

ejemplo, al seleccionar parámetros clave, el experimento básicamente

utiliza validación cruzada múltiple para determinar el reconocimiento

precisión (RA) del conjunto de pruebas como objetivo de la búsqueda de cuadrícula. Los
datos del proceso de búsqueda se muestra en la Tabla 2.

Mediante ajustes constantes, los hiperparámetros utilizados para

tren están cuidadosamente ajustados y se dan en la Tabla 3.

4.1.3 Criterios para evaluar el desempeño:

Con el fin de Asegúrese de que el resultado del reconocimiento sea intuitivo y fácil de

entender, este experimento introduce el RA de la caída de voltaje

causas en modelos tradicionales y su método de cálculo es como se muestra abajo

donde T es un conjunto de muestras de prueba correspondiente a una caída de voltaje que


causa categoría, C es el número de muestras en las que todas las tensiones

las etiquetas de causa de pandeo y combinaciones de las mismas se reconocen


correctamente. Para reflejar la estabilidad de reconocimiento de varios

la caída de voltaje causa etiquetas en la categoría de diferentes compuestos

caídas de voltaje, este experimento también introduce el error (fuga)


La tasa (WR) de la caída de voltaje simple causa etiquetas basadas en el RA.

El índice de evaluación de la tasa se calcula como se muestra a continuación

4.1.4 Análisis del proceso de formación: según la formación

idea de este artículo, el experimento primero utiliza los datos del conjunto de entrenamiento
de

procesamiento silencioso para pre-entrenar el modelo CNN para obtener el

Parámetros de las capas convolucionales y los totalmente conectados

capas en el modelo CNN. Como se muestra en la Fig.11, como el número de

iteraciones aumenta, el RA del modelo generado gradualmente

aumenta y hay fluctuación local, y la pérdida de red

disminuye gradualmente y tiende a ser estable. Cuando el número de

iteraciones alcanza 150, el rendimiento de reconocimiento de la

modelo generado tiende a ser estable, y su RA alcanza el 96%, que

refleja la buena capacidad de procesamiento del modelo CNN para datos 2D,

pero es necesario mejorar el RA. El experimento luego fija los parámetros del
convolucional capa del modelo CNN, y utiliza los datos de salida del conjunto de
entrenamiento a través de la capa convolucional para realizar un entrenamiento sin
supervision en el modelo SSDAE y obtener los parámetros de la

capa de cada modelo SDAE. Luego usa estos parámetros para inicializar

el peso del modelo DBN y completar el entrenamiento previo sin supervisión de cada capa
de RBM y el ajuste fino general del DBN modelo. Como se muestra en la Fig.12, a medida
que aumenta el número de iteraciones, el RA del modelo DBN inicializado por el peso del
modelo SDAE
aumenta rápidamente y las fluctuaciones locales se ralentizan, y la

La pérdida de red también disminuye rápidamente y se estabiliza gradualmente en el

proceso general de ajuste fino. Cuando el número de iteraciones alcanza

60, el rendimiento de reconocimiento del modelo generado tiende a ser

estable y la AR alcanza el 98%. El RA de la red es muy mejorado, lo que refleja la buena


capacidad de procesamiento del DBN modelo para datos 1D. Además, se muestra que el
uso de SDADE modelo para inicializar el modelo DBN puede mejorar eficazmente la

velocidad de convergencia de la red. Finalmente, las capas de conexión completas del


modelo CNN son cambiado a las capas RBM del modelo DBN, el convolucional

Parámetros de capa del modelo CNN previamente entrenado y los parámetros

de las capas de RBM en el modelo DBN se migran, y todo La red se supervisa y ajusta con
los datos del conjunto de entrenamiento. Como mostrado en la Fig.13, con el aumento del
número de iteraciones, el RA del modelo generado aumenta rápidamente y el local

las fluctuaciones no son obvias. La pérdida de la red también disminuye

rápidamente y tiende a ser estable. El RA del modelo final generado tiende a ser del 99%.
En comparación con el RA del preentrenamiento del modelo CNN, el RA del modelo
híbrido ha mejorado enormemente.

4.1.5 Análisis de resultados experimentales:

En este experimento, el Los datos del conjunto de prueba se utilizaron para realizar una
validación cruzada de cuatro veces en el modelo generado. Los resultados de la
clasificación se muestran en la Tabla 4.Se puede ver que la tasa de reconocimiento
promedio de los solteros y caídas de voltaje compuesto para un procesamiento silencioso es
del 99,4%, y el La fracción de error de etiqueta (fuga) es de 1,2% en promedio. El
experiment también realiza entrenamiento iterativo en la red construida bajo

diferentes niveles de ruido y prueba el RA del modelo generado. Eso

Puede verse en la Tabla 4 que a medida que aumenta el nivel de ruido, el


la tasa de reconocimiento promedio del modelo híbrido disminuye del 99,4%

al 98,8%, 97,9% y 96,3% y la tasa de error de etiqueta (fuga)

aumenta del 1,2% al 3,0%, 5,7. % y 10,4%. El experiment Verifica razonablemente la


precisión y antirruido de la propuesta. método. Solo la muestra de prueba con una relación
señal / ruido de 20 Db tiene un RA bajo, principalmente porque las señales de caída de
voltaje de C2 y C7. Es difícil distinguirlos bajo ruido, lo que resulta en un

aumento de la tasa de errores de reconocimiento. Sobre la base de la existente

modelo, la red puede ser supervisada incrementalmente entrenada por

más datos después del procesamiento de ruido, para mejorar el RA y

Mejorar el rendimiento anti-ruido del modelo. El experimento superpone aún más el ruido
blanco gaussiano con una relación señal-ruido de 40, 30 y 20 dB en el equipo de
entrenamiento, y utiliza los datos para llevar a cabo una formación incremental supervisada

el modelo existente. Se puede ver en los resultados que el promedio

RA de la caída de tensión que provoca en un entorno silencioso es del 99,4%

y la fracción (de fuga) es de 1,2% en promedio. La AR promedio

después del tratamiento es del 99,2% y la fracción de error de etiqueta (fuga) es

1,6% de media. El modelo tiene un fuerte aprendizaje autónomo

capacidad para diferentes ruidos y verifica la eficacia del

método para el ruido. También muestra que la red mantiene la estabilidad

y plasticidad durante el entrenamiento incremental y se puede aplicar a

aprendizaje incremental.

4.2 Verificación de datos medidos


4.2.1 Conjunto de datos medidos y etiquetas:

Los datos de medición en Este documento se deriva de los eventos de caída de voltaje
reales capturados por el sistema de información inteligente de la calidad de la energía de la
compañía eléctrica. Específicamente de Beijing, Shanghai, Guangzhou, Xiamen, Shanxi

y otras ciudades. El conjunto de datos contiene eventos de caída de voltaje con

diferentes niveles de voltaje (cubre niveles de voltaje de 10, 35, 110 y

220 kV), diferentes duraciones y diferentes distribuciones de voltaje.

El conjunto de datos utilizado en este trabajo consta de 3508 eventos de caída de tensión.

El método de reconocimiento presentado [16, 32] se ha utilizado para

ayudar e inspeccionar el etiquetado manual que consta de siete

clases. La Tabla 5 muestra la distribución de los datos de medición en

las siete clases. En el conjunto de datos, los eventos causados por una sola caída de voltaje
provocan son dominantes, pero los eventos de la caída de tensión compuesta provocan

también se distribuyen aproximadamente de manera uniforme en diferentes categorías. A

al mismo tiempo, para cumplir con los requisitos de entrada de la

modelo, se seleccionaron 576 datos de puntos de muestreo consecutivos en el

experimento, y el proceso normal y el proceso de hundimiento de todos

Los datos de medición se incluyeron tanto como fue posible, y

normalizado y mapeado en 2D.

4.2.2 Análisis de resultados experimentales:

los resultados experimentales de los datos medidos preprocesados se basan en lo anterior

proceso de reconocimiento. Cabe mencionar que, considerando que

la calidad de los datos reales no es tan perfecta como la de los datos de simulación

y el volumen de datos es limitado, con el fin de acelerar la red


aprendizaje característico de los datos medidos, el experimento primero

migra todos los parámetros después del entrenamiento de datos de simulación, ya que

valor inicial de la red. Entonces, la red es iterative incremental entrenado con los datos
medidos, mejorando la validez y rendimiento de reconocimiento del modelo en los datos
medidos. Para evaluar más a fondo el desempeño del esquema propuesto en

cada clase, la Tabla 6 muestra la matriz de confusión en el conjunto de datos de prueba.

Donde C es la etiqueta obtenida del clasificador, C ′ es el ‘suelo

etiqueta de verdad. Basado en la matriz de confusión dada en la Tabla 6, el

Se calcula RA y WR para cada clase y se muestra en la Tabla 7.

Puede verse en la tabla que el método puede reconocer un total de 3508 datos registrados,
que verifican eficazmente la robustez del modelo híbrido a la completa e incompleta

datos grabados causados por factores como el rendimiento de la grabadora, el entorno en el


lugar o el funcionamiento humano inadecuado que pueden existir en la red eléctrica real, y
demostrar la poderosa capacidad de aprendizaje del modelo híbrido para datos medidos,

aprovechando al máximo la capacidad de aprendizaje flexible de

red neuronal.

4.3 Comparación con otros métodos

Idealmente, se deberían hacer comparaciones para sistemas que están diseñados

para reconocer los mismos tipos y número de clases, utilizando el

mismos conjuntos de datos. Sin embargo, tales comparaciones son muy difíciles ya que

Los primeros trabajos sobre el reconocimiento de caídas de tensión rara vez utilizan
grandes conjuntos de datos. También es difícil encontrar sistemas con el mismo tipo y
número de clases como el sistema propuesto. Por tanto, las comparaciones seleccionadas en
este parte sólo puede servir como una indicación de rendimiento relativo, en lugar de
que la comparación absoluta. Como se muestra en la Tabla 8, en comparación con el
tradicional métodos de investigación, el RA del modelo propuesto de la tensión única

las causas del hundimiento son mayores. Como se muestra en la Tabla 9, en comparación
con el tradicional métodos de investigación, el método propuesto logra mejores resultados
para el RA de la caída de tensión compuesta provoca. Mientras tanto, el

Reconocimiento de causa de caída de voltaje compuesto tradicional existente

Los métodos utilizan métodos manuales para extraer las características físicas de las señales
y la estructura de red construida en este documento. puede aprender y extraer de forma
independiente los parámetros característicos de las señales de caída de tensión, evitando la
pérdida de información del proceso de extracción de características artificiales. El modelo
generado también tiene mejor rendimiento anti-ruido y capacidad de generalización, y
puede ser aplicado eficazmente al sistema de energía.

5. Conclusión

Este documento presenta CNN, DBN y SDADE en el aprendizaje profundo

algoritmo y propone un método para el reconocimiento de caídas de tensión

basado en un modelo híbrido de aprendizaje profundo. La transformación 2D tiene

ha sido usado. Transforma los datos de la señal de caída de voltaje en un gris 2D

imagen, de modo que la distribución de las características de perturbación es más

concentrado, lo que es beneficioso para aprovechar al máximo la señal

características de diferentes causas de caída de tensión y la característica

aprendizaje de CNN. El DBN se utiliza para mejorar la etiqueta múltiple

capacidad de clasificación del modelo. Los parámetros obtenidos por el

Los SDADE se utilizan para mejorar la velocidad de convergencia y el rendimiento


antirruido del modelo. El fuerte rendimiento anti-ruido del modelo de fusión se verifica
mediante comparaciones experimentales bajo diferentes niveles de ruido. Al mismo tiempo,
los datos medidos del El sistema de monitoreo de la calidad de la energía se utiliza para
probar la validez de la

modelo híbrido para los datos de registro completos o incompletos en el

red eléctrica real, que es adecuada para la práctica de la ingeniería.

En comparación con el típico reconocimiento de causas de caída de tensión

métodos, el modelo generado por el método puede lograr un reconocimiento de alta


precisión de las causas de los caídas de voltaje. Su capacidad de generalización y aplicación
práctica. valor son mucho más altos que los métodos tradicionales. El método

propuesto en este documento puede adaptarse a la complejidad de la red eléctrica

equipos, la generación de energía conectada a la red de nueva energía

fuentes y la diferenciación regional del consumo de energía

modos. Solo necesita usar la caída de voltaje histórica etiquetada

datos de señal para entrenar iterativamente la red en la ingeniería real

ambiente. Basado en el modelo existente, la red es supervisado incrementalmente entrenado


por más datos, y el generado

El modelo puede lograr un reconocimiento de alta precisión de la caída de voltaje.

causas.

También podría gustarte