Está en la página 1de 16

Traducido del inglés al español - www.onlinedoctranslator.

com

energías

Artículo

Pronóstico de sobrecarga pesada a corto plazo de transformadores públicos


basado en el modelo combinado LSTM-XGBoost
hao-ma1,*, Peng Yang2,3, FeiWang4, Xiaotian Wang1, Di Yang1y Bo Feng1

1 Centro de servicios de marketing de State Grid Hebei, Shijiazhuang 050021, China


2 Escuela de Ingeniería Eléctrica y Electrónica, Universidad de Energía Eléctrica del Norte de China, Beijing 102206, China State
3 Grid Hebei Electric Power Co., Ltd., Shijiazhuang 050021, China
4 Departamento de Ingeniería Eléctrica, Universidad de Energía Eléctrica del Norte de China, Baoding 071003, China
* Correspondencia: mahao3313@sina.com ; Teléfono: +86-133-1596-7750

Abstracto:Con el fin de llevar a cabo de manera efectiva el monitoreo y mantenimiento de sobrecargas pesadas de los
transformadores públicos en la red de distribución, garantizar la confiabilidad del suministro de energía de la red de distribución
y mejorar la satisfacción del cliente con el consumo de electricidad, este documento presenta un método de pronóstico de
sobrecargas pesadas a corto plazo para transformadores públicos. basado en el modelo combinado LSTM-XGBOOST. El modelo
extrae variables de características de sobrecarga pesada de cuatro dimensiones, incluida la información de parámetros básicos,
el clima, el tiempo y la carga reciente, y construye un modelo de predicción de la segunda carga más alta a corto plazo basado en
el algoritmo LSTM para obtener el valor pronosticado de la segunda carga más alta. tasa. Después de agregar las variables de
característica de sobrecarga pesada y la segunda tasa de carga más alta pronosticada, el algoritmo XGboost se emplea para
construir un modelo de predicción de sobrecarga pesada a corto plazo para transformadores públicos para juzgar si los
transformadores públicos muestran una sobrecarga pesada. Los resultados de las pruebas muestran que este método tiene una
alta precisión en el pronóstico de sobrecargas pesadas a corto plazo y puede ayudar de manera efectiva en el monitoreo y
control clave de sobrecargas pesadas en transformadores públicos.

Palabras clave:transformador de distribución de red; sobrecarga pesada; LSTM; pronóstico de carga; XGBoost

Citación:Ma, H.; Yang, P.; Wang, F.;


Wang, X.; Yang, D.; feng, b.
Pronóstico de sobrecargas pesadas a corto
1. Introducción
plazo de transformadores públicos basado El estado de carga de los transformadores de distribución de la red (en lo sucesivo,
en el modelo combinado LSTM-XGBoost. transformadores) determina en gran medida la calidad y la fiabilidad de un suministro de energía. Con el
Energías2023,dieciséis, 1507. https:// rápido desarrollo económico, la mejora continua del nivel de vida de las personas y el rápido aumento en
doi.org/10.3390/en16031507 el consumo de energía relacionado con la producción industrial y comercial y la vida de las personas, se
Editores Académicos: Vitor
han impuesto cargas cada vez mayores a los transformadores, lo que provoca grandes sobrecargas,
Monteiro y Abu-Siada Ahmed envejece los equipos y reduce su servicio. vida [1]. Además, la fuerte sobrecarga de los transformadores
provoca rápidamente problemas como la inestabilidad del voltaje y los cortes de energía, lo que hace que
Recibido: 15 noviembre 2022
no cumplan con los requisitos de calidad y confiabilidad de la energía [2]. Por lo tanto, es obligatorio
Revisado: 16 enero 2023
desarrollar un método de predicción de sobrecarga pesada para mejorar de manera efectiva la operación
Aceptado: 30 enero 2023
de emergencia de la red eléctrica y garantizar la confiabilidad del suministro de energía de un
Publicado: 3 febrero 2023
transformador. Este método de predicción ayudará en la regulación de la carga, reducirá la inestabilidad
del voltaje y minimizará los cortes de energía causados por fuertes sobrecargas. Además, el método de
predicción de sobrecarga pesada también puede evitar el mantenimiento pasivo y la gestión de

Derechos de autor:© 2023 por los


transformadores [3], mejorando la calidad del suministro eléctrico.
autores. Licenciatario MDPI, Basilea, Con la popularización de los medidores inteligentes y la recopilación de datos de todos los eventos, los sistemas

Suiza. Este artículo es un artículo de de información de consumo de electricidad ya recopilan una gran cantidad de datos, incluidos los datos de operación de

acceso abierto distribuido bajo los los transformadores de distribución [4,5], proporcionando una base sólida para el análisis de grandes datos de tales
términos y condiciones de la licencia transformadores. Teniendo en cuenta la predicción de sobrecarga pesada de los transformadores, la mayoría de los
Creative Commons Attribution (CC BY) estudios han considerado la predicción de carga como punto de partida [6–9], y han usado datos históricos de carga
(https:// creativecommons.org/ para extraer patrones de variación de carga o han empleado métodos de aprendizaje automático para construir
licenses/by/ 4.0/). modelos de previsión de carga [10–12]. Por ejemplo, Shen et al. [13] predicho

energía es2023,dieciséis, 1507. https://doi.org/10.3390/en16031507 https://www.mdpi.com/journal/energies


Energías2023,dieciséis, 1507 2 de 16

la carga diaria de energía desde la perspectiva de los hábitos de consumo. Al dividir los hábitos generales
de consumo de electricidad en varias categorías, se identificaron curvas de carga diarias similares y un
proceso de suavizado de funciones del núcleo ponderó las curvas de carga diarias similares. Después de
pesar, se obtuvo la curva de predicción por unidad y el valor base se predijo mediante el método de
suavizado de multiplicación. Luego, el valor base se multiplicó por la predicción por unidad para obtener
la curva de predicción final. Para predecir la fuerte sobrecarga durante el Festival de Primavera, Shi et al.
[14] propuso un método de predicción de sobrecarga pesada basado en una red neuronal Back
Propagation (BP) y un modelo gris. Este método predijo los cambios de carga de los transformadores
antes y después de la Fiesta de la Primavera para determinar la condición de sobrecarga severa. Vale la
pena señalar que la predicción de carga es solo un factor clave en la predicción de sobrecarga de los
transformadores de distribución, con el estado de sobrecarga definido como la carga que excede el 80%
de la capacidad durante al menos dos horas consecutivas. Debido a la baja precisión de la predicción de
carga, las predicciones que solo involucran el pronóstico de carga no pueden cumplir con el requisito real
porque también se deben considerar el clima, el tiempo y las características operativas.
Por lo tanto, algunos estudios han explorado los factores que influyen en la sobrecarga pesada, con He et
al. [15,dieciséis] analizando la relación entre la sobrecarga de los transformadores de distribución y los factores
relacionados con el transformador, meteorológicos y del cliente. Luego, los autores desarrollaron un modelo de
predicción de sobrecarga pesada basado en la teoría del bosque aleatorio, considerando la temperatura, el día
de la semana, la estación y otros datos como variables características. Zhang et al. [17] examinó la relación entre
varios eventos de sobrecarga pesada, incluidos los atributos del equipo y del usuario, el entorno natural y las
características de carga a corto plazo. Luego, las variables de característica de sobrecarga pesada se utilizaron
para establecer un modelo de predicción de sobrecarga pesada a corto plazo. Sin embargo, estos métodos solo
se centraron en los factores que influyen en la sobrecarga pesada y no consideraron el factor de tendencia de
carga fundamental que causa la sobrecarga pesada.
Impulsado por las deficiencias de los métodos mencionados anteriormente, proponemos un método de
predicción de sobrecarga pesada a corto plazo basado en el modelo combinado Long Short-Term Memory
(LSTM) -XGBoost. Nuestra técnica primero utiliza el algoritmo LSTM para construir un submodelo para la
predicción de carga que predice la segunda carga más alta para el día siguiente, que es una característica
variable crucial para la predicción de sobrecarga pesada. En segundo lugar, teniendo en cuenta los datos
históricos de operación y las condiciones meteorológicas, se extraen veintidós variables de características de
sobrecarga pesada de los datos históricos, incluidos el tiempo, el clima, el estado de carga histórico y la carga
reciente. Finalmente, el algoritmo XGBoost se utiliza para mejorar la precisión de predicción de sobrecarga
pesada a corto plazo del día siguiente. El método desarrollado considera exhaustivamente los factores que
influyen en la sobrecarga pesada y las ventajas de la previsión de carga de potencia. En comparación con los
algoritmos actuales, LSTM ofrece una predicción de carga más precisa, mientras que XGBoost logra una
predicción más precisa de sobrecarga pesada.

2. Teorías básicas
2.1. LSTM
Una red neuronal recurrente (RNN) es una red neuronal multicapa mejorada que
comprende las capas de entrada, oculta y de salida.18]. La red Long Short-term Memory
(LSTM) mejora la RNN al resolver el problema de la desaparición del gradiente. Al configurar
las puertas de olvido, entrada y salida, el LSTM combina las memorias a corto y largo plazo [
19,20], y aprende las funciones de datos a corto y largo plazo. LSTM ha demostrado un
desempeño atractivo en varios problemas de pronóstico de series de tiempo [21,22]. Cifra1
ilustra la estructura interna de la red LSTM.
Dóndehtes el vector de salida en el tiempoyo,yCtes el vector de estado a largo plazo de la red
en el tiempot.WF,Wi,WC, yWoson la matriz de peso de entrada de cada estado,Ft,it, y ot representan
la puerta de olvido, la puerta de entrada y la puerta de salida en la red.C1trepresenta el estado de
entrada actual,sybronceadoson las funciones de activación de la red,ses la función sigmoidea, y
bronceadoes la función tangente hiperbólica. Las dos funciones introducen la transformación no
lineal en la red neuronal de modo que la red tenga una expresividad no lineal robusta.
Energías2023,dieciséis, 1507 3 de 16

Figura 1.Estructura de LSTM.

2.2. XGBoost
Antes de presentar XGBoost, es necesario presentar las estrategias de aprendizaje y potenciación del
conjunto. El aprendizaje en conjunto comprende múltiples alumnos individuales generados a partir de datos de
entrenamiento a través de algoritmos de aprendizaje existentes, que se combinan para obtener una capacidad
de generalización significativamente mejor que la de un solo alumno.
El impulso es un método de aprendizaje conjunto típico, cuyo principio es que el peso de cada
muestra es el mismo en el conjunto de entrenamiento inicial, y se obtiene un alumno base a través del
entrenamiento clásico. Luego, el peso de cada muestra en el conjunto de entrenamiento se ajusta de
acuerdo con el resultado del alumno base; es decir, se aumentan los pesos de las muestras incorrectas y
se reducen los de las muestras correctas. Luego se obtiene un nuevo alumno entrenando las muestras
ajustadas. Este proceso se repite hasta que el número de alumnos básicos alcanza un valor predefinido, y
estos alumnos básicos se ponderan y combinan. Los métodos de impulso tradicionales incluyen árboles
de impulso, árboles de decisión potenciados por gradiente y Adaboost.
El árbol de impulso es un método que utiliza un árbol de decisión como clasificador básico. Utiliza el
modelo aditivo y el algoritmo de distribución directa para realizar un aprendizaje optimizado. Cuando la función
de pérdida es la pérdida cuadrática y la pérdida exponencial, la optimización de cada paso es relativamente
simple pero bastante compleja para las funciones de pérdida estándar. Para resolver esto, el algoritmo del árbol
de decisión potenciado por gradiente (GBDT) utiliza el algoritmo de distribución directa [23], y el alumno débil
solo usa el algoritmo de árbol de regresión del árbol de clasificación y regresión (CART). GBDT combina el
algoritmo de gradiente y el algoritmo de árbol de regresión.
XGBoost significa aumento de gradiente extremo y es una versión mejorada de GBDT
que ofrece alta precisión y eficiencia en varias tareas de clasificación [24]. De acuerdo a [25,26
], XGBoost puede prevenir eficazmente el sobreajuste y presenta un rendimiento de
generalización atractivo.

3. Modelo de predicción de sobrecarga pesada a corto plazo

La sobrecarga pesada se define como la tasa de carga de tres o más puntos de muestreo consecutivos
que superan el 80 %. La ocurrencia de sobrecargas fuertes de un transformador está relacionada con su
condición, el número de usuarios en el área y los tipos de consumo de electricidad. Estos factores también se
ven afectados por el clima, el período, las vacaciones y la industria. Por lo tanto, primero extraemos 21 variables
de características de sobrecarga pesada de las dimensiones y empleamos el algoritmo LSTM para predecir la
segunda carga más alta como la variable 22 de la predicción de sobrecarga pesada a corto plazo. Basado en las
variables de características y el conjunto de datos, el algoritmo XGBoost se utiliza para construir un modelo de
predicción a corto plazo para una gran sobrecarga de transformadores de distribución.

3.1. Construcción de función de sobrecarga pesada

A partir de la información básica del archivo de parámetros sobre el transformador, el clima, el tiempo, las condiciones de
carga recientes y otras dimensiones, exploramos los vectores de características que afectan a los pesados.
Energías2023,dieciséis, 1507 4 de 16

sobrecarga de transformadores de distribución, y extraemos 21 variables de características, incluida la región, la


industria y la capacidad.

3.1.1. Funciones en la dimensión del archivo de parámetros básicos

Mesa1reporta tres variables de características en la dimensión de archivos básicos.

Tabla 1.Variables de características en la dimensión de archivos.

No. Variables de función

1 Región
2 Industria
3 Capacidad

Las variables de características anteriores se pueden obtener de los archivos de transformadores públicos en el
sistema de información de consumo de energía eléctrica.

(1) Características regionales

Las tasas de crecimiento de la demanda de energía entre regiones son desiguales, y las
proporciones de gran sobrecarga de los transformadores públicos en diferentes regiones varían
sustancialmente debido al rápido desarrollo de la economía social y otros factores. Por lo tanto, las
regiones se dividen según el nivel de las estaciones de suministro de energía. Estadísticas sobre la
proporción de sobrecarga pesada de transformadores públicos en cinco estaciones de suministro
eléctrico durante un período determinado (Figura2) revelan que los transformadores públicos de la
central eléctrica de JiaJiaKou sufren las sobrecargas más frecuentes.

Figura 2.La relación del número de sobrecargas pesadas de transformadores públicos en cinco subestaciones de suministro de
energía típicas.

(2) Características industriales

Las características estacionales y las leyes de período de la carga de potencia de los transformadores
públicos varían según las características de la industria, que se puede dividir en residentes urbanos, residentes
rurales, residentes mixtos de riego y drenaje y usuarios de riego y drenaje puros. Según las estadísticas, las
características de los residentes rurales presentan las sobrecargas pesadas más frecuentes de los
transformadores públicos (Figura3).
Energías2023,dieciséis, 1507 5 de 16

Figura 3.La relación del número de sobrecargas fuertes de transformadores públicos en un período específico en una
región según la naturaleza de la industria.

(3) Características de capacidad

Las cargas de los transformadores públicos presentan diferentes estados y leyes cambiantes debido a los
diferentes niveles de capacidad. En cuanto a los niveles de capacidad, los transformadores públicos se pueden
dividir en 20 kVA, 50 kVA, 100 kVA y 250 kVA. De acuerdo con las estadísticas sobre niveles de capacidad, los
transformadores públicos de 125 kVA presentan la sobrecarga fuerte más frecuente de los transformadores
públicos (Figura4).

Figura 4.La relación del número de sobrecargas fuertes de transformadores públicos contados por capacidad en un período
específico de una región.

3.1.2. Características en la Dimensión Meteorológica


Además, se extraen tres variables características en la dimensión meteorológica (Tabla2).

Tabla 2.Características de las variables en la dimensión meteorológica.

No. Variables de función

1 Temperatura máxima/mínima diaria


2 Humedad máxima diaria
3 Precipitación diaria

Las variables de las características meteorológicas, como la temperatura y la humedad máxima, se


pueden obtener de la plataforma de servicios meteorológicos. La temperatura mínima diaria
Energías2023,dieciséis, 1507 6 de 16

se selecciona del 15 de noviembre al 15 de marzo del año siguiente, y se selecciona la temperatura


máxima diaria para los períodos restantes.

(1) Variable de función de temperatura máxima/mínima diaria


Durante el verano, la carga de energía de los acondicionadores de aire aumenta rápidamente
debido a la aumento de la temperatura, y aumenta la probabilidad de una fuerte sobrecarga de los
transformadores públicos . En invierno, la carga de calefacción eléctrica residencial aumenta con la
disminución continua de la temperatura, y la fuerte sobrecarga de algunos transformadores ocurre con
mayor frecuencia. Así, Figura5ilustra la curva de carga de un transformador público, destacando que
cuanto mayor es la temperatura máxima, más frecuente es la sobrecarga fuerte.

Figura 5.La curva de carga de un transformador público a diferentes temperaturas máximas.

(2) Humedad máxima diaria y precipitación diaria


La humedad afecta la comodidad del cuerpo humano e indirectamente afecta la regulación del naturaleza

temperamento y la carga de deshumidificación. A mayor humedad relativa, mayor carga. La lluvia puedeer el
reducir efectivamente la temperatura, reduciendo así la carga de energía, lo que es evidente durante la yo es
lluvia y la precipitación en la carga a corto plazo de la transformación pública. ers.

3.1.3. Funciones en la dimensión del tiempo

Mesa3reporta tres características variables en la dimensión de tiempo.

Tabla 3.Características de las variables en la dimensión temporal.

No. Variables de función

1 Mes
2 Día laborable

3 Vacaciones

Estas características se pueden obtener directamente de la información de consumo de electricidad datos


históricos del sistema y datos de operación. Las características de vacaciones se basan en la ley vacaciones.

(1) Funciones mensuales

La utilización de la carga de los transformadores públicos varía según el mes. Por ejemplo, durante
el período puro de riego y drenaje, los transformadores públicos sufren una gran carga. En contraste, la
fuerte sobrecarga de los transformadores públicos para residentes urbanos y rurales ocurre con mayor
frecuencia durante el período de carga de aire acondicionado en verano y el período de calefacción
eléctrica en invierno (Figura6).
Energías2023,dieciséis, 1507

F nt meses.

(2
Las características de carga de los transformadores públicos están estrechamente relacionadas con las reglas de la vida
diaria de los residentes. De acuerdo con las estadísticas relacionadas con las características de los días de semana, la proporción
de cantidad de sobrecarga pesada de transformadores públicos en una determinada región dentro de un año (Figura7) revela
que la fuerte sobrecarga de los transformadores públicos se presenta con mayor frecuencia los sábados.

Figura 7.La relación de sobrecarga fuerte de los transformadores públicos en un área determinada de acuerdo con las
características semanales.

(3) Funciones de vacaciones

Comportamientos como reunirse y viajar durante los días festivos (p. ej., el día de Año Nuevo, el Festival de
Primavera, el Día de Barrido de Tumbas, el Primero de Mayo, el Festival del Bote del Dragón y el Día Nacional) influyen
en gran medida en la carga de energía regional (Figura8), lo que resulta fácilmente en la fuerte sobrecarga de algunos
transformadores públicos.

Figura 8.La curva de carga de un transformador público en día festivo y no festivo de Año Nuevo.
Energías2023,dieciséis, 1507 8 de 16

3.1.4. Funciones en la dimensión de carga reciente


También extraemos doce variables de características en la dimensión de carga reciente (Tabla4).

Tabla 4.Variables de características en la dimensión de carga reciente.

No. Variables de función

1 Tasa de carga máxima diaria promedio durante los tres días anteriores
2 DE de la tasa de carga máxima diaria de los tres días anteriores Número
3 de días con eventos de sobrecarga intensa en los tres días anteriores
4 Número de eventos de sobrecarga intensa en los tres días anteriores Número de
5 puntos con eventos de sobrecarga intensa en los tres días anteriores
6 Promedio de puntos sin luz o sin carga en los tres días anteriores Tasa
7 de carga máxima diaria promedio durante los siete días anteriores
8 DE de la tasa de carga máxima diaria durante los siete días anteriores Número
9 de días con eventos de sobrecarga intensa en los siete días anteriores
10 Número de eventos de sobrecarga intensa en los siete días anteriores Número
11 de puntos con eventos de sobrecarga intensa en los siete días anteriores
12 Promedio de puntos sin luz o sin carga en los siete días anteriores

Las 12 variables de características en la Tabla4se calculan a partir de los datos de funcionamiento del
sistema de información de consumo eléctrico. Las características específicas se calculan de la siguiente manera:
La tasa de carga máxima diaria promedio de los tres días anterioresrmáximopromedio_3es el
valor medio de la tasa de carga máxima por transformador a pronosticar en los tres días
anteriores, calculado como:
3
∑rimáximo
rmáximopromedio_3=i=1 (1)
3
dónderimáximodenota la tasa de carga máxima diaria del transformador en eli-ésimo día
considerando los tres días anteriores.
La DE de la tasa de carga máxima diaria durante los tres días anterioresrDakota del Sur_3es la
desviación estándar de la tasa de carga máxima por transformador a pronosticar en los tres días
anteriores, calculada como:

√ 3( )2


√∑i=1 rimáximo−rmáximopromedio_3
(2)
rDakota del Sur_3=
3
El número de días con eventos de sobrecarga pesada en los tres días anterioresTzgz_3se
calcula por:
3
Tzgz_3=∑tzgz_j (3)
j=1

dóndetzgz_jindica si se produce una gran sobrecarga en elj-th día. Si se produce una gran
sobrecarga,tzgz_j=1. De lo contrario,tzgz_j=0.
El número de eventos de sobrecarga pesada en los tres días anterioresCzgz_3es dado por:

3
Czgz_3=∑Czgz_j (4)
j=1

dóndeCzgz_jes el número de eventos de sobrecarga pesada en elj-th día.


El número de puntos con eventos de sobrecarga pesada en los tres días anterioresDzgz_3es
dado por:
3
Dzgz_3=∑dzgz_j (5)
j=1
Energías2023,dieciséis, 1507 9 de 16

dóndedzgz_jes el número de puntos con eventos de sobrecarga pesada en elj-th día.


El promedio de puntos sin luz o sin carga en los tres días anterioresDfqz_3se calcula como:

3
Dfqz_3=∑dfqz_j (6)
j=1

dóndedfqz_jes la suma de los puntos sin luz o sin carga en elj-th día. Las seis variables
restantes son las mismas pero se calcularon para los siete días anteriores.

3.2. Predicción de la segunda tasa de carga más alta a corto plazo basada en LSTM

Los datos de funcionamiento del transformador se recogen una vez al día en punto de la hora; es decir,
24 veces al día. La relación entre la segunda carga más alta y la capacidad se denomina segunda tasa de carga
más alta.
La carga a corto plazo se ve afectada principalmente por el clima y las vacaciones. Por lo tanto,
cuando se usa LSTM para predecir la segunda tasa de carga más alta, los datos de entrada del modelo
deben incluir la segunda tasa de carga más alta del día anterior y las variables meteorológicas, festivas y
de días de semana en el día de pronóstico (Tabla5). Esto se debe a que la carga se ve significativamente
afectada por la temperatura, con las temperaturas máximas de verano y las mínimas de invierno
afectando fuertemente la carga. Además, se introduce la variable de vacaciones para reflejar el impacto
de las vacaciones en la segunda carga más alta. Si el día evaluado es feriado, su valor es uno; de lo
contrario, es cero. La variación de carga de lunes a domingo se refleja a través de la variable día de la
semana; es decir, lunes = 1 y domingo = 7.

Tabla 5.Características de las variables del modelo de predicción para la segunda tasa de carga más alta.

Variables de función Contenido Valor

Clima Temperatura máxima/mínima Numero actual


Día de Año Nuevo, Qingming, Primero de Mayo,
Día festivo 0,1
y Festival del Medio Otoño
Día laborable Lunes martes, . . . , y Domingo 1...7

Los datos de salida son la segunda tasa de carga más alta pronosticada en el día de predicción, con
el modelo LSTM correspondiente ilustrado en la Figura9.

Figura 9.Segunda predicción de tasa de carga más alta.

La estructura interna del LSTM se muestra en la Figura1, dóndeLtes la segunda tasa de carga
más alta en elt-th día,Xtincluye la temperatura más alta, la temperatura más baja, si es un día
festivo y el día de la semana en elt-th día.htes la salida del modelo de la segunda tasa de carga más
alta en elt-th día. La segunda tasa de carga más alta pronosticada se usa como una variable
característica para la predicción a corto plazo de sobrecargas pesadas.

3.3. Procesamiento de características

Las variables de características extraídas involucran elementos de cadena discretos y elementos numéricos
continuos. Para facilitar el aprendizaje automático y mejorar la eficiencia del procesamiento, se deben procesar las
variables de características.
Energías2023,dieciséis, 1507 10 de 16

3.3.1. Elementos de cadena discretos

La región, la industria, el día de la semana, el mes y el feriado son variables de cadena discretas.
Por ejemplo, las características de la industria incluyen cinco valores; es decir, residentes urbanos,
residentes rurales, mezcla de riego y drenaje residente, drenaje y riego puro y sin clasificar. El algoritmo
de aprendizaje automático no puede reconocer el significado de los caracteres; por lo tanto, es necesario
convertir los valores en valores numéricos, es decir, 1–5. De manera similar, las variables de región,
industria, día de la semana, mes y feriado se procesan numéricamente.

3.3.2. Normalización de las funciones continuas


Algunas variables de características, como la tasa de carga máxima promedio y la desviación
estándar de la tasa de carga máxima en los tres días anteriores, varían. Si el rango de valores de una
característica es bastante diferente de las otras características, afecta la distancia de muestra calculada
por el modelo y los resultados serán inconsistentes con la situación real. Por lo tanto, es necesario
normalizar los valores de las características para eliminar el impacto negativo del rango de valores en los
resultados y aumentar la velocidad de disminución del gradiente para encontrar rápidamente la solución
óptima. En este estudio, explotamos el método de normalización lineal:

z - zmin
z′= (7)
zmáximo−zmin

dóndez′es el valor de característica normalizado,zes el valor de la característica original, yzminyzmáximo


son los valores máximo y mínimo de la variable. Después de la normalización lineal, el rango
de las variables está entre 0 y 1.

3.4. Predicción de sobrecarga pesada basada en XGBoost

El algoritmo XGBoost crea un método de predicción de sobrecarga intensa y pronostica si se producirá


rápidamente un evento de sobrecarga intensa. Específicamente, el conjunto de datos de características se
divide en conjuntos de entrenamiento y prueba, con el algoritmo XGBoost, explotado para construir el modelo
de predicción de sobrecarga basado en el conjunto de entrenamiento. El modelo de predicción se evalúa en el
conjunto de prueba y los resultados de la predicción se comparan con los datos de operación reales para
determinar la precisión del modelo.

3.4.1. Conjunto de entrenamiento

Por lo general, el conjunto de datos se divide en función de una proporción específica, por ejemplo, 4:1, o
utilizando elnortemétodo de validación cruzada -fold, es decir, el conjunto de datos se divide ennortepartes iguales, y
uno de ellos se selecciona secuencialmente para la prueba. El restantenorte -1 partes se utilizan para el entrenamiento
modelo, y el promedio de lasnorte-tests determina la precisión del modelo. La predicción de sobrecarga pesada en este
estudio tiene características temporales. Además, en el proceso de predicción real, el modelo solo puede entrenarse
con los datos recopilados antes del período de predicción. Por lo tanto, el esquema de selección del conjunto de prueba
aleatorio del conjunto de datos de características no se ajusta al escenario de aplicación real. Por lo tanto, en el caso de
épocas fijas, debe establecerse un cierto período antes del conjunto de prueba como conjunto de entrenamiento. En el
proceso de modelado, el tamaño del conjunto de entrenamiento afecta la precisión y eficiencia del algoritmo. Por lo
tanto, el conjunto de entrenamiento involucra datos relacionados con los primeros tres meses en el conjunto de
prueba.

3.4.2. Ajuste de parámetros


En el modelo de predicción de sobrecarga pesada basado en XGBoost, la tasa de aprendizaje, la
profundidad máxima y la cantidad de iteraciones afectan la precisión del modelo. Por lo tanto, el ajuste de estos
parámetros optimiza la precisión del modelo.

3.5. Pasos del proceso de predicción de sobrecarga pesada

El diagrama de flujo de predicción de sobrecarga pesada a corto plazo de transformadores públicos


ilustrado en la Figura10.
Energías2023,dieciséis, 1507 11 de 16

Figura 10.El diagrama de flujo de predicción de sobrecarga pesada a corto plazo de transformadores públicos basado en el
modelo combinado LSTM-XGBoost.

Paso 1: Se determina el transformador público a pronosticar y el día de la predicción. Paso 2:


Se extraen los datos básicos históricos, de carga y meteorológicos de los transformadores
públicos. En concreto, del sistema de adquisición de información de consumo de energía se
extraen los datos relativos a los archivos de transformadores públicos y la carga en los tres meses
anteriores al día de predicción. Luego, la plataforma de servicios meteorológicos extrae datos
meteorológicos, como temperatura máxima, temperatura mínima, humedad máxima y
precipitación diaria, en esta región durante un período de tres meses.
Paso 3: se construyen las variables de características. Primero, de acuerdo con los datos históricos y de
carga del transformador público que involucran los tres meses anteriores al día de predicción, se forman 18
características como la dimensión de datos históricos, la dimensión de tiempo y la dimensión de carga reciente.
Luego, de acuerdo con los datos de información meteorológica, se extraen tres características de la dimensión
meteorológica. Después de eso, la segunda tasa de carga más alta del transformador público del día anterior se
extrae como una variable característica y se forman 22 variables características.
Paso 4: Se construye un conjunto de entrenamiento que comprende 22 variables de características, que se combinan para
construir las muestras de entrenamiento diario durante los tres meses anteriores al día de predicción.
Energías2023,dieciséis, 1507 12 de 16

Paso 5: Los parámetros de XGBoost se configuran para construir un modelo de predicción de sobrecarga pesada basado
en el conjunto de entrenamiento.
Paso 6: Se diseñan veintiuna variables características del transformador público a predecir el día de
la predicción. Específicamente, 18 variables de características involucran la dimensión de datos históricos,
la dimensión de tiempo y la dimensión de carga reciente, y tres datos de características, es decir,
temperatura máxima/mínima, humedad máxima diaria y precipitación diaria, se extraen en el día de
predicción.
Paso 7: La segunda tasa de carga más alta del transformador público en el día de predicción se pronostica
como la variable característica 22, formando un conjunto de predicción (conjunto de prueba). La segunda tasa
de carga más alta del día de predicción se obtiene usando un algoritmo LSTM que explota los datos de la
segunda tasa de carga más alta, la temperatura máxima, la temperatura mínima y los feriados/días de la
semana del transformador público que se va a predecir para tres meses antes del dia de la prediccion Por lo
tanto, se construye un conjunto de predicción basado en las 22 variables de características diseñadas.
Paso 8: El conjunto de predicción se predice a través del modelo de predicción de sobrecarga pesada,
proporcionando los resultados de predicción de sobrecarga pesada correspondientes, que se envían a la base de datos.

4. Experimenta
4.1. Hardware y software
Se construyó una plataforma de análisis de big data para este estudio, que comprende nueve
servidores (un servidor de interfaz y ocho servidores de clúster Hadoop CDH). El servidor de interfaz
utiliza la base de datos de interfaz de Oracle y los datos de distribución se extraen al almacén de datos
de Hive del clúster CDH de Hadoop a través del programa de interfaz unificada. El clúster CDH de
Hadoop consta de dos nodos maestros y seis servidores de subnodos, y utiliza el almacén de datos de
Hive para procesar y analizar los datos masivos de las variables de distribución, construir y verificar el
modelo a través de Spark y TensorFlow, y almacenar los resultados en el Almacén de datos de Hive para
una demostración visual.

4.2. Datos experimentales


Con el fin de verificar la precisión del método de predicción de sobrecarga pesada propuesto, los datos de carga
de potencia de 66.200 transformadores en un área específica se extraen del sistema de información de consumo de
electricidad que involucra cuatro períodos de prueba con características estacionales típicas seleccionadas como
conjunto de prueba (Tabla6). El conjunto de entrenamiento comprende los datos de características del transformador en
los tres meses anteriores, mientras que la plataforma de análisis de big data se utiliza para la extracción de
características y la construcción de modelos.

Tabla 6.Períodos típicos de prueba.

No. Períodos de prueba típicos Conjunto de datos de prueba

1 Del 20 de marzo al 26 de marzo T1


2 Del 24 de julio al 30 de julio Del 30 T2
3 de octubre al 5 de noviembre Del 25 de T3
4 diciembre al 31 de diciembre T4

4.3. Índices de Evaluación


Las principales métricas de evaluación son la precisión, la tasa de recuperación y laF1, con precisiónPAGcalcular
lated como:
TP
PAG= (8)
TP+FP
dóndeTPdenota el verdadero positivo, yFPes el falso positivo. La tasa de recuerdoRse calcula por:

TP
R= (9)
TP+FN
Energías2023,dieciséis, 1507 13 de 16

dóndeFNdenota falso negativo.F1 se calcula como:

2×PAG×R
F1 = (10)
PAG+R

4.4. Resultados de predicción de la segunda tasa de carga más alta a corto plazo basados en LSTM

Tomando el período de prueba típico del 24 al 30 de julio, el algoritmo LSTM, el algoritmo de red
neuronal y el algoritmo de regresión de la máquina de vectores de soporte se aplican respectivamente
para construir el modelo de tasa de carga subalta para 66,200 transformadores públicos. La tasa de
carga real de los transformadores se utiliza para la verificación, con los resultados correspondientes
ilustrados en la Figura11, donde ely-eje es el valor absoluto del error promedio por modelo. La última
figura destaca que el error del método LSTM en el período de prueba es menor que el de los métodos de
la competencia.

Figura 11.Error de predicción en la segunda tasa de carga más alta de cada algoritmo.

4.5. Resultados

Basado en las 22 variables de función de sobrecarga pesada, el algoritmo XGBoost se usa para construir
el modelo de predicción, utilizando los parámetros presentados en la Tabla7. Mesa8y figuras12–14reportar la
exactitudPAG, tasa de recuperaciónR, yF1 valor de los resultados de la prueba.

Tabla 7.Configuración de parámetros de XGBoost.

No. Parámetro Valor

1 Número de iteraciones 5
2 Profundidad máxima 5
3 Suma mínima de peso 1
4 Tasa de aprendizaje 0.1
5 L1 coeficiente de término regular 0.2
6 L2 coeficiente de término regular 0.2

El rendimiento de LSTM-XGBoost se comparó con la red neuronal BP, el bosque


aleatorio y GBDT. Para ser justos, los parámetros de cada algoritmo se optimizaron antes de
las pruebas.
Desde la perspectiva de los negocios, las unidades comerciales de base prestan más atención a la
precisión de la predicción de si un transformador público se sobrecargará en el corto plazo.
Energías2023,dieciséis, 1507 14 de 16

La alta precisión de la predicción de sobrecarga pesada puede ayudar mejor en la reparación activa y el control
de carga de los transformadores públicos.
Mesa8revela que el algoritmo LSTM-XGBoost alcanza la mayor precisión de predicción de sobrecarga
pesada en los cuatro períodos de prueba, con un promedio de alrededor del 85,87 % y una tasa de recuperación
del 72,67 %. Los resultados indican que el método de predicción de sobrecarga pesada de este estudio supera a
los métodos actuales.

Tabla 8.Rendimiento de la predicción de sobrecarga pesada a corto plazo de cada algoritmo.

Índices Algoritmo T1 T2 T3 T4 Significar

PA 60,13% 68,12% 61,35% 72,52% 65,53%


Bosque aleatorio 74,32% 76,64% 70,51% 69,88% 72,84%
PAG GBDT 74,30% 80,48% 72,52% 75,36% 75,67%
LSTM-XGBoost 86,91% 85,81% 83,99% 86,76% 85,87%
PA 59,88% 55,39% 64,65% 68,57% 62,12%
Bosque aleatorio 49,20% 68,86% 63,21% 62,21% 60,87%
R GBDT 65,11% 74,61% 69,83% 66,56% 63,64%
LSTM-XGBoost 74,46% 75,54% 71,13% 69,55% 72,67%
PA 60,00% 61,10% 62,96% 70,49% 63,64%
Bosque aleatorio 59,21% 72,54% 66,66% 65,82% 66,06%
F1 GBDT 69,40% 77,43% 71,15% 70,69% 72,17%
LSTM-XGBoost 80,20% 80,35% 77,03% 77,21% 78,70%

Figura 12.Precisión P de modelos de predicción de sobrecarga pesada de transformadores públicos basados en varios algoritmos.

Figura 13.Tasa de recuperación R de modelos de predicción de sobrecarga pesada de transformadores públicos basados en cada algoritmo.
Energías2023,dieciséis, 1507 15 de 16

Figura 14.F1 de modelos de predicción de sobrecargas pesadas de transformadores públicos basados en cada algoritmo.

5. Conclusiones
Este estudio extrae variables de características de sobrecarga pesada de cuatro dimensiones, incluida la
información de parámetros básicos, el clima, el tiempo y la carga reciente, y construye un modelo de predicción
de la segunda tasa de carga más alta basado en el algoritmo LSTM para obtener el valor pronosticado de la
segunda tasa de carga más alta. Después de agregar las variables de característica de sobrecarga pesada y la
segunda tasa de carga más alta pronosticada, el algoritmo XGboost construye un modelo de predicción de
sobrecarga pesada a corto plazo para transformadores de distribución. Después de la verificación experimental,
se extraen las siguientes conclusiones:

(1) El modelo LSTM-XGBoost propuesto considera los factores que influyen en las sobrecargas pesadas,
como el día de la semana, el mes y la temperatura, y analiza el impacto de la predicción de carga
en la sobrecarga pesada. Los resultados destacan que el método propuesto mejora la precisión de
la predicción de sobrecargas pesadas a corto plazo.
(2) La investigación futura incluirá la situación actual de gran sobrecarga como una característica variable.
Además, los tipos de industria se subdividirán para construir el modelo de correlación entre la sobrecarga
pesada y factores como el clima, el período y los tipos de industria. Luego, se obtendrá una puntuación
para cada combinación de factores, y cuanto más alta sea la puntuación, más probable será que se
produzca una gran sobrecarga cuando se produzca la combinación de factores.
La puntuación de correlación se utilizará como una variable característica de predicción de sobrecarga pesada, lo que
mejorará la precisión de la predicción.
(3) El modelo de predicción de sobrecarga pesada a ultracorto plazo desarrollado puede detectar y localizar con
precisión los riesgos de sobrecarga pesada por adelantado. Esto es importante, especialmente en períodos
como una epidemia, ayudando a los trabajadores de primera línea a realizar un mantenimiento temprano y
formular planes rápidamente en presencia de eventos de sobrecarga pesada, asegurando una alta eficiencia del
suministro de energía en el área de prevención de epidemias.

Contribuciones de autor:Conceptualización, PY; Metodología, HM; software, SM; Validación, HM;


Análisis formal, HM y FW; Investigación, HM, PY, DY y BF; Recursos, XW, DY y BF; Curación de datos,
HM; Redacción—borrador original, HM; Redacción—revisión y edición, FW; Visualización, PY y FW;
Administración de proyectos, PY y XW; Adquisición de fondos, PY Todos los autores han leído y
están de acuerdo con la versión publicada del manuscrito.

Fondos:Esta investigación no recibió financiación externa.

Declaración de disponibilidad de datos:No aplica.

Conflictos de interés:Los autores declaran no tener conflicto de intereses.

Referencias
1. Wang, T.; Guan, L.; Zhang, X.; Zhang, Y. Un nuevo método para la evaluación de la estabilidad del sistema de potencia basado en el clasificador de vecino k-más cercano
extendido.automático eléctrico Sistema de energía2008,32, 18–21, 75.
2. Zhang, Y.; Kou, L.; Sheng, W.; Wang, J.; Liang, Y.; Song, Q. Método analítico de Big Data para la evaluación del estado operativo del transformador
de distribución.Sistema de energía Tecnología2016,40, 768–773.
Energías2023,dieciséis, 1507 16 de 16

3. Cai, D.; Wang, W.; Ma, X.; Xu, M.; él, Z.; Tang, Z.; Zhou, C.; Han, N.; Wang, Y. Análisis del transformador de distribución de carga pesada y
sobrecarga en la red eléctrica regional. En Actas de la 2.ª Conferencia IEEE de 2018 sobre Internet de energía e integración de sistemas de
energía (EI2), Beijing, China, 20 al 22 de octubre de 2018; págs. 1 a 5.
4. Zhu, E.; Liu, X. Construcción y aplicación del sistema de adquisición de información de energía eléctrica. En las Actas de la 3.ª Conferencia
Internacional sobre Software y Redes de Comunicación del IEEE de 2011, Xi'an, China, 27–29 de mayo de 2011; págs. 114–116.
5. Ma, H.; El, C.; Wang, L.; Yang, P.; Shen, H.; Tao, P. Evaluación de carga de transformadores públicos basada en la adquisición de información de
consumo de energía y big data.eléctrico medida instrumento2020,57, 99–105.
6. Qian, K.; Wang, X.; Yuan, Y. Investigación sobre modelo regional de pronóstico de carga de potencia a corto plazo y análisis de casos.Procesos2021, 9, 1617. [
Referencia cruzada]
7. Fallah, SN; Ganjkhani, M.; Shamshirband, S.; Chau, K.-W. Inteligencia computacional en el pronóstico de carga a corto plazo: una descripción
metodológica.Energías2019,12, 393. [Referencia cruzada]
8. Li, M.; Zhou, Q. Preaviso de carga pesada y sobrecarga a mediano plazo para transformadores de distribución basado en regresión logística. En
Proceedings of 2015 IEEE Eindhoven PowerTech, Eindhoven, Países Bajos, 29 de junio a 2 de julio de 2015; págs. 1 a 5.
9. Torkzadeh, R.; Mirzaei, A.; Mirjalili, MM; Anaraki, AS; Sehhati, MR; Behdad, F. Pronóstico de carga a mediano plazo en sistemas de distribución
basado en regresión multilineal y análisis de componentes principales: un enfoque novedoso. En Actas de la 19.ª Conferencia de distribución
de energía eléctrica (EPDC2014), Teherán, Irán, 6 y 7 de mayo de 2014; págs. 66–70.
10. Kwac, J.; Flora, J.; Rajagopal, R. Segmentación del consumo energético de los hogares utilizando datos horarios.Trans. IEEE. Red inteligente2014,5, 420–430. [
Referencia cruzada]
11. Alberto, A.; Rajagopal, R. Segmentación basada en medidores inteligentes: qué dice su consumo sobre usted.Trans. IEEE. Sistema de energía2013, 28, 4019–
4030. [Referencia cruzada]
12. Pei, S.; Qin, H.; Yao, L.; Liu, Y.; Wang, C.; Zhou, J. Pronóstico de carga a corto plazo de varios pasos mediante la selección de funciones híbridas y la
red de memoria a corto plazo mejorada.Energías2020,13, 4121. [Referencia cruzada]
13. Chen, S.; Qin, J.; Sheng, W.; Fang, H. Estudio sobre el pronóstico a corto plazo de la carga del transformador de distribución utilizando el método Wavelet y
Clustering.Sistema de energía Tecnología2016,40, 521–526.
14. Shi, CK; Yan, W.; Zhang, X.; Zhang, B.; Abanico, Y.; Tang, W. Pronóstico de sobrecarga pesada del transformador de distribución durante el festival de
primavera basado en la red BP y el modelo gris.J. Electr. ciencia del poder Tecnología2016,31, 140–145.
15. Él, J.; Wang, H.; Ji, Z.; Meng, X.; Zhang, T. Análisis de los factores que afectan la sobrecarga del transformador de distribución en la red inteligente.Sistema de energía
Tecnología2017,41, 279–284.
16. Él, J.; Wang, H.; Ji, Z. Pronóstico de sobrecarga pesada de transformadores de distribución basado en la teoría del bosque aleatorio.Sistema de energía Tecnología 2017,
41, 2593–2597.
17. Zhang, G.; Wang, X.; Deng, C. Método de predicción de sobrecarga pesada para redes de distribución basado en análisis de asociación y aprendizaje
automático.Grandes datos2018,11, 106–116.
18. Zaraí, R.; Kachout, M.; Hazber, MAG; Mahdi, MA Redes neuronales recurrentes y redes neuronales profundas basadas en el sistema de detección de
intrusos.Biblioteca de acceso abierto. j2020,7, e6151. [Referencia cruzada]
19. Wang, Y.; Zhang, N.; Chen, X. Un modelo de pronóstico de carga residencial a corto plazo basado en la red neuronal recurrente LSTM teniendo en cuenta las
características climáticas.Energías2021,14, 2737. [Referencia cruzada]
20. Bashir, T.; Haoyong, C.; Tahir, MF; Liqiang, Z. Pronóstico de carga de electricidad a corto plazo utilizando el modelo híbrido Prophet-LSTM optimizado por
BPNN.representante de energía2022,8, 1678–1686. [Referencia cruzada]
21. Zhang, D.; Tong, H.; Li, F.; Xiang, L.; Ding, X. Un método de pronóstico de carga eléctrica a ultracorto plazo basado en temperatura-
factor-peso y modelo LSTM.Energías2020,13, 4875. [Referencia cruzada]
22. Stratigakos, A.; Bachoumis, A.; Vita, V.; Zafiropoulos, E. Pronóstico de carga neta a corto plazo con análisis de espectro singular y redes
neuronales LSTM.Energías2021,14, 4107. [Referencia cruzada]
23. Ke, G.; Xu, Z.; Zhang, J.; Bian, J.; Liu, T.-Y. DeepGBM: un marco de aprendizaje profundo destilado por GBDT para tareas de predicción en línea. En
Actas de la 25.ª Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos, Anchorage, AK, EE. UU., 3–7
de agosto de 2019.
24. Chen, T.; Guestrin, C. Xgboost: Un sistema escalable de potenciación de árboles. En Actas de la Conferencia Internacional sobre Descubrimiento de
Conocimiento y Minería de Datos, San Francisco, CA, EE. UU., 13–17 de agosto de 2016; ACM: Singapur, 2016; págs. 785–794.
25. Li, L.; Situ, R.; Gao, J.; Yang, Z.; Liu, W. Un modelo híbrido que combina una red neuronal convolucional con XGBoost para predecir la popularidad
en las redes sociales. En Actas de la 25.ª Conferencia Internacional ACM sobre Multimedia (MM'17), Nueva York, NY, EE. UU., 23–27 de octubre
de 2017; ACM: Singapur, 2017; págs. 1912–1917.
26. Pan, B. Aplicación del algoritmo XGBoost en la predicción de la concentración de PM2.5 por hora.Conferencia de la OIO. Ser. Entorno terrestre. ciencia2018,113, 012127. [Referencia
cruzada]

Descargo de responsabilidad/Nota del editor:Las declaraciones, opiniones y datos contenidos en todas las publicaciones pertenecen exclusivamente a los
autores y contribuyentes individuales y no a MDPI y/o a los editores. MDPI y/o el(los) editor(es) declinan toda responsabilidad por cualquier daño a personas o
propiedad que resulte de cualquier idea, método, instrucción o producto mencionado en el contenido.

También podría gustarte