Está en la página 1de 43

Facultad de Ingeniería

Ingeniería Eléctrica y de Potencia

TESIS

PREDICCIÓN DE LA DEMANDA ELÉCTRICA MEDIANTE TÉCNICAS DE

MACHINE LEARNING PARA DETERMINAR LA ÓPTIMA POTENCIA A

CONTRATAR EN LA EMPRESA TEXTIL MODIPSA

Integrantes

GOICOCHEA ESCOBAR, Cristhian Omar (U17204973)

SANCHEZ CUEVA, Cristian Juneor (1623861)

Para optar el Título Profesional de Ingeniero Electricista

Asesor:

Dr. Ing. ()

Lima, Perú

2022
DEDICATORIA
(Opcional)

II
AGRADECIMIENTOS

III
RESUMEN

IV
ÍNDICE

ÍNDICE............................................................................................................................... V

Índice de figuras........................................................................................................... VII

Índice de tablas........................................................................................................... VIII

INTRODUCCIÓN............................................................................................................... X

CAPITULO I................................................................................................................... - 1 -

ESTUDIO METODOLÓGICO DEL PROBLEMA........................................................- 1 -

1.1- Descripción del problema...............................................................................- 1 -

1.2- Preguntas de investigación..................................................................................- 3 -

1.2.1- Pregunta general..........................................................................................- 3 -

1.2.2- Preguntas especificas...................................................................................- 3 -

1.3- Objetivos de investigación...................................................................................- 3 -

1.3.1- Objetivo general............................................................................................- 3 -

1.3.2- Objetivos específicos....................................................................................- 3 -

1.4- Hipótesis de investigación...................................................................................- 4 -

1.4.1- Hipótesis general..........................................................................................- 4 -

1.4.2- Hipótesis especificas....................................................................................- 4 -

1.5- Justificación practica...........................................................................................- 4 -

CAPITULO II.................................................................................................................. - 6 -

MARCO TEÓRICO........................................................................................................ - 6 -

2.1- Antecedentes......................................................................................................- 6 -

2.2- Bases teóricas.....................................................................................................- 9 -

2.2.1- Inteligencia artificial.......................................................................................- 9 -

2.2.2- Pronostico de la demanda de energía eléctrica..........................................- 12 -

2.3- Definición de términos básicos..........................................................................- 13 -

CAPITULO III............................................................................................................... - 19 -

DESARROLLO METODOLÓGICO DE LA INVESTIGACIÓN......................................- 19 -

V
3.1- Diseño de investigación.....................................................................................- 19 -

3.2- Unidad de estudio..............................................................................................- 19 -

3.3- Tipo de investigación.........................................................................................- 20 -

3.4 Recolección de datos (que datos, cómo y con qué)...........................................- 20 -

3.5 Matriz de consistencia........................................................................................- 23 -

3.6- Desarrollo de la solución (EDT).........................................................................- 24 -

CAPITULO 4................................................................................................................- 25 -

RESULTADOS Y DISCUSIÓN.....................................................................................- 25 -

4.1- Objetivo 01........................................................................................................ - 25 -

4.2- Objetivo 02........................................................................................................ - 25 -

4.3- Objetivo 03........................................................................................................ - 25 -

4.3.1- Prueba 03-01..............................................................................................- 25 -

4.3.2- Prueba 03-02..............................................................................................- 25 -

4.3.3- Prueba 03-03..............................................................................................- 25 -

4.4- Discusión...........................................................................................................- 25 -

CONCLUSIONES........................................................................................................- 26 -

Anexos..................................................................................................................... - 26 -

Glosario.................................................................................................................... - 26 -

BIBLIOGRAFÍA............................................................................................................- 27 -

VI
Índice de figuras

Figura 1: Grupos de algoritmos de Machine Learning..................................................- 11 -

Figura 2: Configuración de una red neuronal artificial..................................................- 12 -

Figura 3: Etapas del diseño de la investigación...........................................................- 20 -

Figura 4: Perfil del consumo mensual..........................................................................- 22 -

VII
Índice de tablas

Tabla 1: Registro de potencia......................................................................................- 21 -

Tabla 2: Matriz de consistencia....................................................................................- 23 -

Tabla 3: Estructura de desglose de trabajo (EDT).......................................................- 24 -

VIII
IX
INTRODUCCIÓN

X
CAPITULO I

ESTUDIO METODOLÓGICO DEL PROBLEMA

1.1- Descripción del problema

La cadena productiva del sector eléctrico peruano parte desde la generación en donde el

aporte de [1] , describe a la generación eléctrica como la primera actividad que engloba la

transformación de las fuentes de energías primarias y secundarias mediante métodos

como la inducción electromagnética. Por otra parte, nuestra geografía accidenta permite

hacer uso eficiente del recurso hídrico mediante las centrales hidroeléctricas, asimismo,

se aprovecha de los residuos fósiles para la generación térmica, generando para el país

una potencia de aproximadamente 70 000 MW, de acuerdo a la investigación de [2].

Sumando a ello, la expansión demográfica y una industrialización creciente ponen en

marcha estudios y alternativas que permitan seguir satisfaciendo la demanda eléctrica del

Perú.

La información de [1], menciona que mediante la transmisión eléctrica se permite llevar a

niveles elevados de voltaje toda la electricidad desde las centrales de generación,

apoyándose de los distribuidores mediante el empleo de redes de media tensión (MT) y

baja tensión (BT) para permitir ser usadas por el cliente final, en este punto debido a la

existencia de una libre competencia en el mercado eléctrico los medianos y grandes

consumidores pueden negociar mediante contrato los precios de energía y potencia, sin

embargo, como menciona [3] los clientes regulados no están afectados en función del

precio del mercado mayorista, siendo esta una dificultad pendiente por resolver desde la

parte normativa.

1
Actualmente, el sector industrial presenta un crecimiento del 7.40% [4], por lo que cubrir

su demanda eléctrica es importante. Es por ello, la importación de determinar el valor

correcto que permita a la empresa omitir en un futuro gastos por conceptos de penalidad

debido a un consumo por exceso de potencia, además, en otros casos encontrar

limitaciones en las cláusulas del contrato que le permitan ampliar la potencia a contratar;

por lo que en este caso tendría que salir al mercado spot y comprar potencia a un precio

mayor al acordado en el contrato. Esto implica que el cliente pueda tener dos escenarios:

Mayor potencia contratada y menor demanda: este escenario solo se menciona y no será

materia de estudio debido a la magnitud de data requerida y que no es de fácil acceso

para un mejor tratamiento del sistema de predicción que aboca la presente investigación,

sin embargo, se realizan las descripciones de la problemática encontrada. En esta

condición, el generador debe tener potencia disponible para cubrir las cláusulas del

contrato de manera que el cliente no pague un exceso de potencia hasta un límite

establecido, asimismo, este escenario al no tener un estudio con una correcta predicción

pueda ocasionar que otro cliente tengan una amplia potencia contratada de la cual gran

parte no es utilizada; dirigiendo el problema al cliente el cual deberá genera mayor

potencia para cubrir la demanda de todos sus usuarios.

Menor potencia contratada y mayor demanda: este escenario es el más representativo y

que parte desde el cliente al momento de determinar el valor óptimo de potencia a

contratar. Durante las negociaciones; ambas partes realizan sus propuestas de la

potencia a contratar y ofertar; hasta llegar a un acuerdo. No obstante, la oferta que realiza

el generador se basa en el máximo consumo registrado en el año y toma ese valor de

referencia como la potencia optima a contratar, caso contrario, el cliente en base a un

cuadro de cargas o proyección estima la potencia a contratar. Sin embargo, ambos

análisis no consideran el crecimiento y la variación que adopto la empresa, lo que

2
determina una tendencia del perfil de carga que genero la empresa durante los años,

dejando aislado el crecimiento o decrecimiento del perfil de carga.

1.2- Preguntas de investigación

1.2.1- Pregunta general

¿De qué manera un sistema mediante técnicas de Machine Learning predice la

demanda eléctrica para determinar la óptima potencia a contratar en la empresa

textil Modipsa?

1.2.2- Preguntas especificas

 ¿Mediante técnicas de Machine Learning aplicadas a la prediccón del consumo de

energía eléctrica es posible optimizar los costos de la organización?

 ¿Es posible identificar el porcentaje de precisión tiene un sistema predictivo para

determinar la óptima potencia a contratar?

 ¿Cuáles son los procedimientos para realizar las comparaciones en un sistema

predictivo para determinar la óptima potencia a contratar?

1.3- Objetivos de investigación

1.3.1- Objetivo general

Identificar técnicas de Machine Learning que permitan predecir la demanda

eléctrica en la empresa Modipsa con el fin de determinar la potencia óptimaa contratar.

1.3.2- Objetivos específicos

 Demostrar que mediante técnicas de Machine Learning aplicadas a la predicción

del consumo de energía eléctrica se pueden optimizar los costos dentro de una

organización.

 Determinar la confiabilidad predictiva de modelos mediante técnicas de Machine

Learning en la predicción de la demanda eléctrica para determinar la óptima

potencia a contratar en la empresa Modipsa.

3
 Validar los procedimientos óptimos para realizar la predicción de la potencia a

contratar por la empresa Modipsa.

1.4- Hipótesis de investigación

1.4.1- Hipótesis general

H11: Mediante técnicas de machine learning se puede se puede predecir el consumo de

energía eléctrica en la empresa Modipsa.

H10: Mediante técnicas de machine learning no se puede se puede predecir el consumo

de energía eléctrica en la empresa Modipsa.

1.4.2- Hipótesis especificas

H21: Mediante técnicas de machine learning aplicadas a la predicción del consumo de

energía eléctrica se pueden optimizar los costos de la empresa Modipsa.

H20: Mediante técnicas de machine learning aplicadas a la predicción del consumo de

energía eléctrica no se pueden optimizar los costos de la empresa Modipsa.

H31: Los modelos predictivos de demanda eléctrica mediante machine learning tienen

una alta confiabilidad.

H30: Los modelos predictivos de demanda eléctrica mediante machine learning tienen

una baja confiabilidad.

H41: A través de una estructura de procedimientos sólida y ordenada se puede predecir la

demanda de energía eléctrica.

H40: No es posible que a través de una estructura de procedimientos sólida y ordenada

se puede predecir la demanda de energía eléctrica.

1.5- Justificación practica

La creciente demanda del sector industrial representa un futuro incierto para las

generadoras y distribuidores de electricidad en Perú, aun cuando tenemos un mercado

4
eléctrico robusto que satisface la demanda general, este crecimiento acelerado puede

resultar en un déficit energético, debido a esto es importante la predicción en un corto,

mediano o largo plazo. De igual manera, la producción cambiante de las industrias

representa la variable más importante para su estudio, siendo necesario su análisis y

evaluación para desarrollar nuevas estrategias que permitan una gestión energética

eficiente.

La investigación focaliza el estudio en el desarrollo del mejor método predictivo de

demanda eléctrica, con el cual se desea tener un panorama general del perfil de carga de

la empresa de estudio y dejando camino para que futuras investigaciones puedan evaluar

posibles soluciones energéticas tales como: incorporación de fuentes de generación de

energía utilizando tecnologías renovables y proyectos energéticos que desarrollen un

ahorro económico, debido a que , las fuentes de energía principales de las cuales

dispone nuestro mercado energético son de fuentes no renovables como hídrica y

combustibles fósiles, por el contrario, las fuentes no renovables representan un menor

aporte a la demanda existente.

Las evaluaciones de los métodos predictivos más confiables nos permiten utilizar esta

herramienta para poder acondicionarla a una problemática específica y poder formar el

modelo predictivo más cercano a la realidad de la empresa mediante el empleo de la data

histórica de la producción, temporadas y escenarios atípicos. Por ello, la evaluación de

los distintos métodos permitirá desarrollar nuevos alcances para la predicción, del mismo

modo, que abrirá futuros temas de investigación.

5
CAPITULO II

MARCO TEÓRICO

2.1- Antecedentes

En la actualidad, pronosticar el consumo de un sector industrial es una tarea complicada

debido al fluctuante consumo de los equipos eléctricos. Es de vital importancia poder

predecir el consumo eléctrico en la variedad de escalas temporales: Corto plazo (hasta

un mes), mediano plazo (hasta un año), y largo plazo (hasta 20 años). En ese sentido,

surge la idea de explorar la idea de investigar el uso de prácticas de modelos de

aprendizaje automático (machine learning), para poder predecir y en consecuencia

optimizar no solo el consumo eléctrico, sino también la mejora en la economía y la

sociedad en su conjunto. La tarea de saber anticipadamente la demanda eléctrica es

fundamental para poder mantener el equilibrio entre la oferta y la demanda para así

gestionar de manera eficiente los procesos de generación, distribución, y consumo de

electricidad.

La investigación realizada por [5] en su artículo denominado “Red neuronal convolucional

compatible con el perfil de carga típico para el pronóstico de carga a corto plazo en el

sector industrial”, tuvo como objetivo evaluar el error para mejorar un mejor modelo

propuesto mediante la incorporación de un modelo hibrido (arboles de decisiones y red

convolucional). El trabajo de investigación estuvo centrado en pronosticar la carga a

usuarios individuales y resumirlas en una curva de carga total, pronosticando la carga

industrial a nivel de fábrica con base en suposición de que cada vez habrá más datos de

fábricas individuales disponibles debido a la digitalización. En cuanto a la muestra el

6
modelo se entrena y prueba utilizando datos de carga medidos en los puntos de conexión

a la red de tres fábricas diferentes con una resolución de 15 minutos. Los resultados

mostraron que, en primer lugar, el uso de múltiples entradas endógenas conduce a una

mayor precisión. En segundo lugar, la combinación de un perfil de carga típico y entradas

endógenas en un modelo híbrido mejora los pronósticos de ambos modelos base. Por

último, es ventajoso tener en cuenta las características climáticas al formar perfiles de

carga típicos. El estudio concluyo que el modelo convolucional presenta menor tasa de

error y presenta mejor respuesta con datos con un desfase máximo de un día.

Consideramos relevante los aportes y conclusiones de esta investigación desde el punto

de vista del análisis del perfil de carga debido a que nuestra investigación contempla el

registro de cargas en periodos de 15 minutos, sin embargo, la data que emplearemos

para entrenar nuestro modelo utilizara data de mínimo 2 años.

En estudios recientes, los pronósticos mediante técnicas de aprendizaje automático

adquirieron importancia y se viene demostrando que superan a los modelos clásicos. La

predicción de carga de electricidad a corto plazo se utiliza para resolver diferentes

aplicaciones, por otro lado, el rango de pronóstico varía en el campo de la investigación,

según [6], pueden estos rangos pueden ser de 15 o 30 minutos, sin embargo, la mayoría

de los enfoques lo consideran por hora, en su investigación denominada “Pronóstico de

carga de electricidad a corto plazo con aprendizaje automático”. La investigación tuvo

como objetivo desarrollar mejores modelos de pronóstico de carga de corto plazo (STLF).

En su investigación plantean cinco modelos de aprendizaje automático (ML). Los datos

se extraen de diferentes fuentes como la carga histórica, el clima y las vacaciones. Los

resultados mostraron que el algoritmo Extreme Gradient Boosting Regressor (XGBoost)

mostro el mejor rendimiento del conjunto de algoritmos ML, superando los pronósticos

semanales históricos predichos por una herramienta de red neuronal artificial (ANN). Otro

enfoque que se ha utilizado ampliamente para realizar pronósticos de carga durante los

últimos años es la red neuronal artificial (ANN), debido principalmente al dúctil uso del

7
algoritmo. Por ejemplo, [7], en su investigación denominada “Cómo modelar perfiles de

carga de electricidad europeos utilizando redes neuronales” representan un método para

crear perfiles de carga de electricidad anuales, dependientes de clima, para países

europeos utilizando redes neuronales artificiales como base necesaria para pronósticos a

largo plazo. Los autores afirman que la relación entre las variables de entrada (es decir,

temperatura exterior, velocidad del viento, irradiación y fecha) y la carga de electricidad

aprendida por ANN da como resultado perfiles de carga significativamente mejores que

los enfoques basados en regresión. Los resultados que obtuvieron con el algoritmo de la

red neuronal artificial predicen el año de validación del 2016 un error porcentual absoluto

medio (MAPE) de 2.8%, por otro lado, el algoritmo para pronóstico de adecuación a

mediano plazo (MAF) obtuvieron un MAPE aproximado de 3.8%.

Por su parte, [8] , en su investigación “Adecuación de las redes neuronales para

pronósticos de carga diarios a gran escala en edificios y sistemas de distribución

utilizando datos de medidores inteligentes”. La investigación tuvo como objetivo

Adecuación de las redes neuronales para pronósticos de carga diarios a gran escala en

edificios y sistemas de distribución utilizando datos de medidores inteligentes. Sus

resultados mostraron que la metodología de redes neuronales podría no estar bien

elegida cuando se predice numerosas cargas de diferentes características mientras que

la configuración manual no es posible. Su estudio concluyo que, para el pronóstico diario

a gran escala de cargas locales, como casas individuales y pequeñas agregaciones que

se encuentran en micro redes o áreas de sistemas de distribución en general las redes

neuronales (ANN) no producen ninguna mejora estadísticamente significativa.

Por su parte, el objetivo de [9] en su investigación “Un conjunto de funciones novedosas

para consumidores de baja tensión, basado en la dependencia temporal del consumo y

las demandas máximas” fue agrupar los perfiles de carga anuales de los consumidores

de bajo voltaje, así como investigar la naturaleza estocástica de sus picos de demanda.

Estos perfiles de carga describen el consumo de electricidad durante un período de un

8
año, lo que permite el estudio de la dependencia estacional. El documento presenta un

nuevo conjunto de características basado en dos tipos de características:

respectivamente, la ventana de tiempo de consumo a nivel diario y semanal, y el

momento de ocurrencia de los picos de demanda.

Asimismo, [10], efectuaron un estudio denominado “Mejore la precisión de los algoritmos

de pronóstico a corto plazo mediante el perfil de carga estandarizado y el vector de

regresión de soporte: estudio de caso Vietnam”. La investigación tuvo como objetivo

proponer un método de pronóstico de carga a corto plazo mediante la construcción de un

perfil de carga estandarizado (SLP) basado en los datos de carga eléctrica anterior,

combinando algoritmos de aprendizaje automático. Los resultados que obtuvieron

mediante el uso SLP como conjunto de datos de entrada para los módulos de la función

de regresión de pronóstico es efectivo y brinda resultados de pronóstico con pocos

errores.

[11], en su estudio “Pronóstico del consumo de energía en Corea utilizando algoritmos de

aprendizaje automático”. Realizan la comparación de tres algoritmos de aprendizaje

automático como son el modelo Random Forest (RF), el modelo XGBoo (XGB) y el

modelo Long Short-Term Memory (LSTM, los cuales fueron aplicados antes (periodo 1) y

después (periodo 2) del COVID-19. Según sus resultados los autores sugirieron la

aplicabilidad del aprendizaje automático para pronosticar el consumo de energía y

también demostraron que los enfoques econométricos tradicionales pueden superar el

aprendizaje automático cuando hay menos irregularidad desconocida en la serie

temporal, pero el aprendizaje automático puede funcionar mejor con datos inesperados

de series temporales irregulares.

Ante lo expuesto, podemos concluir que el uso de técnicas de aprendizaje automático

(machine learning), es fundamental en el sector energético para poder predecir el

consumo de energía en un corto, mediano y largo plazo y lograr optimizar de manera

eficiente su uso evitando cobros innecesarios por errores en las previsiones de demanda.

9
2.2- Bases teóricas

2.2.1- Inteligencia artificial

La inteligencia artificial (IA, por sus siglas en inglés) se podría definir de una manera más

exacta como el esfuerzo por automatizar las tareas intelectuales que usualmente

realizamos los seres humanos [12]

La IA, es la capacidad de las máquinas para utilizar algoritmos, aprender de la

información y usar lo aprendido en la toma de decisiones semejante como lo haría una

persona. En cambio, a diferencia de las personas, las maquinas basadas en IA no

requieren descansar y pueden analizar enormes tamaños de información

simultáneamente. Igualmente, la dimensión de errores es relevantemente menor en los

dispositivos que realizan las mismas actividades que sus contrapartes humanas.

La IA, como tal, es un campo general que engloba tanto el aprendizaje automático y el

aprendizaje profundo. En los siguientes párrafos se desarrollaran el Machine Learning,

las redes neuronales artificiales y el Deep Learning (aprendizaje profundo), con el fin de

cubrir los conocimientos necesarios para una mejor comprensión de los modelos basados

en técnicas de Machine Learning a desarrollar en el presente trabajo de investigación.

2.2.1.1- Machine Learning

El Machine Learning (en español, aprendizaje automático) puede ser definida como el

campo dentro de la IA, donde la inteligencia se agrega sin ninguna programación

explicita [12].

El aprendizaje automático es uno de los principales enfoques de la IA, en pocas

palabras, son algoritmos que brindan a un ordenador la habilidad de aprender de los

datos y, de acuerdo ello, realizar predicciones y tomar decisiones, se podría decir, que

el aprendizaje automático utiliza algoritmos con el fin de aprender de los patrones de

datos.

Grupos de algoritmos de Machine Learning

10
A continuación, en la figura 1 muestra los tres grupos de algoritmos de Machine

Learning que pueden utilizarse:

Figura 1: Grupos de algoritmos de Machine Learning

Fuente: https://www.elsevier.com/es-es/connect/ehealth/inteligencia-artificial-y-salud-tipos-de-
algoritmos-de-machine-learning

En la Figura 1 encontramos los diferentes tipos de estructuras de machine

learning aplicables al fin de la presente investigación en donde se entiende como

un sistema supervisado a aquel que se basa en herramientas matemáticas para la

resolución de un problema, de la misma forma estos sistemas dependen de los

datos que le son ingresados; debemos entender como sistema no supervisado a

aquel que se autogestiona y a su vez trabaja con base en elementos complejos

como clusters y reglas de asociación para poder resolver un problema, de la

misma forma los sistemas de refuerzo son aquellos algoritmos que con base en la

retroalimentación aprenden mediante la IA a reaccionar frente a las variables del

entorno.

2.2.1.2- Redes neuronales artificiales

11
Las redes neuronales artificiales (ANN), son sistemas de procesamiento de la

información cuya estructura y funcionamiento están inspirados en el comportamiento

del cerebro. Radican en un conjunto de elementos sencillos conocidos como nodos

o neuronas enlazados entre sí por conexiones los cuales tienen un valor numérico

modificable llamado peso.

Figura 2: Configuración de una red neuronal artificial

Recuperado de: https://www.europeanvalley.es/noticias/crear-red-neuronal-desde-las-matematicas/

2.2.1.3- Deep Learning

El Deep Learning (en español, aprendizaje profundo), se trata de un subcampo del

aprendizaje automático el cual se usa para arreglar problemas complejos los cuales

normalmente contienen inmensas cantidades de datos.

2.2.2- Pronostico de la demanda de energía eléctrica

Se entiende por demanda eléctrica a la cantidad de electricidad que un determinado

consumidor requiere para abastecer sus necesidades.

2.2.2.1- Importancia de los pronósticos de la demanda eléctrica

El pronóstico de la demanda de energía eléctrica es de vital importancia puesto que

nos ayuda a tener un panorama general del perfil de carga de la empresa de estudio y

dejando camino para que futuras investigaciones puedan evaluar posibles soluciones

energéticas tales como: incorporación de fuentes de generación de energía utilizando

12
tecnologías renovables y proyectos energéticos que desarrollen un ahorro económico,

debido a que , las fuentes de energía principales de las cuales dispone nuestro

mercado energético son de fuentes no renovables como hídrica y combustibles fósiles,

por el contrario, las fuentes no renovables representan un menor aporte a la demanda

existente.

2.2.2.2- Modelización de predicción de energía eléctrica

Para modelar la demanda eléctrica se debe tener básicamente los siguientes

horizontes de predicción de la energía eléctrica:

Pronóstico de la demanda eléctrica a largo plazo

El pronóstico de la demanda eléctrica a largo plazo comprende entre uno a 10 años.

Pronóstico de la demanda eléctrica a mediano plazo

El pronóstico de la demanda eléctrica a mediano plazo, el cual comprende entre un

mes hasta un año desde el momento que se efectúa el estudio.

Pronóstico de la demanda eléctrica a corto plazo

El pronóstico de la demanda eléctrica a corto plazo, el cual comprende entre una

hora hasta una semana.

2.3- Definición de términos básicos

En presente apartado se detalla un glosario de términos comunes utilizados en la

predicción de la demanda eléctrica mediante el aprendizaje automático:

Aprendizaje automático: "El aprendizaje automático es un campo de la informática que

da a las computadoras la habilidad de aprender sin ser explícitamente programadas" [1].

Redes neuronales: "Una red neuronal es una red de procesamiento de información que

consiste en un conjunto de unidades interconectadas que se ajustan a sus entradas.

13
Estas unidades tienen la habilidad de procesar información y tomar decisiones basadas

en ese procesamiento" [2].

Regresión lineal: "La regresión lineal es una técnica de análisis de datos que se utiliza

para predecir el valor de una variable dependiente a partir de una o más variables

independientes" [3].

Sesgo: "El sesgo es la diferencia entre el valor esperado de una estimación y el valor

verdadero" [3].

Varianza: "La varianza es una medida de la dispersión de un conjunto de datos alrededor

de su media" [3].

Overfitting: "El overfitting ocurre cuando un modelo se ajusta demasiado a los datos de

entrenamiento y pierde su capacidad de generalizar a datos desconocidos" [3].

Regularización: "La regularización es una técnica utilizada para evitar el overfitting en el

aprendizaje automático" [3].

Muestreo: "El muestreo es el proceso de seleccionar un subconjunto de datos de un

conjunto más grande para analizar y obtener conclusiones" [3].

Validación cruzada: "La validación cruzada es una técnica de evaluación de modelos

que implica dividir los datos en grupos, entrenar el modelo en un grupo y evaluarlo en el

otro" [3].

14
Hiperparámetros: "Los hiperparámetros son parámetros de un modelo de aprendizaje

automático que no son directamente aprendidos a partir de los datos de entrenamiento"

[4].

Función de pérdida: "La función de pérdida es una medida de qué tan bien el modelo

está haciendo en la tarea de predicción" [4].

Gradiente descendiente: "El gradiente descendiente es un algoritmo utilizado para

optimizar los parámetros de un modelo de aprendizaje automático" [4]

Redes recurrentes: "Las redes recurrentes son redes neuronales que tienen conexiones

de retroalimentación en su interior, lo que les permite procesar secuencias de datos" [4].

Normalización de datos: "La normalización de datos es el proceso de transformar los

datos de tal manera que tengan una distribución normal" [3].

Feature engineering: "El feature engineering es el proceso de seleccionar y crear

características útiles a partir de los datos para mejorar la precisión de un modelo de

aprendizaje automático" [4].

Características: "Las características son los atributos o variables utilizadas como

entrada para un modelo de aprendizaje automático" [3].

Etiquetas: "Las etiquetas son las variables de salida que se están tratando de predecir

en un modelo de aprendizaje automático" [3].

15
Datos de entrenamiento: "Los datos de entrenamiento son el conjunto de datos

utilizados para ajustar o entrenar un modelo de aprendizaje automático" [3].

Datos de prueba: "Los datos de prueba son un conjunto de datos utilizados para evaluar

la precisión de un modelo de aprendizaje automático" [3].

Datos de validación: "Los datos de validación son un conjunto de datos utilizados para

evaluar el rendimiento de un modelo durante el proceso de entrenamiento" [3]

Métricas de evaluación: "Las métricas de evaluación son medidas utilizadas para

evaluar el rendimiento de un modelo de aprendizaje automático" [3].

Precision: "La precisión es la proporción de predicciones correctas de un modelo de

aprendizaje automático" [3].

Exactitud: "La exactitud es la proporción de predicciones correctas de un modelo de

aprendizaje automático en relación con el total de predicciones" [3].

Sensibilidad: "La sensibilidad es la capacidad de un modelo de aprendizaje automático

de detectar correctamente un evento" [3].

Especificidad: "La especificidad es la capacidad de un modelo de aprendizaje

automático de no detectar un evento cuando éste no está presente" [3].

Transformación de datos: "La transformación de datos es el proceso de modificar los

datos de entrada para mejorar el rendimiento de un modelo de aprendizaje automático"

[3].

16
Outliers: "Los outliers son valores atípicos o extremos en un conjunto de datos" [3].

Escalado de características: "El escalado de características es el proceso de

transformar los datos de tal manera que todas las características tengan la misma escala"

[3].

Estandarización de características: "La estandarización de características es el

proceso de transformar los datos de tal manera que tengan una distribución normal con

una media de cero y una desviación estándar de uno" [3].

Reducción de dimensionalidad: "La reducción de dimensionalidad es el proceso de

eliminar características redundantes o irrelevantes de los datos para mejorar el

rendimiento de un modelo de aprendizaje automático" [3].

Análisis de componentes principales: "El análisis de componentes principales (PCA)

es una técnica de reducción de dimensionalidad que busca encontrar un conjunto de

características no correlacionadas llamadas componentes principales que capturen la

mayor cantidad de varianza en los datos" [3].

Análisis de correspondencias múltiples: "El análisis de correspondencias múltiples

(MCA) es una técnica de reducción de dimensionalidad que busca encontrar un conjunto

de características no correlacionadas llamadas factores que capturen la mayor cantidad

de varianza en los datos" [3].

Extracción de características: "La extracción de características es el proceso de crear

nuevas características a partir de las existentes para mejorar el rendimiento de un modelo

de aprendizaje automático" [3].

17
Análisis de factores: "El análisis de factores es una técnica de extracción de

características que busca encontrar un conjunto de características no correlacionadas

llamadas factores que capturen la mayor cantidad de varianza en los datos" [3].

Clustering: "El clustering es el proceso de agrupar los datos en grupos o clusters

basados en similitudes entre ellos" [3].

K-means: "El algoritmo k-means es un método de clustering que divide los datos en k

clusters basados en la distancia al centroide de cada cluster" (Hair et al., 2010, p. 480).

Agrupamiento jerárquico: "El agrupamiento jerárquico es un método de clustering que

divide los datos en clusters basados en similitudes entre ellos y construye una jerarquía

de clusters" [3].

Ensamble: "Un ensamble es un conjunto de modelos de aprendizaje automático que

trabajan juntos para mejorar la precisión de predicción" [3].

Boosting: "El boosting es una técnica de ensamble en la que se entrenan varios modelos

de manera secuencial, con cada modelo tratando de corregir los errores del modelo

anterior" [3].

Bagging: "El bagging es una técnica de ensamble en la que se entrenan varios modelos

de manera paralela y se promedian sus predicciones para obtener la predicción final" [3].

18
Random forest: "Una random forest es un tipo de ensamble de árboles de decisión en el

que se entrenan varios árboles de decisión de manera paralela y se promedian sus

predicciones para obtener la predicción final" [3].

Árbol de decisión: "Un árbol de decisión es un modelo de aprendizaje automático que

hace predicciones basadas en la evaluación de una serie de reglas de decisión" [3].

CAPITULO III

DESARROLLO METODOLÓGICO DE LA INVESTIGACIÓN

3.1- Diseño de investigación

El diseño de la investigación es de tipo no esxperimental correlacional, ya que se busca

establecer una relación entre las variables que afectan el consumo de la energía eléctrica

y por ende a la predicción del mismo.

3.2- Unidad de estudio

La unidad de estudio se focaliza en la empresa textil Modipsa, la cual cuenta con dos

suministros de energía. Para [16] menciona que la selección de la unidad de estudio

debe contemplar la homogeneidad haciendo referencia a las características de las

variables a estudiar, asimismo, la temporalidad describiendo que la data de estudio debe

19
contemplar valores en distintos escenarios, por otro lado , menciona la cantidad de datos

a estudiar obteniendo de esta manera un ahorro de tiempo, menor número de recursos y

estudiar la totalidad de datos puede ser una actividad poco inaccesible o difícil de

realizar, sin embargo, consideramos que para que el escenario de predicción en un

mediano plazo debemos contemplar la data en años para lo cual usaremos los registros

históricos de los dos últimos años que representan un total de 70080 valores que se

almacenan en una base de datos SQL con una frecuencia de 15 minutos, dentro de los

parámetros eléctricos se podrán observar valores como fecha y hora, potencia, energía,

voltaje, corriente ,etc.

3.3- Tipo de investigación

La presente investigación es del tipo aplicada tecnológica, para [13] este tipo de

investigación logra modificar el conocimiento teórico que resulta de las investigaciones

básicas, generando conocimiento directo en la sociedad o sector productivo. Asimismo,

para la opinión de [14] se ubica dentro de un nivel aplicativo debido a que buscan

mejorar o solucionar problemas específicos, mediante la comprobación de métodos y

modelos concluyendo en una propuesta. El enfoque de la investigación según [15] se

enmarca en una investigación cuantitativa, debido a la recolección, procesamiento y

análisis de datos de variables definidas anteriormente.

Figura 3: Etapas del diseño de la investigación

Fuente: Elaboración propia

20
3.4 Recolección de datos (que datos, cómo y con qué)

Como refiere [5] los datos son de vital importancia para una investigación, es decir, sin

datos no hay investigación cuantitativa, para ello, mediante el sistema SCADA, se

monitoreará en tiempo real los parámetros eléctricos con una frecuencia de 15 minutos,

la técnica como menciona [5] para una investigación cuantitativa pueden ser registro de

datos estadísticos, cuestionarios cerrados, aparatos de precisión, etc. Nuestra

recolección será mediante la adquisición y registro de datos mediante equipos

electrónicos de precisión y su posterior envió al SCADA mediante una red industrial. El

instrumento que se utilizará en muestro trabajo, será la recolección de datos en tiempo

real por medio medidores inteligentes.

La Tabla 1, muestra la tabla SQL resumen correspondiente al registro de la potencia

consumida en una determinada fecha.

Tabla 1: Registro de potencia

Fuente: Elaboración propia

La Tabla 1, muestra la tendencia mensual del comportamiento del perfil de demanda

eléctrica real.

21
Perfil de consumo del mes (kW)
700
600
500
400
300
200
100
11:14
6:44

21:44
17:14
12:44

23:14
18:44

9:44
5:14
0:44

11:14
6:44

17:14
12:44
8:14

23:14
18:44

0:44
20:14

6:44
0:45
20:14
15:44

2:14

8:14
3:44

14:14

20:14
15:44

2:14
21:44

3:44

14:14
9:44
5:14

15:44
11:14

2:14
21:44
Consumo MDC
Potencia Contratada Potencia Adicional
Reactiva Inductiva kVAR Reactiva Capacitiva kVAR

Figura 4: Perfil del consumo mensual

Fuente: Elaboración propia

22
3.5 Matriz de consistencia

MATRIZ DE CONSISTENCIA

Tema de investigación: Predicción de la demanda eléctrica mediante técnicas de Machine


Learning para determinar la óptima potencia a contratar en la empresa textil modipsa.

Variable 01: Inteligencia artificial


Variable 02: Pronostico de demanda de energía eléctrica
Problema general Objetivo general Hipótesis general
Identificar técnicas de
¿Cómo un sistema mediante
Machine Learning que Mediante técnicas de machine
técnicas de Machine Learning
permitan predecir la demanda learning se puede se puede
predice la demanda eléctrica
eléctrica en la empresa predecir el consumo de
para determinar la óptima
Modipsa con el fin de energía eléctrica en la
potencia a contratar en la
determinar la potencia empresa Modipsa.
empresa textil Modipsa?
óptimaa contratar.
Problemas específicos Objetivos específicos Hipótesis específicas
Demostrar que mediante
¿Mediante técnicas de Mediante técnicas de machine
técnicas de Machine Learning
Machine Learning aplicadas a learning aplicadas a la
aplicadas a la predicción del
la prediccón del consumo de predicción del consumo de
consumo de energía eléctrica
energía eléctrica es posible energía eléctrica se pueden
se pueden optimizar los
optimizar los costos de la optimizar los costos de la
costos dentro de una
organización? empresa Modipsa.
organización.
Determinar la confiabilidad
predictiva de modelos
¿Es posible identificar el
mediante técnicas de Machine Los modelos predictivos de
porcentaje de precisión tiene
Learning en la predicción de demanda eléctrica mediante
un sistema predictivo para
la demanda eléctrica para machine learning tienen una
determinar la óptima potencia
determinar la óptima potencia alta confiabilidad.
a contratar?
a contratar en la empresa
Modipsa.
¿Cuáles son los
Validar los procedimientos A través de una estructura de
procedimientos para realizar
óptimos para realizar la procedimientos sólida y
las comparaciones en un
predicción de la potencia a ordenada se puede predecir
sistema predictivo para
contratar por la empresa la demanda de energía
determinar la óptima potencia
Modipsa. eléctrica.
a contratar?
Tipo y diseño Población y muestra Técnicas e instrumentos
Población:
Tipo: No experimental Muestra: Data de 2 años, Técnica: Machine Learning
Nivel: Aplicativo actualmente se tiene Instrumento: Reporte de
Enfoque: cuantitativo aproximadamente 70080 consumo eléctrico
Diseño: Cuasi experimental registros con una granualida
de 15 minutos.

Tabla 2: Matriz de consistencia

Fuente: Elaboración propia

23
3.6- Desarrollo de la solución (EDT)

En esta sección se desarrolla el modelo desglosable del proyecto EDT, de la

investigación acorde a la combinación de la tecnología de machine learning a la

predicción de la demanda eléctrica. Como producto de ello se desglosa la investigación

en seis fases: Análisis de requisistos, diseño del modelo, pruebas y evaluación,

implementación, documentación y soporte y mantenimiento y actualizaciones.

En la siguiente figura, se muestran las fases y las subfases del EDT.

EDT
Proyecto de predicción
de demanda eléctrica

5.0 6.0
1.0. 2.0 3.0
4.0 Implementación Documentación y Mantenimiento y
Análisis de requisitos Diseño del modelo Pruebas y evaluación
soporte actualizaciones

1.1 Identificar los 2.1 Seleccionar y 3.1 Realizar pruebas del 4.1. Implementar el
5.1 Documentar todo el 6.1 Establecer un plan
objetivos y requisitos desarrollar un modelo modelo para evaluar su modelo en un ambiente
proceso de mantenimiento
del proyecto de predicción precisión y rendimiento de producción

1.2 Identificar y 4.2 Establecer 6.2 Evaluar el


3.2. Comparar los 5.2 Proporcionar
obtener los datos 2.2 Validar y calibrar el mecanismos de rendimiento del
resultados con otros soporte técnico y
necesarios para el modelo seguimiento y modelo
modelos existentes capacitación
proyecto monitoreo periódicamente

1.3. Identificación de
requisitos técnicos

1.4. Identificación de
requisitos del negocio

Tabla 3: Estructura de desglose de trabajo (EDT)

Fuente: Elaboración propia

A continuación mostramos en la figura 5, las fases del método VDI 2206 en

concatenación con el EDT, en la que se adaptó el estudio para lograr el desarrollo de la

invstigación.

24
Figura 5: Estructura VDI del proyecto

Fuente: Adaptado de http://repositorio.espe.edu.ec/jspui/bitstream/21000/18719/3/T-ESPE-

039039-D.pdf

3.6.1. Análisis de requisitos.

La fase de análisis de requisitos en el EDT (Esquema de Trabajo) para un proyecto de

predicción de demanda eléctrica tiene como objetivo definir los objetivos y las

necesidades del proyecto, así como también identificar los requisitos técnicos y de

negocio necesarios para lograr esos objetivos. A continuación se describen algunos

pasos que se pueden seguir en esta fase.

Identificación de objetivos y necesidades: en primer lugar, es importante comprender

los objetivos y necesidades del proyecto. Esto puede incluir aspectos como mejorar la

precisión de la predicción de la demanda eléctrica, reducir los costos de generación de

electricidad, mejorar la eficiencia en la gestión de la red eléctrica, entre otros.

25
Recopilación de datos: en esta etapa, se recolectan los datos necesarios para llevar a

cabo el proyecto. Estos pueden incluir datos históricos de la demanda eléctrica,

información meteorológica, datos de consumo de energía de los clientes, entre otros.

Identificación de requisitos técnicos: una vez recolectados los datos, se pueden

identificar los requisitos técnicos necesarios para llevar a cabo el proyecto. Estos pueden

incluir aspectos como la precisión requerida de la predicción, los formatos de los datos,

las herramientas y algoritmos de análisis de datos necesarios, entre otros.

Identificación de requisitos de negocio: además de los requisitos técnicos, es

importante considerar los requisitos de negocio del proyecto. Esto puede incluir aspectos

como los plazos de entrega, los presupuestos, los requisitos legales y normativos, entre

otros.

26
Tabla 4: Matriz de requerimientos

Fuente: Elaboración propia

3.6.2. Diseño del modelo

Construcción del modelo: se construirá el modelo estadístico de predicción de

demanda eléctrica utilizando las variables seleccionadas. Se evaluarán diferentes

27
modelos, como los modelos de regresión lineal, regresión logística, y árboles de decisión,

para determinar el que mejor se ajuste a los datos.

Evaluación del modelo: se evaluará el modelo entrenado utilizando un conjunto de

datos de prueba. Se utilizarán métricas de evaluación como el error cuadrático medio

(MSE), la precisión o el coeficiente de determinación (R2) para medir la precisión del

modelo.

Tabla 5: Desarrollo de la fase 2 del EDT

Fuente: Elaboración propia

La tabla incluye cada tarea específica que se llevará a cabo en esta fase, así como el

responsable de cada tarea, la duración estimada de cada tarea, y las fechas de inicio y fin

esperadas. Esta tabla será utilizada para planificar y monitorear el progreso del proyecto,

y para asegurar que se cumplan los plazos y objetivos establecidos.

28
CAPITULO 4

RESULTADOS Y DISCUSIÓN

4.1- Objetivo 01

4.2- Objetivo 02

4.3- Objetivo 03

4.3.1- Prueba 03-01

4.3.2- Prueba 03-02

4.3.3- Prueba 03-03

4.4- Discusión

29
CONCLUSIONES

Anexos

Glosario

30
BIBLIOGRAFÍA

[1] J. Tamayo, J. Salvador y A. y. C. V. Vásquez, La industria de la electricidad en el

Perú: 25 años de aportes al crecimiento económico del país. Osinergmin. Lima,

Perú., 2016.

[2] P. G. Aita, «ENERGÍA: UN CAMBIO NECESARIO EN EL PERÚ,» 2017.

[3] P. A. O. Suzuki, «EL MERCADO MAYORISTA DE ELECTRICIDAD EN EL PERÚ*,»

2015.

[4] SNI, «COYUNTURA INDUSTRIAL,» 2022.

[5] Walser y Sauer, «Red neuronal convolucional compatible con el perfil de carga típico

para el pronóstico de,» 2021.

[6] Aguilar, Nuño, «Pronóstico de carga de electricidad a corto plazo con aprendizaje

automático,» 2021.

[7] Christian Behm, Lars Nolting, Aaron Praktiknjo, «Cómo modelar perfiles de carga de

electricidad europeos utilizando redes neuronales artificiales,» 2020.

[8] O. Valgáev, F. Kupzog y H. schmeck, «Adecuación de las redes neuronales para

pronósticos de carga diarios a gran escala en edificios y sistemas de distribución

utilizando datos de medidores inteligentes,» 2020.

[9] R. Claeys, H. Azaioud, R. Cleenwerck y J. Desmet, «Un conjunto de funciones

novedosas para consumidores de baja tensión,basado en la dependencia temporal

31
del consumo y las demandas máximas,» 2020.

[10] E. Nguyen T. Y N. Thanh P., «Mejore la precisión de los algoritmos de pronóstico a

corto plazo mediante el perfil de carga estandarizado y el vector de regresión de

soporte: estudio de caso Vietnam,» 2019.

[11] S. Youn S., H. Gyun W., «Pronóstico del consumo de energía en Corea utilizando

algoritmos de aprendizaje automático,» 2022.

[12] Ketkar y Moolayil, Deep Ñearning with python, 2021.

[13] J. LOZADA, «Investigación Aplicada: Definición,,» Diciembre 2014.

[14] Z. R. Vargas Cordero, «LA INVESTIGACIÓN APLICADA: UNA FORMA DE

CONOCER LAS REALIDADES CON EVIDENCIA,» 2009.

[15] Y. S. Domínguez, «El análisis de información y las investigaciones,» 2007.

[16] J. Arias-Gómez, M. Á. Villasís-Keever y M. G. Miranda Novales, «El protocolo de

investigación III: la población de estudio,» Mayo 2016.

[1] T. M. Mitchell, Machine Learning, vol. 1, núm. Pt 1-2. New York: McGraw Hill, 1997. doi:

10.1093/bioinformatics/btq112.

[2] S. Haykin, Neural Networks: A comprehensive Foundation, 2a ed. Upper Saddle River:

Prentice Hall, 2009. Consultado: dic. 19, 2022. [En línea]. Available:

https://cdn.preterhuman.net/texts/science_and_technology/artificial_intelligence/Neural

%20Networks%20-%20A%20Comprehensive%20Foundation%20-%20Simon

%20Haykin.pdf

[3] J. F. Jr. Hair, W. C. Black, B. J. Babin, y R. E. Anderson, “Multivariate Data Analysis ”,

Pearson Education, Inc., p. 761, 2010.

[4] I. Goodfellow, Y. Bengio, y A. Courville, Deep Learning. Cambridge: MIT Press, 2016.

Consultado: dic. 19, 2022. [En línea]. Available: https://www.deeplearningbook.org/

32
33

También podría gustarte