Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Algoritmo Genetico PDF
Algoritmo Genetico PDF
A. Algoritmos genéticos
Condición de No
Los algoritmos genéticos pueden encuadrarse dentro la finalización
clase de métodos estocásticos de búsqueda [8]. Mientras Si
la mayoría de estos métodos operan sobre una única Conjunto solución
solución [7], estos algoritmos operan en una población de
soluciones. La idea básica, inspirada en los procesos Fig 2. Diagrama funcionamiento algoritmo genético.
evolutivos biológicos, es que el contenido genético de
Un algoritmo genético también tiene parámetros que se centro de grupo. A continuación, el algoritmo selecciona
tienen que fijar para cada ejecución: el punto-dato con el mayor potencial remanente como
siguiente centro de grupo y vuelve a destruir los
• Tamaño de la población: debe de ser suficiente para potenciales de los datos en su zona de influencia. Y así
garantizar la diversidad de las soluciones y tiene que sucesivamente. El ciclo iterativo termina cuando el
crecer más o menos con el número de caracteres del potencial de todos los puntos cae por debajo de un
cromosoma. umbral. El algoritmo substractivo necesita cuatro
• Condición de terminación: lo más habitual es que parámetros: el valor del radio que define la influencia (o
sea la convergencia del algoritmo genético o un vecindad), el valor del radio que define la zona de
número prefijado de generaciones. Esta última será reducción de potencial cuando se ha escogido un centro,
la condición de nuestro estudio. un factor de representa el umbral de aceptación como
centro (son aceptados aquellos posibles centros con
El diagrama general de funcionamiento de un algoritmo potencial superior al del primer centro multiplicado por
genético es el representado en la Figura 2. este factor), y otro factor que representa el umbral de
rechazo como centro.
B. Sistemas de inferencia difusa
C. Datos de entrada para los Modelos de Predicción
Las técnicas de inferencia difusa proporcionan un
método para el proceso de modelado fuzzy. Además, una Una de las más importantes tareas en la construcción de
vez construido un sistema de inferencia difusa, pueden un modelo, es la selección de las variables de entrada
utilizarse técnicas neurodifusas [9], [10], similares a las relevantes. Desafortunadamente, no hay un método
utilizadas en el entrenamiento de redes neuronales sistemático a seguir. Sin embargo, una solución práctica
artificiales, para adaptar los parámetros de las funciones aceptable consiste en el proceso de iteración de prueba y
de pertenencia y de las reglas del sistema que permitan la error, donde se añaden algunas nuevas variables o se
mejor adecuación entre la salida del sistema y salida substraen otras irrelevantes para obtener un modelo
deseada. Es decir, usando un conjunto de datos de mejor. En este contexto, la teoría de regresión lineal
entrada y salida podemos construir un sistema de puede aportar información relevante. Así, se han
inferencia difusa cuyas funciones de pertenencia y propuesto métodos automáticos de poda, que hacen
coeficientes de las reglas se ajustan usando un algoritmo posible que, empezando de un modelo que contiene todas
de retro-propagación de error, solo o en combinación con las variables de entrada posible, se descarten aquellas
la técnica de mínimos cuadrados, dotando al sistema de irrelevantes mediante un análisis de sensibilidad.
la capacidad de aprender.
Un planteamiento distinto es el que se ha seguido en este
La estructura de funcionamiento de este modelo es trabajo. Es el proceso de optimización, controlado por
primeramente, clasificar las entradas mediante funciones algoritmo genético, el que selecciona las variables de
de pertenencia y sus parámetros asociados, estudiar el entrada a los sistemas de inferencia difusa de entre todas
modelo, y finalmente generar unas funciones de las variables de entrada disponibles. Las entradas
pertenencia de salida, a partir de los cuales obtenemos los disponibles son las siguientes:
resultados de salida. Los parámetros asociados con las
funciones de pertenencia y los coeficientes de las reglas E1.- Día de la semana (lunes, martes…).
cambian a lo largo del proceso de aprendizaje. El cálculo E2.- Potencia máxima consumida día anterior.
de estos, es proporcionado por un vector gradiente, que E3.- Potencia máxima consumida dos días antes.
realiza una medida de como el sistema de inferencia E4.- Temperatura media para el día siguiente.
difusa está modelizando los datos de entrada–salida, para E5.- Temperatura media día anterior.
un conjunto de parámetros dado. Por tanto, cuanto más se E6.- Temperatura máxima para el día siguiente.
parezcan las funciones de pertenencia iniciales a las E7.- Temperatura mínima para el día siguiente.
óptimas, mejor convergerá el entrenamiento hacia el E8.- Humedad relativa (%)para el día siguiente.
punto óptimo en el espacio de parámetros. Una vez que E9.- Radiación solar (W/m2) para el día siguiente.
se obtiene el vector gradiente, pueden aplicar varias E10.- Velocidad del Viento (m/s) para el día siguiente.
rutina de optimización para ajustar los parámetros que
reduzcan las medidas de error (normalmente mínimos La salida son los datos de consumo reales del centro de
cuadrados). Además, se utiliza conjuntamente el método transformación.
retro-propagación (backpropagation) para la estimación
de los valores de las funciones de pertenencia. D. Consideraciones previas
El agrupamiento (clusterizado) substractivo [11], es una En nuestro estudio comprobaremos que los resultados de
técnica que estima los centros de los grupos en un predicción obtenidos no son tan buenos como los que se
conjunto de datos, para ello, asume que cada punto-dato podrían obtener si el objeto de estudio fuera una red
es un centro de grupo en potencia, y le asigna un eléctrica de mayores dimensiones, donde los errores
potencial basándose en la densidad de puntos que le asociados a CTs individuales pueden compensarse
rodean. El algoritmo, selecciona el punto-dato con mayor mutuamente y reducir el error total. Ya que el centro de
potencial como primer centro de grupo, y después, borra transformación objeto de nuestro estudio dispone de unos
el potencial de los puntos-dato cercanos a dicho primer 400 usuarios, localizados en unos pocos bloques de
viviendas en el centro urbano, sus patrones de consumo los menores errores de predicción. La figura 5 representa
experimentan grandes variaciones a lo largo de las horas como se utilizan los datos.
del día, y entre unos días u otros.
Periodo de medida
En las Figuras 3 y 4 podemos comparar las variaciones
porcentuales de la demanda media a lo largo de los días Entrenamiento
de una semana entre ambos ámbitos de estudio. Validación Test
10
-10
1
∑
N
-15
RMSE = E t2 (1)
N t =1
-20
HORAS DEL DIA Por otro lado, para comprobar la adecuación del modelo
final obtenido y comprobar los resultados obtenidos con
Fig 3. Desvío porcentual en función de la hora. Red eléctrica los datos reales, calcularemos el error absoluto porcentual
extensa. de la media, MAPE.
80 1 Et
∑
N
60 MAPE = (2)
PORCENTAJE (%)
N t =1 Yt
40
20
0 Donde Et es el error de predicción del período t (Et = Yt
-20 1 3 5 7 9 11 13 15 17 19 21 23 − Ft), Y es el valor real para ese período y Ft el valor que
-40 se había pronosticado.
-60
-80 F. Datos utilizados en la creación de los modelos
HORAS DEL DIA
Los datos disponibles como entradas de los modelos de
Fig 4. Desvío porcentual en función de la hora. CT de Logroño. predicción corresponden a predicciones meteorológicas,
para el día siguiente, referidas a dos años (2004 y 2005),
Comparando ambas figuras, se pueden observar las para la ciudad de Logroño, y los datos de consumo de
considerables diferencias entre los valores de variación energía eléctrica proporcionados por el centro de
en una red eléctrica de tamaño medio (Fig. 3), con transformación ubicado en el centro de Logroño y para el
diferentes tipos de clientes (empresas de producción, de mismo periodo de tiempo.
servicios, alumbrado público, particulares, etc.) donde las
diferencias de consumo entre horas respecto al consumo Para el desarrollo de los modelos de predicción, los datos
medio, tienen valores máximos de un 15%, mientras que referidos se han dividido en tres grupos, entrenamiento,
en un centro de transformación con un número limitado validación cruzada y test.
de clientes, las variaciones horarias respecto al consumo
medio llegan a superar el 60%. o Entrenamiento: el primer 60 % de los datos de los
dos años.
Aunque estas diferencias de consumo horario influyen de o Validación: el siguiente 20% de los datos .
manera negativa en el estudio del modelo, obteniendo o Test: el 20% restante de los datos.
peores resultados que en sistemas eléctricos de mayor
tamaño, el modelo de la red como suma de CTs permite
mejorar sustancialmente. G. Solución adoptada
E. Criterios de evaluación de los Modelos de Inicialmente todos los datos de entrada disponibles son
Predicción normalizados a valores comprendidos entre 0 y 1, para
poder aplicar sobre ellos la técnica de la clusterización
La adecuación de los modelos no se evalúa con los datos substractiva, que supone que todos los datos que el rango
utilizados en su ajuste o entrenamiento, sino con otro de valores en cada dimensión (entrada en este caso) es el
conjunto de valores (valores de test) de las variables mismo. Para este algoritmo se toman constantes los
explicativas (Fig 4X). Esta prueba permite la comparación valores de umbral de aceptación y de rechazo, con
de los resultados (valores de predicción) entre diferentes valores de 0.5 y 0.15, respectivamente. Únicamente se va
modelos y de esta forma seleccionar el modelo que arroje a variar el radio de influencia, con valores entre 0 y 2,
haciendo que el radio que define la reducción de de las entradas seleccionadas. El proceso de
potencial sea 1.25 veces mayor que el radio de influencia. entrenamiento se interrumpe cuando el error RMSE con
los datos del grupo de validación cruzada no mejoran tras
La estructura empleada para el cromosoma, que contiene 50 epochs (iteraciones de entrenamiento); en todo caso,
toda la información necesaria para la creación del sistema el valor de los parámetros del sistema de inferencia
de inferencia difusa que se va a utilizar como modelo de difusa resultante son los que corresponden al mínimo
predicción, es la recogida en la figura 6. Cada error RMSE con los datos del grupo de validación
cromosoma (o individuo) es una cadena de 18 dígitos con cruzada. Una vez entrenado el sistema, se toma como
valores de 0 a 9. Cada uno de los 10 primeros dígitos de valor de fitness a la inversa del error RMSE con los datos
la cadena que corresponde al cromosoma (de d1 a d10) de este grupo de validación cruzada.
representa a una de las variables de entrada disponibles.
El significado del valor de estos dígitos es: Si es mayor o El proceso de optimización fue programado en Matlab,
igual que 5 la entrada correspondiente se utiliza como haciendo uso de las funciones de la Fuzzy Toolbox del
entrada del modelo de inferencia difusa; si, por el mismo.
contrario, el dígito correspondiente es menor que 5, la
entrada no se utiliza como tal en el modelo de inferencia
difusa. Los siguientes 8 dígitos de la cadena (de d11 a d18) H. Resultados obtenidos
que representa el cromosoma corresponden al radio de
influencia para el algoritmo substractivo de agrupamiento Los resultados obtenidos tras el proceso de optimización
de los datos de las entradas seleccionadas para el modelo. del modelo de predicción proporciona los siguientes
El valor numérico de este radio se obtiene multiplicando parámetros: las entradas consideradas en ese modelo, el
por 2E-8 el valor numérico representado por esos 8 número de reglas de inferencia, y el valor del radio de del
dígitos. Así, si el cromosoma contiene la cadena algoritmo de clusterización substractiva. Además nos
numérica “158223943122371901” el significado de la proporciona los valores RMSE de los valores de testeo
misma es que las entradas seleccionadas para el modelo con los valores reales.
de inferencia difusa son las E2, E3 y E7 (al ser mayores o
iguales a 5 los dígitos segundo, tercero y séptimo) y el
valor del radio de influencia para el algoritmo 3. Modelo de Previsión de Potencia Máxima
substractivo es 0.44743802. demandada a 24 horas vista.
d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 d11 d12 d13 d14 d15 d16 d17 d18 A. Modelos de Predicción analizados
Fig. 6. Estructura del cromosoma (individuo).
En primer lugar, a la hora de realizar un correcto estudio
de los datos aportados, se debe separar los mismos
Para el operador de mutación se ha realizado una ligera
teniendo en cuenta los diferentes días de la semana, los
modificación cuando el dígito afectado corresponde a los
días festivos del calendario de dichos años, y los puentes
que representan a las entradas disponibles: una mutación
vacacionales propios de la zona de suministro. Si
en uno de estos dígitos se traduce en incrementar en
comparamos los consumos de potencia de un mes
cinco unidades dicho dígito, si este era originalmente
cualquiera, y los dividimos en función del día de la
menor que 5, o decrementarlo en cinco unidades si
semana a que pertenecen, obtenemos patrones de
originalmente era mayor o igual a 5.
comportamiento en el consumo de energía con
diferencias acusadas dependiendo de si es un día laboral
Una vez construido un nuevo cromosoma para la nueva
o un día de fin de semana.
generación, en primer lugar se determina si por lo menos
ha seleccionado a una de las entradas de entre las
El número de generaciones e individuos por generación,
disponibles. Si no es así (los 10 primeros dígitos serían
para el algoritmo genético, se ha limitado a 50. La tasa de
menores a 5), se crea un nuevo individuo por cruce y/o
cruce se ha fijado en el 80% y la tasa de mutación en el
mutación hasta conseguir un cromosoma válido.
2%. También se ha aplicado elitismo: de una generación
a otra se conserva el mejor (menor error RMSE)
Con la información contenida en el cromosoma, se crea
individuo de la generación anterior. Con esto último
el sistema de inferencia difusa. El sistema resultante
conseguimos que no empeore el resultado obtenido por el
consta de tantas reglas y familias de pertenencia por
mejor individuo de una generación a otra.
entrada como grupos obtenidos por aplicación del
algoritmo de clusterización substractiva sobre las
En un estudio inicial no separamos los datos por sus
entradas seleccionadas para el sistema. Si el número de
diferentes patrones de consumo o días, sino que tomamos
grupos y, por tanto, de reglas es mayor que 5 el sistema
todos los datos en su conjunto y estudiamos el sistema.
de inferencia correspondiente no es evaluado y se le
Como resultado, obtenemos la evolución en la búsqueda
otorga un valor de error RMSE elevado. La función de
del modelo óptimo representada en la figura 7.
fitness seleccionada es la inversa del error RMSE con los
datos del grupo de validación cruzada. Si el número de
reglas del sistema de inferencia difusa es menor o igual a
5, el sistema es entrenado como sistema neurofuzzy
adaptativo [9] con los datos del grupo de entrenamiento
máxima consumida, variaba con los días, en esta ocasión
RELACIÓN GENERACIONES- RMSE
se producen cambios importantes, no sólo dependiendo
14.5 de los diferentes días, sino también durante las 24 horas
del día. Es decir, no sólo debemos trabajar con muchos
ERROR RMSE en KWh
Este mismo sistema de separación de datos en función de RELACIÓN ERROR MAPE(%) - HORAS DEL DIA
sus patrones de consumo se ha realizado, todavía con
mayor razón, en los modelos de previsión horaria, ya que 30
20
predicción. 15
10
4. Modelo de Predicción de Potencia Media
5
Horaria demandada a 24 horas vista.
0
1 3 5 7 9 11 13 15 17 19 21 23
El proceso de búsqueda del sistema óptimo de HORAS DEL DIA
predicción, está basado en el mismo procedimiento que
en el apartado anterior. Es decir, inicialmente se Fig. 8. Error MAPE clasificado por horas del total de días.
recopilan las variables de entrada; en nuestro caso hemos
considerado todas las variables disponibles y que puedan Posteriormente de desarrolló, con la metodología
afectar de alguna manera a la solución. descrita, un modelo de predicción distinto para los cinco
grupos en los que han divido los datos en función del tipo
Los datos con los que debemos trabajar en este apartado, de día. En la Tabla 2 se muestra los resultados obtenidos
presentan una dificultad mayor que los analizados en el para el grupo de test señalando sus valores de error
apartado anterior, ya que si bien antes la potencia MAPE, el número de variables de entradas que el modelo
óptimo considera en su análisis, y el número de reglas del sistema. El método seguido permite la selección de las
sistema difuso obtenido. variables de entrada de entre un conjunto de variables
disponibles y selecciona los parámetros que determinan,
En estos sistemas, las variables de entrada consideradas junto con los datos de entrada, las características del
varían ligeramente de las entradas del apartado anterior, y sistema de inferencia difusa (número de reglas y número
son: de funciones de pertenencia). El resultado , tras el
proceso de optimización, es el modelo de predicción que
E1- Hora del día correspondiente al horizonte de mejores resultados ofrece en la predicción de la potencia
predicción. demandada.
E2- Potencia demandada el último día a la misma hora.
E3- Potencia demandada a la misma hora dos días antes. Agradecimientos
E4- Temperatura media prevista para el día siguiente.
E5- Temperatura media el último día. Los autores agradecen el apoyo prestado por el Gobierno
E6- Temperatura máxima prevista para el día siguiente. de La Rioja al financiar este trabajo bajo el proyecto de
E7- Temperatura mínima prevista para el día siguiente. investigación FOMENTA 2008/9. Asimismo, agradecen
E8- Humedad relativa (%)prevista para el día siguiente. a Iberdrola la ayuda prestada para la realización de las
E9- Radiación (W/m2) prevista para el día siguiente. medidas que han servido de base a este estudio.
E10- Velocidad viento (m/s) prevista para el día
siguiente. Referencias
Tabla 2. Previsión Potencia Horaria Demanda. [1] J.A. Jardini, H.P. Schmidt, C.M.V. Tahan, C.C.B. de
MAPE Variables de Oliveira, S.U. Ahn, “Distribution Transformer Loss of Life
Días Entradas Reglas
(%) entradas Evaluation: A Novel Approach Based on Daily Load
Lunes 6.9356 3 3 E1,E2,E7 Profiles”, IEEE Transactions on Power Delivery, VOL. 15,
NO. 1, pp 361-366 January 2000.
Martes –
E1, E2, E3, E4, [2] S.C. Pandian et al., “Fuzzy approach for short term load
Miércoles- 8.0845 7 3
E7, E8, E9 forecasting”, Electric Power Systems Research, Vol. 76, pp
Jueves
541-548, 2006.
E1, E2, E3, E6,
Viernes 6.3656 7 5 [3] T. Konjic, V. Miranda, I. Kapetanovic, “Fuzzy Inference
E8, E9, E10
Systems Applied to LV Substation Load Estimation “,
E1, E2, E3, E5,
Sábado 6.5384 8 5 IEEE Trans. on Power Systems, Vol. 20, No. 2, pp. 742-
E6, E7, E8, E10
749, May 2005.
E1, E2, E3, E4,
Domingo 5.7191 6 5 [4] P.M. Costa, M.A. Matos, “Assessing the contribution of
E7, E9
microgrids to the reliability of distribution networks”,
Electric Power Systems Research, Vol. 79, pp. 382-389,
January 2009.
5. Conclusiones [5] J.A. Jardini, , C.M.V. Tahan, M.R. Gouvea, S. U. Ahn,
F.M. Figueiredo, “Daily Load Profiles for Residential,
En este artículo se ha mostrado los diferentes modelos de Commercial and Industrial Low Voltage Consumers”,
IEEE Transactions on Power Delivery, VOL. 15, NO. 1, pp
predicción de demanda eléctrica para un centro de
375-380 January 2000.
transformación real y concreto. Se han desarrollado [6] D.K. Ranaweera et al., “Economic impact analysis of load
diferentes modelos de predicción para la potencia forecasting”, IEEE Trans. on Power Systems, Vol. 12, No
máxima demanda y para la potencia media horaria para 3, pp. 1388-1392, August 1997.
las 24 horas del día siguiente. Todos lo modelos se han [7] W. Li, J. Zhou, X. Xiong, J. Lu, “A Statistic-Fuzzy
obtenido mediante un proceso de optimización Technique for Clustering Load Curves”, IEEE
controlado por un algoritmo genético. Transactions Oon Power Systems, VOL. 22, NO. 2, pp
890-891, May 2007.
Analizado los resultados obtenidos comprobamos que los [8] D.E. Goldberg, “Genetic algorithms in search, optimization
and machine learning”, Adisson-Wesley, Reading,
valores de error MAPE obtenidos están entre un 5% y un
Massachussets, 1989.
8%, por lo que podemos concluir que son unos errores de [9] J.S.R. Jang, C.T. Sun and E. Mizutani, “Neuro-Fuzzy and
previsión muy aceptables dadas las grandes variaciones Soft Computing”, Prentice Hall, Englewood Cliffs, NJ,
de consumo debido a tratarse sólo de un centro de 1997.
transformación. [10] T. Senjyu, , P. Mandal, K. Uezato, T. Funabashi, “ Next
Day Load Curve Forecasting Using Hybrid Correction
La principal ventaja que proporciona la metodología Method”, IEEE Transactions on Power Systems, VOL. 20,
descrita de optimización de un sistema de inferencia NO. 1, pp 102-109, February 2005.
difusa para su uso como modelo de predicción de la [11] S. Chiu, “Fuzzy model identification based on cluster
estimation”, Journal of Intelligent and Fuzzy Systems, Vol.
potencia demanda en un centro de transformación se
2, pp. 267-278, 1994.
centra en la selección automática de los parámetros del