Documentos de Académico
Documentos de Profesional
Documentos de Cultura
7, DECEMBER 2011
Abstract— Prediction of some events affects both (1) decisions A. Introducción a la predicción
of a company and (2) the planning of resources for a greater and
more efficient production. Moreover, knowledge of the future La acción de predecir hechos o condiciones futuras se le
events allows taking preventive measures. Therefore in this work denomina pronosticar, en otras palabras, realizar un
the primary goal is to realize prediction for a set of data, which pronóstico es obtener noción acerca de hechos futuros. Por
correspond to the monthly maximum demand for electricity in ejemplo:
distribution substation supplied by the Mexican Federal En la producción de una empresa es necesario conocer la
Commission of Electricity (Comisión Federal de Electricidad).
demanda de un artículo en el siguiente periodo. Esta
This prediction is performed by artificial neural networks using
backpropagation as learning algorithm, further compared these predicción se realiza en periodos específicos y permiten a la
predictions with those obtained by time series methodology of empresa realizar la planificación de la producción, el
Box and Jenkins. mantenimiento del inventario y además de conocer la cantidad
de materia prima que será necesaria para poder cubrir la
Keywords— Prediction methods, Time series, Neural
demanda del artículo en el siguiente periodo.
networks, Backpropagation, Electricity consumption.
En el control de procesos de una industria es importante el
I. INTRODUCCIÓN pronosticar el comportamiento que va a tener el proceso. Por
ejemplo, un proceso industrial podría comenzar a producir
tal pronóstico. En algunos casos es necesario solo tener una permita determinar si puede realizarse un pronóstico exacto.
exactitud relativa (p.e. un error del 20%) para tener una idea Para esto existen diversas maneras de realizarla, como por
del comportamiento del evento que estamos estudiando. En ejemplo, la desviación absoluta media (DAM) y el error
otras es necesario que el valor esperado sea lo más cercano cuadrático medio (ECM).
al valor pronosticado (p.e. un error del 1%).
Por otra parte distintas técnicas de pronósticos requieren C. Pronostico y redes neuronales
diferentes cantidades de datos, con ello no solo la
La teoría de las Redes Neuronales Artificiales (RNA), ha
disponibilidad de los datos es importante si no que también
brindado una alternativa a la computación clásica para
la exactitud y la puntualidad de los datos con que se
aquellos problemas, en los cuales los métodos tradicionales no
cuentan, puesto que si los datos son obsoletos o inexactos
han entregado resultados muy convincentes además de que
originaran predicciones inexactas además de esto se
estos modelos están inspirados en tratar de emular el
necesita algún procedimiento para poder recabar los datos
comportamiento inteligente de sistemas biológicos. Las
eficazmente.
aplicaciones más exitosas de las RNA son [5]:
B. Pronóstico y series de tiempo
1. Procesamiento de imágenes y de voz.
El análisis de una serie de tiempo se realiza con el objetivo
2. Reconocimiento de patrones.
de emplear modelos ya establecidos que faciliten la
3. Planeamiento.
descripción de los datos proporcionados previamente. La serie
4. Interfaces adaptativas para sistemas Hombre-Máquina.
está compuesta de varias componentes las cuales se enuncian
5. Predicción.
a continuación [2], [3]:
6. Control y optimización.
1. Tendencia: Es el componente de largo plazo que
7. Filtrado de señales.
representa el crecimiento o declinación de la serie.
El desarrollo de una red neuronal se puede realizar en
2. Ciclo: Es la fluctuación en forma de onda alrededor de la
periodos de tiempos razonables y realizar tareas concretas
tendencia.
mucho mejor que otros enfoques. Existen diversos tipos de
3. Variación Estacional: Son patrones periódicos que se
redes neuronales cada uno con una aplicación particular más
repiten año tras año.
apropiada. Uno de los modelos más utilizados es el modelo
4. Fluctuaciones irregulares o irregularidad: Son
del perceptrón, el cual proporciona buenos resultados al
movimientos erráticos que siguen un patrón indefinido o
resolver problemas en el ámbito financiero, tal es el caso de la
irregular.
predicción de eventos.
No todas las componentes de una serie de tiempo se
La neurona artificial como unidad independiente no es muy
presentan solas, sino que podrá ser la combinación de dos o
eficaz para el tratamiento de la información, de aquí que es
más componentes mencionados anteriormente. Por ejemplo,
importante la implementación de redes multicapa. Cada
un modelo de pronóstico que pueda ser utilizado para predecir
neurona está caracterizada por un valor numérico denominado
una serie de tiempo que sea caracterizada por la tendencia no
estado de activación y asociada a cada unidad, existe una
será apropiado para predecir series caracterizadas por una
función de transmisión que transforma el estado actual de
combinación de tendencia y variación estacional. De ahí la
activación en una señal de salida. Esta señal es enviada a
necesidad de obtener un modelo de predicción apropiado para
través de los canales de comunicación a otras unidades de la
el patrón de los datos disponibles.
red; en estos canales la señal es modificada según sea el peso
Una vez que se haya obtenido un modelo adecuado,
o sinapsis el cual está asociado a cada uno de estos según una
entonces se estiman las componentes de la serie de tiempo, los
determinada regla [9], [10].
cuales serán los parámetros del modelo para después ocupar
La forma en que las neuronas se distribuyen dentro de la
las estimaciones y así realizar un pronóstico.
red neuronal multicapa es mediante niveles o capas las cuales
De los modelos para series de tiempo univariables se
están determinadas por un número determinado de neuronas
pueden mencionar [6]:
las cuales se clasifican en tres tipos:
1. Regresión de serie de tiempo.
1. Entrada: Recibe la información de fuentes externas de la
2. Métodos de descomposición.
red.
3. Suavizado exponencial.
2. Oculta: Procesa la información de la capa exterior para
4. Metodología de Box-Jenkins.
que posteriormente sea enviada a la capa de salida.
Una de las preocupaciones al realizar un pronóstico, es el
3. Salida: Transfiere la información hacia el “exterior”.
medir el error que se comete al tratar de predecir una variable.
Las RNA se han empleado en la resolución de diversos
Supóngase que se denota el valor real de la variable de interés
problemas en donde destaca los problemas financieros cuya
en el tiempo t mediante yt y el valor que se predijo con el
aplicación principal es la predicción [7]. Aunque los datos a
modelo por yt, entonces el error de pronóstico (denotado por
analizar estén incompletos o los datos presenten cierta
et) para un valor particular yt será, et = yt − yt.
dependencia de otras variables para su obtención, los
Si los errores de pronóstico en el tiempo indican que la
resultados obtenidos al usar RNA son satisfactorios.
metodología usada para el pronóstico es la adecuada, entonces
La aplicación de las RNA se divide en dos categorías:
sería importante medir la magnitud de los errores de modo que
clasificación y modelado. En la primera se discrimina las
1068 IEEE LATIN AMERICA TRANSACTIONS, VOL. 9, NO. 7, DECEMBER 2011
observaciones por características comunes en diferentes que resulto de aplicar la primera diferencia y como se observa
grupos, como por ejemplo, predicción de fallas corporativas, tiene una tendencia constante. En la Fig. 4 se muestra los
la clasificación de bonos, entre otros, mientras que el segundo correlogramas de ésta, con lo que se concluye la
consiste en simular el comportamiento de una entidad o estacionalidad de la serie.
variable basado en observaciones previas de los datos, por
ejemplo, predicción de las fluctuaciones de los precios de las
acciones o del tipo de cambio [14].
Si bien la utilización de las redes neuronales en un proceso
de predicción es muy útil también es cierto que encontrar un
modelo que se adapte a una serie de datos particulares no es
algo trivial.
II. DESARROLLO
Para realizar este trabajo se tuvo acceso a un conjunto de
datos que corresponden al registro de demanda máxima
mensual de energía eléctrica en una subestación de un sistema
de distribución de la Comisión Federal de Electricidad, cuyos
valores están expresados en megawatts (MW). Estos registros Figura 2. Correlogramas de la serie.
corresponden al periodo de enero de 1994 a diciembre de
2006. El análisis se realizó eligiendo uno de los dos Una vez que se obtuvo la serie estacionaria se propusieron
transformadores que componen la subestación, con el objetivo algunos modelos que ajusten a la serie, observando los
de realizar la comparación de la predicción (proceso de correlogramas de la serie resultante (Vease Fig. 4). Dichos
simulación) se tomaron los datos hasta junio de 2006 dejando modelos se muestran en la Tabla I, en la cual se presenta la
los últimos seis meses (julio a diciembre de 2006) para tal fin. varianza estimada, la logverosimilitud y el valor del
Resultados previos fueron expuestos en [12]. En la Fig. 1 se estadístico AICC, usado para elegir el modelo. Se elige aquel
ilustra la serie de estos datos. cuyo valor sea mínimo [16]. De aquí que el modelo que mejor
A. Pronóstico con series de tiempo se ajusto a los datos es el ARIMA(1, 1, 1).
Para poder realizar pronósticos utilizando este tipo de
metodología comúnmente se realizan los siguientes pasos Los valores estimados para los parámetros de éste modelo
[15]. son:
1. Ajuste de modelo. φ φˆ = 0.5415 θ θˆ = −0.8387
2. Validación del modelo.
3. Pronóstico.
Para el ajuste del modelo, primero se tiene que tener una
serie estacionaria, y como se observa en la Fig. 1 la tendencia
es no constante por lo que se tiene una serie no estacionaria.
Esto se corrobora en los correlogramas de la serie presentados
en la Fig. 2 en donde los valores de la ACF decrecen y decaen
muy lentamente.
Figura 7. Ajuste de la red 2:2:1:1. Figura 8. Comparativa del ajuste con los datos observados.
Aunque los valores proporcionados por la red no estaban Tabla IV. Pronósticos usando el modelo ARIMA(1, 1, 1).
muy próximos a los datos, se podría realizar modificaciones a Periodo Valor real Pronóstico
Error
absoluto
la estructura de ésta para que se tuviera un buen ajuste a
2006.7 20.40 20.68 0.28
dichos datos. Por lo anterior se eligió otra red cuya 2006.8 21.48 20.89 0.59
estructura fue 1:2:16:12:1 con los valores iníciales de las 2006.9 22.32 21.01 1.31
2006.10 23.04 21.07 1.97
matrices de pesos inicializados con valores producto de otras
2006.11 22.56 21.11 1.45
simulaciones redes. 2006.12 23.16 21.13 2.03
Estos pesos fueron resultados de la implementación de
otras redes de la misma arquitectura salvo que sus pesos En la Fig. 9 se muestra esta predicción junto con una banda
iníciales, para estas implementaciones, fueron aleatorios. de confianza del 95%, y en la Fig. 10 se ilustra la comparativa
de la predicción del modelo utilizado junto con los valores
Tabla III. Configuración de la red neuronal 1:2:16:12:1. reales.
Inicialización Funciones de Número de Factor de
Performance
de los pesos transferencia iteraciones aprendizaje
Tangente
Configuració
Sigmoideal 9.91x10-5 1 0.2
n dada
Lineal
III. RESULTADOS
En esta sección se va a mostrar los resultados de las
predicciones realizadas con los modelos planteados en las
secciones II.A y II.B. Además de realizar la comparativa de
Figura 9. Pronóstico del modelo.
los resultados obtenidos al pronosticar con series de tiempo y
con redes neuronales. B. Redes neuronales
Para obtener los resultados se utilizo el modelo de red
A. Series de tiempo neuronal presentado en la sección II.B. Este modelo consta de
Al tener el modelo de series de tiempo presentado en la las capas siguientes 1:2:16:12:1. Por lo que ya se comentó en
sección II.A se llevó a cabo el pronóstico para los últimos seis la sección II.B esta estructura fue la que dio los mejores
meses del año 2006. En la Tabla IV se muestra el valor real, el resultados tanto en ajuste a los datos reales como en la
pronóstico y el error absoluto de cada periodo. Como se predicción.
observa estos aumentan conforme se predice un número de
periodo mayor, pero aún así para estos 6 periodos el error es
pequeño.
TRUJILLO ROMERO et al.: PREDICTING ELECTRICITY 1071
Tabla VI. Comparativa de resultados obtenidos por los dos modelos usados
Error
Error
Pronóstico absoluto
Dato Pronóstico absoluto
Periodo Series de Red
real Red neuronal Serie de
tiempo neurona
tiempo
l
2006.7 20.40 20.21 20.68 0.28 0.19
Figura 10. Comparativa de los valores reales y el pronóstico del modelo. 2006.8 21.48 21.62 20.89 0.59 0.14
2006.9 22.32 22.26 21.01 1.31 0.06
En la Fig. 11 se ilustra el pronóstico de los últimos 6 meses 2006.1
23.04 22.22 21.07 1.97 0.82
0
del año 2006 y en la Tabla V los correspondientes valores de 2006.1
pronóstico y los errores absolutos de cada uno de los valores 22.56 21.60 21.11 1.45 0.96
1
predichos. 2006.1
23.16 20.81 21.13 2.03 2.35
2
Figura 11. Comparación entre el pronóstico de la red contra los datos reales.
C. Comparativa de predicción
Figura 12. Comparación gráfica de los modelos de predicción.
Una vez que se han obtenido la predicción de éstos
periodos mediante los dos modelos, se realiza un pequeño REFERENCIAS
análisis comparativo acerca de cada uno de éstos.
Para el modelo de serie de tiempo, se observó que para [1]. M. K. S. Alsmadi, K. B. Omar, and S. A. Noah. Back propagation
realizar inferencia en el conjunto de datos, la serie debería de algorithm: The best algorithm among the multi-layer perceptron
algorithm. International Journal of Computer Science and Network
ser estacionaria y con la aplicación de una sola diferencia
Security, 9(4):378–383, Abril 2009.
basto para que la serie resultante fuera estacionaria. Una vez [2]. B. L. Bowerman, R. T. O’Connell, and A. B. Koehler. Pronósticos,
que se obtuvo ésta serie, se siguió un conjunto de pasos los Series de Tiempo y Regresión, Un Enfoque Aplicado, Cengage
cuales proporcionaba, en primer lugar, modelos que se Learning, 2009.
ajustaran al modelo, en seguida la selección de uno de ellos [3]. P. J. Brockwell and R. A. Davis. Introduction to Series and
Forecasting. Springer, 2002.
mediante un criterio y finalmente se prosiguió la elaboración [4]. P. J. Brockwell and R. A. Davis. Time Series: Theory and Methods.
del pronóstico. Statistics. Springer, second edition, 2006
Por otra parte, la metodología usada para la elaboración de [5]. M. I. Acosta Buitrago and C. A. Zuluaga Muñoz, Tutorial Sobre
la red neuronal fue muy distinta. Mientras que en la Redes Neuronales Aplicada en Ingeniería Eléctrica y su
implementación en un sitio Web. Universidad Tecnológica de
metodología de series de tiempo en el seguimiento de los Pereira. Facultad de Ingeniería Eléctrica, 2000.
1072 IEEE LATIN AMERICA TRANSACTIONS, VOL. 9, NO. 7, DECEMBER 2011