Está en la página 1de 8

Boletn IIE, 2015

octubre-diciembre

Modelo para detectar y prevenir prdidas


no tcnicas en sistemas de distribucin elctrica
con base en tcnicas de minera de datos
y redes bayesianas
Mara Yasmn Hernndez Prez, Gustavo Arroyo Figueroa, Martn Santos Domnguez,
Guillermo Rodrguez Ortiz e Hilda Escobedo Hernndez
Abstract
The energy sector faces a considerable loss of energy in both, the technical field and the non-technical field. Non-technical losses are
related to the energy delivered, but whose cost is not recovered. Several attempts have carried out to reduce this problem; however,
it still persists. The application of data mining algorithms to the commercial and technical databases provides patterns of energy
consumption. These consumption patterns can be related to social, economic and demographic information, and in this way it
allows to know the phenomena behind energy losses. In turn, consumption patterns are useful for designing models of energy losses
prediction. In this paper, we proposed a prediction model based on Bayesian networks which includes a wide range of parameters
and relationships and allows the use of minimal evidence for potential or early losses. The structure of the Bayesian network is based
on the consumption patterns and on expert knowledge. We have evaluated several algorithms to prepare data and to select relevant
data because there is a large amount of data and in many cases incomplete or irrelevant. In this paper, the current results in the
construction of diagnostic model are presented.

Introduccin
Las prdidas de energa en los sistemas de distribucin es un
problema importante que enfrentan las empresas de energa
elctrica. En Mxico, cada ao se pierde ms del 21% de
la energa que se genera (Acosta, 2010). Este problema
recae principalmente en la gestin de los servicios pblicos,
es decir, en la eficiencia y optimizacin de recursos.
La falta de inversin en los sistemas de distribucin y
comercializacin de energa elctrica no slo conduce al
deterioro en la calidad del servicio, sino que tambin es uno
de los principales factores en el aumento de las prdidas de
energa, tanto tcnicas como no tcnicas.
Primordialmente, las prdidas tcnicas se deben al calor
que se produce cuando la electricidad pasa a travs de las
lneas de transmisin y de los transformadores, mientras
que las prdidas no tcnicas se producen cuando la energa
se toma del sistema sin que el medidor de energa registre
el consumo, ya sea por robo, por manipulacin de equipos
192

Artculos tcnicos

o de los sistemas de facturacin para


modificar los registros de consumo,
entre otros (Rodrguez, 1997).
En Mxico se han llevado a cabo
diversos intentos para minimizar
las prdidas no tcnicas, que en su
mayora han consistido en dispositivos
fsicos que se han interesado en el
robo, sin embargo, el problema
ha persistido, ya que no se han
considerado otros factores como una
mala administracin y la falta de
mantenimiento.
Las bases de datos tcnicas y
comerciales de las empresas de energa
elctrica almacenan informacin de
consumo de varias dcadas, de tal
manera que es posible aplicar tcnicas
de minera de datos para descubrir
patrones de comportamiento que
expliquen las causas de las prdidas
no tcnicas de energa. Con la
aplicacin de estos algoritmos se podra
conocer, entre otros factores, las zonas
geogrficas que tienen mayores prdidas
no tcnicas de la energa. A su vez, con
los patrones de consumo se pueden
predecir las prdidas potenciales o
detectarlas en etapas tempranas.
Los algoritmos de minera de datos
descubren y muestran conocimiento
oculto en los datos. Se trata de
un proceso largo que incluye
diversas etapas: pre-procesamiento,
transformacin y post-procesamiento.
Proponemos un modelo que incluye
el pre-procesamiento de las bases de
datos tcnicas y comerciales, a travs
de algoritmos de seleccin de atributos

para detectar la informacin relevante. Para el diseo del


modelo se estn evaluando diversos algoritmos de minera
de datos y se propone un modelo bayesiano para detectar y
prevenir las prdidas no tcnicas de energa a partir de los
patrones descubiertos.
El artculo est organizado de la siguiente manera: La
seccin 2 presenta el modelo para detectar las prdidas
no tcnicas de energa. La seccin 3 presenta la red
Bayesiana, la cual es un elemento fundamental del modelo.
Finalmente, las conclusiones y el trabajo futuro se presentan
en la seccin 4.

Modelo para detectar prdidas de


energa en sistemas de distribucin
El sistema de distribucin de energa elctrica es el
encargado de proporcionar la energa a los consumidores
finales, la cual se transporta a travs de redes de distribucin
de las plantas elctricas a los usuarios. Las prdidas de
193

Boletn IIE, 2015


octubre-diciembre

energa se refieren a la energa elctrica que se produce y


transporta, pero que las empresas que prestan el servicio
no facturan. Esto sucede a causa de que la energa se pierde
a lo largo del proceso, o a causa de problemas de gestin,
o porque se ha tomado de manera ilegal, por lo tanto, las
prdidas se clasifican en tcnicas y no tcnicas.
Las prdidas tcnicas se deben principalmente al calor que
se produce cuando la electricidad pasa por las lneas de
transmisin y transformadores.
Las prdidas no tcnicas se producen cuando la energa se
toma de manera ilegal desde el sistema sin ser registrada
por el medidor de energa, principalmente por robo,
manipulacin de equipos o de los sistemas de facturacin
(Rodrguez, 1997).
El aumento de las prdidas no tcnicas afecta a las empresas
de distribucin de energa. Por ejemplo, en el aspecto

socioeconmico se afectan las


inversiones futuras y puede llegar a la
racionalizacin del uso de la energa.
La falta de inversin en los sistemas
de distribucin y comercializacin de
energa elctrica conduce no slo al
deterioro de la calidad del servicio que
se presta, sino que es uno de los factores
que ms contribuyen al aumento de las
prdidas tcnicas y no tcnicas.
En el trabajo previo se ha tratado de
evitar las prdidas no tcnicas que
atacan slo el robo, sin embargo,
estudios recientes han detectado otras
causas de prdidas no tcnicas, las cuales
se encuentran principalmente en los
sistemas de administracin (Acosta,
2010) . El porcentaje de prdidas

Figura 1. Causas de prdidas no tcnicas de energa. Se identifican cinco categoras de causas importantes en el rea
Metropolitana de Mxico (Acosta, 1997).

194

Artculos tcnicos

vara entre regiones y entre actividades


econmicas. En la figura 1 se muestra
un anlisis de las causas de las prdidas
no tcnicas en el rea metropolitana de
Mxico.
Como puede verse en la figura 1, el
robo de energa es slo una de las
causas de las prdidas no tcnicas en el
rea metropolitana y como un primer
intento de reducirlas, se ha atacado el
problema del robo de energa mediante
la aplicacin de algoritmos de minera
de datos a la informacin histrica de la
facturacin.
La base de datos comercial SICOM
contiene informacin detallada de los
contratos de los consumidores que
incluyen el consumo de energa y los
medidores de consumo. Esta base de
datos ha estado en operacin durante
varias dcadas, por lo tanto, cuenta con
millones de registros que constituyen
una fuente importante para detectar
patrones de consumo de energa, pero
se tienen que establecer relaciones con
otras bases de datos con informacin
tcnica y demogrfica, para tratar de
identificar un espectro ms amplio de
las prdidas no tcnicas.
Nuestro modelo incluye el
pre-procesamiento de los datos, la
minera de bases de datos, el anlisis
del conocimiento descubierto, y la
aplicacin de los nuevos conocimientos.
En la figura 2 se presenta este proceso.
En la etapa de pre-procesamiento de
los datos se consideran varias tareas,
tales como completar los registros

Figura 2. Diagrama de deteccin de prdidas no tcnicas. La


propuesta incluye el pre-procesamiento de los datos, la aplicacin
de algoritmos de minera de datos, el anlisis de los patrones
descubiertos y la aplicacin del nuevo conocimiento.

incompletos. En esta etapa, la participacin de expertos es muy


importante, ya que conocen el proceso y por lo tanto pueden
generar reglas para completar los registros, generar los registros
faltantes, as como establecer relaciones entre los datos.
La minera de datos de bases de datos juega un papel central
en la explotacin de la gran cantidad de informacin
disponible, sin embargo, cuando se trata de bases de datos
muy grandes, los algoritmos de minera requieren mucho
tiempo para procesar la informacin. Una forma de abordar
este problema es reducir la cantidad de datos antes de aplicar
los algoritmos de minera a travs del pre-procesamiento.
Por otro lado, los datos del mundo real generalmente estn
incompletos, con discrepancias o inconsistencias: faltan
valores en algunos atributos, faltan atributos relevantes, slo
contienen los datos agregados, con errores o con valores
atpicos. Las tareas en el pre-procesamiento de datos son:
Limpieza de datos: completar los valores perdidos,
reducir los datos ruidosos, identificar y eliminar los
valores atpicos, y eliminar las inconsistencias.
195

Boletn IIE, 2015


octubre-diciembre

Integracin de datos de diferentes bases de datos, cubos


de datos o archivos.
Transformacin de datos a travs de la normalizacin y
la agregacin
Reduccin de datos: se reduce el volumen de datos, pero
se producen los mismos resultados analticos o similares
Discretizacin de datos: se sustituyen atributos
numricos con valores nominales.
La aplicacin del mtodo de pre-procesamiento de seleccin
de atributos antes de la minera de datos ha demostrado
que este mtodo es prometedor, ya que puede eliminar
los atributos irrelevantes o redundantes que hacen que
las herramientas de minera se conviertan en ineficientes
(Meja, 2004). Al mismo tiempo se puede conservar y
aumentar la calidad de la clasificacin del algoritmo de
minera (precisin predictiva) y ayudar a entender los
modelos inducidos, ya que tienden a ser ms pequeos y
por lo tanto se hacen ms entendibles para el usuario final.
En el aprendizaje supervisado es conveniente aplicar un
mtodo de clasificacin. El mtodo buBF y el mtododG
(Meja, 2004) consideran interdependencias entre los
atributos nominales.
Como resultado del anlisis y la aplicacin de algoritmos
de minera de datos a la base de datos SICOM hemos
encontrado algunos patrones para detectar el robo de
energa, sin embargo, ahora estamos buscando otras
relaciones para tratar de detectar y prevenir las prdidas
no tcnicas de la energa que incluye otras causas como
se indica en la figura 1. Estamos evaluando diferentes
algoritmos para saber cul es ms eficaz.
Adicionalmente estamos construyendo un modelo para
detectar las prdidas potenciales o en una etapa temprana
con base en redes bayesianas.

196

Modelo Bayesiano para


deteccin de prdidas
de energa
Las prdidas no tcnicas de energa
involucran muchos factores, de
tal manera que cada factor puede
contribuir con la evidencia para
identificar un patrn, por lo que no
se tiene una nica fuente directa de
evidencia, sino que se cuenta con varias
y diferentes fuentes de evidencia. El
razonamiento bayesiano proporciona
mecanismos robustos para trabajar
con cualquier evidencia mnima que
permite hacer frente a la incertidumbre
inherente en la evaluacin de las
prdidas de energa.
Se han modelado redes bayesianas en
varios dominios. Se propone disear
un sistema de diagnstico basado
en redes probabilsticas temporales
(Arroyo, 2000). El sistema de
diagnstico utiliza un anlisis causaconsecuencia, con base en un modelo
que hace frente a la incertidumbre y el
tiempo. El modelo est representado
por medio de una red bayesiana de
eventos temporales (RBET) (Arroyo,
1999). Una RBET es un grafo
acclico dirigido (DAG) donde los
nodos representan un evento y las
aristas representan una relacin causal
temporal entre los nodos temporales.
Una RBET es una representacin
formal de la causalidad y las relaciones
temporales entre eventos. En otras
palabras, una RBET es un modelo
de comportamiento de consumo que
puede compararse al consumo real.
Una RBET se define de la siguiente

Artculos tcnicos

manera: RBET = (V, E), donde V


es el conjunto de nodos temporales
y E es el conjunto de aristas. Cada
nodo temporal est definido por un
par ordenado (, ) y la matriz de
probabilidad condicional que especifica
la probabilidad de cada par ordenado
dados sus padres (Meja, 2004).
Los valores de cada nodo temporal
pueden verse como el producto
vectorial entre el conjunto de valores
() y el conjunto de intervalos de
tiempo (T), a excepcin del estado
predeterminado que se asocia a un
solo intervalo.
El anlisis de causa-consecuencia
se utiliza para indicar que el nfasis
principal est en la determinacin
de las causas de los acontecimientos
que se han producido, as como la
prediccin de consecuencias futuras.
El formalismo RBET incluye el
manejo de la incertidumbre y del
tiempo para el diagnstico del
consumo y la prediccin de eventos,
utilizando la evidencia como pieza
importante de informacin. El
anlisis comienza cuando el mdulo
de deteccin de eventos detecta
un evento, ste toma las lecturas y
compara su valor con los lmites bajos
y altos. Un evento es una seal que
sobrepasa los lmites especificados.
El mecanismo de inferencia de un
modelo RBET se basa en la deteccin
de eventos y en la propagacin
de la evidencia. El mecanismo de
inferencia actualiza las probabilidades
marginales posteriores de cada nodo

(variable) de la red, debido a la ocurrencia de un evento o


eventos. Definimos tc como el tiempo cuando se detecta
un evento y como la funcin de ocurrencia en tiempo
real. Esta funcin se define como el valor absoluto de
la diferencia entre el tiempo de ocurrencia de un par de
eventos conectados. A medida que la red no tiene ninguna
referencia temporal, el tiempo de ocurrencia del primer
evento fija el tiempo de la red. El valor de se utiliza para
determinar el intervalo de tiempo del nodo efecto, teniendo
en cuenta el nodo causa como evento inicial. Despus,
la evidencia se propaga a travs de la red para actualizar
las probabilidades de los otros nodos. Estas posibilidades
indican la ocurrencia potencial de eventos en el pasado y en
el futuro. La funcin termina cuando se alcanza un nodo
terminal o de la hoja.
Se han identificado tres pasos principales en el proceso de
inferencia:
1) Deteccin de la ocurrencia del evento o eventos y
definicin del intervalo de tiempo de ocurrencia del
evento o eventos.
2) Propagacin de la evidencia de la ocurrencia a travs
de la red y actualizacin de las probabilidades de las
variables.
3) Determinacin de los eventos pasados y futuros
potenciales.
Una RBET se construye con base en los patrones descubiertos
en la fase de minera de datos y tambin es importante el
conocimiento de un experto. La red bayesiana implcita en
RBET se muestra en la figura 3. Esta RBET inicial representa
las causas de las prdidas no tcnicas de energa.

Conclusiones
Las prdidas no tcnicas de energa son un tema importante
en la generacin de energa elctrica y representan un gran
reto, ya que las empresas de generacin elctrica estn
perdiendo una cantidad considerable de dinero. Se han
realizado diversos esfuerzos para atacar este problema, que
se han centrado principalmente en el robo de la energa, sin
embargo, el problema ha persistido.
197

Boletn IIE, 2015


octubre-diciembre

Uncertainty on Artificial Intelligence, 1999,


pp. 13-20.
Meja, M., Rodrguez, G., Arroyo, G., Morales,
Feature selection-ranking methods in a very large
electric database. MICAI 2004: Advances in
Artificial Intelligence, 3rd Mexican Int. Conf.
on Artificial Intelligence, Springer Berlin,
April, pp. 292-301.
Rodrguez, R. L., Vidrio, G. Tendencias en
medicin: deteccin de robos de energa
elctrica. Boletn IIE, 1997.

Figura 3. Red Bayesiana inicial para la deteccin de prdidas no


tcnicas de energa. Incluye datos sobre demografa, equipo y gestin.

Adems del robo de energa se han identificado diversas


causas de las prdidas, tales como equipo de medicin
obsoleto. Se ha trabajado en la deteccin de robo de energa,
tratando de identificar los patrones de consumo en las bases
de datos de facturacin. Ahora se quiere detectar otras
causas de las prdidas no tcnicas de energa, por medio
del descubrimiento de nuevos patrones en la base de datos
de facturacin y a travs de la identificacin de relaciones
con las bases de datos tcnicas y demogrficas. Adems, se
est construyendo un modelo Bayesiano con la base de los
patrones descubiertos y con el apoyo de expertos. En este
artculo presentamos nuestra propuesta general y como
trabajo futuro nos gustara aplicar los algoritmos de minera
de datos que hemos evaluado y comparar los resultados.

Referencias
Acosta, F. Sector Energtico Mexicano, Talk at Regional Conference on
Smart Grids in Latin America and Caribbean: Feasibility and Challenges.
CEPAL. Santiago de Chile, Octubre, 12-13, 2010.
Arroyo G., lvarez Y., Sucar L. E. SEDRET an intelligent system for
the diagnosis and prediction of events in power plants, Expert Systems
with Applications. vol. 18, No. 2, 2000, pp. 75-86.
Arroyo G., Sucar L. E. Temporal Bayesian Network for diagnosis and
prediction. In Laskey K., Prade H. (eds.) Proc. 15th Conference on

198

Artculos tcnicos

Currculum vtae
Yasmn Hernndez Prez
[myhp@iie.org.mx]

Martn Santos Domnguez


[msantos@iie.org.mx]

Doctora en Ciencias Computacionales por el Tecnolgico


de Monterrey. Maestra en Ciencias Computacionales
por el Centro Nacional de Investigacin y Desarrollo
Tecnolgico (CENIDET). Ingeniera en Sistemas
Computacionales por el Instituto Tecnolgico de Ciudad
Madero. Ingres al Instituto de Investigaciones Elctricas
(IIE) en 1998, a la Divisin de Tecnologas Habilitadoras.
Su rea de especialidad es la inteligencia artificial,
particularmente interaccin humano-computadora,
modelado de usuario, sistemas tutores inteligentes,
e-learning y computacin afectiva. Ha desarrollado
y aplicado tecnologas para sistemas de capacitacin
avanzada en diversos proyectos para la industria elctrica y
energtica de Mxico. Es autora de diversas publicaciones
en revistas, captulos de libro y memorias de conferencias
internacionales. Actualmente coordina el eje temtico de
interaccin y emociones de la red temtica en tecnologas
del lenguaje del CONACYT. Es miembro del Sistema
Estatal de Investigadores de Morelos y de la Sociedad
Mexicana de Inteligencia Artificial.

Maestro en Ciencias con la especialidad en Fibras pticas


por la Universidad de Salford, Inglaterra en 1994.
Licenciado en Fsica por la Universidad Veracruzana en
1987. Tiene experiencia en el desarrollo de sistemas de
instrumentacin virtual y procesamiento de imgenes
(visin robtica), diseo, instalacin y administracin de
redes LAN y WAN. Tambin ha laborado en el campo de
las aplicaciones multimedia con integracin de servicios de
audio y video digital. Desde 1988 es Jefe de proyecto en la
Gerencia de Tecnologa de la Informacin del Instituto de
Investigaciones Elctricas (IIE). Ha dirigido proyectos para
Pemex Exploracin y Produccin y para la Comisin Federal
de Electricidad (CFE).

Gustavo Arroyo Figueroa


[garroyo@iie.org.mx]
Doctor en Ciencias Computaciones por el Instituto
Tecnolgico y de Estudios Superiores de Monterrey.
Maestro en Ciencias Qumicas e Ingeniero Industrial
Qumico por el Instituto Tecnolgico de Celaya.
Ingres al IIE en 1991, donde colabor en proyectos
relacionados con la automatizacin integral de plantas
elctricas, algoritmos de control avanzado, sistemas de
informacin en tiempo real y aplicacin de tcnicas de
inteligencia artificial en la supervisin y diagnstico
de procesos. Desde 1999 es Gerente de Tecnologas de
la Informacin. Autor de ms de 100 publicaciones
nacionales e internacionales; editor de Lectures Notes
on Artificial Intelligence. Pertence al Sistema Nacional
de Investigadores (SNI) desde 1991 y actualmente es
investigador nivel II. Miembro de la mesa directiva de
la Sociedad Mexicana de Inteligencia Artificial, de la
IEEE, del Comit de Plantas Elctricas del IASTED,
y del Comit Estudios D2 Information Systems and
Telecommunications del CIGRE.

Hilda Escobedo Hernndez


[escobedo@iie.org.mx]
Maestra en Inteligencia Artificial en el programa
UV-LANIA (Universidad Veracruzana-Laboratorio
Nacional de Informtica Avanzada A.C.). Licenciada
en Informtica por la Facultad de Informtica de la UV.
Desde 1989 es investigadora en la Gerencia de Tecnologas
de la informacin. Ha participado en el desarrollo de
varios proyectos relacionados con base de datos, portales
y capacitacin para la Comisin Federal de Electricidad
(CFE). Sus reas de inters son minera de datos y
tecnologas de informacin.

199

También podría gustarte