Utilización de Modelos Categóricos para Perfiles de Carga Eléctricos

UNIVERSIDAD DE COSTA RICA
CENTRO DE ESTUDIOS DE POSGRADOS

MAESTRÍA PROFESIONAL EN ESTADÍSTICA
Proyecto de investigación:
Utilización de modelos de análisis categórico para la

asignación de perfiles de carga de consumo eléctrico.
Profesor: M.Sc. Gilbert Brenes
Integrantes:
Allan Quesada
SP-1629 Análisis de datos categóricos

Semestre 2017-I
RESUMEN
Las tarifas eléctricas, presentan una división por sectores, nivel de tensión y bloques horarios. Esta
segregación se conoce como estructura tarifaria. En Costa Rica esta estructura data de 1980 y no
ha sufrido actualizaciones significativas desde entonces.
Para lograr una correcta asignación de incentivos se deben agrupar a los clientes en grupos que
cumplan ciertas características socioeconómicas y de comportamiento de la demanda horaria.
En el presente trabajo se realizó un análisis de conglomerados con el fin de crear los grupos de un
modo objetivo, como resultado del análisis se obtuvieron 5 grupos según el volumen de energía
que consumen, según el periodo horario en que lo realizan y según la variabilidad de este
consumo.
Se observó que la región central se diferencia de modo significativo de las demás regiones del país.
Los perfiles agrupados como Grandes de Carga Media, son muy semejantes a los perfiles
agrupados en circuitos de carga en punta, con una diferencia sustancial, que son las industrias
menores las cuales tienen entre cuya razón de pertenencia a este grupo es más de cuatro veces la
razón de pertenencia del grupo de circuitos grandes con carga en media.
A su vez se observa que las empresas grandes están más relacionados con circuitos con buen
manejo de carga, por su parte los comercios y servicios mayores, sólo presentan efecto
significativo en los circuitos pequeños con buen manejo de carga, mientras que industrias medias
y menores presentan comportamientos poco compatibles con algún nivel de carga específico, al
respecto llama la atención las industrias menores quienes tienen efectos positivos y significativos
principalmente en circuitos con buen manejo de carga y con mal manejo de carga.
De este modo, se observa que la configuración regional y de grupo tarifario presenta una relación
importante con el manejo de carga, e incluso de observa que el grupo tarifario al que pertenece
tiene un efecto significativo en determinar el tipo de perfil de carga que tiene el usuario, sin
embargo este efecto no tiene una línea clara para los Comercios, Servicios e Industrias, debido a la
heterogeneidad que poseen estos grupos, teniendo ciertos agentes con un buen perfil de carga y
agentes con un mal perfil de carga.
INTRODUCCIÓN:
En Costa Rica, la electricidad es un bien público según lo indicado en la Ley N°7593, esto implica que
el servicio es regulado y por tanto la determinación del precio a pagar debe ser fijado por medio de
un estudio tarifario.
Dicha Ley delega esta potestad en la Autoridad Reguladora de los Servicios Públicos (ARESEP) y esta
por medio de estudios técnicos debe fijar las tarifas de un modo objetivo, manteniendo el equilibrio
financiero de las empresas reguladas, velando por los derechos de los usuarios y atendiendo a dos
principios muy importantes, que corresponden al servicio al costo y a la eficiencia en la prestación
del servicio.
La ARESEP, debe determinar los costos necesarios para la prestación de los servicios públicos, en
cumplimiento con los principios antes mencionados, según lo dispuesto en la resolución RJD-139-
2015. Estos costos deben cubrirse con los ingresos propios de la prestación del servicio, para ello se
determina cuanto deben aportar cada una de las tarifas (Residencial, Industrial, Media Tensión,
entre otras), para ello se utiliza la estructura tarifaria la cual debe permitir que los usuarios finales
paguen según sus características y según el impacto que genere en los costos de generación (Srouga,
2000).
Para la definición de una estructura tarifaria adecuada se “utilizan los Factores de Carga,
Simultaneidad y Participación (o Coincidencia Interna/Externa) correspondientes a cada
categoría/subcategoría/banda tarifaria consideradas en este grupo tarifario” (Facchini et al, 2017,
pág. 4), de modo que los usuarios o grupos de usuarios paguen según la cantidad de energía que
consuman, pero también según la máxima capacidad que haya que proveer a cada grupo, pues si
existen grupos que demandarán en un determinado instante una gran cantidad de energía, se
requiere contar con la capacidad necesaria para suministrarla.
Dado lo anterior, se deben generar grupos tarifarios, de acuerdo a sus características técnicas de
consumo, para lo cual se requiere un método de creación de grupos objetivos. Por esta razón en el
presente artículo se hace uso del análisis de conglomerados o clusters con el objetivo de crear una
asignación y agrupación de conformidad con las características propias de consumo de los clientes,
para ello se hizo uso de la información propia de consumo horario, normalmente conocido como
curva de carga.
Por medio de esta técnica se lograron obtener 5 grupos de clientes eléctricos, en los cuales se
encuentran usuarios de diferentes sectores económicos, una vez seleccionado cada grupo se
procedió a realizar una validación interna a fin de determinar qué características de consumo posee
cada grupo y posteriormente se realizó una validación externa, a fin de caracterizarlos
socioeconómicamente y determinar así la relación entre cada grupo con el conglomerado
resultante.
Estos conglomerados constituyen una variable categórica para cada consumo, de este modo la
categoría dada al perfil de carga de cada circuito se convirtió en una característica de dicho circuito,
y en la búsqueda de explicaciones para comprender las razones que generaban cada agrupamiento
se observó una importante relación entre el perfil de carga y el grupo tarifario predominante en
cada circuito.
En este trabajo se observó cómo los circuitos con grandes empresas lograban un manejo de carga
adecuado, situación semejante a la observada con las macro empresas e industrias medias. Por su
parte los sectores de comercios y servicios mayores se asociaban a las cargas medias, más sin
embargo el grupo de comercios y servicios menores no mostraba una clara asociación con ningún
grupo, es decir presentaba un comportamiento bastante proporcional entre cada conglomerado.
Como complemento a dicho análisis, en este artículo se utiliza los datos del porcentaje de consumo
que cada categoría tiene en cada circuito con el objetivo de determinar si la concentración de un
determinado grupo en un circuito, permite clasificarlo en alguno de los grupos antes mencionados,
el agrupamiento varía según la zona en la cual se encuentre el circuito, es por esta razón que a su
vez se incorporó estas variables en el análisis respectivo, obteniendo a su vez resultados
significativos y consistentes con el trabajo desarrollado.
OBJETIVOS DEL TRABAJO:
Objetivo general
• Desarrollar un conjunto de modelos categóricos que permitan asociar las características

demográficas de los circuitos y la composición del consumo del mismo con los perfiles de
carga promedio.
Objetivos específicos
• Implementar una categorización objetiva de los perfiles de carga de los circuitos, por medio
de la utilización de análisis de conglomerados.
• Relacionar los perfiles de carga de los circuitos con las características demográficas de los
circuitos y la composición del consumo del mismo con los perfiles de carga promedio, por
medio del uso de distintas modelaciones logísticas.
• Analizar los resultados obtenidos, en función de la estructura tarifaria actual del sector
electricidad.
TEORÍA SOBRE LAS FIJACIONES TARIFARIAS.
La electricidad a diferencia de los demás bienes y servicios, posee dos componentes asociados: la
energía y la potencia. Por lo cual para comprender el problema en estudio se debe conocer ambas
definiciones:
La potencia es “es la rapidez con la cual la fuerza se transforma en energía” (Fowler, 1992, pág. 26),
por su parte la energía eléctrica es “la capacidad de producir trabajo en un periodo de tiempo”
(Fowler, 1992, pág. 1).
De este modo para efectos del servicio regulado, la energía es todo el voltaje recibido que le
permite, utilizar los Watts en aparatos eléctricos que le proveen calor, sonido, movimiento y demás
manifestaciones de materia, por su parte la potencia es la máxima energía recibida en un instante,
es decir el mayor voltaje recibido en un periodo de tiempo.
Por su parte una curva de carga es una representación gráfica, en la cual se observa el consumo de
energía en cada intervalo de 15 minutos, por ejemplo en la gráfica 1 se observa la curva de carga de
Costa Rica, en la cual se visualiza en promedio para el mes de febrero, cual fue el consumo de energía
para cada intervalo de 15 minutos.
Gráfico 1
Costa Rica: Demanda promedio de energía en Mega Watts por circuito de los usuarios por
periodos temporales de 15 minutos
Febrero 2017
Fuente: Elaboración propia con datos de ARESEP
De acuerdo a esta gráfica la potencia sería la máxima energía recibida, la cual es de 3 359 MW,
demandados a las 6:30 p.m., mientras que la energía seria la suma de toda la energía recibida en el
mes, que sería la integral o área bajo la curva de dicha gráfica.
La generación eléctrica se ve influenciada por la demanda de un modo significativo, pues se requiere

satisfacer toda la energía demandada, pero también se debe poder cumplir con los picos de
demanda, es decir se debe suplir la demanda por potencia, pues como se observó en la gráfica, en
un momento dado Costa Rica como un conjunto demando en promedio por circuito 3 359 MW por
lo que se debía contar con la capacidad en las plantas generadoras para cumplir justamente en ese
instante con el flujo de energía requerido.
Lo anterior ha fomentado el desarrollo de plantas eléctricas cuyo factor de utilización no es muy

alto en el día, pues se construyen con el fin de colaborar en el proceso de cubrimiento de estos
periodos de alta demanda. Esta situación ha sido atacada por diferentes sectores del país, indicando
ineficiencias en el proceso de generación, por la capacidad ociosa de las plantas, además existen
periodos en los cuales la generación con fuentes renovables no alcanzan para cubrir estos periodos
de demanda y se debe recurrir a generación de respaldo, específicamente a plantas de generación
térmica las cuales tienen un costo marginal más elevado y que son más contaminantes.
De este modo tal y como indica la Comisión de Tarifas Eléctricas de Perú (1998), se requiere crear
una tarifa por potencia, que permita que los usuarios que requieren esta capacidad de generación
instantánea paguen por los costos asociados a contar con la disponibilidad de energía para la
atención de su demanda.
En la actualidad los incentivos y costos tarifarios son muy distintos entre los diferentes grupos, en
el gráfico 2 se logra observar como a nivel nacional los precios medios entre cada tarifa varían
significativamente pasando de precios medios de 108,55 colones por kWh para la tarifa de
comercios y servicios, hasta tarifas de 59,52 colones por kWh para la tarifa de media tensión b.
Gráfico 2
Costa Rica: Precio medio de la electricidad en colones por KWh por grupo tarifario
2012-2017
Estas diferencias tarifarias se deben a múltiples factores, entre los cuales resaltan por ejemplo el
nivel de tensión de cada tarifa, pues entre más bajo es el nivel de tensión, mayores son los costos
de suplir el servicio (Unidad de Planeación Minero Energética, 2004), además de factores sociales
en los cuales por ejemplo los centros educativos, lugares de beneficencia, y personas oxígeno
dependientes pagan menores tarifas, así como factores económicos, en los cuales se busca que las
tarifas permiten el desarrollo competitivo del país (MINAE, 2015).
Además de lo anterior existen otros factores técnicos del comportamiento de consumo, los cuales
se relacionan con los costos de la energía y la potencia. La potencia para el mes de febrero
representó cerca del 30% de los ingresos, lo anterior para efectos teóricos presupone que la
potencia representa cerca del 30% de los costos, por lo cual se deben generar tarifas explícitas como
implícitas que permitan recaudar este monto entre todos los clientes.
La determinación de la tarifa por potencia obedece a la problemática antes mencionada, es decir a

la determinación de un costo por potencia que atienda a principios técnicos del comportamiento de
la demanda, con el fin de generar incentivos para que los agentes que concentran su consumo en
periodos “pico”, desplacen su consumo de un modo más equilibrado, y de este modo disminuir la
presión sobre el sistema.
Para la determinación de estos factores de coincidencia se realiza una campaña de medición que
determina el factor de responsabilidad de cada grupo tarifario.
La estructura tarifaria actual data de los años 70 y 80 del siglo XX y no existen documentos formales
que permitan comprender el desarrollo de la misma, y por tanto es necesario una revisión de la
misma. Máxime que las condiciones técnicas y socioeconómicas son muy distintas de las existentes
en aquel momento.
Como se observa en el gráfico 3, la estructura tarifaria actual plantea importantes diferencias en la
tarifación de potencia entre los grupos, lo anterior emite señales que hacen pensar que las
industrias medias son quienes más capacidad demandan del sistema, mientras que la tarifa
residencial presenta un costo por potencia considerablemente menor. Además resalta el hecho de
que no existen diferencias entre los grupos de industrias medias y menores, situación que también
se presenta en los comercios y servicios.
Gráfico 3
Costa Rica: Precio medio de la electricidad en colones por KWh por grupo tarifario
Febrero, 2017
12 000,00
10 000,00
8 000,00
6 000,00
4 000,00
2 000,00
-
Industrias Industrias Comercios y Comercios y Empresas Macro Residencias
medias menores Servicios Servicios grandes empresas
mayores menores
(1) El dato de potencia residencial fue calculado utilizando los mismos criterios de los comercios y servicios.
Estas señales pueden malinterpretarse, pues como se mencionó anteriormente existen condiciones
socioeconómicas que hacen que las tarifas difieran unas de otras y al no lograr separarse estas
condiciones de los elementos técnicos, las conclusiones pueden no ser válidas.
Por lo anterior, es importante recalcar que un primer punto a mejorar en el desarrollo de una
estructura tarifaria para Costa Rica, sería la necesidad de visibilizar cada efecto, a fin de tener una
mayor claridad en los criterios y métodos utilizados.
De este modo es importante delimitar el alcance de la presente investigación; pues lo que se desea
es realizar un esfuerzo por diagnosticar la estructura actual, para ello el trabajo se centrara en dos
puntos importantes, en primera instancia determinar si los grupos tarifarios que existen en la
actualidad son lo suficientemente homogéneos desde su comportamiento de agruparse del modo
que se está realizando en la actualidad, o si por el contrario se requiere una mayor separación y en
segunda instancia se desea analizar si la asignación de los costos de potencia parecen estar bien
distribuidos en la estructura tarifaria actual.
DATOS Y MÉTODOS.
Dado que no se cuenta con una campaña de medición, y que no existe evidencia bibliográfica del
desarrollo de la misma en el país, es necesario realizar un esfuerzo por aproximar de alguna manera
el comportamiento de carga de los diferentes grupos tarifarios del país.
Gracias a la resolución de la ARESEP RIE-089-2016, las empresas distribuidoras deben suministrar

las curvas de carga de los circuitos de distribución; los circuitos son conjuntos de líneas de
distribución en la cual los distintos abonados se conectan, con lo cual la curva de carga de un circuito
es igual a la sumatoria de curvas de carga de los distintos abonados.
Esta información es muy valiosa pues es la única aproximación existente en la actualidad para el
análisis de curvas de carga. De igual modo, gracias a la resolución RIE-089-2016, se tiene la base de
datos de facturación de las empresas, de modo que se cuenta con el detalle de todos los clientes
asociados a las empresas de distribución, contando con información de la georreferencia del cliente,
los datos de consumo de este, así como los datos de facturación y también permiten determinar en
qué circuito se encuentra cada cliente.
De este modo se pueden unir ambas bases de datos, obteniendo una base de datos por circuito que
permita determinar las curvas de carga, así como datos descriptivos, indicando el porcentaje de
consumo por cada grupo tarifario y la georreferencia para cada circuito. Así pese a que no se logra
contar con curvas de carga por abonado, se logran generar curvas de carga promedio por circuito
para el mes de febrero y se busca determinar si estas se logran agrupar en conglomerados según el
comportamiento de su consumo.
Se puede notar que si todos los usuarios siguen el comportamiento de la curva de carga nacional
mostrada en el gráfico 1, todos los circuitos seguirían este comportamiento y por tanto no se
lograrían generar diferentes subgrupos. Sin embargo, si existieran diferentes perfiles de consumo,
de modo que hubiera usuarios con un manejo diferenciado de carga, podrían influir en la curva de
carga del circuito, y por tanto podríamos observar subgrupos de circuitos, con base en el perfil de
carga que manejan, así por ejemplo podríamos contar con grupos de circuitos con mal manejo de
carga, y otros con un adecuado manejo de carga, entre otros. De este modo si el análisis de
conglomerados es efectivo al generar grupos de circuitos, se podrá demostrar que no todos los
circuitos tienen el mismo comportamiento en su curva de carga y por tanto es probable que los
clientes a su vez tengan diferencias, resultado muy importante en la investigación que abrirá
espacios para determinar a qué se deben estas diferencias y si el sistema tarifario actual está siendo
consistente con esto.
Si los circuitos lograsen agruparse de acuerdo a su perfil de carga, habría que analizar, cuáles son
las razones que hacen que determinados circuitos tengan estos comportamientos en la curva de
carga, para esto se analizará la composición del consumo de este circuito, es decir se determinará
si está compuesto por residencias, comercios y servicios menores, industrias medias, entre otros.
Para esto se determinará el porcentaje del consumo de cada circuito que corresponde a cada grupo
tarifario.
Si todos los grupos tarifarios generan un impacto semejante, de modo que ningún grupo tarifario se
relacione en mayor medida con algún perfil de carga, la composición del consumo de cada grupo
de circuitos sería parecida a la composición global por grupos de consumo, pero si por ejemplo las
empresas grandes se relacionan con un buen manejo de la curva de carga, es probable que los
circuitos en los cuales hayan empresas grandes se relacionan con los conglomerados que tienen un
buen perfil de carga.
De modo similar se realizará un análisis por georreferencia, a fin de determinar si este también se
relaciona con los diferentes perfiles de carga.
Para el análisis de los circuitos, se tuvo que realizar un análisis del comportamiento e información
de cada uno, de este análisis se determinó que se tuvieron que excluir cerca del 18% de los circuitos,
debido a que algunos circuitos no presentaron información, como es el caso de los circuitos de
Coopealfaroruiz R.L., además los circuitos de ESPH presentaron comportamientos atípicos, y se
excluyeron algunos cuyo coeficiente de variación era extremadamente elevado superior a 45%, y
que observando la distribución de los coeficientes de variación presentaban comportamientos
claramente atípicos. Posterior a la limpieza se contó con un total de 261 circuitos para análisis.
Debido a que las curvas de carga son mediciones en intervalos de 15 minutos, para todas las horas
del mes, para cada circuito se tienen 2688 mediciones para el mes de febrero, de este modo para
lograr hacer un adecuado análisis de conglomerados se requería contar con un conjunto de variables
que resumiera de modo adecuado estas 2688 mediciones y que permitiera tipificar la curva de carga
del circuito, a fin de que permitiera generar conglomerados que identificaran perfiles de carga con
características importantes. Para ello se tomaron las siguientes variables, las cuales buscaron
denotar elementos importantes de cada curva de carga:
Cuadro 1
Costa Rica: Definición de las variables utilizadas en la determinación de los conglomerados
Febrero, 2017
Variable Acrónimo Descripción Razón por la cual se usó
Permite determinar que tan distribuido es
Es el porcentaje de máxima utilización
Factor de Carga FC el perfil de carga y por tanto que tan
de la capacidad instalada.
homogéneo en su consumo en el tiempo.
Es la razón entre el promedio de Permite determinar que tan diferente es el

Razón de Carga en
CARGA_PUNTA consumo en punta, entre el promedio consumo en el periodo punta, indicando
Punta
de consumo en todos los periodos. que tanto se consume en este periodo.

Razón de Carga en
CARGA_VALLE consumo en valle, entre el promedio consumo en el periodo valle, indicando
Valle

Razón de Carga en
CARGA_NOCHE consumo en noche, entre el promedio consumo en el periodo noche, indicando
Noche
Permite determinar que tan grande es el
Es el porcentaje que representa el
Porcentaje del PORCENTAJE_CONS consumo del circuito, y de este modo
consumo del circuito con respecto al
consumo total UMO diferenciar los circuitos grandes de los
consumo del país.
pequeños.
Permite determinar que tan variable es el
Coeficiente de Es el coeficiente de variación del
CV_CONSUMO comportamiento del consumo en cada
variación consumo.
circuito.
Fuente: Elaboración propia
Como se observa en el cuadro dos, el comportamiento de estas variables es el esperado para los
distintos circuitos, se observa una importante variabilidad en estos datos, con lo cual se logra
determinar variabilidad en el manejo de la carga, elemento muy importante para la determinación
de conglomerados.
De igual modo se puede observar que los datos promedio obedecen a una curva de carga promedio,
en la cual se cuenta con un factor de carga del 55%, un consumo promedio en la punta que es 20%
mayor que el promedio global, con circuitos medios que representaban 0,38% del total del consumo
nacional.
Cuadro 2
Costa Rica: Estadísticas descriptivas de las variables seleccionadas para los
conglomerados
Desviación
Variables Máximo Mínimo Promedio
estándar
Factor de Carga 100% 16% 55% 0,14pp
Razón de Carga en Punta 1,57 0,60 1,20 0,13
Razón de Carga en Valle 1,31 0,87 1,08 0,07
Razón de Carga en Noche 1,12 0,60 0,82 0,09
Porcentaje del consumo total 1,62% 0,00% 0,38% 0,35pp
Coeficiente de variación 0,46 - 0,27 0,08
Fuente: Elaboración propia con datos de ARESEP.
Utilizando estas variables se puede describir el comportamiento del consumo de cada circuito, es
por esta razón que las mismas fueron las empleadas en el análisis de conglomerados. Dicho análisis
se realizó siguiendo el procedimiento de k-medias, y fue un proceso iterativo, iniciando con dos
conglomerados, analizando el comportamiento de las variables por cada conglomerado,
determinando su razonabilidad e interpretación. De este procedimiento se observó que con 5
conglomerados se lograba obtener grupos con diferentes perfiles en las variables utilizadas, que
tenían una lógica adecuada en el comportamiento de cada variable, estos grupos resultados podían
interpretarse y la distribución de los circuitos en cada grupo era representativa.
Una vez conformados los distintos conglomerados, se procedieron a realizar un conjunto de

regresiones logísticas con el objetivo de determinar el modelo que mejor pudiera relacionar los
perfiles de carga de cada grupo con la composición por grupos tarifarios existentes en los mismos.
Cada circuito posee un conjunto de clientes en diferentes grupos tarifarios lo cual caracteriza la
composición del mismo, existen circuitos con una alta concentración de servicios residenciales, así
como otros circuitos en los cuales existe un fuerte porcentaje de consumo que está asociado a los
servicios industriales. Sí los perfiles de carga de cada uno de estos grupos tarifarios es diferente se
espera que, los circuitos en los cuales predomina estos grupos tarifarios reflejen el patrón de dicho
grupo. De este modo, cada conglomerado representa perfiles de carga diferenciados los cuales se
espera que se asocien a un conjunto de clientes que por sus características de consumo se asocian
a dichos perfiles de carga, observando así una relación entre los grupos tarifarios y los diferentes
perfiles.
En síntesis, se espera que sí el comportamiento de las empresas grandes está asociado a un perfil
de carga especifico, los circuitos en los cuales hay una mayor proporción del consumo asociado de
dichas empresas, también se asocie en mayor medida a un conglomerado al perfil de carga de este
grupo tarifario.
Para realizar esta asociación se desarrollaron un conjunto de regresiones logísticas, las cuales
permitieron modelar el conglomerado al que pertenece cada circuito en función del porcentaje de
consumo asociado a cada grupo tarifario.
En dichos modelos también se incorporó variables dicotómicas regionales con el objetivo de

determinar si la región a la que pertenece los servicios asociados al circuito influye en la
determinación del perfil de carga, de modo que, se puede determinar que una región especifica se
asocie a mayor medida a un perfil de carga.
A continuación, se exponen las estadísticas descriptivas de la composición de consumo por grupo

tarifario tanto a nivel nacional como por circuito.
A nivel nacional para el mes de febrero, tal y como se observa en el gráfico 1, cerca del 42% del
consumo es del conjunto de clientes residenciales, seguido por los comercios y servicios con casi el
30% del consumo, mientras que las empresas grandes servidas en media tensión poseen cerca del
22% del consumo, mientras que los industriales tienen sólo cerca del 5% del consumo. Por lo
anterior es probable que a nivel de circuitos la mayoría del consumo sea de clientes residenciales.
Gráfico 4
Costa Rica: Distribución porcentual del consumo eléctrico por tarifa.
Febrero 2017
Fuente: ARESEP, IE
Pese a esto al obtener los datos promedio de las ponderaciones utilizadas, se observa que a nivel
de circuito esta condición no es tan homogénea, observando que en todos hay circuitos dedicados
exclusivamente a ciertos grupos tarifarios, al tiempo que se observa que existe al menos un circuito
en el cual no está la participación de algún grupo tarifario.
Esta situación le agrega una alta variabilidad a la configuración del circuito, tal y como se observa
en la desviación estándar de los datos, elemento importante a fin de que estos datos permitan
dilucidar cuales son los grupos tarifarios que mayor efecto tienen sobre el comportamiento de la
curva de carga del circuito.
Cuadro 3:
Costa Rica: Estadísticos descriptivos del porcentaje de participación de cada grupo tarifario, en el
consumo de cada circuito.
Febrero, 2017.
Promedio de Desviación estándar Mínimo del Máximo del
Grupo tarifario porcentaje de del porcentaje de porcentaje de porcentaje de
participación participación participación participación
Comercios y Servicios mayores 17.53 17.64 0 100.00
Comercios y Servicios menores 15.88 10.44 0 77.69
Empresas grandes 16.58 23.73 0 100.00
Industrias medias 3.84 8.29 0 96.34
Industrias menores 1.01 2.84 0 33.46
Macro empresas 1.15 8.52 0 99.70
Residencias 44.01 25.51 0 100.00
A su vez, a nivel de región socioeconómica se observa una clara concentración de los circuitos en la
región central del país con cerca del 57% del total de los circuitos analizados. Con lo anterior se
observa que dicha variable es relevante, pues pese a la alta concentración y por consiguiente menor
variabilidad, esta variable resulta relevante en el análisis.
Cuadro 4:
Costa Rica: Distribución de circuitos por región económica.
Febrero, 2017.
Cantidad de Porcentaje que
Region
Circuitos representa
Demás Regiones 84 32.18
Chorotega 28 10.73
Central 149 57.09
Para la construcción de la regresión logística se utiliza como variable dependiente el conglomerado

al cual fue asignado y como variables explicativas las variables de concentración de consumo en
cada grupo tarifario y variables dicotómicas para la clasificación por región.
Las regresiones logísticas utilizadas en el análisis fueron: logística simple, logística ordinal, logística
ordinal proporcional y la logística multinomial. Para la regresión logística simple se recodificaron los
conglomerados en dos grupos los que presentan un buen perfil de carga y los que no. Para la
regresión ordinal se utilizaron las cinco categorías obtenidas del análisis de conglomerados, además
se empleó dicha técnica en una variable recodificada de tres categorías, agrupando en la primer
categoría los circuitos con mal perfil de carga y en la segunda categoría los que poseían carga media
o carga en punta y en la tercer categoría a los circuitos pequeños y grandes con buen perfil de carga.
Por su parte en el modelo multinomial también se utilizaron las tres y cinco categorías indicadas en
el modelo ordinal.
Todos los modelos fueron desarrollados en el software estadístico R, y para la selección del mejor
modelo para la clasificación de datos se analizó el logaritmo de verosimilitud, el pseudo R2, y el
porcentaje de clasificación correcta con cada modelo, a su vez se realizaron pruebas de razón de
verosimilitud a fin de determinar si existían diferencias significativas entre los distintos modelos.
En primera instancia no se podían emplear todos los grupos tarifarios pues generan un problema de
multicolinealidad, por ello se excluye el grupo de macro empresas, sin embargo, aún se vislumbra
el mismo problema, por lo anterior se comenzaron a desarrollar un conjunto de modelos a fin de
lograr ir generando el modelo con la mejor capacidad de categorización.
Al respecto se observó que los grupos tarifarios residencial y comercios y servicios menores no
generaron buenos resultados al incluirse en los modelos, razón por la cual decidieron excluirse, lo
cual es consistente con los resultados obtenidos de artículos anteriores en los cuales se determinó
que dichos grupos no contribuían en mucho al poder de clasificación de los circuitos en los
diferentes perfiles.
A su vez como categoría base se empleó la región Central, pues se determinó que las diferencias
significativas se daban contra esta región, pues la Chorotega pese a tener características distintas al
resto del país, poseen un comportamiento menos similar a la región Central.
RESULTADOS.
Una vez desarrollado el análisis de conglomerado, tal y como se indicó en la sección anterior se
analizaron los diferentes resultados y se determinó que 5 conglomerados lograban dividir de un
modo adecuado el conjunto de circuitos, los resultados obtenidos para estos 5 grupos se muestran
a continuación:
Cuadro
Cuadro 35
Costa Rica: Promedio de las variables de consumo por circuito por cada conglomerado
Febrero, 2017
Pequeñas con
Pequeñas con Grandes con Buen manejo Medianas con
Variables buen manejo
mala carga carga media de carga carga en punta
de carga
Factor de Carga 49% 53% 72% 54% 63%
Razón de Carga en Punta 1,25 1,23 1,09 1,26 1,08
Razón de Carga en Valle 1,1 1,1 1,06 1,11 1,04
Razón de Carga en Noche 0,78 0,79 0,9 0,77 0,92
Porcentaje del consumo total 0,14% 1,07% 0,74% 0,50% 0,15%
Coeficiente de variación 0,3 0,29 0,18 0,31 0,21
Como se logra apreciar, el análisis de conglomerados desarrollado, permitió obtener 5 grupos que
distan uno de otro, y que cada uno ofrece perfiles de carga bastante diferentes. Por ejemplo en el
primer conglomerado se logra contar con circuitos una factor de 49%, inferior al promedio general,
con consumos promedios altos en los periodos punta, con circuitos pequeños que representan en
promedio el 0,14% del consumo total y con coeficientes de variación elevados en términos
comparativos, lo que indica que el consumo es bastante variable a lo largo del día. Es decir tenemos
un grupo de circuitos pequeños que tienen un mal perfil de carga que contribuye a la creación de
“picos”.
Así como se logró interpretar este conglomerado, se le puede dar interpretación a cada uno de estos
grupos, de ahí proviene el nombre dado a cada grupo. Como se logra apreciar contamos con los
circuitos pequeños que poseen mala carga, tenemos circuitos con mayor consumo que poseen un
factor de carga, coeficiente de variación y distribución de la carga semejantes al promedio nacional,
por ello se dice que este engloba a los circuitos con carga media. Parecido a este conglomerado se
encuentran las medianas con carga en punta, que son circuitos medianos con resultados
semejantes al promedio, pero con una mayor concentración en punta, que afecta su factor de carga
y coeficiente de variabilidad. Por último se tiene a las que tienen buen manejo de carga, que son
circuitos medianos, que poseen resultados de factor de carga, coeficiente de variación y distribución
de la carga claramente mejores a los demás circuitos y también se cuenta con los circuitos pequeños
con buen manejo de carga, quienes son circuitos bastante pequeños, pero con muy buenos
resultados en cuanto al factor de carga, coeficiente de variación y distribución de la carga.
Como se logra apreciar en el cuadro 5, cada circuito obtuvo una representatividad importante,
elemento que ratifica que el análisis de conglomerados es adecuado y permite obtener una
distribución de circuitos por perfiles de carga, con lo cual se demuestra que existen conjuntos de
agentes que se separan del comportamiento típico, y que por tanto se debe valorar lo anterior en
el desarrollo de la estructura tarifaria, para la determinación del cargo por potencia.
Cuadro 64
Cuadro
Costa Rica: Promedio de las variables de consumo por
circuito por cada conglomerado
Febrero, 2017
Cantidad de
Conglomerado Porcentaje
circuitos
Pequeñas con mala

96 37%
carga
Grandes con carga

35 13%
media
Buen manejo de carga 16 6%
Medianas con carga en

50 19%
punta
Pequeñas con buen

64 25%
manejo de carga
Total 261 100%
Fuente: Elaboración propia
Como se mencionó en la sección precedente se desarrollaron seis modelos logísticos con el objetivo
de clasificar los diferentes circuitos obtenidos del análisis de conglomerados, en función del área de
procedencia y la composición de consumo por grupo tarifario.
A continuación de muestran los resultados obtenidos para cada uno de los modelos
En primera instancia se desarrolló un modelo logístico simple, se dividieron los conglomerados en

dos grupos, lo que poseen un buen manejo de carga y los que no, los coeficientes estimados fueron
los siguientes:
Cuadro 7:
Costa Rica: Resultados de la regresión logística simple para los datos de perfil de carga de los
circuitos.
Febrero, 2017.
Razón de odds
Variable Coeficiente Significancia
ratios
Intercepto -3,20 0,00
Chorotega 3,01 0,00 20,24
Demás Regiones 2,65 0,00 14,19
Empresas grandes 0,03 0,00 1,03
Industrias medias 0,04 0,02 1,04
Industrias menores 0,03 0,57 1,03
Comercios y Servicios mayores 0,01 0,36 1,01
El modelo de regresión logística simple ofrece resultados significativos para para las variables
regionales y para las variables de consumo asociadas a empresas grandes e industrias medias.
Como se logra apreciar los odds de clasificación en circuitos con buen manejo de carga son 20,24
veces mayores en los circuitos de la región Chorotega, en comparación con los de la región Central,
situación similar a los de las regiones, Pacífico Central, Brunca y Huetar Norte, donde dicho valor es
de 14,19.
También se observa que ante un aumento de un punto porcentual en el porcentaje del consumo
del circuito que corresponde a empresas grandes, se observa un aumento de 3% en los odds de
pertenencia al conglomerado con buen manejo de carga, esta situación es similar en el caso de
industrias medias, cuyo coeficiente también es significativo y en el cual se observa un aumento de
4% en los odds de pertenencia al conglomerado con buen manejo de carga, ante un aumento de un
punto porcentual en el porcentaje del consumo del circuito que correspondiente a este grupo de
industrias.
Como parte de este análisis se incorporaron interacciones, sin embargo estas no fueron
estadísticamente significativas al 5% y por medio de una prueba de razón de verosimilitud
El segundo modelo desarrollado fue una regresión ordinal, para 3 y 5 categorías. Las 5 categorías
empleadas en el análisis son las indicadas en el cuadro 5, y se ordenaron de modo del siguiente
modo:
1. Pequeñas con mala carga.

2. Grandes con carga media.
3. Medianas con carga en punta.
4. Pequeñas con buen manejo de carga.
5. Buen manejo de carga.
Como se logra apreciar, existe cierto orden lógico, pues se busca pasar de circuitos con mal manejo
de carga, hasta llegar a circuitos con buen manejo de carga.
Los resultados obtenidos para dicho modelo son:
Cuadro 8:
Costa Rica: Resultados de la regresión ordinal con 5 categorías para los datos de perfil de carga de
los circuitos.
Febrero, 2017.
Razón de odds
ratios
Intercepto 1 0,01 0,96
Intercepto 2 -0,56 0,04
Chorotega 1,59 0,00 4,89
Comercios y Servicios mayores -0,01 0,43 0,99
Como se logra apreciar los resultados observado son semejantes a los obtenidos con el modelo
logístico simple los coeficientes significativos, corresponden a las mismas variables, sin embargo el
valor de dicho coeficiente posee una menor magnitud.
Al realizar el modelo sólo con 3 categorías, agrupando las categorías 2 y 3 antes mencionadas como
circuitos con cargas medias y las categorías 4 y 5 como circuitos con buen manejo de carga, se
obtienen los siguientes resultados:
Cuadro 9:
Costa Rica: Resultados de la regresión ordinal con 5 categorías para los datos de perfil de carga de
los circuitos.
Febrero, 2017.
Razón de odds
ratios
Chorotega 1,40 0,00 4,07
Como se logra apreciar los resultados de los coeficientes son semejantes, lo cual aporta evidencia
en favor del principio de colapsabilidad de los coeficientes, indicando que existe lógica en la
agrupación desarrollada y el orden asignado.
El modelo indica que los odds de pertenecer a un circuito clasificado con un mejor manejo de carga
es 4,07 veces mayor en los circuitos de la región Chorotega, en comparación con los de la región
Central, situación similar a los de las regiones, Pacífico Central, Brunca y Huetar Norte, donde dicho
valor es de 3,01.
También se observa que ante un aumento de un punto porcentual en el porcentaje del consumo
del circuito que corresponde a empresas grandes, se observa un aumento de 1% en los odds de
posicionarse en un conglomerado con mejor manejo de carga, esta situación es similar en el caso
de industrias medias, cuyo coeficiente también es significativo y en el cual se observa un aumento
de 3% en los odds de mejorar el perfil de carga, ante un aumento de un punto porcentual en el
porcentaje del consumo del circuito que correspondiente a este grupo de industrias.
Por último, se realizó un modelo multinomial con las 3 características utilizadas en el modelo ordinal
de 3 categorías, a fin de analizar las diferencias entre ambos modelos; los resultados de dicho
modelo fueron:
Cuadro 10:
Costa Rica: Resultados de la regresión nominal con 3 categorías para los datos de perfil de carga de los
circuitos.
Febrero, 2017.
Razón de odds
Conglomerado Variable Coeficiente Significancia
ratios
Intercepto 2,14 0,00
Chorotega -2,38 0,00 0,09
Demás Regiones -1,98 0,00 0,14

Mal manejo de carga con
respecto a buen manejo Empresas grandes -0,02 0,00 0,98
de carga.
Industrias medias -0,05 0,05 0,95
Industrias menores -0,01 0,81 0,99
Chorotega -4,25 0,00 0,01

Carga media con respecto
-0,05 0,00 0,95
a buen manejo de carga. Empresas grandes

Como se logra apreciar, las variables que resultaron significativas son las mismas de las indicadas en
los modelos precedentes, lo cual permite evidenciar la consistencia esperada y por tanto que las
relaciones resultantes se mantienen entre modelos.
Pese a ello, en el modelo multinomial, el coeficiente de Comercios y Servicios mayores resultado

significativo al 10 de significancia y aporta información relevante que no se visualizó en los demás
modelos, este revela una relación negativa, el cual se refleja en los odds ratios, en donde se observa
que ante un aumento de un punto porcentual en el consumo de comercios y servicios mayores, se
observa una disminución de 2% en los odds de pertenecer al conglomerado de carga media, en
comparación a los odds de pertenencia a los conglomerados de buena carga.
Al realizar la prueba de razón de verosimilitud, entre este modelo y el ordinal de 3 categorías se

observa que al 1% de significancia, los modelos son estadísticamente distintos, observando
evidencia en favor de que la verosimilitud del modelo multinomial es mayor.
Al realizar un ejercicio similar pero con un modelo multinomial con las 5 categorías resultantes de
los conglomerados se obtuvieron los siguientes resultados:
Cuadro 11:
Costa Rica: Resultados de la regresión nominal con 5 categorías para los datos de perfil de carga de los
circuitos.
Febrero, 2017.
Razón de odds
Conglomerado Variable Coeficiente Significancia
ratios
Chorotega -2,14 0,01 0,12

Pequeñas con mal manejo Demás Regiones 0,39 0,66 1,47
de carga respecto a
-0,02 0,15 0,98
grandes con buen manejo Empresas grandes
de carga Industrias medias -0,07 0,03 0,93
Chorotega -4,88 0,00 0,01

Grandes con carga media
respecto a grandes con Empresas grandes -0,04 0,01 0,96
buen manejo de carga

-3,81 0,00 0,02
Medianas con carga en Chorotega
punta respecto a grandes Demás Regiones -1,04 0,28 0,35
con buen manejo de carga
Empresas grandes -0,05 0,00 0,95

Intercepto -0,22 0,81
Chorotega 0,33 0,69 1,39

Pequeñas con buen Demás Regiones 2,95 0,00 19,09
manejo de carga respecto
a grandes con buen
manejo de carga Industrias medias -0,04 0,32 0,96

Los resultados observados permiten obtener conclusiones muy reveladoras, pues los niveles más
elevados, en donde se concentran los circuitos con carga media y pequeños con buen manejo de
carga se observan resultados similares a los de los modelos anteriores, lo cual indica que en efecto
la región Central presenta circuitos con peor manejo de carga, que las empresas grandes y las
industrias medias están asociados con circuitos en los cuales se observan buenos perfiles de carga.
El modelo en el cual se comparan los circuitos pequeños con buen manejo de carga respecto a
grandes con buen manejo de carga, se obtiene coeficientes no significativas, lo cual indica que este
conglomerado presenta características de perfiles muy similares entre los perfiles de carga de
ambos grupos, reafirmando que ambos presentan buen manejo de carga.
Del modelo se comparan los circuitos medianos con carga en punta respecto a grandes con buen
manejo de carga, se observa que las empresas grandes e industrias medias no se asocian con este
tipo de perfil, es decir buscan generar un mejor manejo de carga.
Un elemento importante en este análisis es observar como no todos los circuitos de la región Central
presentan malos perfiles de carga, se puede concluir a partir de los coeficientes, que esta región se
asocia con mucha fuerza a circuitos con grandes con carga media y medianos con carga en punta,
es decir estos circuitos casi que se dan de modo exclusivo en la región Central, diferencia que no se
vislumbra de un modo tan marcado en los circuitos con buen manejo de carga. Al respecto se
observa como ante un aumento de un punto porcentual en el consumo de industrias menores, se
observa una disminución de 75% en los odds de pertenecer al conglomerado de carga media, en
comparación a los odds de pertenencia a los conglomerados de buena carga
Por último, llama la atención como los circuitos de carga media, además de ser un fenómeno
suscitado en mayor media en la región Central también se asocian en mayor medida con las
industrias y empresas, es decir parece que las cargas medias son generadas en mayor medida por
residencias y comercios y servicios menores.
Al realizar la prueba de razón de verosimilitud, entre este modelo y el ordinal de 5 categorías se

observa que al 1% de significancia, los modelos son estadísticamente distintos, observando
evidencia en favor de que la verosimilitud del modelo multinomial es mayor.
Expuestos todos los modelos, se observa que cada uno ofrece características distintas, con el
objetivo de realizar una comparación más amplia, se revisan un conjunto de indicadores generales
de cada modelo.
Cuadro 12:
Costa Rica: Resultados generales de los modelos logísticos desarrollados.
Febrero, 2017.
Estadístico Logística simple Ordinal 3 Multinomial 3 Ordinal 5 Multinomial 5
Pseudo R2 0,26 0,06 0,25 0,04 0,27
Log Verosimilitud -118,97 -269,74 -227,96 -367,17 -302,84
P value de la prueba de
0,64
Hosmer y Lemeshow
Porcentaje de predicción 0,76 0,46 0,57 0,33 0,41
Como se logra observar del cuadro anterior los modelos de regresión obtienen resultados bastantes
positivos para la clasificación de los circuitos en diferentes conglomerados.
El modelo que presenta el ajuste más bajo es el modelo ordinal, dando evidencia en favor de que
no existe una escala ordinal entre los diferentes conglomerados, es decir, no se puede determinar
con contundencia que los conglomerados llevan una escala lógica, pues como se indicó en el
desarrollo de los conglomerados estos poseen una composición que no necesariamente va en una
misma dirección para todas las variables. Por ejemplo, el tamaño del circuito no se asocia
directamente con un perfil de carga.
De este modo, para la clasificación de tres o cinco conglomerados se prefiere la utilización de un

modelo multinomial, para la verificación de lo anterior se realizó una prueba de razón de
verosimiltud, en la cual se rechaza la igualdad de los modelos observando así que el modelo
multinomial presenta mejores resultados que el modelo ordinal.
Además, se logra observar como los modelos predicen mejor las 3 categorías, que las 5, lo cual es
de esperar pues entre más categorías existan, la predicción se torna más complicada, sin embargo
si el modelo presenta un muy buen ajuste y capacidad predictiva, podría hacerlo, pero lo que se
observa en los datos es que el modelo no logra clasificar de un buen modo en especial a los primeros
grupos, pues las variables explicativas no logran asociarse con mucha fuerza a estas categorías.
Lo anterior se debe a qué la información no es tan específica, y por tanto las primeras categorías se
asocian a circuitos más típicos, en los cuales no existe la predominancia de un grupo tarifario
específico y entre tanta heterogeneidad, no se logra determinar quiénes son los agentes que más
se están asociando a ciertos patrones de consumo, si no que los que se obtiene son circuitos de
composición estándar que se asemejan en mayor medida a la curva de carga típica del país.
De este modo se logra determinar que existe un grupo que sí es más homogéneo y que posee un
perfil de carga que se asocia a circuitos en los cuales predomina cierta composición de la demanda,
y que se asocian en mayor medida a ciertas regiones socioeconómicas.
Es por ello que la regresión logística simple permitió un mejor ajuste, pues la gran mayoría de los
circuitos se asocian con malos perfiles de carga, pero lo que mostraban mejores perfiles de carga,
eran circuitos cuya composición era en mayor medida de empresas grandes e industrias medias, lo
cual permitió generar una asociación mucho más clara.
Lo anterior se logra evidenciar en el hecho de que posee el menor logaritmo de verosimilitud, uno
de los mayores pseudo R2, el mayor porcentaje de clasificación, además de que no se logra rechazar
la prueba de hipótesis de Hosmer y Lemeshow de que el modelo presenta un buen ajuste al 5% de
significancia.
Gráfico 5
Costa Rica: Comportamiento de los residuos del modelo logístico simple.
Con respecto al comportamiento de los residuos de este modelo, se observa que presentan un
comportamiento normal.
Gráfico 6
Costa Rica: Detección de valores extremos en el modelo logístico simple.
En el modelo se observa que existen cerca de 4 valores extremos, los cuales se mantuvieron en el
análisis pues constituían información de circuitos importantes.
Gráfico 7
Costa Rica: Comportamiento de la especificidad y sensibilidad del modelo logístico simple.
Con respecto a la especificidad y sensibilidad, se logra observar que el modelo logra predecir con
gran facilidad los ceros, pues los 1 se asocian en gran medida a circuitos más particulares, sin
embargo, se observa que existen ciertos circuitos que presentaron buenos perfiles de carga, que el
modelo no los logró clasificar de dicho modo y que por tanto se requiere ahondar en las razones
que explican su adecuado perfil de carga.
CONCLUSIONES Y DISCUSIÓN.
Del trabajo realizado se logra concluir que las variables de factor de carga, coeficiente de variación
del consumo, razón de consumo promedio en el periodo punta, valle y noche, así como el porcentaje
que representa el consumo del circuito con respecto al total general, son un conjunto de variables
que permiten tipificar de un modo adecuado el perfil de carga de los circuitos eléctricos del país.
Al emplear estas variables en un análisis de conglomerados, se obtienen 5 grupos según las

características del consumo: las que tienen buen manejo de carga, los circuitos grandes con carga
media, los circuitos medianos pero que cargan principalmente en el periodo punta, los circuitos
pequeños con buen manejo de carga y los pequeños con mal manejo de carga. Gracias a este análisis
se concluye que es posible determinar agentes que contribuyen de modo positivo y negativo en el
manejo de carga, lo cual demuestra la necesidad de analizar la estructura tarifaria actual.
Al relacionar los conglomerados con los grupos tarifarios actuales se observó una importante
variabilidad de perfiles de carga para las tarifas de macro empresas, empresas grandes, industrias
medias, comercios y servicios mayores e industrias medias. Lo anterior plantea que existen agentes
con manejos de carga distintos en un mismo grupo tarifario, con lo cual es importante analizar con
mayor profundidad la clasificación actual, a fin de determinar si es necesario una mayor
desagregación de dichos grupos a fin de generar tarifas para clientes con características
socioeconómicas y de consumo más homogéneas.
Esta situación se reafirma en el hecho de que existen grupos tarifarios que no logran agruparse de
modo adecuado en algún perfil de carga específico, de modo que existen industrias pequeñas y
comercios y servicios mayores que por su heterogeneidad contempla agentes disímiles que reciben
las mismas señales tarifarias.
Un caso claramente identificado en el trabajo es el caso de las industrias, los comercios y servicios,
quienes a nivel tarifario se tienen la misma tarifa, pero como se evidenció en el trabajo el perfil de
carga de las industrias medias es bueno, y el de las industrias menores se aleja del perfil de carga
medio donde se ubican el grueso de los comercios y servicios, es decir se tienen en un mismo nivel
tarifario que poseen un manejo de carga muy diferente y que por tanto deberían recibir señales
diferenciadas.
Esta situación sí se observa en las empresas grandes, quienes tienen tarifas diferenciadas por
periodo horario, lo que constituye un incentivo a movilizar su patrón de carga y manejar un patrón
de carga adecuado a fin de beneficiarse en la facturación. Según lo observado en el trabajo, en
efecto este estímulo ha funcionado, y por tanto podría transmitirse a otros agentes como por
ejemplo las industrias medias quienes sin recibir ese estímulo han logrado manejar buenos niveles
de carga. Además, podría emplearse en Comercios y Servicios mayores e industrias menores, a fin
de motivar en ellos el mejor manejo de carga, considerando que son usuarios con un consumo que
podría adaptarse con mayor facilidad.
El sistema tarifario actual no contempla estas diferencias en el cargo por potencia, con lo cual existe
una oportunidad de mejora, que podría generar efectos positivos en el manejo de la potencia, como
al parecer está generando las tarifas horarias para macro empresas y empresas grandes.
Se observa que con el modelo logístico simple se pueden clasificar los distintos perfiles de consumo,
sin embargo la modelación multinomial, permitió a nivel interpretativo y de significancia en los
coeficientes, comprender con mayor claridad las diferencias entre las regiones del país y entre los
grupos tarifarios.
A su vez existen importantes diferencias en la composición de circuitos por perfil de consumo para
cada una de las regiones socioeconómicas, de modo que se observa que la región Central se asocia
con peores manejos de carga, pero específicamente con cargas medias y cargas en el segmento en
punta, asociado en importante medida a las residencias, comercios y servicios.
De este modo, como conclusión general, el presente trabajo permitió comprender que la estructura
tarifaria en Costa Rica requiere de mayor análisis e investigación, es un tema con un gran potencial,
y los resultados de este trabajo abren inquietudes que deben de analizarse de un modo más
profundo, pues muestran que hay espacios de mejora que deben analizarse de un modo serio en
pro de una estructura tarifaria adecuada a las condiciones actuales.
Bibliografía
ARESEP. (2015). Metodología tarifaria ordinaria para el servicio de distribución de energía eléctrica
brindado por operadores públicos y cooperativas de electrificación rural. San José, Costa
Rica: Diario Oficial La Gaceta.
Asamblea Legislativa de Costa Rica. (2008). Ley de la Autoridad Reguladora de los Servicios
Públicos. San José, Costa Rica: Asamblea Legislativa.
Comisión de Tarifas Eléctricas de Perú. (1998). Situación Tarifaria en el sector eléctrico peruano.
Lima, Perú: CTE.
Facchini et al. (2017). Modelo para el cálculo de tarifas de empresas eléctricas de distribución
considerando aspectos económicos-financieros. Mendoza, Argentina: Universidad Nacional
de Cuyo.
Fowler, R. J. (1992). Electricidad: principios y aplicaciones. París, Francia: Reverte.
MINAE. (2015). Plan Nacional de Energía 2015-2030. San José, Costa Rica: Ministerio de Ambiente
y Energía MINAE ; Programa de las Naciones Unidas para el Desarrollo PNUD.
Srouga, A. (2000). El Proceso de Cálculo de los Cuadros Tarifarios de Empresas Distribuidoras de

Electricidad. Buenos Aires, Argentina: CIER.
Unidad de Planeación Minero Energética. (2004). Análisis comparativo internacional de precios de

electricidad en el sector industrial. Bogotá, Colombia: Ministerio de Energías y Minas de
Colombia.
Anexo: Programa en R:
rm(list=ls())
library(epitools)
library(pROC)
library(ResourceSelection)
library(car)
library(foreign)
library(zoo)
library(splines)
library(stats4)
library(VGAM)
library(ordinal)
library(ggplot2)
library(JGR)
library(rJava)
library(JavaGD)
library(iplots)
library(Deducer)
library(epitools)
setwd("C:/Users/quesadara/Dropbox/Allan/Estudio/UCR/2017/I semestre/Análisis Categórico/Trabajo")

load("BD_CIRCUITOS.Rdata")
attach(bd_circuitos)
bd_circuitos$cat1=0
bd_circuitos$cat1=replace(bd_circuitos$cat1,bd_circuitos$cluster>3,1)
bd_circuitos$cat2=2
bd_circuitos$cat2=replace(bd_circuitos$cat2,bd_circuitos$cluster==1,1)
bd_circuitos$cat2=replace(bd_circuitos$cat2,bd_circuitos$cluster>3,3)
################========================== MODELO INICIAL LOGÍSTICO================================

mod.log<-glm(cat1~cho+demas+èmpresas grandes`+ìndustrias medias`+ìndustrias menores`+`comercios y servicios
mayores`,family=binomial(link=logit))
summary(mod.log)
#### RESULTADOS GENERALES#####
###Pseudo-R2
logLik(mod.log)
mod.nulo<-glm(cat1~1,family=binomial(link=logit))
logLik(mod.nulo)
(logLik(mod.nulo)-logLik(mod.log))/logLik(mod.nulo)
## Bondad de ajuste
hlt=hoslem.test(cat1,mod.log$fitted,g=3)
hlt
###gráfico de los residuos de deviancia vs. los predichos
plot(mod.log$fitted,mod.log$residuals)
title("Predichos vs. residuos de deviancia")
#vif
vif(mod.log)
###No se analiza la heteroscedasticidad porque el model logístico es inherentmente heteroscedástico
###Valores influyentes###
###Leverage###
lev.mod.log=hatvalues(mod.log)
###DFFIT
dffit.mod.log=dffits(mod.log)
###D de Cook
cook.mod.log=cooks.distance(mod.log)
###DFBETAs
dfbeta.mod.log=dfbeta(mod.log)
summary(cbind(lev.mod.log,dffit.mod.log,cook.mod.log))
summary(dfbeta.mod.log)
###Definir los límites para considerar como valor extremo
##Para leverage
lim.lev=2*length(mod.log$coef)/length(lev.mod.log)
plot(mod.log$fitted,lev.mod.log)
abline(h=lim.lev, col=5)
title("Leverage por valores predichos")
summary(bd_circuitos)[4,]
clasif<-recode(mod.log$fitted,"0:0.5=0;0.5:1=1")
tab.clas<-table(clasif,bd_circuitos$cat1)/length(bd_circuitos$cat1)
tab.clas
sum(diag(tab.clas))
################========================== MODELO ORDINAL 3
CATEGORÍAS===============================
###Pruebas de hip?tesis bivariadas

#Pruebas de Pearson para ver si hay asociaciÃ³n
#H0: HipÃ³tesis nula de independencia.
chisq.test(table(cat2,cho))
chisq.test(table(cat2,demas))
#Cambiar el orden para probar el supuesto de irrelevancia del orden.

cat2_2=recode(cat2, "1=3;2=2;3=1")
###Con vglm del paquete VGAM
###Modelo de odds proporcionales acumulativo
mod.ord=vglm(cat2~cho+ demas +èmpresas grandes`+ ìndustrias medias`+ ìndustrias menores`+ `comercios y servicios
mayores`, family=propodds) #family=propodds para acumular
summary(mod.ord)
###Pseudo-R2
logLik(mod.ord)
mod.nulo<-vglm(cat2~1, family=propodds)
logLik(mod.nulo)
(logLik(mod.nulo)-logLik(mod.ord))/logLik(mod.nulo)
p1_cat2=fitted(mod.ord)[,1]
bd_circuitos$escog_cat2=1
bd_circuitos$escog_cat2=replace(bd_circuitos$escog_cat2, p2_cat2> p1_cat2& p2_cat2> p3_cat2,2)
bd_circuitos$escog_cat2=replace(bd_circuitos$escog_cat2, p3_cat2> p1_cat2& p3_cat2> p2_cat2,3)
bd_circuitos$igu_cat2=( bd_circuitos$cat2== bd_circuitos$escog_cat2)
porc_clasi=mean(bd_circuitos$igu_cat2)
porc_clasi
###Viendo la irrelevancia de la codificaci?n
mod2=vglm(cat2_2~cho+ demas +èmpresas grandes`+ ìndustrias medias`+ ìndustrias menores`+ `comercios y servicios
mayores`, family=propodds)
cbind(coef(mod.ord),coef(mod2))
##Analizando el supuesto de odds proporcionales
mod.ord.nopar=vglm(cat2~cho+ demas +èmpresas grandes`+ ìndustrias medias`+ ìndustrias menores`+ `comercios y

servicios mayores`, family=cumulative(parallel=FALSE, reverse=TRUE))
# El parallel=FALSE es para que estime ecuaciones por aparte.
lrtest(mod.ord,mod.ord.nopar)
#no hay suficiente evidencia estadÃ?stica para rechazar la hipÃ³tesis de odds proporcionales.
#Es decir que el odds de pasar de una categorÃ?a a otra de y es semejante.
summary(mod.ord.nopar)
################========================== MODELO MULTINOMINAL===============================
mod.multinom=vglm(cat2~cho+ demas +èmpresas grandes`+ ìndustrias medias`+ ìndustrias menores`+ `comercios y

servicios mayores`, family="multinomial")
summary(mod.multinom)
exp(coef(mod.multinom))
###Pseudo-R2
logLik(mod.multinom)
mod.nulo<-vglm(cat2~1, family="multinomial")
logLik(mod.nulo)
(logLik(mod.nulo)-logLik(mod.multinom))/logLik(mod.multinom)
p1_cat2=fitted(mod.multinom)[,1]
bd_circuitos$escog_mcat2=1
bd_circuitos$escog_mcat2=replace(bd_circuitos$escog_mcat2, p2_cat2> p1_cat2& p2_cat2> p3_cat2,2)
bd_circuitos$escog_mcat2=replace(bd_circuitos$escog_mcat2, p3_cat2> p1_cat2& p3_cat2> p2_cat2,3)
bd_circuitos$igu_mcat2=( bd_circuitos$cat2== bd_circuitos$escog_mcat2)
porc_clasi=mean(bd_circuitos$igu_mcat2)
porc_clasi
lrtest(mod.ord,mod.multinom)
################========================== MODELO ORDINAL 5

CATEGORÍAS===============================
###Pruebas de hip?tesis bivariadas

#Pruebas de Pearson para ver si hay asociaciÃ³n
#H0: HipÃ³tesis nula de independencia.
chisq.test(table(cluster,cho))
chisq.test(table(cluster,demas))
###Con vglm del paquete VGAM
###Modelo de odds proporcionales acumulativo
mod.ord5=vglm(cluster~cho+ demas +èmpresas grandes`+ ìndustrias medias`+ ìndustrias menores`+ `comercios y

servicios mayores`, family=propodds) #family=propodds para acumular
summary(mod.ord5)
###Pseudo-R2
logLik(mod.ord5)
mod.nulo<-vglm(cluster~1, family=propodds)
logLik(mod.nulo)
(logLik(mod.nulo)-logLik(mod.ord5))/logLik(mod.nulo)
p1_cluster=fitted(mod.ord5)[,1]
bd_circuitos$escog_cluster=1
bd_circuitos$escog_cluster=replace(bd_circuitos$escog_cluster, p2_cluster> p1_cluster& p2_cluster> p3_cluster,2)
bd_circuitos$escog_cluster=replace(bd_circuitos$escog_cluster, p3_cluster> p1_cluster& p3_cluster> p2_cluster,3)
bd_circuitos$igu_cluster=( bd_circuitos$cluster== bd_circuitos$escog_cluster)
porc_clasi=mean(bd_circuitos$igu_cluster)
porc_clasi
##Analizando el supuesto de odds proporcionales

mod.ord5.nopar=vglm(cluster~cho+ demas +èmpresas grandes`+ ìndustrias medias`+ ìndustrias menores`+ `comercios
y servicios mayores`, family=cumulative(parallel=FALSE, reverse=TRUE))
# El parallel=FALSE es para que estime ecuaciones por aparte.
lrtest(mod.ord5,mod.ord5.nopar)
#no hay suficiente evidencia estadÃ?stica para rechazar la hipÃ³tesis de odds proporcionales.
#Es decir que el odds de pasar de una categorÃ?a a otra de y es semejante.
summary(mod.ord5.nopar)
################======================== MODELO MULTINOMINAL 5 Categorías==========================
mod.multinom5=vglm(cluster~cho+ demas +èmpresas grandes`+ ìndustrias medias`+ ìndustrias menores`+ `comercios

y servicios mayores`, family="multinomial")
summary(mod.multinom5)
exp(coef(mod.multinom5))
###Pseudo-R2
logLik(mod.multinom5)
mod.nulo<-vglm(cluster~1, family="multinomial")
logLik(mod.nulo)
(logLik(mod.nulo)-logLik(mod.multinom5))/logLik(mod.multinom5)
p1_cluster=fitted(mod.multinom5)[,1]
bd_circuitos$escog_mcluster=1
bd_circuitos$escog_mcluster=replace(bd_circuitos$escog_mcluster, p2_cluster> p1_cluster& p2_cluster> p3_cluster,2)
bd_circuitos$escog_mcluster=replace(bd_circuitos$escog_mcluster, p3_cluster> p1_cluster& p3_cluster> p2_cluster,3)
bd_circuitos$igu_mcluster=( bd_circuitos$cluster== bd_circuitos$escog_mcluster)
porc_clasi=mean(bd_circuitos$igu_mcluster)
porc_clasi
lrtest(mod.ord5,mod.multinom5)

Utilización de Modelos Categóricos para Perfiles de Carga Eléctricos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Utilización de Modelos Categóricos para Perfiles de Carga Eléctricos

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE COSTA RICA

CENTRO DE ESTUDIOS DE POSGRADOS

Utilización de modelos de análisis categórico para la

Profesor: M.Sc. Gilbert Brenes

SP-1629 Análisis de datos categóricos

OBJETIVOS DEL TRABAJO:

• Desarrollar un conjunto de modelos categóricos que permitan asociar las características

TEORÍA SOBRE LAS FIJACIONES TARIFARIAS.

Fuente: Elaboración propia con datos de ARESEP

La generación eléctrica se ve influenciada por la demanda de un modo significativo, pues se requiere

Lo anterior ha fomentado el desarrollo de plantas eléctricas cuyo factor de utilización no es muy

Fuente: Elaboración propia con datos de ARESEP

La determinación de la tarifa por potencia obedece a la problemática antes mencionada, es decir a

Fuente: Elaboración propia con datos de ARESEP

Gracias a la resolución de la ARESEP RIE-089-2016, las empresas distribuidoras deben suministrar

Es la razón entre el promedio de Permite determinar que tan diferente es el

Es la razón entre el promedio de Permite determinar que tan diferente es el

Es la razón entre el promedio de Permite determinar que tan diferente es el

Factor de Carga 100% 16% 55% 0,14pp

Razón de Carga en Punta 1,57 0,60 1,20 0,13

Razón de Carga en Valle 1,31 0,87 1,08 0,07

Razón de Carga en Noche 1,12 0,60 0,82 0,09

Porcentaje del consumo total 1,62% 0,00% 0,38% 0,35pp

Coeficiente de variación 0,46 - 0,27 0,08

Fuente: Elaboración propia con datos de ARESEP.

Una vez conformados los distintos conglomerados, se procedieron a realizar un conjunto de

En dichos modelos también se incorporó variables dicotómicas regionales con el objetivo de

A continuación, se exponen las estadísticas descriptivas de la composición de consumo por grupo

Comercios y Servicios mayores 17.53 17.64 0 100.00

Comercios y Servicios menores 15.88 10.44 0 77.69

Empresas grandes 16.58 23.73 0 100.00

Industrias medias 3.84 8.29 0 96.34

Industrias menores 1.01 2.84 0 33.46

Macro empresas 1.15 8.52 0 99.70

Residencias 44.01 25.51 0 100.00

Fuente: Elaboración propia con datos de ARESEP.

Central 149 57.09

Fuente: Elaboración propia con datos de ARESEP.

Para la construcción de la regresión logística se utiliza como variable dependiente el conglomerado

Razón de Carga en Punta 1,25 1,23 1,09 1,26 1,08

Razón de Carga en Valle 1,1 1,1 1,06 1,11 1,04

Razón de Carga en Noche 0,78 0,79 0,9 0,77 0,92

Porcentaje del consumo total 0,14% 1,07% 0,74% 0,50% 0,15%

Coeficiente de variación 0,3 0,29 0,18 0,31 0,21

Fuente: Elaboración propia con datos de ARESEP.

Pequeñas con mala

Grandes con carga

Buen manejo de carga 16 6%

Medianas con carga en

Pequeñas con buen

Total 261 100%

Fuente: Elaboración propia

En primera instancia se desarrolló un modelo logístico simple, se dividieron los conglomerados en

1. Pequeñas con mala carga.

Los resultados obtenidos para dicho modelo son:

Chorotega -2,38 0,00 0,09

Demás Regiones -1,98 0,00 0,14

Industrias menores -0,01 0,81 0,99

Comercios y Servicios mayores 0,00 0,79 1,00

Intercepto 3,28 0,00

Chorotega -4,25 0,00 0,01

Demás Regiones -3,94 0,00 0,02

Industrias menores -0,13 0,42 0,88