Está en la página 1de 4

Exploración Estadı́stica de los Datos Generados por

Sistemas de Energı́a Solar Fotovoltaica

1st Ivan Santiago Luna Lasso 2nd Given Name Surname 3rd Given Name Surname
dept. name of organization (of Aff.) dept. name of organization (of Aff.) dept. name of organization (of Aff.)
name of organization (of Aff.) name of organization (of Aff.) name of organization (of Aff.)
City, Country City, Country City, Country
email address or ORCID email address or ORCID email address or ORCID

4th Given Name Surname 5th Given Name Surname 6th Given Name Surname
dept. name of organization (of Aff.) dept. name of organization (of Aff.) dept. name of organization (of Aff.)
name of organization (of Aff.) name of organization (of Aff.) name of organization (of Aff.)
City, Country City, Country City, Country
email address or ORCID email address or ORCID email address or ORCID

Abstract—El presente informe presenta el estudio y análisis III. P ROCEDIMIENTO


para una base de datos relacionada con la generación de energı́a
por medio de células fotovoltaicas, el objetivo de este análisis es
construir la relación entre la variable de humedad relativa del
aire y su relación con la producción de energı́a eléctrica a partir El análisis implica la exportación del archivo .csv[1] o
de sistemas fotovoltaicos, en este análisis se realizan diferentes de la base de datos, con la separación de las columnas
cálculos estadı́sticos utilizando la librerı́a Pandas por medio
correspondientes a humedad relativa del aire y la Producción
de Notebooks de Python, con los cuales se pueden establecer
predicciones con respecto a la tendencia, se determinan también del sistema. La base de datos consta de 8760 datos, cuyo
estimadores como la correlación de Pearson, media, varianza y comportamiento se evidencia en las representaciones gráficas
desviación estándar. presentadas en la Figura 1 y la Figura 2.”
Index Terms—Media muestral, correlación, varianza, base de
datos, desviación estándar, estadı́stica.

I. I NTRODUCCION

Para realizar el análisis estadı́stico se cuenta con una base


de datos con diferentes variables climáticas y de producción,
de las cuales se toman las variables de humedad relativa y de
producción, los datos fueron tomados durante el año 2017 con
un periodo de muestreo de 1 hora[1], estos datos se agruparon
en tablas para realizar su análisis, observar su comportamiento,
comparar las variables y establecer conclusiones con base a la
información observada.

II. OBJETIVOS

1) Calcular estimadores estadı́sticos básicos.


2) Analizar la base de datos y realizar el estudio de la
tendencia de las variables con la finalidad de predecir Fig. 1. Sistemas De Producción
un comportamiento en el futuro.
3) Calcular estimadores estadı́sticos básicos.
En la figura 1 se puede observar el comportamiento de
Sistemas De Producción en el tiempo, hora a hora en un año.
promedio entre las muestras o datos y la media. Este valor se
obtiene a través de la siguiente fórmula:

Fig. 5. Desviación Estándar

Para realizar este cálculo se empleó el siguiente código con


Pandas por medio de Python.

Fig. 2. Humedad Relativa Del Aire

En la Figura 2, se aprecia cómo varı́a la humedad relativa


del aire a lo largo del tiempo, analizando cada hora durante un
año. Después de examinar el comportamiento de las variables,
se procede al cálculo del primer estimador, la media muestral.
Este valor representa el promedio de los datos y constituye el
punto con la mayor concentración de probabilidad. También Fig. 6. Desviación Estándar .
se denomina primer momento estadı́stico, y su expresión es la
siguiente: Después de obtener la desviación estándar, se procede al
cálculo de otro indicador estadı́stico llamado varianza. Este
último se puede determinar utilizando el valor de la desviación
estándar mediante la siguiente expresión:

Fig. 3. Media Muestral


Fig. 7. Varianza
Para realizar este cálculo se empleó el siguiente código con
Pandas por medio de Python en overleaf.

Fig. 4. Desviación Estándar Fig. 8. Varianza De Humedad Relativa Del Aire Y Sistema De Producción

Después, se realiza el cálculo de la desviación estándar, que Se realiza el mismo procedimiento para la “muestra grande”
es un indicador que nos brinda información sobre la distancia como se observa en la siguiente figura:
Fig. 9. Muestra grande Del Sistema de producción y humedad relativa

Fig. 12. Gráfica De Dispersión De Humedad Relativa Del Aire vs Sistema


De Producción
Observando las figuras 6 y 4, se presentan los valores de la
media de las muestras extraı́das de la base de datos. En este
análisis, se destaca que se evidencia una disparidad entre la
media de la muestra pequeña y la muestra grande. Este patrón Correlación cercana a -0.54: Aunque no es una correlación
también es evidente al examinar la desviación estándar donde muy fuerte, aún indica una tendencia negativa moderada. En
ocurre igual diferencia de datos. este caso, podrı́as decir que hay una asociación, pero no es
tan fuerte como cuando la correlación es más cercana a -
1. Relación inversa moderada: La magnitud del valor (-0.54)
sugiere que hay una asociación moderada entre la humedad
relativa del aire y el sistema de producción. En este caso,
podrı́a significar que, en general, a medida que la humedad
relativa del aire aumenta, el sistema de producción tiende a
disminuir, y viceversa.
Impacto moderado: La magnitud de la correlación (-0.54)
indica que la relación no es extremadamente fuerte, pero aún
Fig. 10. Coeficiente De Correlacion De Pearson ası́ sugiere una tendencia en la dirección opuesta. Es decir,
cambios en la humedad relativa del aire podrı́an tener un
impacto moderado en el sistema de producción.

Una vez calculados los estimadores se procede a realizar


el análisis correlación de las variables por medio de la cor-
relación de Pearson, este coeficiente permite medir la relación
entre 2 variables

Fig. 11. Coeficiente De Correlación De Pearson De La Humedad Relativa


Del Aire Y El Sistema De Producción Fig. 13. Histogramas Sistema De Producción

A continuación se expresa la dispersión de datos de la


humedad relativa del aire y el sistema de producción.
los “Outlayers” no generaron cambios significativos en
cuanto a la varianza y a la media.
R EFERENCES
[1] https://www.kaggle.com/datasets/pythonafroz/solar-powe-generation-
data

Fig. 14. Histogramas Sistema De Humedad Relativa Del Aire

IV. C ONCLUSIONES

• Desviación estándar de la humedad relativa del aire


(19.27):Una desviación estándar más alta indica que los
valores de humedad relativa del aire están más dispersos
alrededor de la media. Si la media de la humedad
relativa del aire es, por ejemplo, 50%, una desviación
estándar de 19.27 sugiere que muchos de los valores
individuales estarán en el rango de 30.73% a 69.27%
aproximadamente.
• Desviación estándar del sistema de producción
(1487.45):Una desviación estándar más alta indica
que los valores del sistema de producción están más
dispersos alrededor de la media. Si la media del sistema
de producción es, por ejemplo, 1500, una desviación
estándar de 1487.45 sugiere que muchos de los valores
individuales estarán en el rango de 12.55 a 2987.45
aproximadamente.
• Una correlación de Pearson de -0.54 entre dos variables
indica una relación negativa moderada entre ellas. Aquı́
hay algunas interpretaciones comunes para valores de
correlación de Pearson:
Correlación cercana a -1: Existe una relación negativa
fuerte. Esto significa que a medida que una variable
aumenta, la otra tiende a disminuir de manera constante,
y viceversa.
Correlación cercana a -0.54: Aunque no es una cor-
relación muy fuerte, aún indica una tendencia negativa
moderada. En este caso, podrı́as decir que hay una aso-
ciación, pero no es tan fuerte como cuando la correlación
es más cercana a -1.
• La relación negativa sugiere que, en promedio, cuando
una variable aumenta, la otra tiende a disminuir. Sin
embargo, ten en cuenta que la correlación de Pearson solo
mide una relación lineal, por lo que no captura patrones
más complejos.
• Es importante resaltar que la base de datos utilizada en el
análisis corresponde a una muestra con una cantidad de
datos suficientemente amplia como para determinar que

También podría gustarte