Está en la página 1de 20

Diplomatura en Ciencia de Datos, Aprendizaje Automático y sus Aplicaciones

Facultad de Matemática, Astronomía, Física y Computación – Universidad Nacional de Córdoba

M07 MENTORIAS 2023

Cambio climático y ML:


cómo mitigar las emisiones de CO2
mediante la reducción del consumo energético
en construcciones edilicias
EL EQUIPO

Mentora Alumna:
Dra. Tamara Natalia Lamia
Ing. Química
Dra.Maggione
en Biología Esp. en Ing. Ambiental
OBJETIVOS
● Intentar mitigar los efectos del cambio climático
mediante el análisis de la eficiencia energética en la
construcción de edificios.

● Determinar qué variables son más influyentes en la DESAFIOS


● Usar herramientas de ML y
eficiencia energética de los edificios ciencia de datos para la
mitigación del cambio
● Predecir el consumo energético de las edificaciones climático
utilizando un set de datos que contempla algunas
● Emplear y/o construir
características edilicias y meteorológicas
modelos para predecir el
consumo energético de
edificios
BASE DE DATOS

VARIABLE Caracterís- Variables


A predecir ticas de los climáticas o
Intensidad de uso edificios meteorológica
de energía
s

Dataset de 75.757 filas y 36 columnas


Edificios ubicados en la costa NE de EEUU
(mayormente Nueva York).
ANÁLISIS DE VARIABLES

30 variables meteorológicas:
Intensidad de uso de - 3 Referidas al vientos
1. Función del edificio
- 4 Sobre precipitaciones,
energía 2. Superficie total
neblina y nieve
Mide la energía total consumida 3. Año de construcción - 12 sobre Temperaturas
en un año por unidad de 4. Elevación promedios, máximas y
5. Índice de eficiencia energética mínimas
superficie bruta total del edificio
- 11 de cuántos días hay con
Estima su performance energética. ciertas temperaturas
ANÁLISIS Y VISUALIZACIÓN DE DATOS
DATOS FALTANTES

ANÁLISIS Y
CURACIÓN DE
DATOS
Datos Generados
Datos 1 Datos 2

Incluir Quitar
DataCenter DataCenter

Dejamos columnas con


Dejamos columnas con muchos muchos valores Faltantes
valores Faltantes (Imputamos) (Imputamos)

Quitamos valores extremos Quitamos valores extremos


METODOLOGÍA DE TRABAJO

1 Separación Variable a predecir 4 Imputación de valores faltantes

2 División en training, test y validación. 5 Escalar variables

Transformación de variables
3 categóricas a numericas.
6 Pasemos a la acción
MODELOS DE APRENDIZAJE SUPERVISADO

Regresión de Impulso de
1 Regresión Lineal
4 Gradiente (Gradient Boosting)

Regresión de Máquina de Regresión de K-Vecinos Más


2 Vectores de Soporte (SVM) 5 Cercanos (K-Nearest Neighbors)

Regresión de Bosque METRICAS


3 Aleatorio (Random Forest)
• Error Medio Absoluto
• Error medio
cuadrático
MODELOS DE APRENDIZAJE SUPERVISADO

COMPARACION MAE DATOS 1 DATOS 2


Regresión Lineal 24 21

Regresión de Máquina de Vectores de Soporte (SVM)


23 19,5

Regresión de Bosque Aleatorio (Random Forest)


20 17

Regresión de Impulso de Gradiente (Gradient Boosting) 22 18,6

Regresión de K-Vecinos Más Cercanos (K-Nearest Neighbors) 22,6 19


Comparación entre Modelos
Datos 1 Datos 2
OPTIMIZACION DE
Mejor algorítmo
MODELO
RandomizedSearchCV y GridSearchCV

1. Regresión de
Impulso de Gradiente Validación Búsqueda
Hiperparámetros
(Gradient Boosting) cruzada Aleatoria
Modelo GradientBoostingRegressor:

Regresor de Reforzamiento de Gradiente

Datos 1 Datos 2
MODELOS DE APRENDIZAJE SELECCIONADOS

Rendimiento del modelo en el conjunto de datos de prueba MAE:

MODELO DATOS 1 DATOS 2


Regresor de Reforzamiento de Gradiente (Gradient MAE=18,6 MAE=15,4
BoostingRegressor) Tiempo: 5 min 3 s Tiempo: 7 min 6 s
Distribución de Predicciones vs. Valores Reales
Datos 1 Datos 2
Histograma de Residuos
Datos 1 Datos 2
Variables de Importancia
Datos 1 Datos 2
CONCLUSIONES
Predecir la variable objetivo Intensidad de uso de energía de un Edificio

El conjunto de datos 2, major performance de predicción de la variable objetivo.

El algoritmo que predice con menor error absoluto es el Regresor de


Reforzamiento de Gradiente (Gradient BoostingRegressor)

Para mejorar la performance del modelo se empleo un ajuste por hiperparámetros,


búsqueda aleatoria y validación cruzada.
Limitaciones en cuanto a la capacidad y tiempo de procesamiento
¡Muchas gracias!

También podría gustarte