Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Plantilla Sustentacion Azul
Plantilla Sustentacion Azul
Director
VANESSA PAOLA BLANCO VILLAFAÑE
Ingeniera de Sistemas
Msc. Ingeniería de Sistemas y Computación
AGENDA
1 INTRODUCCIÓN
4 METODOLOGÍA
6 CONCLUSIONES
INTRODUCCIÓN
PROBLEMATICA
Información desorganizada
• Construir un conjunto de datos de las variables meteorológicas y del Índice de Calidad del Aire de
acuerdo con los datos suministrados por la Corporación Autónoma Regional del Cesar -
CORPOCESAR.
• Crear un modelo descriptivo de minería de datos para analizar el comportamiento del índice de
calidad del aire en la zona carbonífera del departamento del Cesar.
• Encontrar predictores para el análisis del comportamiento del índice de calidad del aire en la
OBJETIVOS zona carbonífera del departamento del Cesar, basados en la aplicación de una técnica de minería
ESPECIFICOS de datos.
• Generar un informe de resultados para la divulgación de los hallazgos encontrados de las
técnicas de minería de datos aplicadas en el análisis del comportamiento del índice de calidad
del aire.
METODOLOGÍA CRISP-DM
Entendimiento Comprensión
del Negocio de los datos
Preparación
de los datos Modelado
Evaluación Implementación
FASE I: ENTENDIMIENTO DEL NEGOCIO
Presión Atmosférica
FASE IV: MODELADO
Clustering por K-
Descriptivo Means
Modelado
Regresión lineal
Predictivo
Redes
neuronales
artificiales
CONSTRUCCIÓN MODELO DESCRIPTIVO
Método del codo para el conjunto de datos Método del codo para el conjunto de datos
con la variable ICAPM10 con la variable ICAPM2.5
CONSTRUCCIÓN MODELO DESCRIPTIVO
Mejor K según Índice de Davies Bouldin (DBI)
Numero de K 2 3 4 5 6 7 8
DBI para ICAPM10 1.473 1.387 1.190 1.254 1.239 1.399 1.335
DBI para ICAPM2.5 1.696 1.220 1,191 1,254 1,347 1,310 1,359
Rendimiento de grupos según criterio DBI Rendimiento de grupos según criterio DBI
1,700 1,700
1,600 1,600
1,500 1,500
1,400 1,400
1,300 1,300
1,200 1,200
1,100 1,100
2 3 4 5 6 7 8 2 3 4 5 6 7 8
DBI para ICAPM10 DBI para ICAPM2.5 DBI para ICAPM10 DBI para ICAPM2.5
MODELO DESCRIPTIVO ICAPM10
Cluster Vs ICAPM10
100%
90%
80% Mas de 300 -Peligrosa
201-300
70%
151-200
-Muy dañina
60%
50% 101-150 -Dañina S
40% 51-100 -Dañino Gs
30% 0-50
-Moderado
20%
10% -Bueno
0%
Cluster 1 Cluster 2 Cluster 3 Cluster 4
Temperatura Temperatura
• 48% de registros superan los 30°C • 50% de registros superan los 35°C
Humedad Humedad
• 43% de los registros por debajo de 60 • 50% de los registros por debajo de 60
Precipitación Precipitación
• 3% de lluvias leves entre 0.1 y 5 mm • No se presentan lluvias en este cluster
Temperatura Temperatura
• 90% de los registros por debajo de los 30°C • Mas del 40% de registros menores de 25°C
Humedad Humedad
• 60% de los registros por encima de 80 • 76% de los registros por encima de 80
Precipitación Precipitación
• 4% de lluvias leves entre 0.1 y 5 mm • 6% de lluvias leves entre 6 y 10 mm
Temperatura Temperatura
• 50% de registros por debajo de los 30°C • Cerca de 90% de registros superan los 35°C
Humedad Humedad
• 40% de los registros por debajo de 60 • 50% de los registros por debajo de 60
Precipitación Precipitación
• 3% de lluvias leves entre 0.1 y 5 mm • No se presentan lluvias en este clúster
Temperatura Temperatura
• 90% de los registros por debajo de los 30°C • 90% de registros menores de 30°C
Humedad Humedad
• 75% de los registros por encima de 80 • 60% de los registros por encima de 80
Precipitación Precipitación
• 5% de lluvias entre 0.1 y 5 mm • 4% de lluvias entre 6 y 10 mm
ICAPM10 ICAPM2.5
ENTRADAS
# Neuronas MAE RMSE # Neuronas MAE RMSE
Capa Oculta Capa Oculta
Regresión Lineal RNA una capa oculta RNA dos capas ocultas
Errores
ICAPM10 ICAPM2.5 ICAPM10 ICAPM2.5 ICAPM10 ICAPM2.5