Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MINERÍA DE DATOS
Objetivos
1
01/07/2022
Motivación
Datos Escondidos
(se descubren con KDD)
Motivación
2
01/07/2022
Minería de datos
3
01/07/2022
Es la unidad Es la información
un conjunto de datos
fundamental de la adquiridos por una
procesados
información persona
4
01/07/2022
5
01/07/2022
Transformación
Preprocesamiento Conocimiento
Selección
Patrones
Datos
Transformados
Datos
Datos Preprocesados
Datos
Seleccionados
6
01/07/2022
Knowledge
Conocimiento
“Data rich,
(patrones interesantes)
Information poor”
7
01/07/2022
8
01/07/2022
9
01/07/2022
Áreas de aplicación
•Aplicaciones financieras y de banca:
−obtención de patrones de uso fraudulento de tarjetas.
−obtención de perfiles de clientes en el uso de tarjetas.
−obtención de correlaciones entre indicadores financieros.
−análisis de riesgos en la concesión de préstamos, ...
Aplicaciones
• Medicina:
- Identificación de terapias médicas satisfactorias para diferentes enfermedades.
- Asociación de síntomas y clasificación diferencial de patologías.
- Estudio de factores (genéticos, precedentes, hábitos, alimenticios, etc.) de
riesgo/salud en distintas patologías.
- Segmentación de pacientes para una atención más inteligente según su grupo.
- Predicciones temporales de los centros asistenciales para el mejor uso de recursos,
consultas, salas y habitaciones.
- Estudios epidemiológicos, análisis de rendimientos de campañas de información,
prevención, sustitución de fármacos, etc.
10
01/07/2022
11
01/07/2022
Regla 1:
Si cuentas-morosas > 0 entonces devuelve-préstamo = no
Regla 2:
Si cuentas-morosas = 0 Y ( salario>2.500 O D-credito>10)
entonces devuelve-préstamo = sí
...
Mg. Marleny Peralta Ascue
12
01/07/2022
Conocimiento
Patrones
•Control
•Diagnóstico
•Predicción
•Toma de decisiones
Mg. Marleny Peralta Ascue
13
01/07/2022
14
01/07/2022
15
01/07/2022
16
01/07/2022
33
Mg. Marleny Peralta Ascue
Minería de datos
Vista minable
17
01/07/2022
Minería de datos
18
01/07/2022
- Estadísticas
- Inteligencia Artificial
- Aprendizaje de máquinas
19
01/07/2022
20
01/07/2022
21
01/07/2022
22
01/07/2022
“Volumen masivo de
datos, tanto
estructurados como no-
estructurados, los cuales
son demasiado grandes y
difíciles de procesar con
las bases de datos y el
software tradicionales"
(ONU, 2012)
23
01/07/2022
24
01/07/2022
25