Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MINERIA DE DATOS
Gersom Costas
INTRODUCCIÓN
Selección,
Integración y Evaluación e
limpieza y DATA MINING
recopilación interpretación
transformación
Data Mining : confluencia de múltiples
disciplinas
Estadístic Visualización
a
Aprendizaj
e
Data Mining automátic
o
Sistemas de Otras
información disciplinas
Distribución de las
materias (Cajal et al.,
2001).
VERIFICACIÓN DESCUBRIMIENTO
DESCRIPCIÓN PREDICCIÓN
SQL
OLAP
Análisis estadístico
CLASIFICACIÓN TENDENCIA/
REGRESIÓN
Visualización
Agrupamiento
Reglas de
asociación Árboles de decisión Árboles de regresión
Reglas asociación Redes neuronales
Redes neuronales Series temporales
Métodos bayesianos
CLASIFICACION ALGORITMOS
1. SUPERVISADOS: predicen el valor de un atributo de un
conjunto de datos conocidos otros atributos.
- Árboles de Clasificación
- Árboles de Regresión
Aprendizaje competitivo.
Descubrir por si misma rasgos, peculiaridades, correlaciones o categorías
que se encuentren en los datos. El objetivo es descubrir “características o
patrones característicos” de entre un conjunto de datos de entrada, pero
de forma NO SUPERVISADA.
•Medida de similitud/disimilitud
Método
jerárquico
Step 0 Step 1 Step 2 Step 3 Step 4
agglomerative
(AGNES)
a ab
b abcde
c
cde
d
de
e
divisive
Step 4 Step 3 Step 2 Step 1 Step 0 (DIANA)
SVM (Support Vector Machine)
Máquinas de Vectores de soporte