Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Minera de Datos
Introduccin
Da a da generamos informacin y esto nos lleva a tener
una gran cantidad de esta, lo cual implica que el generar
informacin, nos puede ayudar a controlar, optimizar,
administrar, examinar, investigar, planificar, predecir,
someter, negociar o tomar decisiones de cualquier
mbito segn el dominio en que nos desarrollemos.
Qu es Minera de Datos?
PROBLEMAS TCNICAS DE
DATA MINING
A
L
G
O
R
I
T
M IMPLANTAR
O
S
MODELO DE
DATA MINING
1
3
CLASIFICACION DE ALGORITMOS DE
MINERIA DE DATOS
1
4
Descripcin
Normalmente esta tcnica es usada para anlisis preliminar de
los datos (resumen, caractersticas de los datos, etc.).
1
5
Ejemplo
Gestin de personal de una empresa: Qu clases de empleados
hay contratados?
Datos:
Modelo generado:
Minera de datos
Grupo 1: Sin nios y en una casa alquilada. Bajo nmero de uniones. Muchos das enfermos
Grupo 2: Sin nios y con coche. Alto nmero de uniones. Pocos das enfermos. Ms mujeres y en una casa alquilada
Grupo 3: Con nios, casados y con coche. Ms hombres y normalmente propietarios de casa. Bajo nmero de uniones
1
6
ALGORITMOS DE MINERIA DE DATOS
Prediccin
La meta es inducir un modelo para poder predecir una
clase dados los valores de los atributos
Ejemplo: Diagnostico medico, deteccin de fraude o que
Clasificacin producto compraran ms unos clientes, clasificar solicitudes de
crdito (alto, medio, bajo)
Se usan arboles de decisin, reglas, anlisis de discriminantes,
etc.
SE SELECCIONA EL NODO
RAIZ Y ESTE SE DIVIDE DE
ACUERDO A LOS VALORES
DEL ATRIBUTO RAIZ
rboles de decisin
Representan reglas donde atributos independientes determinan los valores finales. En
estos rboles cada nodo representa una propiedad que puede tomar diversos valores,
cada uno de los cuales genera una rama. Los nodos hojas representan las clasificaciones
finales.
Nos pueden servir para tareas como:
Clasificacin en general y validaciones
Usadas donde se deben tomar decisiones a partir de varias alternativas
Son tiles en problemas de alta dimensionalidad y pequeo numero de valores
para cada atributo. Ingreso
M F >35 <= 35
Ingreso Genero Antigedad
0 Casado Soltera F M >=4 >4
0 1 0 1 0 1
If (Ingreso=>5000 AND Genero=F AND Estado = Soltera Then P(Coche)=1
1
9
rboles de decisin
rboles de decisin
Datos:
Modelo generado:
Minera de datos
If Defaulter-accounts = 0 and [(Salary > 2500) or (Credit-p > 10)] then Returns-credit = yes
2
1
Ejemplo
Tienda de TV: Cuntas televisiones planas se vendern el
prximo mes?
Datos:
Modelo generado:
Minera de datos
2
2