Está en la página 1de 10

MINERIA DE DATOS

Consiste en utilizar informacin para obtener informacin significante


para la empresa bajo herramientas estadsticas con el fin de ahorrar
costos y mejorar la productividad.
Es la bsqueda de informacin valiosa en grandes volmenes de datos .
Es decir convertir datos en conocimiento.
Descubrir patrones, perfiles y tendencias a travs del anlisis de datos

Aplicaciones

Segmentacin de mercado
CRM (Ejemplo: Tendencia de desercin de
clientes)
Perfiles de clientes
Ventas
Mejoramiento de canales de distribucin
Recursos humanos(Ejemplo: Atencin a clientes)
Prediccin de clientes potenciales (Focalizacin
de clientes y campaas promocionales

FLUJO DE INFORMACIN
TCNICAS

Asociacin
Clasificar
Predecir
Distribuir

MODELOS DE MINERIA
DE DATOS

Modelo Predictivo
Responde preguntas sobre datos futuros

Modelo Descriptivo
Proporciona informacin sobre las relaciones
entre los datos

ETAPAS EN UN PROYECTO
DE MINERIA DE DATOS

Filtrado de datos: Eliminar valores incorrectos


e invlidos
Seleccin de variables: Elegir las variables
mas influyentes en el problema
Extraccin de conocimiento: Patrones de
comportamiento observados en los valores de las
variables del sistema
Interpretacin y Evaluacin: Validacin y
comprobacin
que
las
conclusiones
son
satisfactorias

BD. AdventureWorks

Algoritmo rbol de decisiones

Es una tcnica utilizada para la toma de decisiones secuenciales basada en el


uso de resultados y probabilidades asociadas.
Ejemplo: Estimar probabilidades de obtener beneficios.
Un rbol de decisin es un conjunto de condicione (reglas) organizadas en una
estructura jerrquica, de tal manera que la decisin final se puede determinar
siguiendo las condiciones que se cumplen desde la raz hasta alguna de sus
hojas.
El algoritmo de rboles de decisin de Microsoft es un algoritmo de clasificacin
y regresin para el modelado de prediccin de atributos discretos y continuos.

Algoritmo Bayes naive


de Microsoft

El algoritmo Bayes naive de Microsoft es un algoritmo de clasificacin para


el modelado de prediccin. Resulta til para generar rpidamente modelos
de minera de datos para descubrir relaciones entre columnas de entrada y
columnas de prediccin. Se puede utilizar este algoritmo para realizar
exploraciones iniciales de datos y aplicar los resultados para crear modelos
de minera de datos adicionales.

Algoritmo de clsteres
de Microsoft
El algoritmo utiliza tcnicas iterativas para
agrupar los casos de un conjunto de datos dentro
de clsteres que contienen caractersticas
similares. Estas agrupaciones son tiles para la
exploracin de datos, la identificacin de
anomalas en los datos y la creacin de
predicciones.

También podría gustarte