Está en la página 1de 22

MINERÍA DE DATOS

Marzo 2018
Temas
 Introducción
 Que es Minería de Datos?
 Proceso de Minería de Datos
 Principales características de la Minería
de Datos
 Aplicaciones de Minería de Datos
 Que es el proceso KDD?
 Modelado de Minería de Datos
 Clasificación de algoritmos de minería de
datos
Introducción
Día a día generamos información y
esto nos lleva a tener una gran
cantidad de esta, lo cual implica que
el generar información, nos puede
ayudar a controlar, optimizar,
administrar, examinar, investigar,
planificar, predecir, someter, negociar
o tomar decisiones de cualquier
ámbito según el dominio en que nos
desarrollemos.
Que es Minería de Datos?

- La extracción no trivial de información


implícita, previamente desconocida y
potencialmente útil, a partir de datos. (1)

 La integración de un conjunto de áreas que


tienen como propósito la identificación de
un conocimiento obtenido a partir de las
bases de datos que aporten un sesgo hacia
la toma de decisión(2)
Proceso de Minería de
Datos

Los pasos a seguir para la realización de un proyecto


de minería de datos son:

1. La Determinación de los Objetivos. Trata sobre la


delimitación de los objetivos que el cliente desea

2. Pre procesamiento de los Datos. Se refiere a la


selección, la limpieza, el enriquecimiento, la reducción
y transformación de las bases de datos.
Proceso de Minería de
Datos
3. Determinación del Modelo. Se comienza realizando unos
análisis estadísticos de los datos y después se lleva a
cabo una visualización gráfica de los mismos para tener
una primera aproximación. Según los objetivos
planteados y la tarea que debe llevarse a cabo son los
algoritmos a utilizarse.

4. Análisis de los Resultados. Verifica si los resultados


obtenidos son coherentes con los obtenidos por el
análisis y la visualización gráfica. Y el cliente determina
si le aporta nuevos conocimientos que le permita la
toma de decisiones.
Principales características de la Minería de Datos

•Explorar los datos que se encuentran en las profundidades de


las bases de datos, o almacenes de datos, que algunas veces
contienen información almacenada durante varios años.
• El entorno de la minería de datos suele tener una arquitectura
cliente-servidor.
• Las herramientas de la minería de datos ayudan a extraer el
mineral de la información enterrado en archivos corporativos o
en registros públicos archivados.
• Las herramientas de la minería de datos se combinan
fácilmente y pueden analizarse y procesarse rápidamente.
• La minería de datos produce cinco tipos de información:
— Asociaciones.
— Secuencias.
— Clasificaciones.
— Agrupamientos.
— Pronósticos.
Aplicaciones de la Minería de Datos
Que es el proceso KDD?
Extracción de Conocimiento en Bases de Datos

Es la extracción automatizada de conocimiento o


patrones interesantes, no triviales, implícitos,
previamente desconocidos, potencialmente
útiles y predictivos de la información de grandes
Bases de Datos.(3)

El proceso de KDD consiste en usar métodos de


minería de datos(algoritmos) para extraer
(identificar) lo que se considera como
conocimiento de acuerdo a la especificación de
ciertos parámetros usando una base de datos
Que es el proceso KDD?
Modelado de Minería de Datos

 Con el modelado se construye un modelo en una situación donde se


conoce la respuesta y luego se aplica en otra situación de la cual se
desconoce la respuesta.
Clasificación de algoritmos de minería de datos
Descripción
 Normalmente esta técnica es usada
para análisis preliminar de los datos
(resumen, características de los
datos, etc.).

 Describir un comportamiento en una


base de datos compleja para
aumentar el conocimiento y
entendimiento sobre gente,
productos, procesos etc. (–
Descripción

•Establecer que las mujeres presentan menor siniestralidad en


seguros de automóvil que los hombres
• Identificar las características de personas que apoya uno u otro
partido político
Ejemplo
Un ejemplo de la minería de datos (Data Mining) con pañales y
cervezas: Un caso famoso acerca del comportamiento de los consumidores.

Una situación muy popular sucedió en una cadena de víveres en


USA. Utilizando un software de minería de datos para estudiar el
 
comportamiento de sus clientes, encontraron relaciones interesantes
entre pañales, cervezas, hombres, y día de la semana.
             

Encontraron que los días jueves y sábado, los


hombres que compraban pañales también compraban
cerveza. Información como esa, que no siempre es
evidente a primera vista, puede ser utilizada para
reubicar la mercancía en lugares más estratégicos, en
este ejemplo, manteniendo a los pañales y a las
cervezas cercanos unos de otros.
Software para Minería de
Datos
Ejercicio_1

¿Qué dato se
pronosticara utilizando
la minería de datos?
Ejercicio2

 Ejemplo simple: ● En EE.UU. los maestros


clasifican a los estudiantes en A, B, C, D o F
según sus notas. Utilizando simplemente
límites (60, 70, 80, 90), las siguientes
clasificaciones son posibles:
 90 <= nota A
 80 <= nota <= 90 B
 70 <= nota <= 80 C
 60 <= nota < 70 D
 Nota < 60 F
Clasificación contra
predicción
 En alguna literatura de minería de datos
se considera a la clasificación como el
emparejamiento contra clases (etiquetas
de valores), mientras que la predicción
está asociada a valores continuos. Es
decir, en el conjunto de entrenamiento la
variable objetivo es una variable
continua. ● Finalmente, clasificación y
predicción vienen siendo lo mismo,
aunque se pueden hacer la
diferenciación según el tipo de variable.
Clasificación: aprendizaje
Clasificación: pruebas

También podría gustarte