Está en la página 1de 10

Mineria de Datos

Data Warehouse
INTRODUCCIÓN
- Uso extendido de SGBD - soporte de SI y funciones de la organización
- Sistemas operacionales: OLTP (OnLine Transaction Processing)
- Se requiere sistemas de información para la toma de decisiones - Tecnología
de almacenes de datos
- Data Warehouse - Almacenes de datos: disponer de SI que apoyen la toma
de decisiones para:
- Análisis de la organización
- Previsiones de evolución
- Diseño de estrategias
- Minería de datos: Proceso de extracción del conocimiento válido, útil,
comprensible, desconocido, a partir de datos almacenados
Arquitectura - Data Warehouse

mini almacenamiento |
intermedio

Minería de Datos
Data Warehouse vs Informes convencionales

Estáticos
Basados en el
esquema
=i
Herramientas
de consultas
Dinámicos
OLAP: Online
Analytical
Processing
e informes
Multidimensiona
relacional
les
SQL: Consultas drill

En
— Herramientas
de OLAP
-
-
-
Clasificación
Agrupación
Totales
En down, roll up:
-—
-
Filtros
Estadística
- . Resumir/
- Adiciones refinar

ni
- . Rangos

Herramientas
de Data Mining
Herramientas
de Data Mining
Minería de Datos

ni
Herramientas
de consultas
e informes

<a > Las herramientas de minería de datos


En Herramientas permiten extraer conocimiento a partir de los
o de OLAP datos almacenados.

patrones, pautas,
reglas, ...
Minería de Datos

El analista parte de una pregunta o


hipótesis, explora los datos y valida
o rechaza su hipótesis hasta
construir su modelo de los datos.
(proceso deductivo)

El sistema encuentra y sugiere


modelos de los datos.

(proceso inductivo)
El proceso KDD - Knowledge Discovery in Databases

- Proceso global que permite la extracción de conocimientos a partir de datos


almacenados.
/ Sistemas de DN
N Información Re

Preparación de
los Datos
LA
Minería de — Datos

KDD
parones >

Evaluación /
Interpretación /
Visualización

===
e
e
E p rOCeso KD D Fuentes de datos
SA Extracción
Il ETL => Limpieza
Transformación
Data
Warehouse -
Selección
Preparación Lim ¡ieza
de los datos p -
Transformación
Vista
minable

-— Minería de

Modelos xa]

7 Evaluación

Conocimiento Aa => “Y Decisiones


Difusión y
uso
El proceso KDD

- Preparación de datos: es importante seleccionar adecuadamente los datos:


- Selección vertical: atributos significativos
- Selección horizontal: se puede trabajar sobre un subconjunto o muestra de los datos
- Minería de datos:
- Extracción de conocimientos a partir de los datos almacenados.
- Se debe identificar patrones entre los datos.
- Decisiones previas:
Tipo de conocimiento
Tareas: predictivas o descriptivas
Técnica
Algoritmo
El proceso KDD

- Evaluación
- Medida de la validez del modelo
- — Verificación de hipótesis
- Difusión y uso
-. Toma de decisiones
- Replicar el modelo para otros datos
- Difundir en la organización

También podría gustarte