Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DWDM I
DWDM I
1. Introduccin
PARTE I: INTRODUCCIN
Jos Hernndez Orallo
jorallo@dsic.upv.es
1.1. Finalidades y Evolucin de los Sistemas de Informacin. 1.2. Herramientas para la Toma de Decisiones: diferencias e interrelacin. 1.3. Almacenes de Datos, OLAP y Minera de Datos: definicin e interrelacin.
2. Almacenes de Datos
2.1. Introduccin a los Almacenes de Datos. 2.2. Arquitectura de un Sistema de Almacn de Datos. 2.3. Explotacin de un Almacn de Datos: Herramientas OLAP. 2.4. Sistemas ROLAP y MOLAP. 2.5. Carga y Mantenimiento de un Almacn de Datos. 2.6. Diseo de un Almacn de Datos. 2.7. Lneas de Investigacin Abiertas.
3. Minera de Datos
3.1. Introduccin a la Minera de Datos (DM) 3.2. El proceso de KDD 3.3. Tcnicas de Minera de Datos 3.4. Web Mining 3.5. Lneas de Investigacin Abiertas
Objetivos Parte I
Distinguir los sistemas de informacin para la gestin y los sistemas de informacin para la toma de decisiones. Conocer la evolucin de las herramientas para el anlisis de sistemas de informacin para la toma de decisiones. Distinguir las propiedades y finalidades de las diferentes herramientas DSS (soporte a la toma de decisiones): EIS, OLAP, consultas & informes, minera de datos.
3
La informacin reduce nuestra incertidumbre (sobre algn aspecto de la realidad) y, por tanto, nos permite tomar mejores decisiones
Actualmente, con la informatizacin de las organizaciones y la aparicin de aplicaciones software operacionales sobre el sistema de informacin, la finalidad principal de los sistemas de informacin es dar soporte a los procesos bsicos de la organizacin (ventas, produccin, personal...). 5
Las organizaciones exigen nuevas prestaciones de los sistemas de informacin (sistemas de informacin para la toma de decisiones).
6
Evolucin
60s: Informes batch:
la informacin es difcil de encontrar y analizar, poco flexible, se necesita reprogramar cada peticin.
70s: Primeros DSS (Decision Support Systems) y EIS (Executive Information Systems):
80s: Acceso a datos y herramientas de anlisis integradas (conocidas como intelligent business tools):
Herramientas de consultas e informes, hojas de clculo, interfaces grficos e integrados, fciles de usar. Acceden a las bases de datos operacionales (killer queries).
90s: Almacenes de Datos y herramientas OLAP. 00s: Herramientas de Minera de Datos y Simulacin.
7
Proporciona a los directivos acceso a la informacin de estado y sus actividades de gestin. Est especializado en analizar el estado diario de la organizacin (mediante indicadores clave) para informar rpidamente sobre cambios a los directivos. La informacin solicitada suele ser, en gran medida, numrica (ventas semanales, nivel de stocks, balances parciales, etc.) y representada de forma grfica al estilo de las hojas de clculo.
Funcionan sobre un sistema de informacin (transaccional o almacn de datos) Permiten realizar agregaciones y combinaciones de los datos de maneras mucho ms complejas y ambiciosas, con objetivos de anlisis ms estratgicos. 9
10
ETL
Fuente de Datos 1
texto
Almacn de Datos
Interfaz y Operadores
Herramientas OLAP
Fuente de Datos 3
HTML
Fuente de Datos
Fuentes Externas
son muy variadas: permiten extraer patrones, modelos, descubrir relaciones, regularidades, tendencias, etc. producen reglas o patrones (conocimiento).
11
La aparicin de algunas de ellas han hecho cambiar la manera de trabajar de otras herramientas.
12
Almacenes de Datos
El almacn de datos es ahora el sistema de informacin central en todo estre proceso. Un almacn de datos es una coleccin de datos: orientada a un dominio integrada no voltil variante en el tiempo para ayudar en la toma de decisiones [Immon 1992, 1996] Actualmente,
Almacenes de Datos
Los almacenes de datos y las tcnicas OLAP son las maneras ms efectivas y tecnolgicamente ms avanzadas para integrar, transformar y combinar los datos para facilitar al usuario o a otros sistemas el anlisis de la informacin. La tecnologa OLAP generalmente se asocia a los almacenes de datos, aunque:
13
Minera de Datos
La Minera de Datos es un conjunto de tcnicas de anlisis de datos que permiten: Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos. Extraer patrones y tendencias para predecir comportamientos futuros. Debido al gran volumen de datos este anlisis ya no puede ser manual (ni incluso facilitado por herramientas de almacenes de datos y OLAP) sino que ha de ser (semi-)automtico.
Minera de Datos
La Minera de Datos se diferencia claramente del resto de herramientas en el sentido de que: no transforma y facilita el acceso a la informacin para que el usuario la analice ms fcilmente. la minera de datos analiza los datos
15
16
Minera de Datos
La minera de datos es slo una etapa del proceso de extraccin de conocimiento a partir de datos. Este proceso consta de varias fases: incorpora muy diferentes tcnicas de campos diversos:
Preparacin de Datos (seleccin, limpieza, y transformacin), Minera de Datos, Evaluacin, Difusin y Uso de Modelos. rboles de decisin, regresin lineal, redes neuronales artificiales, tcnicas bayesianas, mquinas de soporte vectorial, etc.
aprendizaje automtico e I.A., estadstica, bases de datos, clasificacin, categorizacin, estimacin/regresin, agrupamiento, ...
17
18