Está en la página 1de 3

Temario

1. Introduccin

PARTE I: INTRODUCCIN
Jos Hernndez Orallo
jorallo@dsic.upv.es

1.1. Finalidades y Evolucin de los Sistemas de Informacin. 1.2. Herramientas para la Toma de Decisiones: diferencias e interrelacin. 1.3. Almacenes de Datos, OLAP y Minera de Datos: definicin e interrelacin.

2. Almacenes de Datos
2.1. Introduccin a los Almacenes de Datos. 2.2. Arquitectura de un Sistema de Almacn de Datos. 2.3. Explotacin de un Almacn de Datos: Herramientas OLAP. 2.4. Sistemas ROLAP y MOLAP. 2.5. Carga y Mantenimiento de un Almacn de Datos. 2.6. Diseo de un Almacn de Datos. 2.7. Lneas de Investigacin Abiertas.

3. Minera de Datos
3.1. Introduccin a la Minera de Datos (DM) 3.2. El proceso de KDD 3.3. Tcnicas de Minera de Datos 3.4. Web Mining 3.5. Lneas de Investigacin Abiertas

Departamento de Sistemas Informticos y Computacin Universidad Politcnica de Valencia

Objetivos Parte I
Distinguir los sistemas de informacin para la gestin y los sistemas de informacin para la toma de decisiones. Conocer la evolucin de las herramientas para el anlisis de sistemas de informacin para la toma de decisiones. Distinguir las propiedades y finalidades de las diferentes herramientas DSS (soporte a la toma de decisiones): EIS, OLAP, consultas & informes, minera de datos.
3

Finalidad de los Sistemas de Informacin

La informacin reduce nuestra incertidumbre (sobre algn aspecto de la realidad) y, por tanto, nos permite tomar mejores decisiones

Finalidad de los Sistemas de Informacin


Inicialmente la finalidad de los sistemas de informacin era recopilar informacin sobre un parcela del mundo para ayudar en la toma de decisiones:
recuentos de cereales en Babilonia, de cacao por los pipiles, censos civiles y militares romanos o chinos, libros contables de rabes o sefardes, ...

Inters Renovado por la Finalidad Prstina


Una vez satisfecha la necesidad de tener un soporte informtico para los procesos bsicos de la organizacin (sistemas de informacin para la gestin).

Actualmente, con la informatizacin de las organizaciones y la aparicin de aplicaciones software operacionales sobre el sistema de informacin, la finalidad principal de los sistemas de informacin es dar soporte a los procesos bsicos de la organizacin (ventas, produccin, personal...). 5

Las organizaciones exigen nuevas prestaciones de los sistemas de informacin (sistemas de informacin para la toma de decisiones).
6

Evolucin
60s: Informes batch:
la informacin es difcil de encontrar y analizar, poco flexible, se necesita reprogramar cada peticin.

Herramientas para la Toma de Decisiones


Han aparecido diferentes herramientas de negocio o DSS que coexisten: EIS, OLAP, consultas & informes, minera de datos, ... Cul es la diferencia entre EIS y OLAP? Cul es la diferencia entre informes avanzados y OLAP? Cul es la diferencia entre OLAP y Minera de Datos? Qu interrelaciones existen entre todas estas herramientas?

70s: Primeros DSS (Decision Support Systems) y EIS (Executive Information Systems):

basados en terminal, no integrados con el resto de herramientas.

80s: Acceso a datos y herramientas de anlisis integradas (conocidas como intelligent business tools):

Herramientas de consultas e informes, hojas de clculo, interfaces grficos e integrados, fciles de usar. Acceden a las bases de datos operacionales (killer queries).

90s: Almacenes de Datos y herramientas OLAP. 00s: Herramientas de Minera de Datos y Simulacin.
7

Herramientas para la Toma de Decisiones


Cul es la diferencia entre EIS y OLAP?
Un EIS (Executive Information System) es un sistema de informacin y un conjunto de herramientas asociadas:

Herramientas para la Toma de Decisiones


Cul es la diferencia entre informes avanzados y OLAP?
Los sistemas de informes o consultas avanzadas:
estn basados, generalmente, en sistemas relacionales u objetorelacionales, utilizan los operadores clsicos: concatenacin, proyeccin, seleccin, agrupamiento, (en SQL y extensiones). el resultado se presenta de una manera tabular. Estn basadas, generalmente, en sistemas o interfaces multidimensionales, Utilizando operadores especficos (adems de los clsicos): drill, roll, pivot, slice & dice, El resultado se presenta de una manera matricial o hbrida.

Proporciona a los directivos acceso a la informacin de estado y sus actividades de gestin. Est especializado en analizar el estado diario de la organizacin (mediante indicadores clave) para informar rpidamente sobre cambios a los directivos. La informacin solicitada suele ser, en gran medida, numrica (ventas semanales, nivel de stocks, balances parciales, etc.) y representada de forma grfica al estilo de las hojas de clculo.

Las herramientas OLAP

Las herramientas OLAP (On-Line Analyitical Processing) son ms genricas:

Funcionan sobre un sistema de informacin (transaccional o almacn de datos) Permiten realizar agregaciones y combinaciones de los datos de maneras mucho ms complejas y ambiciosas, con objetivos de anlisis ms estratgicos. 9

10

Herramientas para la Toma de Decisiones


Cul es la diferencia entre OLAP y minera de datos? Las herramientas OLAP
proporcionan facilidades para manejar y transformar los datos. producen otros datos (ms agregados, combinados). ayudan a analizar los datos porque producen diferentes vistas de los mismos.

Herramientas para la Toma de Decisiones


Qu interrelaciones existen entre todas estas herramientas?
Fuentes Internas Base de Datos Transaccional
Herramientas EIS Herramientas de consultas e informes

ETL
Fuente de Datos 1
texto

Almacn de Datos

Interfaz y Operadores
Herramientas OLAP

Fuente de Datos 3
HTML

Las herramientas de Minera de Datos:

Fuente de Datos

Fuentes Externas

Herramientas de Minera de Datos

son muy variadas: permiten extraer patrones, modelos, descubrir relaciones, regularidades, tendencias, etc. producen reglas o patrones (conocimiento).

11

La aparicin de algunas de ellas han hecho cambiar la manera de trabajar de otras herramientas.

12

Almacenes de Datos
El almacn de datos es ahora el sistema de informacin central en todo estre proceso. Un almacn de datos es una coleccin de datos: orientada a un dominio integrada no voltil variante en el tiempo para ayudar en la toma de decisiones [Immon 1992, 1996] Actualmente,

Almacenes de Datos

Los almacenes de datos y las tcnicas OLAP son las maneras ms efectivas y tecnolgicamente ms avanzadas para integrar, transformar y combinar los datos para facilitar al usuario o a otros sistemas el anlisis de la informacin. La tecnologa OLAP generalmente se asocia a los almacenes de datos, aunque:
13

Podemos tener Almacenes de Datos sin OLAP y viceversa.


14

Minera de Datos
La Minera de Datos es un conjunto de tcnicas de anlisis de datos que permiten: Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos. Extraer patrones y tendencias para predecir comportamientos futuros. Debido al gran volumen de datos este anlisis ya no puede ser manual (ni incluso facilitado por herramientas de almacenes de datos y OLAP) sino que ha de ser (semi-)automtico.

Minera de Datos
La Minera de Datos se diferencia claramente del resto de herramientas en el sentido de que: no transforma y facilita el acceso a la informacin para que el usuario la analice ms fcilmente. la minera de datos analiza los datos

15

16

Minera de Datos
La minera de datos es slo una etapa del proceso de extraccin de conocimiento a partir de datos. Este proceso consta de varias fases: incorpora muy diferentes tcnicas de campos diversos:
Preparacin de Datos (seleccin, limpieza, y transformacin), Minera de Datos, Evaluacin, Difusin y Uso de Modelos. rboles de decisin, regresin lineal, redes neuronales artificiales, tcnicas bayesianas, mquinas de soporte vectorial, etc.

Almacenes de Datos y Minera de Datos


Es necesario tener almacenes de datos para realizar minera de datos? Los almacenes de datos no son imprescindibles para hacer extraccin de conocimiento a partir de datos. Las ventajas de organizar un almacn de datos para realizar minera de datos se amortizan sobradamente a medio y largo plazo cuando:
tenemos grandes volmenes de datos, o stos aumentan con el tiempo, o provienen de fuentes heterogneas o se van a combinar de maneras arbitrarias y no predefinidas.

se puede hacer minera de datos sobre un simple fichero de datos.

aborda una tipologa variada de problemas:

aprendizaje automtico e I.A., estadstica, bases de datos, clasificacin, categorizacin, estimacin/regresin, agrupamiento, ...
17

18

También podría gustarte