Está en la página 1de 17

ANLISIS Y EXTRACCIN DE CONOCIMIENTO

Almacenes y Minera de datos

Objetivo General

El objetivo Fundamental de esta asignatura es:

Conocer el potencial de los almacenes de datos y del anlisis y la extraccin de la minera de datos, para la toma de decisiones.

La asignatura se puede dividir en Dos objetivos especficos.


Conocer las tcnicas de Almacenes de datos y OLAP para facilitar el procesamiento analtico de apoyo a la toma de decisiones estratgicas. Saber de las tcnicas de Minera de datos apropiadas para problemas concretos de extraccin del conocimiento.

Parte I. Introduccin

Finalidades y evolucin de sistemas de informacin Tipos de datos Tipos de modelos Relacin con otras disciplinas Aplicaciones Sistemas y herramientas para la toma de decisiones: Diferencias e interrelacin

Finalidad de los sistemas de Informacin

La Informacin reduce nuestra incertidumbre (sobre algn aspecto de la realidad) y por tanto, permite tomar mejores decisiones.

Finalidad de los sistemas de Informacin

Inicialmente la finalidad de los sistemas de informacin era recopilar informacin sobre una parcela del mundo para ayudar en la toma de decisiones. Actualmente, con la informatizacin de las organizaciones y la aparicin de aplicaciones operacionales sobre los sistemas de informacin, la finalidad principal de los sistemas de informacin es dar soporte a los procesos basicos de la organizacin (ventas, produccin, personal, ).

Finalidad del sistema de informacin


Una vez satisfecha la necesidad de tener un soporte informtico para los procesos bsicos de la organizacin (sistemas de informacin para la gestin).

Las organizaciones exigen nuevas prestaciones de los sistemas de informacin (sistemas de informacin para la toma de decisiones).

Evolucin

60s: Informes batch:

la informacin es difcil de encontrar y analizar, poco flexible, se necesita reprogramar cada peticin.

70s: Primeros DSS (Decision Support Systems) y EIS (Executive Information Systems):

basados en terminal, no integrados con el resto de herramientas.

80s: Acceso a datos y herramientas de anlisis integradas (conocidas como intelligent business tools):

Herramientas de consultas e informes, hojas de clculo, interfaces grficos e integrados, fciles de usar. Acceden a las bases de datos operacionales (killer queries).

90s: Almacenes de Datos y herramientas OLAP. 00s: Herramientas de Minera de Datos y Simulacin

Herramientas para la toma de decisiones


Cul es la diferencia entre EIS y OLAP?

Un EIS (Executive Information System) es un sistema de informacin y un conjunto de herramientas asociadas:


Proporciona a los directivos acceso a la informacin de estado y sus actividades de gestin. Est especializado en analizar el estado diario de la organizacin (mediante indicadores clave) para informar rpidamente sobre cambios a los directivos. La informacin solicitada suele ser, en gran medida, numrica (ventas semanales, nivel de stocks, balances parciales, etc.) y representada de forma grfica al estilo de las hojas de clculo.

Las herramientas OLAP (On-Line Analyitical Processing) son ms genricas:


Funcionan sobre un sistema de informacin (transaccional o almacn de datos) Permiten realizar agregaciones y combinaciones de los datos de maneras mucho ms complejas y ambiciosas, con objetivos de anlisis ms estratgicos.

Herramientas para la toma de decisiones


Cul es la diferencia entre informes avanzados y OLAP

Los sistemas de informes o consultas avanzadas:

estn basados, generalmente, en sistemas relacionales u objetorelacionales, utilizan los operadores clsicos: concatenacin, proyeccin, seleccin, agrupamiento, (en SQL y extensiones). el resultado se presenta de una manera tabular.

Las herramientas OLAP


Estn basadas, generalmente, en sistemas o interfaces multidimensionales, Utilizando operadores especficos (adems de los clsicos): drill, roll, pivot, slice & dice, El resultado se presenta de una manera matricial o hbrida.

Herramientas para la toma de decisiones


Cul es la diferencia entre OLAP y minera de datos?

Las herramientas OLAP


proporcionan facilidades para manejar y transformar los datos. producen otros datos (ms agregados, combinados). ayudan a analizar los datos porque producen diferentes vistas de los mismos.

Las herramientas de Minera de Datos:


son muy variadas: permiten extraer patrones, modelos, descubrir relaciones, regularidades, tendencias, etc. producen reglas o patrones (conocimiento).

Herramientas para la toma de decisiones


Qu interrelaciones existen entre todas estas herramientas?
Fuentes Internas Base de Datos Transaccional
Herramientas EIS Herramientas de consultas e informes

ETL
Fuente de Datos 1
texto

Almacn de Datos

Interfaz y Operadores
Herramientas OLAP

Fuente de Datos 3
HTML

Fuente de Datos

Fuentes Externas

Herramientas de Minera de Datos

La aparicin de algunas de ellas han hecho cambiar la manera de trabajar de otras herramientas.
11

Almacenes de datos
El almacn de datos es ahora el sistema de informacin central en todo este proceso. Un almacn de datos es una coleccin de datos:

orientada a un dominio integrada no voltil variante en el tiempo

para ayudar en la toma de decisiones [Immon 1992, 1996]

Almacenes de datos
Actualmente,

Los almacenes de datos y las tcnicas OLAP son las maneras ms efectivas y tecnolgicamente ms avanzadas para integrar, transformar y combinar los datos para facilitar al usuario o a otros sistemas el anlisis de la informacin.
La tecnologa OLAP generalmente se asocia a los almacenes de datos, aunque:

Podemos tener Almacenes de Datos sin OLAP y viceversa.

13

Minera de datos
La Minera de Datos es un conjunto de tcnicas de anlisis de datos que permiten:

Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos. Extraer patrones y tendencias para predecir comportamientos futuros.

Debido al gran volumen de datos este anlisis ya no puede ser manual (ni incluso facilitado por herramientas de almacenes de datos y OLAP) sino que ha de ser (semi-)automtico.

Minera de datos
La Minera de Datos se diferencia claramente del resto de herramientas en el sentido de que:

no transforma y facilita el acceso a la informacin para que el usuario la analice ms fcilmente.


la minera de datos analiza los datos

Minera de datos

La minera de datos es slo una etapa del proceso de extraccin de conocimiento a partir de datos. Este proceso consta de varias fases:

Preparacin de Datos (seleccin, limpieza, y transformacin), Minera de Datos, Evaluacin, Difusin y Uso de Modelos. rboles de decisin, regresin lineal, redes neuronales artificiales, tcnicas bayesianas, mquinas de soporte vectorial, etc. aprendizaje automtico e I.A., estadstica, bases de datos, clasificacin, categorizacin, estimacin/regresin, agrupamiento, ...

incorpora muy diferentes tcnicas

de campos diversos:

aborda una tipologa variada de problemas:

Almacenes de datos y Minera de datos


Es necesario tener almacenes de datos para realizar minera de datos?

Los almacenes de datos no son imprescindibles para hacer extraccin de conocimiento a partir de datos.

se puede hacer minera de datos sobre un simple fichero de datos.

Las ventajas de organizar un almacn de datos para realizar minera de datos se amortizan sobradamente a medio y largo plazo cuando:

tenemos grandes volmenes de datos, o stos aumentan con el tiempo, o provienen de fuentes heterogneas o se van a combinar de maneras arbitrarias y no predefinidas.

17

También podría gustarte