Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Objetivo General
Conocer el potencial de los almacenes de datos y del anlisis y la extraccin de la minera de datos, para la toma de decisiones.
Parte I. Introduccin
Finalidades y evolucin de sistemas de informacin Tipos de datos Tipos de modelos Relacin con otras disciplinas Aplicaciones Sistemas y herramientas para la toma de decisiones: Diferencias e interrelacin
La Informacin reduce nuestra incertidumbre (sobre algn aspecto de la realidad) y por tanto, permite tomar mejores decisiones.
Inicialmente la finalidad de los sistemas de informacin era recopilar informacin sobre una parcela del mundo para ayudar en la toma de decisiones. Actualmente, con la informatizacin de las organizaciones y la aparicin de aplicaciones operacionales sobre los sistemas de informacin, la finalidad principal de los sistemas de informacin es dar soporte a los procesos basicos de la organizacin (ventas, produccin, personal, ).
Las organizaciones exigen nuevas prestaciones de los sistemas de informacin (sistemas de informacin para la toma de decisiones).
Evolucin
la informacin es difcil de encontrar y analizar, poco flexible, se necesita reprogramar cada peticin.
70s: Primeros DSS (Decision Support Systems) y EIS (Executive Information Systems):
80s: Acceso a datos y herramientas de anlisis integradas (conocidas como intelligent business tools):
Herramientas de consultas e informes, hojas de clculo, interfaces grficos e integrados, fciles de usar. Acceden a las bases de datos operacionales (killer queries).
90s: Almacenes de Datos y herramientas OLAP. 00s: Herramientas de Minera de Datos y Simulacin
Proporciona a los directivos acceso a la informacin de estado y sus actividades de gestin. Est especializado en analizar el estado diario de la organizacin (mediante indicadores clave) para informar rpidamente sobre cambios a los directivos. La informacin solicitada suele ser, en gran medida, numrica (ventas semanales, nivel de stocks, balances parciales, etc.) y representada de forma grfica al estilo de las hojas de clculo.
Funcionan sobre un sistema de informacin (transaccional o almacn de datos) Permiten realizar agregaciones y combinaciones de los datos de maneras mucho ms complejas y ambiciosas, con objetivos de anlisis ms estratgicos.
estn basados, generalmente, en sistemas relacionales u objetorelacionales, utilizan los operadores clsicos: concatenacin, proyeccin, seleccin, agrupamiento, (en SQL y extensiones). el resultado se presenta de una manera tabular.
Estn basadas, generalmente, en sistemas o interfaces multidimensionales, Utilizando operadores especficos (adems de los clsicos): drill, roll, pivot, slice & dice, El resultado se presenta de una manera matricial o hbrida.
proporcionan facilidades para manejar y transformar los datos. producen otros datos (ms agregados, combinados). ayudan a analizar los datos porque producen diferentes vistas de los mismos.
son muy variadas: permiten extraer patrones, modelos, descubrir relaciones, regularidades, tendencias, etc. producen reglas o patrones (conocimiento).
ETL
Fuente de Datos 1
texto
Almacn de Datos
Interfaz y Operadores
Herramientas OLAP
Fuente de Datos 3
HTML
Fuente de Datos
Fuentes Externas
La aparicin de algunas de ellas han hecho cambiar la manera de trabajar de otras herramientas.
11
Almacenes de datos
El almacn de datos es ahora el sistema de informacin central en todo este proceso. Un almacn de datos es una coleccin de datos:
Almacenes de datos
Actualmente,
Los almacenes de datos y las tcnicas OLAP son las maneras ms efectivas y tecnolgicamente ms avanzadas para integrar, transformar y combinar los datos para facilitar al usuario o a otros sistemas el anlisis de la informacin.
La tecnologa OLAP generalmente se asocia a los almacenes de datos, aunque:
13
Minera de datos
La Minera de Datos es un conjunto de tcnicas de anlisis de datos que permiten:
Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos. Extraer patrones y tendencias para predecir comportamientos futuros.
Debido al gran volumen de datos este anlisis ya no puede ser manual (ni incluso facilitado por herramientas de almacenes de datos y OLAP) sino que ha de ser (semi-)automtico.
Minera de datos
La Minera de Datos se diferencia claramente del resto de herramientas en el sentido de que:
Minera de datos
La minera de datos es slo una etapa del proceso de extraccin de conocimiento a partir de datos. Este proceso consta de varias fases:
Preparacin de Datos (seleccin, limpieza, y transformacin), Minera de Datos, Evaluacin, Difusin y Uso de Modelos. rboles de decisin, regresin lineal, redes neuronales artificiales, tcnicas bayesianas, mquinas de soporte vectorial, etc. aprendizaje automtico e I.A., estadstica, bases de datos, clasificacin, categorizacin, estimacin/regresin, agrupamiento, ...
de campos diversos:
Los almacenes de datos no son imprescindibles para hacer extraccin de conocimiento a partir de datos.
Las ventajas de organizar un almacn de datos para realizar minera de datos se amortizan sobradamente a medio y largo plazo cuando:
tenemos grandes volmenes de datos, o stos aumentan con el tiempo, o provienen de fuentes heterogneas o se van a combinar de maneras arbitrarias y no predefinidas.
17