Está en la página 1de 11

INFOSPHERE DATASTAGE

Rbinson Andrs Meja Nexos Software SAS

Capitulo 1: Fundamentos

Objetivos
O Definir BI
O Definir ETL O Definir Data warehouse O Algunas herramientas de ETL O Fundamentos de Datastage O Componentes de Datastage

Business intelligence
Inteligencia empresarial (Business Intelligence), tambin llamado Gestin de los Datos (Data Management), es un agregado de aplicaciones y herramientas enfocadas al procesamiento de los datos en una empresa para poder ayudar tomar decisiones y hacer varios anlisis.

Business intelligence
Algunos conceptos importantes concernientes a la inteligencia de negocios:
O O O O

O O O O O

DW - Almacenes de datos, Bodegas de Datos (Data warehouses) ETL - Transformar, Extraer y Cargar datos DM - Minera de datos (Data mining) Aplicaciones OLAP - cubos OLAP, procesamiento analtico lnea, Online Analytical Processing and multidimensional analysis MIS - Sistemas de Informacin para la Administracin (Management Information Systems) Consultas e informes - Information visualization, and Dashboarding Calidad de Datos y limpieza de Datos Sistemas de previsin empresarial DSS - Apoyo en la toma de decisiones (Decision Support Systems)

ETL (Extraccin, Transformacin y Carga)


El proceso ETL organiza el flujo de los datos entre diferentes sistemas en una organizacin y esta fase de importar y cargar datos se suele realizar con una herramienta ETL (como por ejemplo Informtica Powercenter, Datastage). Tambin es posible y ocurre a menudo programar el proceso ETL en el lenguaje dedicado a la base de datos (PL/SQL por ejemplo).

Almacn de Datos
Un Almacn de Datos (Data Warehouse) es una coleccin de datos que est formada por Variables (hechos, facts) y Dimensiones (dimensions). Dimensiones son los elementos para ubicar datos que participan en el anlisis y Variables los valores que se desean analizar.

Fundamentos Datastage
DataStage es una herramienta ETL que permite crear y mantener fcil y rpidamente almacenes de datos procedentes de sistemas de Aplicaciones Empresariales incluyendo SAP, Siebel, Oracle y PeopleSoft CRM y de otros sistemas relacionados al negocio.

Fundamentos Datastage
Datastage soporta la extraccin, integracin y transformacin de altos volmenes de datos desde estructuras simples hasta muy complejas. Entre funciones de DataStage, la ms destacada es el diseo de tareas que extraen, integran, agregan, cargan y transforman los datos para el Data Warehouse o Data Mart. Las tareas son compiladas para crear ejecutables que son calendarizados por el Director y ejecutadas por el Servidor.

Componentes Datastage
Hay cuatro componentes principales de la herramienta Datastage:
O Administrator - Interfaz de usuario usada

para configurar proyectos de Datastage y usuarios. Gestiona administracin de proyectos de DataStage en ambientes de desarrollo y produccin.

Componentes Datastage
O Designer - usada para crear, disear y

compilar tareas Datastage (tambin permite testear y ejecutar). Mayormente usado por los desarrolladores. O Director - para validar, calendarizar, testear, ejecutar y monitorizar jobs Datastage. Usado por los operadores y los testers. O Manager - interfaz de usuario usada para visualizar y editar el contenido del repositorio.