Está en la página 1de 16

Modulo 1

Introduccin al Data Warehousing


Descripcin General del Mdulo

Introduccin al Data Warehousing


Consideraciones para una solucin de Data
Warehouse.
Leccin 1: Introduccin al Data Warehousing

El Problema en los negocios.


Que s un Data Warehouse?
Arquitectura de un Data Warehouse
Componentes de una Solucin de Data
Warehousing
Proyectos de Data Warehousing
Roles en los proyectos de Data Warehousing
SQL Server Como Plataforma de Data
Warehousing
El Problema del Negocio

Los principales datos empresariales se


distribuyen a travs de mltiples sistemas
Encontrar la informacin necesaria para la toma
de decisiones empresariales requiere tiempo y es
propenso a errores.
Las preguntas fundamentales de los negocios
son difciles de contestar.
Que s un Data Warehouse?

Es una base centralizada de datos empresariales


para la elaboracin de informes y anlisis
Normalmente, un data warehouse es:
Contiene largos volumenes de datos histricos.
Esta optimizado para consultar datos. (En opisicin a
insertar o actualziar)
Se carga de forma incremental con nuevos datos
comerciales a intervalos regulares.
Proporciona la base para soluciones de Inteligencia de
Negocio para las empresas.
Arquitectura de un Data Warehouse

Centralizado Data Warehouse

Departamental Data Mart

Hub and Spoke


Componentes de una solucin de Data Warehousing

Reporting and Analysis

Data Data
Data Sources

Cleansing Models

Data
Warehouse
Master Data ETL
Management
Proyectos de Data Warehousing

1. Comience identificando las preguntas de negocio que


la solucin de data warehousing debe responder.
2. Determine los datos que se requieren para responder a
estas preguntas
3. Identificar las fuentes de datos para los datos
requeridos
4. Evaluar el valor de cada pregunta para los objetivos
clave de la empresa frente a la factibilidad de
contestarla a partir de los datos disponibles.
Evaluar el valor de cada pregunta para los objetivos clave
de la empresa frente a la factibilidad de contestarla a
partir de los datos disponibles :
Romper el proyecto en varios subproyectos
Cada subproyecto se ocupa de un tema en particular en el data
warehouse
Funciones y Roles en los Proyectos de Data
Warehousing

Gerente de Proyecto
Arquitecto de Soluciones
El Modelador de Datos
Administrador de Base de Datos
Especialista en Infraestructura
Programador de ETL
Usuario/Analista de Negocio
Probadores (Tester)
Administradores de Datos.
SQL Server como una Plataforma de Data Warehousing

Core Data Warehousing


SQL Server Database Engine
SQL Server Integration Services
SQL Server Master Data Services
SQL Server Data Quality Services
Enterprise BI
SQL Server Analysis Services
SQL Server Reporting Services
Microsoft SharePoint Server
Microsoft Office
Self-Service BI and Big Data Analysis
Excel Add-ins (PowerPivot, Power Query, Power View, Power Map)
Microsoft Office 365 Power BI
Windows Azure HDInsight
Leccin 2: Consideraciones para una solucin de Data
Warehouse

Data Warehouse y el almacenamiento de los datos


Data Sources
Extraer, Transformar y Cargar los Datos
Data Quality y Master Data Management
Data Warehouse y almacenamiento da Datos

Database Schema
Hardware
Alta disponibilidad y Disaster Recovery
Seguridad
Data Sources

Tiposde Conexiones Data Source


Permisos y Credenciales
Formato de Datos
Procesos de Extraccin, transformacin y carga

Puesta en escena:
Que datos se deben poner en escena?
Formato de datos estadsticos.

Transformaciones Requeridas:
Transformaciones durante la extraccin versus
transformaciones de flujo de datos.
Incremental ETL:
Identificacin de cambio de datos para extraccin.
Insertar o Actualizar al cargar.
Data Quality y Master Data Management

Data quality:
Limpieza de Datos:
Validar valores de datos.
Asegurar la coherencia de los datos.
Identificacin de Valores perdidos.

Duplicacin de datos

Master Data Management:


Asegurar definiciones consistentes de entidades
empresariales a travs de mltiples sistemas.
Aplicacin de reglas empresariales para
garantizar la validez de los datos
Revisin de Mdulos

Preguntas de Revisin.