Está en la página 1de 26

Ing.

Carlos Gil Narvaez


Agenda
Introducción

Data Warehouse

Modelo de la BD Transaccional

Creación de la BD para el DW

ETL

Creación de Cubos
Introducción
Data Warehouse

Modelo de la BD Transaccional

Creación de la BD para el DW

ETL

Creación de Cubos
Introducción
Primero fueron los datos…
Los programadores de sistemas transaccionales,
desarrollan aplicativos que soportan las tareas operativas
de las organizaciones. Podemos decir que cualquier
empresa utiliza programas informáticos para la gestión
de los datos de su explotación diaria: Compras, Ventas,
gastos, etc. Pero ¿cuál es el siguiente paso?.
… después viene la información.
Prácticamente todas las empresas de la actualidad disponen
de BDs que almacenan datos sobre sus actividades y sus
colaboradores (clientes y proveedores) mediante distintas
aplicaciones informáticas (de contabilidad, de facturación, de
gestión de clientes, etc.). Por lo tanto, podemos decir que las
empresas disponen de datos históricos, fiables y rigurosos de
todas las actividades realizadas. Es lógico pensar que dichos
datos podrían ser refinados , agrupados, tratados y analizados
para intentar extraer información que permitiera ayudar en la
toma de decisiones de la empresa.
Encontrar patrones de conducta en la compra de
nuestros clientes, presentar información en tiempo real
sobre el rendimiento de las distintas sucursales de una
empresa a su dirección, o identificar los clientes que no
nos son rentables son ejemplos que muestran qué se
podría obtener a partir de los datos de la empresa. Este
hecho, la conversión de los datos operativos de las
empresas en información que dé soporte a la toma de
decisiones, es lo que se conoce como inteligencia de
negocio o Business Intelligence (BI)
Inteligencia de Negocios (Business
Intelligence, BI)
El contexto de la sociedad de la información ha
propiciado la necesidad de tener mejores, más rápidos y
más eficientes métodos para extraer y transformar los
datos de una organización en información y distribuirla
a lo largo de la cadena de valor.
BI es el conjunto de metodologías, aplicaciones,
prácticas y capacidades enfocadas a la creación y
administración de información que permite tomar
mejores decisiones a los usuarios de una organización
Alguna de las tecnología que forman parte de BI son:
 Data warehouse
 Reporting
 Análisis OLAP
 Análisis visual
 Analisis predictivo
 Cuadro de mando integral
 Data Mining
 Gestión del rendimiento
 Previsiones
 Reglas de negocio
 Dashboards
 Integración de datos
Introducción

Data Warehouse
Modelo de la BD Transaccional

Creación de la BD para el DW

ETL

Creación de Cubos
Data Warehouse
Un Data warehouse es un almacén de datos que
proporciona una visión global, común e integrada de los
datos de la organización –independientemente de cómo
se vayan a utilizar posteriormente por los usuarios-, con
las siguientes propiedades: estable, coherente, fiable y
con información histórica.
Un data warehouse es un conjunto de datos
orientados por temas, integrados, variantes en el
tiempo y no volátiles, que tienen por objetivo dar
soporte a la toma de decisiones.

W.H. Inmon

Un data warehouse es una copia de los


datos transaccionales, específicamente
estructurada para la consulta y el
análisis

Ralph Kimball
Conceptos importantes
 Data Warehousing: es el proceso de extraer y filtrar datos
de las operaciones comunes de la organización,
procedentes de los distintos sistemas de información
operacionales y/o sistemas externos, para transformarlos,
integrarlos y almacenarlos en un almacén de datos con el
fin de acceder a ellos para dar soporte en el proceso de toma
de decisiones de una organización.
 Data Mart: es un subconjunto de los datos del data
warehouse cuyo objetivo es responder a un determinado
análisis, función o necesidad, con una población de
usuarios específica. El data mart está pensado para cubrir
las necesidades de un grupo de trabajo o de un
determinado departamento dentro de la organización.
 Procesos ETL: tecnología de integración de datos
basada en la consolidación de datos que se usa
tradicionalmente para alimentar data warehouse y
data marts. Usualmente se combina con otras técnicas
de consolidación de datos.
 Metadatos: datos estructurados y codificados que
describen características de instancias; aportan
informaciones para ayudar a identificar, descubrir,
valorar y administrar las instancias descritas.
Elementos de un data warehouse
La estructura relacional de una base de datos
operacional sigue las formas normales en su diseño. Un
data warehouse no debe seguir ese patrón de diseño.
La idea principal es que la información sea presentada
desnormalizada para optimizar las consultas. Para ello
debemos identificar, en el seno de nuestra organización,
los procesos de negocio, las vistas para el proceso de
negocio y las medidas cuantificables asociadas a los
mismos. De esta manera todo data warehouse tiene los
siguientes elementos:
 Tabla de Hechos (Fact
Table): es la representación
en el data warehouse de los
procesos de negocio de la
organización. Por ejemplo,
una venta puede
identificarse como un
proceso de negocio de
manera que es factible, si
corresponde en nuestra
organización, considerar la
tabla de hechos Venta.
 Dimensión: es la representación en el data warehouse
de una vista para un cierto proceso de negocio. Si
regresamos al ejemplo de una venta, para la misma
tenemos el cliente que ha comprado, la fecha en la que
se ha realizado, etc. Estos conceptos pueden ser
considerados como vistas para este proceso de negocio.
Puede ser interesante recuperar todas las compras
realizadas por un cliente. Ello nos hace entender por
qué la identificamos como una dimensión.
 Métrica: son los indicadores de negocio de un proceso
de negocio. Aquellos conceptos cuantificables que
permiten medir nuestro proceso de negocio. Por
ejemplo, en una venta tenemos el importe de la
misma.
Esquemas de Data warehouse
Existen principalmente dos tipos de esquemas para
estructurar los datos en un data warehouse:
 Esquema en Estrella: consiste en estructurar la
información en procesos, vistas y métricas recordando
a una estrella (por ello el nombre). A nivel de diseño,
consiste en una fact table en el centro para el hecho
objeto de análisis y una o varias tablas de dimensión
por cada punto de vista de análisis que participa de la
descripción de ese hecho. En la tabla de hecho
encontramos los atributos destinados a medir. La tabla
de hechos sólo presenta uniones con dimensiones.
 Esquema en copo de nieve: es un esquema de
representación derivado del esquema en estrella, en la
que las tablas de dimensión se normalizan en
múltiples tablas. Por esta razón, la tabla de hechos deja
de ser la única tabla del esquema que se relaciona con
otras tablas, y aparecen nuevas uniones .
Introducción

Data Warehouse

Modelo de la BD Transaccional
Creación de la BD para el DW

ETL

Creación de Cubos
Introducción

Data Warehouse

Modelo de la BD Transaccional

Creación de la BD para el DW
ETL

Creación de Cubos
Introducción

Data Warehouse

Modelo de la BD Transaccional

Creación de la BD para el DW

ETL
Creación de Cubos
Introducción

Data Warehouse

Modelo de la BD Transaccional

Creación de la BD para el DW

ETL

Creación de Cubos
Pasos
 Conectarse a las bases de datos
 Generar la vista de origen de datos
 Generación de cubos
 Procesar el cubo

También podría gustarte