Está en la página 1de 25

CURSO: DATA ANALYTICS POWER

BI – NIVEL INTERMEDIO

Capítulo 2: Diseño Dimensional


Objetivos
Al finalizar el capítulo, el alumno logrará:

• Comprender los mecanismos de agregación.


• Diseñar soluciones de un DataMart.
• Diseñar estructuras que se utilizarán en el desarrollo de un DataMart.
• Aplicar los conocimientos adquiridos en múltiples situaciones de diseño.

2
Agenda
1. Concepto de medida
2. Tabla de hechos
3. Granularidad
4. Criterios para agrupar la información
5. Relaciones entre las tablas
6. Tipos de modelo dimensional
7. Pasos del modelo dimensional

3
1. Concepto de medida
• Todo modelo dimensional está compuesto por una parte cuantitativa o
cuantificable y la pregunta que nos permite identificarla es ¿Cuánto?.
• Este elemento se denomina indicador, medida, métrica o measure.
• La medida está representada por columnas numéricas y casi siempre se
encuentran almacenadas en la tabla de hechos o fact table.
• Son los valores de negocio por los que queremos analizar nuestra
organización.
• Existen medidas naturales y medidas calculadas:
− Cantidad vendida
− Monto vendido
− Impuestos
− Costo
− Acumulado Ventas
Medidas
− Ratios

4
2. Tabla de Hechos
• Actividad que ocurre en el tiempo (operación o actividad).
• Para identificar una tabla de hechos nos haremos la pregunta: ¿Qué quiero
medir?
− Medidas: Valores numéricos que describen el hecho que se está analizando.
Ejemplo: Cantidad, Monto Ventas, Descuento, Impuestos, etc.
− Llaves Foráneas: Código que enlaza las distintas tablas de dimensiones con
nuestra tabla de hechos.
Ejemplo: PK_Vendedor, PK_Cliente, PK_Tiempo, etc.
− Llaves Primarias (PK): Casi siempre son las unión de todas las llaves foráneas o
los datos relevantes del negocio.
Ejemplo: # factura, Correlativo factura.
− Datos relevantes: Códigos / Números de documentos, operaciones, tickets que
son relevantes para el negocio.
Ejemplo: # Documento Tributario, #. Ticket, Código actividad.

5
3. Granularidad
• La granularidad es el nivel de detalle al que se desea almacenar información
sobre la actividad a modelar,
• Define el nivel atómico de datos en el almacén de datos
• A mayor de detalle, mayor posibilidad analítica, ya que los mismos podrán ser
resumidos o sumarizados.
• Los datos con granularidad final (nivel de detalle) podrán ser resumidos hasta
obtener una granularidad media o gruesa. No sucede lo mismo en sentido
contrario.
• Por ejemplo:
− Datos de ventas o compras de una empresa, pueden registrarse día a día para
cada factura. Granularidad : día, factura (cliente, vendendor).
− Datos pertinentes a pagos de sueldos o cuotas de socios, podrán almacenarse a
nivel de mes. Granularidad : mes, socios.
− Cantidad en el inventario por día para cada producto. Granularidad : día,
producto.

6
4. Criterios para agrupar la información
• Dimensiones:
− Es la parte cualitativa (características) de los reportes y se denomina
dimensiones.
− Para identificar una dimensión nos haremos la pregunta: ¿Cómo quiero ver mi
datos?.
− Conocidas también como las tablas maestras.
− Atributos: Característica de la dimensión.

Llave Primaria
Código transaccional
Atributos:
Característica de
dimensión

7
4. Criterios para agrupar la información
• Jerarquías:
− Ordenamiento lógico dentro de la dimensión.
Ejemplo:
Jerarquía Fecha -> Año, Semestre, Trimestre, Mes, Dia.
Jerarquía Producto -> Categoría, subCategoria, Producto.

8
5. Relación entre las tablas
• La relación es una asociación establecida entre campos comunes (columnas)
en dos tablas.
• Necesarias para que los datos de las tablas se puedan seleccionar, encontrar y
procesar de forma rápida y eficaz, es necesario que las tablas no se
encuentren aisladas.
− Uno-a-uno (1:1)
− Uno-a-muchos (1:M) o
− Muchos-a-uno (M:1)
− Muchos-a-muchos (M:N)

9
6. Tipos de modelo dimensional
• Existen dos arquitecturas de acuerdo con la normalización de sus
dimensiones:
− Estrella
 Desnormalizado
 Habilidad para análisis dimensional

− Copo de Nieve
 Normalizado
 Variación del modelo estrella
 Forma normalizada de las
dimensiones (solo las dimensiones
primarias están enlazadas con la
tabla de hechos)
 Rompe el análisis dimensional
 Se usa cuando no se puede
implementar un modelo estrella

10
6. Tipos de modelo dimensional
• Modelo Start (Estrella)
− Las tablas de dimensión se desnormalizan y se relacionan directamente con la
tabla de hechos, a través de sus respectivas claves.
− Características:
 Estructura simple
 Es ideal por su simplicidad y velocidad para ser usado para análisis.
 Las consultas son sencillas, ya que las condiciones y las uniones (JOIN) necesarias sólo
involucran a la tabla de hechos y a las de dimensiones
− Inconvenientes
 Este modelo es el menos robusto para la carga y es el más lento de construir.

11
6. Tipos de modelo dimensional
• Modelo Start (Estrella)
− Las tablas de dimensión se desnormalizan y se relacionan directamente con la
tabla de hechos, a través de sus respectivas claves.
− Características
 Estructura simple
 Es ideal por su simplicidad y velocidad para ser usado para análisis.
 Las consultas son sencillas, ya que las condiciones y las uniones (JOIN) necesarias sólo
involucran a la tabla de hechos y a las de dimensiones
− Inconvenientes
 Este modelo es el menos robusto para la carga y es el más lento de construir.

12
6. Tipos de modelo dimensional
• Modelo Start (Estrella)

13
6. Tipos de modelo dimensional
• Modelo Snowflake (Copo de nieve)
− Representa una extensión del modelo en estrella, en el que las tablas de
dimensión se normalizan en múltiples tablas.
− Las dimensiones se pueden relacionar con las tablas de hechos, o con otras
dimensiones.
− Características:
 Estructura compleja.
 Puede desarrollar clases de jerarquías fuera de las tablas de dimensiones, que permiten
realizar análisis de lo general a lo detallado y viceversa.
− Inconvenientes
 Un escenario de jerarquías en múltiples tablas de dimensiones, se creara un número
elevado de tablas que puede ser inmanejables.
 Al existir muchas uniones y relaciones entre tablas, el desempeño es poco eficiente.

14
6. Tipos de modelo dimensional
• Modelo Snowflake (Copo de nieve)

15
7. Pasos del modelo dimensional
• Identificar el proceso del negocio a modelar.
− Entrevistas:
 Se debe leer todos los informes posibles de la organización; entrevistar a los
empleados de negocio y técnico. Se deben conocer los términos y la terminología del
negocio.
• Definir diseño conceptual.
• Definir relación de dimensiones que aplican a las tabla de hechos:
− Matrix Bus
− Star Net
• Elegir las jerarquías que se apliquen a las dimensiones.
• Definir modelo dimensional.
• Tipo de modelo dimensional (Estrella / Copo de nieve).

16
7. Pasos del modelo dimensional
• Diseño Conceptual
− Diagrama que representa los insumos requeridos para diseñar l una solución de
negocio.
− Se diagrama una representación única del negocio.
− Un rectángulo representa todas las medidas identificadas para el análisis.
− Los círculos representan los atributos de agrupación de una dimensión,
conectadas por líneas de precedencia entre los atributos.

Fechas, Nro. teléfono,


medidas, código, etc

17
7. Pasos del modelo dimensional
• Matrix Bus
− Diagrama de matriz que permite identificar qué dimensiones intervienen en el
proceso de negocio o hecho.
− Cada fila representa un proceso de negocio y define al menos una tabla de
hechos y sus dimensiones asociadas.

1 Fact

DataMart 1
2 Fact
3 Fact
4 Fact

18
7. Pasos del modelo dimensional

• Star Net:
− Es un diagrama que nos muestra a través de líneas, círculos y rectángulos la
representación de un modelo dimensional.
− El rectángulo representa los hechos (medidas), los círculos mayores son las
dimensiones, los círculos pequeños corresponden a los atributos de las
dimensiones y las líneas permiten la relación entre estos elementos:

Tiempo
Día
Mes
Trimestre Tienda
Semestre Tienda
Tipo Tienda
Año
• Cantidad Vendedor
Hechos • Impuesto Vendedor
Dimensiones
Sección
• Monto Venta
País Provincia Cliente
Ciudad Cliente
Familia
Categoría
Sub Categoría
Producto
Producto

19
7. Pasos del modelo dimensional

• Jerarquías:
− Muestran las diferentes formas de analizar una perspectiva del negocio.
Definiendo criterios de agrupamiento de los atributos de una dimensión.
− Se diagrama una dimensión por Datamart.
− Cada dimensión puede tener de ninguna a varias jerarquías.

Dimensión Tiempo Dimensión Producto

J1 J2 J1 J2

20
7. Pasos del Modelo dimensional
• Modelo dimensional
− Es un modelo desnormalizado/normalizado basado en dos entidades: tablas
dimensionales y tablas de hecho.

Llave Autogenerada

Llave Natural

21
Ejercicio Nº 1: Diseño dimensional Entidad Medica
Al finalizar el laboratorio, el alumno logrará:

• Realizar de forma correcta el diseño dimensional, así como reconocer


dimensiones y tabla de hechos.

22
Ejercicio Nº 2: Diseño Dimensional Empresa
Tecnológica Información
Al finalizar el laboratorio, el alumno logrará:

• Realizar de forma correcta el diseño dimensional, así como reconocer


dimensiones y tabla de hechos.

23
Tarea Nº 2: Diseñar modelo dimensional

Al finalizar la tarea, el alumno logrará:

• Modelar una solución de negocio

24
Resumen
En este capítulo, usted aprendió que:

• El diseño de un modelo de datos proporciona una alternativa para identificar


los diferentes procesos de negocio que requieren ser evaluados para una
adecuada toma de decisiones.
• La existencia de dos tipos de modelamiento (estrella y copo de nieve)
proporcionan la flexibilidad que se requiere para los diferentes escenarios de
negocio actual.

25

También podría gustarte