Está en la página 1de 18

9/2/2023

ARQUITECTURA

1
9/2/2023

BASES DE
DATOS

Una base de datos o


banco de datos es un
conjunto de datos
pertenecientes a un
mismo contexto y
almacenados
sistemáticamente para su
posterior uso.

BASES DE
DATOS MÁS
UTILIZADAS

2
9/2/2023

ORACLE

SQL SERVER

3
9/2/2023

POSTGRES
OPEN SOURCE

MYSQL
OPEN SOURCE

4
9/2/2023

MONGO DB
OPEN SOURCE

Gran cantidad de almacenamiento

OBJETIVO: BI

10

5
9/2/2023

CONCEPTOS BÁSICOS PARA BI

11

Un Datawarehouse es una base de


datos corporativa que se caracteriza
por integrar y depurar información de
DATAWAREHOUSE * una o más fuentes distintas, para luego
procesarla permitiendo su análisis
desde infinidad de perspectivas y con
grandes velocidades de respuesta.

12

6
9/2/2023

La creación de un datawarehouse representa


en la mayoría de las ocasiones el primer paso,
DATAWAREHOUSE desde el punto de vista técnico, para implantar
* una solución completa y fiable de Business
Intelligence.

13

¿Qué es un Data
Warehouse?
• Orientado a un Tema
• Colección de información relacionada
organizada alrededor de un tema
central
• Integrado
• Datos de múltiples orígenes;
consistencia de datos
• Variable en el tiempo
• ‘Fotos’ en el tiempo
• Basado en fechas/periodos
• No-volátil
• Sólo lectura para usuarios finales
• Menos frecuencia de
cambios/actualizaciones
• Usado para el Soporte a Decisiones y
Análisis de Negocio

14

7
9/2/2023

PRINCIPIOS
DEL
ALMACÉN
DE DATOS

15

CARACTERÍSTICAS

16

8
9/2/2023

17

18

9
9/2/2023

DATAWAREHOUSE

La ventaja principal de este tipo de bases de datos radica en las estructuras en las que
se almacena la información. Ejemplo:

 Modelos de tablas en estrella.


 En copo de nieve
 Cubos relacionales.

19

Modelización Dimensional -
Regla de Oro

Los Esquemas en Estrella deberían ser


utilizados para cualquier dato accedido
directamente por los usuarios finales.

20

10
9/2/2023

El Esquema en Estrella
 Hechos
 Dimensiones
 De-normalizado (generalmente)
 Tiene caminos de unión bien diseñados
 Paraleliza la visión de los datos por el usuario
 Son fácilmente modificables
 Simplifica la comprensión y navegación por los
metadatos
 Amplia la elección de herramientas de usuario final

21

Modelización Dimensional

 Tablas de Hechos: contienen datos cuantitativos sobre el


negocio
 La clave primaria es una concatenación de claves de dimensión,
incluyendo el tiempo
 Cada elemento de la clave primaria compuesta es una clave de
integridad referencial hacia una tabla de dimensión.
 Contienen menos atributos, pero muchos más registros

 Tablas de Dimensión: gestionan datos descriptivos que reflejan


las diversas dimensiones del negocio
 Contienen muchos atributos pero menos (pocos) registros
 La clave primaria ‘ayuda’ a componer las claves primarias de las
tablas de hechos

22

11
9/2/2023

Determine los Hechos


 ¿Qué hechos están disponibles?
 ¿Cuáles son los datos cuantitativos fundamentales que hay por
debajo?
 Los hechos más útiles son los numéricos y aditivos

 ¿Qué nivel de detalle (granularidad) necesita mantener?


 Serán datos ‘atómicos’ (todo el detalle) o datos agregados
(sumarizados)?
 Si son agregados, cómo (usando qué algoritmo)?
 ¿Para qué propósito de negocio?

 ¿Cuál es la frecuencia de carga de datos requerida?


 ¿Cada transacción?
 ¿Cada hora? ¿Día? ¿Semana? ¿Mes?

23

Determine las Dimensiones

 ¿Qué dimensiones pueden necesitar los usuarios?


 ¿Cuáles son los conceptos fundamentales (entidades o temas)
con los que los usuarios trabajarán?
 Siempre existirán al menos dos dimensiones; quizá hasta una
decena.
 El tiempo será una dimensión prácticamente siempre
 ¿Cuál es el identificador (clave primaria) de cada una de las
dimensiones?
 No_Cliente, ID_Cuenta, NoFactura
 Los atributos de la dimensión se convierten en las cabeceras
de los registros SQL

24

12
9/2/2023

Para Cada Tabla de Dimensión

 Establezca la clave primaria para cada registro dimensional


 Use la clave primaria como una parte de la clave compuesta de
la tabla de hechos
 Identifique los atributos de interés para los usuarios
 ¿Qué atributos deben ser de-normalizados?
 ¿Qué otros atributos podrían tener valores significativos?
 ¿Hay alguna oportunidad de incluir datos ‘de fuera’? ¿Cuáles?
 Ayúdese de los valores reales contenidos en los atributos

25

La Dimensión de Tiempo

 Debe ser día a día durante 5-10 años


 Separe los campos de semana, mes, día, año, día de la
semana, vacaciones, estaciones, etc.
 Trimestres naturales y fiscales
 Créela como una sola tabla en el DWH
 Cargue el contenido en los DM a medida que se
necesiten

26

13
9/2/2023

Establezca Relaciones

 Dibuje la relación visualmente


 Identifique la cardinalidad (1-N)
 Entre la tabla de hechos . . . y cada tabla de
dimensión
 “Una Imagen vale más . . .”

27

MODELO ESTRELLA

28

14
9/2/2023

MODELO
COPO DE
NIEVE

29

DATAMART *

 Un Datamart es una base de datos departamental, especializada en el


almacenamiento de los datos de un área de negocio específica.

 Se caracteriza por disponer la estructura óptima de datos para analizar


la información al detalle desde todas las perspectivas que afecten a los
procesos de dicho departamento.

 Un datamart puede ser alimentado desde los datos de un datawarehouse, o


integrar por si mismo un compendio de distintas fuentes de información.

30

15
9/2/2023

MEDIDAS

 Bases (1 sola variable).


 Derivadas (más de una variable).
 Indicadores (medidas derivadas o bases que están dentro de un rango)

31

32

16
9/2/2023

OLTP

33

OLAP

34

17
9/2/2023

35

36

18

También podría gustarte