Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Porque todos los listados y anlisis que se hagan se harn a partir de esta
nica base de datos. En el DWH la informacin est limpia, unificada y
verificada, y gracias a esto todo lo que hagamos despus ser conforme y
preciso. Aunque algunos no compartan la anterior afirmacin, y crea n que se
puede construir un DASHBOARD, o un sistema de REPORTING, a partir de un
DATAMART o unos cubos, estn equivocados si lo que se quiere hacer es algo
coherente con el plan estratgico de la empresa.
Creo una segunda base de datos o trabajo sobre la B.D. del ERP ?
Un DWH es una base de datos con fines analticos. En ese sentido, la propia
base de datos del ERP podra actuar como una especie de DWH ... pero eso casi
nunca es lo habitual ni lo recomendable. Al hablar de DWH se entiende que
hablamos de una rplica de los datos del ERP con una estructura de datos
distinta y en una base de datos distinta.
Para montar ese DWH se puede hacer manualmente usando (T-SQL, PL-SQL,
entre otros) o utilizar alguna de las soluciones ETL existentes (SSIS, etc.). Es
decir:
JERARQUAS
L as t ab la s d e he c ho c on ti en en los i nd i ca do re s n um r i co s pro ve n ie nt es d e
l o s or g en es tra ns acc i on al es .
L as ta b las de d im ens i n co nt i en en lo s a tr i bu tos (n or ma lm en t e t e xt ua le s)
q u e nos pe rm i te n fi lt ra r y a gr up ar l os ind i c ado re s.
Podemos hacer la siguiente asociacin:
o Hechos= tablas de movimientos del ERP,
o Dimensiones= tablas maestras del ERP
En caso de duda:
E v i ta co l oc ar te x to l ar go s ( co mo c om en ta r ios , o no mb re s d e c iu da de s o
p er so nas ) en l as tab la s d e h e ch o. E s to s ca mp os o cu pa ra n un e spa c io
p re c io so de nu es t ra s t ab la s d e h e ch os , qu e p ue de n t ene r c ie nt os de
m i l lo ne s de re g is tro s, y q ue p or lo t an to o c up ar an mu ch o es pa c io en
d i s co y l as con su l ta s se r an le n tas p or e l IO g en era do . Hoy en d a , l os
g i ga s so n bar at os , pe ro e l ti em po p ara le e rl os , no.
S i e l da to es co mp ar t ido en tr e v ar ia s t ab la s d e h ec ho , po n lo s i em pre
c o mo una d im en si n . P o r e j em pl o, un m i sm o cl i en te pu ede t en er pe d ido s,
v en ta s, de vo lu c io nes , q ue ja s,
Requisitos del proceso de negocio - Procesos del Negocio (Unidad de anlisis Ej.
clientes, ganancias, ventas, datos de pedido, productos, etc., no son departamentos de
la organizacin Son actividades relacionadas se crea una lista de procesos
candidatos y se ordenan de acuerdo al inters de negocio y debe priorizar los
requisitos) modelos dimensionales (uno o ms modelos dimensionales por proceso
Dos modelos dimensionales no deben redundar los mismos datos).
3. Identifique las entidades y medidas de alto nivel que son comunes en diversos
procesos.
Los requisitos suelen ser difciles de definir. Generalmente, slo despus de ver un
resultado se puede decidir que el resultado cumple (o no) un requisito. Los
requisitos de una organizacin tambin cambian a lo largo del tiempo. Lo que es
vlido un da puede no serlo al da siguiente. A pesar de ello, los requisitos
identificados en este punto se utilizan en el ciclo de desarrollo para crear el
modelo dimensional.
Qu es lo que se analiza?
Cules son los criterios de evaluacin?
Cuando rena los requisitos, debe tratar de comprender el dominio del
problema para el que se realiza el modelado. Generalmente, los requisitos en
esta fase se documentan informalmente y los esquemas no se detallan en su
totalidad. Cuando rena estos requisitos, identifique las siguientes reas de
inters:
Identifique las cuestiones ms importantes que debe tratar el negocio.
Puede asignar valores de importancia a cada cuestin para determinar
las cuestiones ms importantes que se deben abordar.
Determine cmo desea el negocio registrar los datos cuando estos
cambian. Por ejemplo, desear saber cmo gestionar los datos
histricos de los productos que ya no estn disponibles o de los
registros de los empleados.
Cuando identifique los granos de los objetos de datos, realice los pasos siguientes:
El grano que elija determinar el nivel de detalle de la informacin que puede haber
disponible en el modelo dimensional.
Revise la atomicidad (nivel de detalle) del grano para asegurarse de que est en
el nivel de mayor detalle. Esta decisin incluye la consideracin por anticipado de
las necesidades futuras con el fin de minimizar la necesidad de crear un nuevo
diseo cuando cambien los requisitos empresariales.
Por ejemplo, considere una dimensin de fecha que slo tenga un atributo Year.
Como slo hay un atributo, no puede consultar la informacin a nivel trimestral,
mensual o diario. Para maximizar la informacin disponible, elija un grano atmico
detallado. En este ejemplo, puede definir el grano a nivel diario.
El informe de definicin del grano se crea para esta fase. El informe contiene una
o ms definiciones para el grano del proceso de negocio y define el tipo de tabla
de hechos. El informe tambin incluye las dimensiones y medidas preliminares de
alto nivel.
Paso 3: Identificar las dimensiones
Una vez que haya determinado el grano (el detalle) del modelo, se debe identificar las
dimensiones verdaderas para ese grano. Se deben crear columnas, jerarquas y
casos para el esquema de copo de nieve.
Las tablas de dimensiones contienen columnas que describen los registros de hechos
en la tabla de hechos. Algunas de estas columnas proporcionan informacin
descriptiva. Otras columnas especifican cmo se resumen los datos de la tabla de
hechos para proporcionar informacin til. Las tablas de dimensiones contienen
jerarquas que ayudan a resumir los datos. Las tablas de dimensiones son ms
pequeas, tablas de bsqueda desnormalizadas que contienen columnas descriptivas a
las que se hace referencia al definir las consultas.
Para obtener ms informacin sobre las tablas, consulte Tablas y entidades de
dimensiones.
Despus de identificar las dimensiones, rellene las dimensiones con columnas. Utilice
las columnas descriptivas para definir los criterios de restriccin para las consultas.
Utilice una clave sucednea para la clave primaria de una dimensin. No es necesario
que analice la clave sucednea. Para obtener ms informacin sobre las claves
sucedneas, consulte Claves sucedneas.
Cree columnas descriptivas exclusivas en el modelo.
Las columnas de una dimensin reflejan las reas potenciales de inters que se pueden
utilizar para los datos agregados o para crear restricciones y notificar interrupciones.
Defina columnas que puedan contener un valor NULL cuando una columna no se aplica
a un elemento especfico o se desconoce su valor.
Gestin de cdigos
Una vez que haya definido las columnas, puede definir las jerarquas de la dimensin.
Una jerarqua es una serie en cascada de relaciones de muchos a uno. Una jerarqua
contiene distintos niveles, y cada uno corresponde a un atributo de dimensin. Para
obtener ms informacin sobre las jerarquas, consulte Jerarquas.
Dimensin de fecha
Dado que todos los modelos dimensionales se basan en unidades de tiempo, cada
despensa de datos tiene una dimensin de fecha. Por ejemplo, quiz desee medir el
rendimiento del negocio transcurrido un tiempo. Un modelo dimensional puede
contener varias dimensiones de fecha.
La dimensin de fecha generalmente no tiene un sistema de origen OLTP conectado a
la dimensin. Puede desarrollar la dimensin de fecha antes de disear el modelo
dimensional. Para crear una dimensin de fecha, realice los pasos siguientes:
Hay varios atributos de fecha que las funciones de fecha SQL no soportan. Estas
funciones incluyen los perodos fiscales, las vacaciones, las temporadas, los das
de la semana, los fines de semana y las fiestas nacionales. Cuando cree una
dimensin de fecha, puede consultar los indicadores de rendimiento del negocio
a travs de varios atributos fiscales y relacionados con fechas. Los indicadores
de rendimiento no se muestran si utiliza una columna de fecha u hora SQL en la
tabla de hechos.
Es mucho ms fcil arrastrar las columnas desde una tabla de fechas en vez de
utilizar funciones SQL complejas para crear la lgica de los informes.
Dimensin de hora
Horas
Agrupaciones de tiempo especficas de negocio (turnos de maana, de noche o
de ltima hora de la tarde durante los das de la semana)
Tambin debe crear una dimensin de hora si desea representar distintas jerarquas
para el tiempo que va a medir. Por ejemplo, cree distintas jerarquas para el tiempo
estndar y el tiempo militar.
Sin embargo, si no resume ni filtra los grupos de hora del da, exprese la hora como un
hecho en la tabla de hechos. En este caso, el tiempo se considera un simple hecho
numrico en el tipo de datos de indicacin de fecha y hora.
Una dimensin que cambia lentamente es aquella cuyos atributos para un registro
cambian lentamente a lo largo del tiempo. Por ejemplo, es posible que necesite realizar
un seguimiento de las transferencias de empleados en la empresa.
Tipo 0
Tipo 1
Tipo 2
Con este mtodo, se crean dos entradas distintas. El registro original y el nuevo
registro estn disponibles en la tabla. La nueva fila obtiene su propia clave primaria
(clave sucednea).
Tipo 4
Se crean tablas distintas para almacenar algunos o todos los datos histricos. Slo una
tabla contiene los datos actuales, y cuando se producen actualizaciones, los datos
antiguos se desplazan a la tabla histrica.
Tipo 6
Slo debe crear una estructura de copo de nieve en una dimensin de un modelo
dimensional en dos casos:
Durante este paso del ciclo de diseo de modelo dimensional, identificar las medidas
y el tipo de medidas incluidas en el modelo dimensional.
Las medidas de ao a fecha son valores numricos que constan de un total agregado
desde el inicio del ao a la fecha actual. Debe asegurarse de que dichas medidas no se
incluyan en una tabla de hechos con los elementos de lnea de nivel atmico.
Supongamos que una tabla de hechos almacena datos de ventas para el ao 2005. Las
ventas de cada mes son aditivas, y aade las ventas para crear totales de ao a fecha.
Si crea un hecho de ao a fecha, como por ejemplo Sales_$$_Year_To_Date, cuando
consulte este hecho en agosto de 2005 obtendr la suma de todas las ventas hasta
agosto de 2005.
Si es una tabla de hechos basada en sucesos, debe determinar cmo gestionar los
sucesos.
Las tablas de hechos basadas en sucesos se utilizan para registrar sucesos, como las
visitas a pginas web y la asistencia de empleados o alumnos. Los sucesos no siempre
se convierten en medidas. Si gestiona escenarios basados en sucesos en los que no
hay medidas, utilice las tablas de hechos basadas en sucesos que constan de
seudohechos o de hechos sin hechos.
Comprender el negocio
Por ejemplo, supongamos que el negocio de ventas al por menor genera unos
ingresos brutos de 100 millones de dlares americanos. Supongamos tambin
que el precio medio de un elemento de lnea es de 2 dlares americanos. Para
calcular la cantidad de elementos de lnea que necesita, divida los ingresos
brutos por el precio medio de un elemento de lnea:
Nmero de medidas: 8
Supongamos que la tabla de hechos ocupa 4 bytes para una columna ENTEROS, y
calcule el tamao de una sola fila:
(8 + 1 + 8) * 4 bytes = 68 bytes
Calcule el crecimiento mximo de los datos para un solo ao del modelo dimensional: