Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejemplo Didactico DataMart
Ejemplo Didactico DataMart
Ventas
Ejemplo
La utilización de las técnicas de inteligencia de negocios (business
intelligence BI), sirven como apoyo a los gerentes y operadores del
conocimiento en la toma de decisiones. Su principal objetivo es encontrar
en grandes volúmenes de datos, información que pueda ser relevante para
los procesos que se realizan en la empresa; debido a que facilita el análisis
de la información en distintos niveles y además permite encontrar
relaciones entre tales datos.
Dentro de estas tecnologías se encuentran las bodegas de datos (Data
Warehouse, y en pequeña escala el Data Mart), las cuales se definen como
bases de datos que contienen datos consolidados con los que se pueden
generar análisis. Su materia prima son las bases de datos transaccionales (y
otras fuentes de datos como Excel, archivos planos entre otros) que tiene la
empresa.
Este documento presenta un análisis y un diseño para un Data Mart
académico dirigido a una tienda de ropa “La universal”, el cual tiene como
propósito proporcionar una herramienta que le permita tomar decisiones de
diversas variables en diversos contextos (históricos, geográficos entre otros).
“La Universal” es una empresa líder en una amplia gama de productos de limpieza, cocina, cuidado personal, cuidado de ropa y de rop
Descripción de la
empresa
“La Universal” es una empresa líder en una amplia gama de productos
de limpieza, cocina, cuidado personal, cuidado de ropa y de ropa en general.
“La universal” comercializa productos de diversas marcas principalmente
en varios departamentos de Colombia. La empresa lleva en el mercado 15 años
Sistema transaccional
actual
Alcance
Cada dimensión esta conformada por diversos niveles que permiten ver la
información
en forma general o en forma mas detallada
Los niveles para cada dimensión son los siguientes
(Comenzando por el nivel más alto):
Geografia Tiempo
Dimensión Geografía
En este nivel, las ventas se analizarian a diferente nivel o jerarquia:
- A un nivel mas general, es decir las ventas totales de toda la empresa
- A niveles mas detallados como:las ventas por cada departamento
- Mas minuciosamente por cada departamento el valor total de las ventas por cada
una de las ciudades que la conforma
- muchisimo mas detallado por cada una de las sucursales existentes en cada
ciudad.
Total 70.000.000
Dpto Antioquia 50.000.000
Ciudad Medellín 40.000.000
Sucursal Colombia 25.000.000
Laureles 15.000.000
Ciudad Itagui 10.000.000
Sucursal Calatrava 7.000.000
Santamaría 3.000.000
Dpto Valle 20.000.000
Ciudad Cali 20.000.000
Sucursal Juanchito 15.000.000
Dimensión Tiempo
Igualmente se desea analizar la información a través del tiempo lo cual significa
alcanzar una jerarquia en la que se observaria las ventas totales o discriminadas
por ano o en forma mas detallada por mes o por día.
Total 70.000.000
Ano 2004 20.000.000
Enero 5.000.0000
.
.
Noviembre 1.000.000
Ano 2005 50.000.000
Enero 2.000.000
Noviembre 3.000.000
Dimensión Producto
Por producto se desea analizar los diferentes tipos de productos y dentro
de los tipos la marca de cada uno de ellos
Total 70.000.000
Ropa 30.000.000.
Arquitect 10.000.000
Camisa 3.000.000
Camiseta 5.000.000
Pantalón 2.000.000
Leonisa 15.000.000
Get 5.000.000
Limpieza 20.000.000
Fab 7.000.000
Jabon 5.000.000
Detergente 2.000.000
Limpieza
Personal 20.000.000
Dimensión producto
El modelo estrella esta conformado por una tabla de hechos y las tablas de
tipo dimensión
Las dimensiones están conformadas por los niveles de las dimensiones
identificadas anteriormente.
La tabla de hechos contiene las medidas que se desean analizar en este caso se
analizaran las ventas en pesos a través de toda la geografía nacional, a través de
todo el tiempo y los diferentes productos que ofrece la empresa.
Modelo Estrella
Geografía: Contiene la información de todas las sucursales en las que se
encuentra ubicada la empresa distribuidas a través de todas las ciudades y
los departamentos del país, esto con el fin de poder analizar las ventas en
todos estos niveles
Tiempo: Corresponde a los datos de los diferentes anos, meses y días en
que la empresa ha estado laborando, lo cual permite obtener información
importante sobre las ventas realizadas a través de los años, en forma
histórica, además de realizar comparativos
Columna Tipo
IdGeografia Int
Sucursal Varchar(50) Nombre de la Tabla: tmpSucursal
Ciudad Varchar(50)
Dpto Varchar(20) Columna Tipo Calculada Long
[idSucursal] Int
[strNomSucursal varchar 100
IdCiudad Int 100
TMPCiudad.[IdDptol] = [TMPDpto].[IdDpto]
Filtros
SELECT tmpSucursal.idSucursal,
tmpSucursal.strNomSucursal,
tmpCiudad.strNomCiudad,
tmpDpto.strNomDpto
FROM tmpSucursal, tmpCiudad, tmpDpto
WHERE tmpCiudad.idCiudad = tmpSucursal.IdCiudad AND
tmpCiudad.idDpto = tmpDpto.IdDpto
Carga de datos
Instrucción insert para hacer una inserción
masiva de todas las sucursales existentes
con su respectiva ciudad y departamento en
la tabla de geografía.
Insert into Geografia_Dim
(idSucursal,strNomSucursal,strNomCiudad,st
rNomDpto)
SELECT tmpSucursal.idSucursal, Tablas
tmpSucursal.strNomSucursal, temporales
tmpCiudad.strNomCiudad,
tmpDpto.strNomDpto
FROM tmpSucursal, tmpCiudad,
tmpDpto
WHERE tmpCiudad.idCiudad =
tmpSucursal.IdCiudad AND
tmpCiudad.idDpto =tmpDpto.IdDpto
Producto cartesiano
Producto cartesiano.
Consiste en una nueva tabla formada por las filas que resulten de todas
las combinaciones posibles de las filas de la primera tabla con todas las
filas de la segunda tabla. El número de filas resultante es el producto de
la multiplicación de todas las filas de la primera tabla por la segunda. Por
esta razón es imprescindible adicionar un filtro que corresponda con el
vínculo que existe entre las tablas, de otra forma los resultados no
serían
coherentes con la información.
Producto cartesiano
UPDATE Geografia_Dim
SET IdSucursal = tmpSucursal.idSucursal,
strNomSucursal = tmpSucursal.strNomSucursal,
strNomCiudad =tmpCiudad.strNomCiudad,
strNomDpto =tmpDpto.strNomDpto
FROM tmpSucursal, tmpCiudad, tmpDpto,Geografía_Dim
WHERE tmpCiudad.idCiudad = tmpSucursal.IdCiudad AND
tmpCiudad.idDpto = tmpDpto.IdDpto AND
tmpSucursal.idSucursal = Geografia_Dim.IdSucursal
Combinaciones externas
Las sucursales nuevas serían aquellas que con el left join dan null en Geografia_Dim
específicamente en el campo id_Sucursal
Consultas sumarizadas