Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UN CUBO
INTRODUCCIÓN ................................................................................................................................... 3
Modelos y metodologías para el diseño y construcción de Bodegas de Datos (Data Warehouses) .. 3
Metodologías para minería de datos .............................................................................................. 3
FASES PARA EL DISEÑO E IMPLEMENTACIÓN DE CUBOS DE DATOS .................................................. 4
FASE DE COMPRENSIÓN DEL MODELO DE NEGOCIO ......................................................................... 4
Comprensión del modelo de negocio ............................................................................................. 4
FASE DE LEVANTAMIENTO DE REQUERIMIENTOS .............................................................................. 4
FASE DE RECOLECCIÓN DE LOS DATOS: .......................................................................................... 5
Identificación de las fuentes de los datos ................................................................................... 5
Descripción de los datos.............................................................................................................. 5
Exploración de los datos.............................................................................................................. 5
Verificación de la calidad y consistencia de los datos ................................................................. 6
FASE DE PREPARACIÓN DE DATOS ...................................................................................................... 6
FASE DE MODELADO DEL CUBO DE DATOS ........................................................................................ 7
FASE DE IMPLEMENTACIÓN DEL CUBO DE DATOS ............................................................................. 9
FASE DE CONSTRUCCIÓN DEL VISUALIZADOR DEL CUBO DE DATOS................................................ 16
AA4-EV6-BLOG DE GRUPOS DE TRABAJO PARA EL DISEÑO DE UNA BODEGA DE
DATOS Y CONSTRUCCIÓN DE UN CUBO
INTRODUCCIÓN
El diseño y construcción de cubos de datos permite a las organizaciones escalar
progresivamente hacia una arquitectura de almacenamiento con Bodegas de Datos
(Data Warehouse), sobre los que se puede aplicar técnicas de minería de datos con
el fin de extraer conocimiento que permita satisfacer las expectativas de los clientes
y alcanzar los objetivos estratégicos de la organización.
Se identifican los sistemas fuentes que contienen los datos y se extraen para
posteriormente adecuarlos, es importante tener en cuenta que los datos pueden
residir en diversos tipos de sistemas, a continuación mencionamos algunos de los
más típicos dentro de las organizaciones: Hojas de cálculo, Bases de datos,
Archivos estadísticos, Sistemas de información empresarial (ERP, ERP, FRM,
HRM, MRP, SCM) Archivos documentales físicos y digitales.
Se realiza la descripción de los datos extraídos desde los sistemas fuentes con el
fin de establecer sus características y métricas de la siguiente forma:
Descripción cualitativa, Descripción cuantitativa, La información recolectada de los
datos se consigna en un informe denominado “reporte de la descripción de datos
Se procede a explorar los datos que han sido extraídos desde los sistemas fuentes,
con el fin de encontrar una estructura general para los datos “homogeneidad” y de
identificar problemas “datos paralizantes” que puedan ocurrir durante las fases
siguientes.
Verificación de la calidad y consistencia de los datos
CASO PRÁCTICO:
Para realizar la fase de recolección de datos con cada una de sus etapas deberá
tener en cuenta que los datos de la empresa “Adventure Works Cycles” están dentro
del archivo “BaseDatosEjemplo.zip”, allí se encuentra una base de datos relacional
que está construida sobre el sistema manejador de bases de datos SQL Server
2008.
Para la descripción de los datos debe consultar el diccionario de datos de las
siguientes tablas con el fin de identificar los metadatos que contiene cada una de
ellas
CASO PRÁCTICO
En esta fase se deben identificar los campos, metadatos y datos que se requieren
para construir las dimensiones del cubo de datos. Para esto se toman como
referencia las cinco (5) tablas creadas en el SMBD, de la siguiente forma:
Identificados los campos que se requieren para la construcción de cada una de las
dimensiones del cubo, para el caso que se está desarrollando se recomienda
seleccionar el modelo estrella para el diseño del cubo. En el gráfico puede ver el
modelo estrella del cubo de datos construido a partir de la base de datos
“AdventureWorks”.
1. Creación de las dimensiones: Se crean las tablas que corresponden a cada una
de las dimensiones del cubo de datos. Consulte el script SQL
“CrearTablasDimensiones.sql ” y ejecútelo en el SMBD.
2. Llenado de las dimensiones desde las tablas fuentes: Se recuperan los datos
desde los sistemas fuentes del nivel (OLTP), se transforman y se cargan en cada
una de las tablas que conforman las dimensiones del cubo de datos. Consulte el
script SQL “LlenarDimensiones. sql ” y ejecútelo en el SMBD.
3. Construcción de la(s) tabla(s) de hechos del cubo de datos: Se crea la tabla de
hechos del cubo de datos. Consulte el script “CrearTablaHechos.sql ” y ejecútelo en
el SMBD.
4. Llenado de la(s) tabla(s) de hechos del cubo de datos: Se consolidan las métricas
realizando los cálculos sobre los datos multidimensionales y se almacena el
resultado dentro de la tabla de hechos del cubo de datos. Consulte el script SQL
“LlenarTablaHecho.sql ” y ejecútelo en el SMBD.
FASE DE CONSTRUCCIÓN DEL VISUALIZADOR DEL CUBO DE DATOS
La fase de construcción del visualizador del cubo de datos puede ser abordada de
las siguientes formas:
•Construcción una vista en la base de datos
•Desarrollo de una aplicación en un lenguaje de programación específico
•Utilización de una herramienta de uso específico existente
•Creación del visualizador en una herramienta de uso general como una hoja de
cálculo.
CASO PRÁCTICO:
En esta fase final se debe crear una consulta sobre las dimensiones del cubo de
datos de manera que proporcione algunos elementos claves que permitan
interpretar más fácilmente los datos arrojados por la tabla de hechos. Siga los
siguientes pasos:
1. Construir la tabla visualizador en donde se almacena el resultado de la consulta.
Revise el script “visualizador.sql ” y ejecútelo en el SMBD.
Creamos la tabla del vistalizador
2. Desde la base de datos “cubo”, exportar a un archivo de texto plano los datos que
contiene la tabla de nombre “visualizador”. Para este caso específico puede
consultar el archivo “dataVisualizador.txt ” que contiene 121.288 registros, que son
el resultado que debe dar la exportación de datos si se han realizado los pasos
correctamente.
3. Para finalizar debe cargar el archivo exportado, “dataVisualizador. txt”, a una hoja
de cálculo con el fin de generar una tabla dinámica que permita consultar el cubo
de datos. El resultado de este procedimiento puede consultarse en el archivo
“visualizadorCubo.xlsx ”.