Está en la página 1de 31

DISEÑO DE UNA BODGEA DE DATOS Y CONSTRUCCION DE UN CUBO

PRESENTADO POR:

ALDAMIR JOSÉ AVILA BENAVIDES


ORFA MARTINEZ CORREO
MELBYS LEONOR GARCIA GUTIERREZ

PRESENTADO A:

ING. EWIN MAURICIO ORTIZ LOPEZ

SERVICIO NACIONAL DE APRENDIZAJE SENA


ESPECIALIZACIÓN EN GESTION Y SEGURIDAD EN BASES DE DATOS
MODALIDAD VIRTUAL
2019
INTRODUCCIÓN
Como parte del proceso de crecimiento de una empresa con infraestructura
informática y manejando un gran volumen de datos, las empresas encuentran la
necesidad de consolidar sus datos y encuentran el desafío de construir su propia
bodega de datos, consolidar los datos desde diferentes fuentes en un solo
repositorio.
Las bodegas de datos como fuente de los cubos multidimensionales que son usados
para obtener la información necesaria que puede ser consultada y analizada para
la toma de decisiones del negocio.
La implementación de una bodega de datos puede llegar a ser compleja para las
empresas con escasa experiencia en manejo de datos, es decir sus bases de datos
están dispersas y solo son consultadas para realizar tareas básicas como
inventarios. Para nuestro caso de estudio vamos a construir una bodega de datos
para la Alcaldía de San Antonio del SENA, que se encuentra conformada por
diferentes dependencias, las cuales necesitan relacionarse entre sí a través de sus
diferentes bases de datos con el fin de tomar decisiones más seguras, oportunas,
rápidas que ayuden a consolidar el cumplimiento de sus funciones.
FORMULACIÓN DEL PROBLEMA
¿Cómo ayudar de forma clara a desarrollar una bodega de datos para la Alcaldía
de San Antonio del SENA?

JUSTIFICACIÓN
La importancia de contar con una guía general de implementación de una bodega
de datos, radica en los tiempos de implementación del modelo y en los estándares
de documentación que se generan como proceso para la construcción de los cubos
multidimensionales que aporten valor agregado a la organización.

OBJETIVOS
 Diseñar la implementación y construcción de un Bodega de datos y cubo de
datos para la Alcaldía de San Antonio del SENA.

Objetivos específicos
 Llevar a cabo el levantamiento y análisis planteado el caso de estudio.
 Integrar los componentes elementales involucrados en la solución.
 Identificar las herramientas para generar los cubos multidimensionales.
MARCO TEORICO
¿QUE ES UNA BODEGA DE DATOS?
Una bodega de datos es una herramienta empresarial utilizada como una solución
informática que consolida los datos de diferentes fuentes de una entidad, institución
o negocio ya sean de bases de datos, archivos planos o de otros sistemas del
negocio, extrayéndolos, transformarlos en el caso de ser necesario y almacenarlos
en un solo repositorio. El objetivo de la bodega de datos es soportar la toma de
decisiones en un negocio y centralizar los datos, interpretarlos y darle un valor
agregado para beneficio del negocio, ofreciendo un fácil acceso y visualización para
su análisis por parte de los usuarios. La bodega de datos es un almacén de los
datos que han sido extraídos y transformados, y están separados físicamente del
origen donde provienen los datos. Una bodega de datos es una copia de los datos
de las bases de operaciones del negocio que está estructurado específicamente
para la consulta y el análisis. Las bodegas de datos pueden estar integrados por
Datamarts, que es son subconjuntos de datos específicos de una dependencia del
negocio. Los Datamarts deben ser consistentes en la representación de los datos
para asegurar robustez.

Archivos

planos

Cubos
T
Base de E R Data
X A
Datos 1 Mart
T N
R S Reporte
A F BODEGA DE
Data
C O
Base de
C
DATOS Mart
R
Datos 2 I M
O A
N CI Data
Ó Mart
Otra N
Figura 1. Arquitectura de una bodega de datos
fuente
La arquitectura de la bodega de datos se basa en aplicar un proceso de extracción,
transformación y carga más conocido como proceso ETL (Extract, Tranform and
Load), por medio de este proceso se cargan los datos en una bodega de datos por
medio de las siguientes operaciones:

 Extracción: Obtener los datos necesarios que están almacenados desde


diferentes fuentes externas a la bodega de datos

 Transformación: Cualquier tarea realizada para limpiar o transformar los


datos para que se puedan cargar en la bodega. Los datos al ser extraídos
desde diferentes fuentes, pueden tener diferentes formatos y ser poco
integrales.
 Carga: Es el almacenamiento de los datos en la bodega de datos.

Las bodegas de datos pueden ser consultadas por medias herramientas de consulta
y análisis como los cubos multidimensionales, reportes, soluciones web.
Las bodegas de datos deben cumplir con estas características:
 Utiliza solo los datos necesarios: no se extraen de las fuentes los datos
que no se puedan analizar o sean requeridos.
 Integrado: Los datos deben ser consistentes, en formato, atributos. En el
caso de que los datos no sean consistentes, se deben transformar los datos
para cumplir esta característica.
 Historia: la información en la bodega debe incluir datos históricos para
poderse usar en la identificación y análisis de tendencias.
 Los datos no se eliminan o modifican, solo se deben hacer dos operaciones
únicas en la bodega: la carga de los datos y su consulta.

MODELADO DIMENSIONAL
El modelado dimensional es un diseño lógico que presenta la información de una
manera estándar, sencilla y sobre todo intuitiva para los usuarios del negocio. El
modelo dimensional está conformado por una tabla de hechos (Fact) y tablas de
dimensión. En este documento se va a usar el modelo de estrella tiene una tabla de
hechos con varias llaves foráneas que se relacionan con cada una de las llaves
primarias de las tablas de dimensión.
Figura 2. Modelado estrella. Secretaria Recreación y Deportes.

La tabla de dimensión contiene atributos que determinan los parámetros de lo que


dependen las medidas en la tabla de hechos.
La tabla de hechos contiene las medidas de negocio mediante la intersección de
dimensiones, por lo general son numéricas y son usadas para el análisis. Un
ejemplo de medida es la cantidad de personas que participaron en un evento y a
que institución pertenecen.

MODELO MULTIDIMENSIONAL
Este modelo está diseñado para permitir el almacenamiento y la recuperación
eficiente de grandes volúmenes de datos relacionados, vistos y analizados desde
diferentes perspectivas (dimensiones). Ofrece una mejor comprensión de los datos
y proporciona un mejor rendimiento para consultas complejas de análisis. Es una
matriz de n-dimensiones. En el modelo se representa el hecho que es objeto de
análisis y las dimensiones que caracterizan la actividad y la información relevante
sobre el hecho se representa por un conjunto de medidas. Las bodegas de datos
se basan en un modelo multidimensional.

OLTP (On-Line Transactional Processing)


Son bases de datos orientadas al procesamiento de transacciones. Una transacción
genera un proceso atómico y que puede involucrar operaciones de inserción,
modificación y borrado de datos. El proceso transaccional es típico de las bases de
datos operacionales. El acceso a los datos está optimizado para tareas frecuentes
de lectura y escritura, por ejemplo, la enorme cantidad de transacciones que tienen
que soportar las bases de datos de bancos o hipermercados diariamente. Los datos
se estructuran según el nivel aplicación como programa de gestión a medida, ERP
o CRM implantado, sistema de información departamental. Los formatos de los
datos no son necesariamente uniformes en los diferentes departamentos es común
la falta de compatibilidad y la existencia de islas de datos. El historial de datos suele
limitarse a los datos actuales o recientes.
OLAP
Son bases de datos orientadas al procesamiento analítico. Este análisis implica
generalmente la lectura de grandes cantidades de datos para llegar a extraer algún
tipo de información útil: tendencias de ventas, patrones de comportamiento de los
consumidores, elaboración de informes complejos… etc. Este sistema es típico de
los Datamarts.
El acceso a los datos suele ser de sólo lectura. La acción más común es la consulta.
Los datos se estructuran según las áreas de negocio, y los formatos de los datos
están integrados de manera uniforme en toda la organización. El historial de datos
es a largo plazo, normalmente de dos a cinco años. Se suelen alimentar de
información procedente de los sistemas operacionales existentes, mediante un
proceso de extracción, transformación y carga (ETL).

CUBOS MULTIDIMENSIONALES
Los cubos OLAP es un modelo multidimensional de datos, que simplifica y facilita a
los usuarios realizar consultas complejas, arreglar datos en un reporte, cambiar la
vista de datos de datos resumidos a datos detallados.
Los Cubos OLAP son vectores o pequeños almacenes de datos en los cuales se
dispone la información y permite un análisis rápido de los datos y convertirla en
información valiosa para la toma de decisiones.
Imagen 1. Cubo multidimensional

MARCO CONCEPTUAL
La Metodología que se va a utilizar para esta guía es la metodología Kimball, esta
es una metodología empleada para la construcción de bodegas de datos. La
metodología se basa en lo que Kimball denomina Ciclo de Vida Dimensional del
Negocio. Este ciclo de vida del proyecto de DWH, está basado en cuatro principios
básicos:
 Centrarse en el negocio.
 Construir una infraestructura de información adecuada.
 Realizar entregas en incrementos significativos.
 Ofrecer la solución completa proporcionando los elementos necesarios para.
 entregar valor a los usuarios del negocio
 entregar valor a los usuarios del negocio
Imagen 2. Ciclo de vida metodología de Kimball

DESARROLLO DEL PROYECTO


Para la construcción de una bodega de datos debemos cumplir unos requisitos
respecto a las herramientas de software y hardware que usaremos para el desarrollo
de esta actividad:
HERRAMIENTAS DE HARDWARE
La herramienta de hardware que se requiere es un servidor para el almacenamiento
y manejo de la base de datos corporativa; se recomienda que este servidor sea
altamente escalable, puede que algunas veces el proyecto de construcción de la
bodega presente algún redimensionamiento a medida que se avanza en la
implementación. La capacidad inicial de almacenamiento estará determinada por
los requerimientos de información histórica presentados por la empresa y por la
perspectiva de crecimiento que se tenga.

HERRAMIENTAS DE SOFTWARE
Las herramientas de software que necesitamos para la construcción de la bodega
de datos se clasifican en cuatro categorías básicas:
Herramientas de Almacenamiento: corresponde a las herramientas en la cual se
irán a almacenar los datos. Existen muchas opciones dependiendo del volumen de
los datos, presupuesto y capacidad del sistema. Cada uno de los sistemas de
administración de bases de datos, como Oracle, SQL Server, Postgresql, DB2,
Informix, TeraData, Sybase.
Herramientas de Extracción y Colección: Ayudan a realizar el proceso de
extracción, transformación y carga de los datos de los sistemas transaccionales de
la empresa a la bodega de datos. Algunas de estas herramientas son:
 Informática - Power Center
 SAP – Business Objects Data Integrator
 IBM - Cognos Data Manager
 Microsoft - SQL Server Integration Services
 Oracle - Data Integrator
 SAS - Data Integration Studio
La mayoría de esas herramientas son utilizadas por el personal interno de las
organizaciones dado el gran conocimiento que tienen de los sistemas
transaccionales.
Herramientas para Elaboración de Reportes: Son las herramientas que
construyen la interface vista por el usuario final. Al usuario se le debe proveer un
mecanismo para que vea los datos a un alto nivel y que obtenga con ellos la solución
a preguntas específicas del negocio. Existen muchas herramientas orientadas a
reportes como: Cognos Powerplay, Business Objects, SAS Enterprice, etc. En esta
guía no vamos a profundizar en estas herramientas.
Herramientas para Construcción de cubos Multidimensionales: Son las
herramientas donde se establecen las dimensiones y medidas que van a ser usadas
en el cubo y se genera el cubo para la consulta. Algunas de las herramientas
orientadas a la construcción de cubos multidimensionales son: Cognos Powerplay
Transformer, Microsoft Analysis Service, Orale Analytic Workspace Manager 11g.

PLANIFICACIÓN DEL PROYECTO


Siguiendo con la guía y aplicando la metodología de Kimball iniciamos con
Planificación del Proyecto donde determinamos la construcción de la bodega de
datos del área de ventas. Se deben determinar unas acciones para la planificación
del proyecto:
 El alcance, en nuestro caso nuestro alcance es el área de ventas de una
empresa, la construcción de la bodega de datos y el diseño de los cubos
multidimensionales.
 Identificar las tareas que se van a desarrollar en la construcción de la bodega
de datos. Las tareas que identificamos en la guía son:
- Especificar de manera clara y precisa de las funciones que se esperan
obtener de la bodega de datos.
- Definir el modelo lógico de datos para la bodega de datos.
-Definir los procedimientos de conexión con las fuentes de datos y a la
bodega de datos.
-Determinar el formato de los datos que se almacenaran en la bodega de
datos.
-Definir los modelos físicos obtenidos de los modelos lógicos.
-Generar los diseños para programas y procesos que se requieran para el
área de ventas a nivel de datos como de aplicación.
-Diseño de la bodega de datos.
-Construir los programas que realicen el proceso de ETL para alimentar la
bodega.
-Montaje de la bodega de datos, instalación, puesta en marcha y utilización
de la bodega de datos.
-Definir las herramientas de acceso del usuario final.
- Diseñar los cubos multidimensionales.
- Generar los cubos multidimensionales.
 Programar las tareas para limitar el tiempo de la implementación y poder
hacer un seguimiento del estado de la construcción de la bodega.
 Planificar los tiempos de los recursos que se usaran para desarrollar las
tareas que se identificaron, crear un cronograma con los tiempos para hacer
seguimiento de la construcción de la bodega y ayudando a tener un estado
de la construcción para identificar si se están cumpliendo con los tiempos
establecidos. Se deben evitar tiempos muertos de los recursos, en el caso
de ser necesario cuando ya se inició la construcción de la bodega y se
presenta un inconveniente, se debe identificar tareas adicionales que puedan
impactar en el desarrollo, adicionarlo al cronograma con su respectivo
tiempo.
 Asignar la carga de trabajo a los recursos apoyándose en los tiempos
identificados en el punto anterior.
 Elaboración de un documento final que representa un plan del proyecto,
donde se incluyen los puntos anteriores, este documento debe ser muy
específico para que el equipo que va a construir la bodega de datos tenga el
mismo enfoque, conocimiento de las tareas, tiempos para cada tarea y se
eviten malinterpretaciones que se pueda ver reflejado en una mala
implementación y/o tareas que tomen más tiempo de lo planeado.
Se debe definir cómo se va a realizar la administración con las siguientes
actividades:
 Monitoreo del estado de las tareas y su desarrollo dentro de los tiempos
establecidos.
 Rastreo e identificación de problemas.
 Definir un canal de comunicación entre la empresa y las áreas de TI
ayudando a una fácil comunicación y apoyo cooperativo.
DEFINICIÓN DE REQUERIMIENTOS DEL NEGOCIO
Para nuestro objeto de estudio en esta actividad solo vamos a trabajar con la base
de datos de la secretaria recreación y deportes y la base de datos de la secretaria
de salud. Dicho esto, a continuación, describimos la contextualización del problema
que se presenta en la alcaldía de San Antonio del SENA:
Debido a los problemas de fidelidad en los datos suministrados por cada una de las
secretarías el mes anterior, los informes derivados de éstos y presentados por el
Señor Alcalde en el último Consejo de Gobierno, no brindaron un nivel de confianza
aceptable y dejaron en evidencia la necesidad inmediata de implementar soluciones
con el fin de obtener datos precisos y confiables que soporten los nuevos proyectos.
Consiente de esta necesidad, el Alcalde y su equipo de asesores considera hacer
lo necesario para disponer en el próximo consejo de gobierno de información
coherente que les permita visualizar en forma clara y precisa la relación entre los
acontecimientos registrados por las diferentes secretarías. De esta forma el Alcalde
podrá tomar mejores decisiones con respecto a su plan de gobierno.
Para este proyecto, el Señor Alcalde ha asignado al Administrador de Bases de
Datos y a su equipo de trabajo.

REQUERIMIENTOS DE LA INTELIGENCIA DE NEGOCIOS


1. Analizar mes a mes la relación directa entre las personas que han participado en
los eventos deportivos y las atenciones que especialistas realizaron a esas mismas
personas a través de consultas en las EPS’s.
2. Determinar si hay relación entre quienes asisten a un evento de la secretaría de
recreación y deportes y quienes son atendidos en unidades de urgencias. Se debe
tener en cuenta: el mes, el rango de edad y el tipo de evento realizado.
3. Verificar si existe una correlación entre las personas atendidas por tipo de servicio
psiquiatría y personas que se hayan visto involucradas en una contravención.
4. Identificar si hay alguna relación entre los datos registrados mes a mes por la
Secretaría de Ambiente, con los datos de consultas médicas generadas en cada
uno de los meses.
5. Desde la consulta a los datos de inspecciones de la secretaría de Hacienda y los
datos de la secretaría de Gobierno, establecer si existen registros de personas
morosas que hayan sido detenidas por hechos que alteran el orden público.
6. Identificar el número de propietarios de predios que han sido demandados por
temas relacionados con la propiedad horizontal.
7. Precisar las personas que presentaron mora en el pago de impuestos y posterior
a dicha mora fueron atendidos por unidad de urgencias, por cuidados intensivos,
especialista o psiquiatría.
8. Determinar si la variación del número de eventos realizados por la secretaría de
recreación y deporte está correlacionada con la variación del número de
contravenciones por: alicoramiento en vía pública, riña callejera, desorden en la vía
pública o pelea familiar (teniendo en cuenta el tipo de evento).

MODELADO DIMENSIONAL Y DISEÑO FISICO DE LA BASE DE DATOS


En base a nuestro modelo multidimensional vamos a generar un modelo físico, con
los nombres de las tablas, campos y tipo de dato:

Figura 3. Secretaria de Recreación y Deporte – Modelo E-R.


Figura 4. Secretaria de Salud – Modelo E-R.
DISEÑO E IMPLEMENTACIÓN DEL SUBSISTEMA DE EXTRACCIÓN,
TRANSFORMACIÓN Y CARGA (ETL)
En esta parte de la actividad vamos a enfocarnos en el subsistema de Extracción,
Transformación y Carga (ETL) que es la base sobre la cual se alimenta la bodega
de datos. Vamos a diseñar un ETL básico teniendo en cuenta que tendremos
distintas fuentes de datos, con distintos tipos de datos:

Archivos planos xls

EXTRACCION TRANSFORMACION CARGA


Participante
-Evento - Conexión
--Tipo
nativa
Base de datos Limpieza de
ASCII/OLEDB
Entrega de
Sec. Recreación datos
Estandarizar datos a las
Institución datos respectivas
Conexión Staging BODEGA DE
tablas en la
nativa SQL Area - Crear datos bodega de
Base de datos calculados DATOS
datos
Sec. Salud

Conexión

nativa SQL
Persona

Eps

HistorialPersona

EstadoEps

Diseño ETL Secretaria recreación y Deportes – Secretaria Salud

Dependiendo de la herramienta ETL que se vaya a utilizar se debe crear las


conexiones a las distintas fuentes de los datos, como en nuestro caso a los archivos
planos, a la base de datos Sec. Recreación y Deportes con la información de sus
distintas entidades y a la base datos Sec. Salud. Se debe tener en cuenta que los
orígenes de datos no pueden ser los mismos que los que necesite su empresa y se
debería ajustar a sus necesidades.
Los campos que se van a extraer de cada fuente son:
Secretaria de Recreación y Deportes
Base de datos

Tabla Evento
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
CODEVE NUMBER No 1
NOMEVE VARCHAR2(60 BYTE) No 2
CODTIPO NUMBER No 3
FECHINI DATE No 4
FECHFIN DATE No 5

Tabla Institución
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
CODINS NUMBER No 1
NOMINS VARCHAR2(30 BYTE) No 2
DIRINS VARCHAR2(30 BYTE) No 3
TELINS VARCHAR2(15 BYTE) No 4

Institución_Evento
COLUMN_NAME
DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
CODSEC NUMBER No 1
CODEVE NUMBER No 2
CODINS NUMBER No 3

Tabla Participante
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
CODPAR NUMBER No 1
NOMPAR VARCHAR2(30 BYTE) No 2
APEPAR VARCHAR2(30 BYTE) No 3
IDPAR VARCHAR2(30 BYTE) No 4
EDADPAR NUMBER(38,0) No 5
FOTOPAR BLOB Yes 6

Tabla Participante_evento
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
CODSEC NUMBER No 1
CODEVE NUMBER No 2
CODPAR NUMBER No 3
VALINS NUMBER(19,4)Yes 4

Tabla Tipo
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
CODTIPO NUMBER No 1
NOMTIPO VARCHAR2(30 BYTE) No 2
Secretaria de Salud

Base de datos

Tabla Eps
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
IDEPS NUMBER No 1
NOMBRE VARCHAR2(4000 BYTE) No 2
ESTADOEPS NUMBER No 3

Tabla Estado_Eps
COLUMN_NAME
DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
IDESTADOEPS
NUMBER No 1
DESCRIPCION
VARCHAR2(4000 BYTE) No 2

Tabla Estado_Persona
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
IDESTADOPERSONA
NUMBER No 1
DESCRIPCION VARCHAR2(4000 BYTE)No 2
Tabla Historial_Persona
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
IDHISTORIALPERSONA
NUMBER No 1
IDPERSONA NUMBER No 2
FECHAINGRESO DATE No 3
FECHARETIRO DATE Yes 4
ESTADOPERSONA CHAR(1 BYTE) No 5
IDEPS NUMBER No 6
TIPOAFILIADO NUMBER No 7

Tabla Persona
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
IDPERSONA NUMBER No 1
TIPOIDENTIFICACION
NUMBER No 2
NOMBRE VARCHAR2(4000 BYTE) No 3
APELLIDO VARCHAR2(4000 BYTE) No 4
FECHANACIMIENTO DATE No 5
SEXO CHAR(1 BYTE) No 6

Tabla Servico_Eps
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
IDEPS NUMBER No 1
IDTIPOSERVICIO NUMBER No 2
ESTADO VARCHAR2(4000 BYTE) No 3
VALOR NUMBER No 4
DETALLE VARCHAR2(4000 BYTE) Yes 5

Tabla Tipo_Afiliado
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
IDTIPOAFILIADO NUMBER No 1
DESCRIPCION VARCHAR2(4000 BYTE) No 2

Tabla Tipo_Identificación
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
IDTIPOIDENTIFICACION
NUMBER No 1
ABREVIATURA VARCHAR2(4000 BYTE) No 2
DESCRIPCION VARCHAR2(4000 BYTE) Yes 3

Tabla Tipo_Servicio
COLUMN_NAME DATA_TYPE NULLABLE DATA_DEFAULT COLUMN_ID COMMENTS
IDTIPOSERVICIO NUMBER No 1
DESCRIPCION VARCHAR2(4000 BYTE) No 2
Se deben limpiar los datos eliminando caracteres especiales, datos nulos,
convirtiendo los datos de ser necesario y que los datos cumplan con tipo de dato
especificado en el modelo físico. De esta forma aseguramos la calidad de los datos
cuando provienen de distintas fuentes y se almacenan en un solo repositorio.
La tabla de tiempo se puede crear por medio de la herramienta de ETL que se utilice
fijando una fecha inicial y especificando que detalle de la fecha se requiere para
poblar otros campos de la tabla.
Durante el desarrollo de la bodega de datos es muy seguro requerir de una Staging
Area, esta es un área intermedia de almacenamiento de datos utilizada para el
procesamiento de los mismos durante procesos de ETL. En el caso de que una
extracción requiera más de una iteración y/o crear campos calculados a partir de
campos de diferentes fuentes.
Finalmente se cargan los datos en la bodega de datos en las tablas especificadas
en el modelo físico. Ya se puede contar los datos almacenados en un solo
repositorio, de calidad y consistentes.

SCRIPT DE CONSTRUCCIÓN DE LOS CUBOS DE DATOS DE ACUERDO CON


EL CASO DE ESTUDIO

Script Secretaria Recreación y Deportes


SELECT * FROM PARTICIPANTE, PARTICIPANTE_EVENTO, EVENTO
WHERE PARTICIPANTE.CODPAR = PARTICIPANTE_EVENTO.CODPAR AND
PARTICIPANTE_EVENTO.CODEVE = EVENTO.CODEVE
Cubo de Datos
CODPAR NOMPAR APEPAR IDPAR EDADPAR FOTOPAR CODSEC CODEVE CODPAR_1 VALINS CODEVE_1 NOMEVE CODTIPO FECHINI FECHFIN
1 Andres Nieto Alvarez 83232390 33 1 1 1 3000 1 Festival de la canción
9 01/01/12 02/01/12
2 Juan Castro Nieto 83232392 28 2 1 2 3000 1 Festival de la canción
9 01/01/12 02/01/12
3 Lunio Castañeda Silva 80232393 35 3 1 3 3000 1 Festival de la canción
9 01/01/12 02/01/12
4 Pedro Nieto Alvarez 81232190 24 4 1 4 3000 1 Festival de la canción
9 01/01/12 02/01/12
5 Daniel Guzman Ortiz 84232397 27 37 5 5 6500 5 Concurso de Rafting4 15/04/12 17/04/12
5 Daniel Guzman Ortiz 84232397 27 5 1 5 3000 1 Festival de la canción
9 01/01/12 02/01/12
6 Lino Castro Ordoñez 82232391 24 36 5 6 6500 5 Concurso de Rafting4 15/04/12 17/04/12
6 Lino Castro Ordoñez 82232391 24 6 1 6 3000 1 Festival de la canción
9 01/01/12 02/01/12
7 Hernando Moncaleano Vargas 83232244 22 35 5 7 5500 5 Concurso de Rafting4 15/04/12 17/04/12
7 Hernando Moncaleano Vargas 83232244 22 7 1 7 3000 1 Festival de la canción
9 01/01/12 02/01/12
8 Pablo Henriquez Villa 81232396 26 8 1 8 3000 1 Festival de la canción
9 01/01/12 02/01/12
9 Andres Peña Silva 83234397 27 34 5 9 5500 5 Concurso de Rafting4 15/04/12 17/04/12
9 Andres Peña Silva 83234397 27 9 2 9 5000 2 Zonal de Fútbol 1 02/02/12 02/03/12
10 Adan Perez Alvarez 83232333 29 33 5 10 5500 5 Concurso de Rafting4 15/04/12 17/04/12
10 Adan Perez Alvarez 83232333 29 10 2 10 5000 2 Zonal de Fútbol 1 02/02/12 02/03/12
11 Sergio Nieto Vargas 84234394 31 32 5 11 5500 5 Concurso de Rafting4 15/04/12 17/04/12
11 Sergio Nieto Vargas 84234394 31 11 2 11 5000 2 Zonal de Fútbol 1 02/02/12 02/03/12
12 Jose MiguelLlanos Mosquera 83233398 33 31 5 12 5500 5 Concurso de Rafting4 15/04/12 17/04/12
12 Jose MiguelLlanos Mosquera 83233398 33 12 2 12 5000 2 Zonal de Fútbol 1 02/02/12 02/03/12
13 Javier Pinto Ortiz 82222390 20 13 2 13 5000 2 Zonal de Fútbol 1 02/02/12 02/03/12
14 Pedro Castro Nieto 83232399 25 14 2 14 5000 2 Zonal de Fútbol 1 02/02/12 02/03/12
15 Manolo Cardona Prieto 83232380 23 15 2 15 5000 2 Zonal de Fútbol 1 02/02/12 02/03/12
16 Luis Carvajal Silva 83232395 33 16 3 16 6000 3 Exposición de Pintura
5 04/03/12 11/03/12
17 Jairo Osorio Castro 84232390 37 17 3 17 6000 3 Exposición de Pintura
5 04/03/12 11/03/12
18 Leandro Quintero Narvaez 83232330 35 18 3 18 6000 3 Exposición de Pintura
5 04/03/12 11/03/12
19 Marcos Dussan Alvarez 87237390 31 19 3 19 6000 3 Exposición de Pintura
5 04/03/12 11/03/12
20 Diego Polanco Vargas 88232398 30 20 3 20 6000 3 Exposición de Pintura
5 04/03/12 11/03/12
21 Julio Neira Castro 82232290 24 21 3 21 6000 3 Exposición de Pintura
5 04/03/12 11/03/12
22 Manuel Silva Castro 84235390 21 22 3 22 6000 3 Exposición de Pintura
5 04/03/12 11/03/12
23 Rafael Mendieta Alvarez 83237397 20 23 3 23 6000 3 Exposición de Pintura
5 04/03/12 11/03/12
24 Guillermo Cano Soto 81232391 19 24 4 24 4500 4 Encuentro de habilidades
9 11/04/12
artísticas
11/04/12
25 Pastor Luna Ortiz 87238399 22 25 4 25 4500 4 Encuentro de habilidades
9 11/04/12
artísticas
11/04/12
26 James Claros Alvarez 81231391 21 26 4 26 4500 4 Encuentro de habilidades
9 11/04/12
artísticas
11/04/12
27 Carlos Alvarado Silva 84234395 23 27 4 27 4500 4 Encuentro de habilidades
9 11/04/12
artísticas
11/04/12
28 Hernan Rojas Alvarez 86236396 23 28 4 28 4500 4 Encuentro de habilidades
9 11/04/12
artísticas
11/04/12
29 Jose Martinez Rojas 84242390 34 29 4 29 4500 4 Encuentro de habilidades
9 11/04/12
artísticas
11/04/12
30 Miguel Silva Castro 88232390 35 30 5 30 5500 5 Concurso de Rafting4 15/04/12 17/04/12

Script Secretaria Salud


SELECT * FROM SERVICIOEPS, TIPOSERVICIO, EPS
WHERE SERVICIOEPS.IDTIPOSERVICIO = TIPOSERVICIO.IDTIPOSERVICIO
AND SERVICIOEPS.IDEPS = EPS.IDEPS
Cubo de Datos
IDEPS IDTIPOSERVICIO ESTADO VALOR DETALLE IDTIPOSERVICIO_1 DESCRIPCION IDEPS_1 NOMBRE ESTADOEPS
1 1 A 56000 1 Consulta medico general 1 SALUDCOOP 4
1 2 A 28000 2 Consulta especialista 1 SALUDCOOP 4
1 3 I 36000 3 Consulta unidad de urgencias 1 SALUDCOOP 4
1 4 A 156000 4 Consulta externa 1 SALUDCOOP 4
1 5 I 256000 5 Odontologia 1 SALUDCOOP 4
1 6 A 556000 6 Radiologia 1 SALUDCOOP 4
1 7 I 78000 7 Consulta unidad de pediatra 1 SALUDCOOP 4
1 8 A 6000 8 Consulta interna 1 SALUDCOOP 4
1 9 A 76000 9 Unidad de cuidados intensivos 1 SALUDCOOP 4
1 10 I 96000 10 Consulta psiquiatria 1 SALUDCOOP 4
2 1 A 56000 1 Consulta medico general 2 CAFESALUD 1
2 2 A 28000 2 Consulta especialista 2 CAFESALUD 1
2 3 I 36000 3 Consulta unidad de urgencias 2 CAFESALUD 1
2 4 A 156000 4 Consulta externa 2 CAFESALUD 1
2 5 I 256000 5 Odontologia 2 CAFESALUD 1
2 6 A 556000 6 Radiologia 2 CAFESALUD 1
2 7 I 78000 7 Consulta unidad de pediatra 2 CAFESALUD 1
2 8 A 6000 8 Consulta interna 2 CAFESALUD 1
2 9 A 76000 9 Unidad de cuidados intensivos 2 CAFESALUD 1
2 10 I 96000 10 Consulta psiquiatria 2 CAFESALUD 1
3 1 A 56000 1 Consulta medico general 3 NUEVA EPS 1
3 2 A 28000 2 Consulta especialista 3 NUEVA EPS 1
3 3 I 36000 3 Consulta unidad de urgencias 3 NUEVA EPS 1
3 4 A 156000 4 Consulta externa 3 NUEVA EPS 1
3 5 I 256000 5 Odontologia 3 NUEVA EPS 1
3 6 A 556000 6 Radiologia 3 NUEVA EPS 1
3 7 I 78000 7 Consulta unidad de pediatra 3 NUEVA EPS 1
3 8 A 6000 8 Consulta interna 3 NUEVA EPS 1
3 9 A 76000 9 Unidad de cuidados intensivos 3 NUEVA EPS 1
3 10 I 96000 10 Consulta psiquiatria 3 NUEVA EPS 1
4 1 I 56000 1 Consulta medico general 4 ISS 5
4 2 A 28000 2 Consulta especialista 4 ISS 5
4 3 I 36000 3 Consulta unidad de urgencias 4 ISS 5
4 4 I 156000 4 Consulta externa 4 ISS 5
4 5 I 256000 5 Odontologia 4 ISS 5
4 6 I 556000 6 Radiologia 4 ISS 5
4 7 A 78000 7 Consulta unidad de pediatra 4 ISS 5
4 8 A 6000 8 Consulta interna 4 ISS 5
4 9 I 76000 9 Unidad de cuidados intensivos 4 ISS 5
4 10 I 96000 10 Consulta psiquiatria 4 ISS 5
5 1 I 56000 1 Consulta medico general 5 CAPRECOM 4
5 2 A 28000 2 Consulta especialista 5 CAPRECOM 4
5 3 I 36000 3 Consulta unidad de urgencias 5 CAPRECOM 4
5 4 I 156000 4 Consulta externa 5 CAPRECOM 4
5 5 I 256000 5 Odontologia 5 CAPRECOM 4
5 6 I 556000 6 Radiologia 5 CAPRECOM 4
5 7 A 78000 7 Consulta unidad de pediatra 5 CAPRECOM 4
5 8 A 6000 8 Consulta interna 5 CAPRECOM 4
5 9 I 76000 9 Unidad de cuidados intensivos 5 CAPRECOM 4
5 10 I 96000 10 Consulta psiquiatria 5 CAPRECOM 4
6 1 A 56000 1 Consulta medico general 6 COOMEVA 1
6 2 A 28000 2 Consulta especialista 6 COOMEVA 1
6 3 A 36000 3 Consulta unidad de urgencias 6 COOMEVA 1
6 4 I 156000 4 Consulta externa 6 COOMEVA 1
6 5 I 256000 5 Odontologia 6 COOMEVA 1
6 6 A 556000 6 Radiologia 6 COOMEVA 1
10 9 I 76000 9 Unidad de cuidados intensivos 10 FAMISANAR 1
10 10 A 96000 10 Consulta psiquiatria 10 FAMISANAR 1
Estos 2 cubos de datos están diseñados para responder algunas de las preguntas
que se pueden crear a partir de la bodega de datos que tenemos diseñada. No se
debe olvidar que los cubos pueden variar dependiendo del negocio. Como se ha
venido recomendando, en el caso de que la bodega de datos se haya modificado,
se debe tener en cuenta que los cubos también deben ser modificados o ajustados.
Se deben capacitar a los usuarios finales sobre la visualización de estos cubos y su
correcto uso. Recordamos que la comunicación es esencial para enfocar la bodega
de datos y los reportes de usuario final, utilizar las estrategias de retroalimentación
es una buena práctica.

TABLAS DINÁMICAS

Secretaria Recreación y Deporte

Suma de Suma de Suma de


Etiquetas de fila CODSEC CODEVE VALINS
01/01/12 36 8 24000
02/01/12 36 8 24000
Castañeda Silva 3 1 3000

Festival de la canción 3 1 3000


Lunio 3 1 3000
80232393 3 1 3000
Castro Nieto 2 1 3000
Festival de la canción 2 1 3000
Juan 2 1 3000
83232392 2 1 3000
Castro Ordoñez 6 1 3000
Festival de la canción 6 1 3000
Lino 6 1 3000
82232391 6 1 3000
Guzman Ortiz 5 1 3000
Festival de la canción 5 1 3000
Daniel 5 1 3000
84232397 5 1 3000
Henriquez Villa 8 1 3000
Festival de la canción 8 1 3000
Pablo 8 1 3000
81232396 8 1 3000
Moncaleano Vargas 7 1 3000
Festival de la canción 7 1 3000
Hernando 7 1 3000
83232244 7 1 3000
Nieto Alvarez 5 2 6000
Festival de la canción 5 2 6000
Andres 1 1 3000
83232390 1 1 3000
Pedro 4 1 3000
81232190 4 1 3000
02/02/12 84 14 35000
02/03/12 84 14 35000
Cardona Prieto 15 2 5000
Zonal de Fútbol 15 2 5000
Manolo 15 2 5000
83232380 15 2 5000
Castro Nieto 14 2 5000
Zonal de Fútbol 14 2 5000
Pedro 14 2 5000
83232399 14 2 5000
Llanos Mosquera 12 2 5000
Zonal de Fútbol 12 2 5000
Jose Miguel 12 2 5000
83233398 12 2 5000
Nieto Vargas 11 2 5000
Zonal de Fútbol 11 2 5000
Sergio 11 2 5000
84234394 11 2 5000
Peña Silva 9 2 5000
Zonal de Fútbol 9 2 5000
Andres 9 2 5000
83234397 9 2 5000
Perez Alvarez 10 2 5000
Zonal de Fútbol 10 2 5000
Adan 10 2 5000
83232333 10 2 5000
Pinto Ortiz 13 2 5000
Zonal de Fútbol 13 2 5000
Javier 13 2 5000
82222390 13 2 5000
04/03/12 156 24 48000
11/03/12 156 24 48000
Carvajal Silva 16 3 6000
Exposición de Pintura 16 3 6000
Luis 16 3 6000
83232395 16 3 6000
Dussan Alvarez 19 3 6000
Exposición de Pintura 19 3 6000
Marcos 19 3 6000
87237390 19 3 6000
Mendieta Alvarez 23 3 6000
Exposición de Pintura 23 3 6000
Rafael 23 3 6000
83237397 23 3 6000
Neira Castro 21 3 6000
Exposición de Pintura 21 3 6000
Julio 21 3 6000
82232290 21 3 6000
Osorio Castro 17 3 6000
Exposición de Pintura 17 3 6000
Jairo 17 3 6000
84232390 17 3 6000
Polanco Vargas 20 3 6000
Exposición de Pintura 20 3 6000
Diego 20 3 6000
88232398 20 3 6000
Quintero Narvaez 18 3 6000
Exposición de Pintura 18 3 6000
Leandro 18 3 6000
83232330 18 3 6000
Silva Castro 22 3 6000
Exposición de Pintura 22 3 6000
Manuel 22 3 6000
84235390 22 3 6000
11/04/12 159 24 27000
11/04/12 159 24 27000
Alvarado Silva 27 4 4500
Encuentro de habilidades artísticas 27 4 4500
Carlos 27 4 4500
84234395 27 4 4500
Cano Soto 24 4 4500
Encuentro de habilidades artísticas 24 4 4500
Guillermo 24 4 4500
81232391 24 4 4500
Claros Alvarez 26 4 4500
Encuentro de habilidades artísticas 26 4 4500
James 26 4 4500
81231391 26 4 4500
Luna Ortiz 25 4 4500
Encuentro de habilidades artísticas 25 4 4500
Pastor 25 4 4500
87238399 25 4 4500
Martinez Rojas 29 4 4500
Encuentro de habilidades artísticas 29 4 4500
Jose 29 4 4500
84242390 29 4 4500
Rojas Alvarez 28 4 4500
Encuentro de habilidades artísticas 28 4 4500
Hernan 28 4 4500
86236396 28 4 4500
15/04/12 268 40 46000
17/04/12 268 40 46000
Castro Ordoñez 36 5 6500
Concurso de Rafting 36 5 6500
Lino 36 5 6500
82232391 36 5 6500
Guzman Ortiz 37 5 6500
Concurso de Rafting 37 5 6500
Daniel 37 5 6500
84232397 37 5 6500
Llanos Mosquera 31 5 5500
Concurso de Rafting 31 5 5500
Jose Miguel 31 5 5500
83233398 31 5 5500
Moncaleano Vargas 35 5 5500
Concurso de Rafting 35 5 5500
Hernando 35 5 5500
83232244 35 5 5500
Nieto Vargas 32 5 5500
Concurso de Rafting 32 5 5500
Sergio 32 5 5500
84234394 32 5 5500
Peña Silva 34 5 5500
Concurso de Rafting 34 5 5500
Andres 34 5 5500
83234397 34 5 5500
Perez Alvarez 33 5 5500
Concurso de Rafting 33 5 5500
Adan 33 5 5500
83232333 33 5 5500
Silva Castro 30 5 5500
Concurso de Rafting 30 5 5500
Miguel 30 5 5500
88232390 30 5 5500
Total general 703 110 180000

Secretaria Salud
Etiquetas de fila Suma Suma de Suma de Suma de
de VALOR ESTADOEP IDTIPOSERVICI
IDEPS S O
CAFESALUD 20 1344000 10 55
Consulta especialista 2 28000 1 2
Consulta externa 2 156000 1 4
Consulta interna 2 6000 1 8
Consulta medico 2 56000 1 1
general
Consulta psiquiatria 2 96000 1 10
Consulta unidad de 2 78000 1 7
pediatra
Consulta unidad de 2 36000 1 3
urgencias
Odontologia 2 256000 1 5
Radiologia 2 556000 1 6
Unidad de cuidados 2 76000 1 9
intensivos
CAPRECOM 50 1344000 40 55
Consulta especialista 5 28000 4 2
Consulta externa 5 156000 4 4
Consulta interna 5 6000 4 8
Consulta medico 5 56000 4 1
general
Consulta psiquiatria 5 96000 4 10
Consulta unidad de 5 78000 4 7
pediatra
Consulta unidad de 5 36000 4 3
urgencias
Odontologia 5 256000 4 5
Radiologia 5 556000 4 6
Unidad de cuidados 5 76000 4 9
intensivos
COOMEVA 36 1088000 6 21
Consulta especialista 6 28000 1 2
Consulta externa 6 156000 1 4
Consulta medico 6 56000 1 1
general
Consulta unidad de 6 36000 1 3
urgencias
Odontologia 6 256000 1 5
Radiologia 6 556000 1 6
FAMISANAR 20 172000 2 19
Consulta psiquiatria 10 96000 1 10
Unidad de cuidados 10 76000 1 9
intensivos
ISS 40 1344000 50 55
Consulta especialista 4 28000 5 2
Consulta externa 4 156000 5 4
Consulta interna 4 6000 5 8
Consulta medico 4 56000 5 1
general
Consulta psiquiatria 4 96000 5 10
Consulta unidad de 4 78000 5 7
pediatra
Consulta unidad de 4 36000 5 3
urgencias
Odontologia 4 256000 5 5
Radiologia 4 556000 5 6
Unidad de cuidados 4 76000 5 9
intensivos
NUEVA EPS 30 1344000 10 55
Consulta especialista 3 28000 1 2
Consulta externa 3 156000 1 4
Consulta interna 3 6000 1 8
Consulta medico 3 56000 1 1
general
Consulta psiquiatria 3 96000 1 10
Consulta unidad de 3 78000 1 7
pediatra
Consulta unidad de 3 36000 1 3
urgencias
Odontologia 3 256000 1 5
Radiologia 3 556000 1 6
Unidad de cuidados 3 76000 1 9
intensivos
SALUDCOOP 10 1344000 40 55
Consulta especialista 1 28000 4 2
Consulta externa 1 156000 4 4
Consulta interna 1 6000 4 8
Consulta medico 1 56000 4 1
general
Consulta psiquiatria 1 96000 4 10
Consulta unidad de 1 78000 4 7
pediatra
Consulta unidad de 1 36000 4 3
urgencias
Odontologia 1 256000 4 5
Radiologia 1 556000 4 6
Unidad de cuidados 1 76000 4 9
intensivos
Total general 206 7980000 158 315
CONCLUSIONES

Una bodega de datos es mucho más que un repositorio de información histórica, es


una serie de datos relacionados por procesos bien definidos que llegan a producir
la información más adecuada para una correcta toma de decisiones.
Una bodega de datos es un insumo para soportar objetivamente procesos de toma
de decisiones porque permite analizar y modelar información histórica y actual para
proponer modelos predictivos.
La investigación y experiencia personal que se aplicó para el desarrollo de esta guía
está enfocada en mostrar los posibles inconvenientes, mejores prácticas y
escenarios que se ha identificado para que la implementación sea lo más
satisfactorio posible para así disfrutar de los beneficios que la bodega de datos
ofrece.