Está en la página 1de 15

Gestin de Negocios con Business Intelligence

Actividad 5

Introduccin En el siguiente informe se presenta el anlisis, planificacin e implementacin de un proyecto de creacin de Data Warehouse (Almacn de Datos o DW), el cual tiene un plazo mximo de desarrollo de 6 meses. El contexto de la base de datos a trabajar hace referencia a un grupo de personas las cuales han sido consultadas en relacin a inseguridad ciudadana en Chile. Las preguntas estn divididas en distintos tpicos y todos ellos relacionados con la siguiente interrogante: De qu delito cree usted que ser victima en los prximos doce meses?. Para poder analizar y trabajar los datos se ha realizado una planificacin de tareas la cual es organizada mediante una carta Gantt, la cual contiene el nombre de las tareas a ejecutar as como tambin los plazos definidos para el desarrollo de estas. Tambin se presentara, mediante imgenes, algunas etapas del proceso como: modelo de base de datos, esquema de DW (Esquema Estrella), scripts de carga de datos (ETL FULL), etc.. La creacin del Data Warehouse tiene como objetivo realizar un esquema del tipo estrella para maximizar el performance de las consultas. Lo cual nos permitir obtener informacin confiable y con esto poder tomar buenas decisiones.

Modelo de Base de Datos Operacional


A partir de la tabla Paciente analizamos los datos y los dividimos en diferentes tablas, para lo cual realizamos los siguientes modelos que presentamos a continuacin. En primera instancia realizamos el modelo entidad relacin, en el cual tuvimos que reconocer sus entidades con sus atributos correspondientes ms sus relaciones entre s. Como se ve en la imagen a continuacin;

Modelo Entidad Relacin

Luego de tener nuestro primer modelo concluido y a partir de l mismo, se construy el Modelo Relacional, estableciendo llaves forneas entre las distintas tablas relacionas desde el Modelo Entidad Relacin.

Modelo Relacional

Modelo de Base de datos (Esquema Estrella)


El esquema utilizado para la base de datos de nuestro Data Warehouse es un esquema del tipo Estrella, esto con el objetivo de maximizar el performance de las consultas. Tabla de hechos: DW_FACT: contiene las relaciones entre las 3 dimensiones (Paciente, institucin y estado). A partir de esta tabla se pueden hacer anlisis de los datos. Tabla de dimensiones: DW_PACIENTE: contiene datos personales de un paciente. DW_INSTITUCION: contiene el nombre de la institucin en la cual se ubica el paciente. DW_ESTADO: indica el estado actual de paciente tratado.

Carga inicial de Datos (ETL FULL)


La carga de datos fue realizada mediante un ETL FULL, que se logro realizando un BULK de datos desde unos archivos plano de texto en formato .csv. A continuacin se muestra el proceso de llenado de la tabla DW_PACIENTE. Datos DW_PACIENTE

Esto corresponde al contenido del archivo DW_PACIENTE.csv con 23 registros.

Carga DW_PACIENTE

Mediante este script se realiza la limpieza de la tabla DW_PACIENTE_PASO que corresponde a una tabla de transicin para luego hacer una validacin de los datos nulos y finalmente insertarlos en la dimensin DW_PACIENTE.

Resultado DW_PACIENTE

Registros finalmente insertados en la dimensin DW_PACIENTE. Luego de la validacin de datos Nulos.

Carga Incrementa de Datos (ETL INCREMENTAL)


La segunda carga de datos fue realizada mediante un ETL INCREMENTAL, que se logro realizando un BULK de datos desde un archivos plano de texto en formato .csv. A continuacin se muestra el proceso de llenado de la tabla DW_PACIENTE. Datos DW_PACIENTE

Esto corresponde a el contenido del archivo DW_PACIENTE.csv con 31 registros.

Carga DW_PACIENTE

Mediante este script se realiza la carga de los nuevos registros en DW_PACIENTE_PASO para luego hacer la validacin de datos o registros nulos y/o finalmente insertarlos en la dimensin DW_PACIENTE.

Resultado DW_PACIENTE

Registros finalmente insertados en la dimensin DW_PACIENTE. Luego de la validacin de datos Nulos y/o repetidos.

Log de Proceso de Carga


Los ETL anteriormente ejecutados (FULL e INCREMENTAL), realizan un INSERT en la tabla LOG_CARGA, la cual contiene los siguientes datos:

Tras haber realizado la ejecucin de los script anteriormente mencionados, se obtiene a modo de registro la accin realizada, el tiempo, y la cantidad de registros Cargados con xito en la tabla DW_PACIENTE, los registros que fueron descartados por tener campos nulos o estar repetidos y finalmente el Total de registros que fueron manipulados para proceder a hacer la validacin y posterior insercin.

Cubo
Mediante Excel se realizo la lectura de la tabla DW_FACT y poder crear una tabla y grafico dinmico el cual responde la pregunta: Cantidad de Pacientes por institucin.

La Tabla y grafico representan la distribucin de paciente dentro de las distintas instituciones. A continuacin se listan los nombres de las instituciones junto con su "id" correspondiente para interpretar la tabla.

Conclusin
Tras haber realizado este trabajo podemos concluir que la implementacin de un Data Warehouse produce un valor agregado a nuestra informacin almacenada e histrica que tengamos en nuestras bases de datos operacionales, otorgndonos un plus, y guindonos hacia obtener ventajas competitivas considerables, las que hoy por hoy son trascendentales en nuestra sociedad y en nuestros negocios, El Data Warehouse gracias a su filtrado de datos nos permite enfocarnos en un rea en particular del nuestro negocio y sacarle rendimiento, realizando exhaustivos anlisis de su comportamiento, a travs de anlisis grficos. La construccin de un Data Warehouse cumple ese objetivo y nos da la posibilidad de tomar decisiones que nos beneficien. Por tanto Business intelligence, y particularmente Data Warehouse nos permite responder interrogantes del tipo: Cuntos hombres fueron encuestados?, Cuntas personas de la 4ta regin cree que ser asaltada en el prximo ao?, entre otras interrogantes. Como podemos aprecias los beneficios son enormes y nos permite poder tomar buenas decisiones estando mejor informado, gracias a las consultas hechas sobre nuestro Data Warehouse. Un ejemplo de esto en particular sera tomar la decisin de aumentar la seguridad en ciertos territorios del pas, a partir de la Data analizada y obtenida.

Bibliografa
GBI (CUBOS).ppt Script ETL facilitados por el profesor. http://jmendozabi.blogspot.com/2012/12/ssas-crear-cubo-olap-pasopaso.html http://www.informatica-hoy.com.ar/telefonos-celulares/Cubo-OLAP-unabase-de-datos-multidimensional.php

También podría gustarte