Está en la página 1de 21

CURSO:

DATA WAREHOUSE Y BASE DE DATOS MULTIDIMENSIALES

(SC-602).

PROYECTO FINAL DE CURSO

TEMA:
Innova Market Datawarehouse.

SOMETIDA A CONSIDERACIÓN DEL PROFESOR(A):


MIGUEL COREA TORUÑO.

CUATRIMESTRE:
TERCER CUATRIMESTRE.

AUTOR(ES):

SAN PEDRO, SAN JOSÉ, COSTA RICA

FECHA: 07/10/2021.
Innova Market S.A.

Para el presente proyecto se planea desarrollar un Datawarehouse mediante el


cual se puedan obtener grandes cantidades de datos generadas en años
anteriores para que la empresa Innova Market S.A, pueda obtener información
de alto valor con base a distintos gráficos que se obtendrán a través del
análisis de datos.
Con la ayuda de distintas herramientas como lo son Pentaho (Utilizada para
realizar las transformaciones de datos, y realizar las inserciones necesarias
dentro de la base de datos),Power BI (Utilizada para cargar la información de la
base de datos desde SQL Server y poder realizar la creación de gráficos para
visualizar la información requerida por la empresa), SQL Server Manager
Studio (Herramienta mediante la cual se creará la base de datos para
almacenar toda la información de la empresa para así poder conectarla a
Power BI y tener acceso a ella).

La idea principal de desarrollar este proyecto, es poder hacer uso del


conocimiento adquirido durante el cuatrimestre en el curso de Datawarehouse,
en el cual se demostró en cómo el uso de las aplicaciones mencionadas
anteriormente, pueden ayudar a una empresa a obtener valiosa información
con base a las compras de sus clientes en años anteriores. Es importante
mencionar que también se demostró el cómo usan las empresas la información
de sus clientes para modificar tanto sus productos como sus técnicas para
llegar a más personas dentro del mercado.
Formulación.
Planteamiento del problema.

Con estas crisis de aumento a la gasolina ha motivado a muchos hacer uso de


la bicicleta como medio de transporte ya que es económicamente atractivo,
pero a raíz de la competitividad del mercado la empresa la empresa Ciclo
Market quien se dedica a exportar bicicletas a diferentes partes del planeta, se
ha visto afectada debido a la aparición de nuevos competidores con precios
muchos más baratos y de buena calidad, otros competidores con volúmenes de
ventas mayores, diferentes y más regiones a las que Ciclo Market ofrece sus
productos e incluso más variedad de productos ofrecidos. Ciclo Market es una
empresa que ha estado en este mercado durante los últimos 16 años y siempre
se ha caracterizado por ofrecer un servicio excepcional y con gran variedad a
sus clientes, pero debido a la situación mencionada anterior mente y detallada,
ha experimentado ciertos problemas como la no existencia de clientes en
determinadas regiones y un gran registro de bicicletas menos barato que ha
generado la pérdida de clientes, es por esto y otras situaciones más que la
empresa ha decidido utilizar la tecnología de análisis de datos para estar por
delante de la competencia en cuanto a ventas a negocios mayoristas tales
como supermercados, tiendas exclusivas y moles, los cuales son los mayores
clientes de Ciclo Market, generando así la expansión de las regiones a las
cuales vende sus productos, mejorar los precios de sus productos e incluso
determinar si debe de realizar contrataciones de personal en caso de que se dé
un aumento en los volúmenes de ventas o debido a la posible expansión a
nuevas regiones.
Objetivos

Objetivo General:

Desarrollar un Datawarehouse, tomando como fuente de datos diferentes


bases de datos que tiene la empresa, así como archivos de Excel, para
construir un almacén de datos, que permita tener reportes y generar consultas,
utilizando las herramientas vistas en clase, para que la empresa Innova Market
cuente con una herramienta que le permita aplicar estrategias de bussiness
intelligence y le facilite la toma de decisiones por medio del análisis de datos
presentes en este Datawarehouse.

Objetivos Específicos:
1. Crear un modelo dimensional de estrella como base del proyecto en
SQL Server.
2. Desarrollar el Datawarehouse mediante el uso de las herramientas
vistas en clase como lo es, Pentaho, con el fin de que esta se encargue
de extraer y transformar los datos provenientes de las diversas fuentes
como Excel, Oracle y MS SQL.
3. Generar reportes de valor por medio de la herramienta Power BI.
Justificación y su importancia

Con investigación y estudio podemos ver el propósito de aplicar el análisis con


Data Warehouse, es brindar un servicio tecnológico con el fin de identificar
posibles ramas a mejorar en el negocio, las cuales puedan crear oportunidades
que sean aprovechables para la empresa así tomando decisiones que
finalmente se traduzca en un incremento de ingresos para la empresa Ciclo
Market, al tener mayor presencia de mercado y estar por delante de sus
mayores competidores y de la misma manera ayudar a la gerencia a
determinar mejores estrategias de negocio, por medio del uso de una
herramienta como lo es un Data Warehouse, esto debido a que Ciclo Market,
nunca han implementado este tipo de herramientas, además, los datos que
posee la empresa con respecto a sus clientes son muy básicos, a tal punto que
conocen muy poco quiénes son sus clientes principales, no han añadido
nuevas regiones a las que vender sus productos en 9 años, además, tienen
muy pocos datos para realizar un gran análisis dentro de los mercados. La
importancia del desarrollo de un proyecto de esta índole es que los miembros
del equipo logren, aprender más acerca de las herramientas actuales del
análisis de datos como Power BI y la gran cantidad de funcionalidades y
oportunidades que esta novedosa herramienta ofrece y además aplicar todo
esto en función del desarrollo de un proyecto completo que genere experiencia
y un conocimiento más amplio en esta área del análisis de datos.
Alcances y Limitaciones

Se detallan los siguientes alcances y limitaciones del proyecto:

1. Alcances

Para lograr los objetivos planteados anteriormente, se hará uso de las


aplicaciones que se usen durante el curso, Pentaho y Power BI, para analizar
los datos dentro del datawarehouse y generar gráficos de valor en los cuales se
tomen en cuenta únicamente:

1. Regiones donde se realizan ventas.


2. Ventas.
3. Productos que distribuye la empresa.
4. Marketing.
5. Análisis de mercados.
6. Clientes.

No se incluyen dentro del alcance de este proyecto:

1. Recursos Humanos.
2. Contabilidad y finanzas.
3. Proveedores.
4. Gastos Generales de la empresa (pago de servicios públicos,
mantenimiento de equipos y de la empresa, impuestos, etc.).
5. Pago de salarios de planilla.

Para el desarrollo del proyecto se tomará únicamente como fuente de datos:

1. Archivos de Excel.
2. Bases de datos SQL.
2. Limitaciones

A continuación, se detallan las limitaciones presentes para el desarrollo de este


proyecto:

1. Uso de bases de datos Northwind y demás bases de datos en SQL


Server, así como archivos Excel.
2. Otra de las limitaciones que presenta el grupo es la diferente disposición
de horarios para reuniones entre los miembros del equipo.
3. Otra limitación corresponde al inconveniente al localizar una empresa
real que contara con lo adecuado para la realización del proyecto.
4. De igual manera al proyecto se le define un plazo máximo de 3 meses
para su desarrollo.
5. El conocimiento de las herramientas que serán utilizadas es limitado,
debido a que se conocieron en este mismo curso.
Levantamiento de

Requerimientos
Supuestos del Proyecto:

· Asumimos que los requerimientos ya están listos para el desarrollo del


proyecto.
· Asumimos que ya se tiene conocimiento en bases de datos y Data
Warehouse.
· Asumimos que ya se tiene la fuente de dato establecida para el
proyecto.

Requerimientos:
· Creación de la dimensión cliente, para poder guardar la información
necesaria del cliente como el nombre, los apellidos, el teléfono, el correo
electrónico y la dirección para poder hacer la compra.

· Creación de la dimensión de producto, para poder guardar la


información de los productos de la tienda virtual con nombre del
producto, descripción, precio y a la categoría que pertenece.

· Creación de la dimensión categoría, para poder categorizar por áreas los


productos del supermercado teniendo en cuenta el nombre de la
categoría y la descripción de la misma.

· Creación de la dimensión empleado, para poder tener la información


básica de los empleados que trabajan con la tienda virtual como la
identificación, nombre, apellidos, correo electrónico, teléfono, y
dirección.

· Creación de la dimensión pedido, para poder realizar el pedido debido


del cliente con la información necesaria como fecha de pedido, fecha de
compra, la descripción del pedido, e información de la dirección de
entrega del pedido.

· Creación de la tabla detalle del pedido, para poder detallar más el


pedido, con la cantidad de productos que va a comprar el cliente, con el
precio unitario, y el descuento que llega a tener el producto.
Preguntas de Análisis (OLAP):

· ¿Cuál genero de cliente compra la mayor cantidad de productos y que


categoría de productos es la más comprada, en la ciudad de Seattle, y
cuál es la línea de productos menos vendida? Diagrama 1
· ¿En qué regiones a nivel global no se presentan ventas de productos
y en cuáles sí?
· ¿Cuál es el método de paga favorito por los clientes que son miembros
de Innova Market en la ciudad de Jersey City? Diagrama2
· ¿Cuál es la relación de impuestos por precio unitario total por categoría
de productos? Diagrama 3
· ¿Cuál es el total de ingresos brutos de acuerdo con el tipo de cliente y
su método de pago? Diagrama 4
· ¿De los años 1996 al 1998 en cual país europeo se gastó más en fletes?
Diagrama 5
· ¿Cuál es la cantidad de ordenes enviadas a países nórdicos europeos
en el año 1998? Diagrama 6
· ¿De qué país provienen la mayor cantidad de proveedores de Innova
Market? Diagrama 7
· ¿Cuáles son los 10 productos que más tienen existencias y cuáles son
los 10 productos con menos existencias? Diagrama 8
· ¿Cuál es la ubicación geografica por pais de cada uno de los clientes de
Innova Market? Diagrama 9
· ¿Cuál es el vendedor que más ordenes realizo y cuánto dinero genero
con las mismas? Diagrama 10
Diagrama de Datos.
Riesgos Identificados.
Identificación de Riesgos.

Descripción de los riesgos


Categoría Riesgos Descripción
Perdida de personal clave Salida de personal
necesario para operar el
sistema de software.
Pérdidas en facturación Si los servidores no están
Administrativos por equipo clave que no funcionando, la empresa
esté en operación no puede cobrar las horas
no trabajadas.
Crecimiento del personal Necesidad de comprar
de la empresa más servidores por
aumento en el uso, con
más personal
Fallas por falta de fluido No hay plantas eléctricas
eléctrico de emergencia
Pérdida de información de Fallas en el
los clientes almacenamiento de datos
Técnicos causada por un
componente dañado
Falta de mantenimiento Fallas por falta de ajustes
preventivo de equipos y limpieza de filtros
Riesgos de falla por fallas Los equipos llegaron a su
mecánicas vida útil y sus partes
pueden fallar
Mal dimensionamiento de Compra de equipo no
las capacidades técnicas acorde a las necesidades
del equipo del negocio
Ausencia de gestión Falta de capacitación y
experta (inexperiencia en experiencia en las
la tecnología) personas que van a usar
Operativos los equipos y el sistema
de software
Falta de documentación Falta de documentación
necesaria del proceso de los equipos y de los
procesos necesarios de
gestión, operación e
instalación de los equipos
Accesos no autorizados al Vulnerabilidad del sistema
servidor

Diseño del

Datawarehouse.
Diseño de la Arquitectura
Para el desarrollo del siguiente proyecto se hará uso de algunas aplicaciones
que facilitarán el importe de datos, generación de reportes y creación de bases
de datos.
MS SQLServer: Se hará uso de la aplicación SQL Server para poder crear
tanto las bases de datos como los modelos que se vayan a desarrollar
(Estrella, copo de nieve).
Pentaho: Se utilizará la herramienta Pentaho para realizar transformaciones y
realizar inserciones dentro de la base de datos.
Microsoft PowerBI: Se implementará esta aplicación para poder generar los
gráficos de valor de los cuales se ha mencionado durante el desarrollo de este
proyecto. Esto será de gran ayuda para poder visualizar de manera grafica los
datos que se han extraído.

Elección de la herramienta y justificación


Las herramientas seleccionadas para el desarrollo del presente proyecto son
las que se han presentado en el curso, las cuáles son, Pentaho, PowerBI, SQL
Server y archivos de Excel (en formatos .csv y .xlsx), esto debido a que son
herramientas bajo las cuales los integrantes del grupo han trabajado durante el
desarrollo de este
Diseño de cubos de datos incluyendo: dimensiones, hechos, jerarquías,
categorías y medidas.

Tipos de reportes o21 consulta a mostrar y requerimiento al cual


responden

Conclusiones

Como conclusión de este proyecto en el uso de Data warehouse, aprendimos


bien como implementar Data warehouse y su significado en la aplicación para
cualquier empresa, y como en nuestro caso aplicarlo en tienda global en una
línea interactivo enfocada en las bicicletas, implica como objetivo mejorar la
calidad de las bases de datos existentes y apegarse a esta nueva estructura de
manejo de información y dejar atrás las bases de datos obsoletas, lentas y que
ofrecían en ocasiones perdida información, los objetivos incluyen la reducción
de los costes de almacenamiento, una mayor velocidad de respuesta frente a
las consultas de los clientes, no permitiendo la redundancia de datos y solo
mostrando información que ha sido cargada en la base de datos así finalizando
un gran trabajo en le Data warehouse.
Recomendaciones

Al ser una tienda global esta estará cambiando su inventario por lo cual se
recomienda tener un mantenimiento constante para evitar problemas futuros al
ingresar o quitar productos. Otra recomendación seria incluir diferentes
modelos de inventarios para que la tienda se pueda adaptar a la variedad de
productos y también poder brindar una mayor velocidad y eficiencia al sistema

Lecciones Aprendidas

Como lecciones aprendidas e importante mencionar que la herramienta Power


BI fue de mucha ayuda y permitió al grupo adquirir conocimiento y dominio
sobre la misma, lo cual es bastante positivo ya que este conocimiento puede
ser aplicado tanto para trabajos universitarios como para el área laboral.
También se puede resaltar que la curva de aprendizaje que hubo al tener poco
conocimiento sobre la herramienta Pentaho, ya que existía poca
documentación en la internet, también en el intento de su uso se presentaron
errores propios de la aplicación los cuales se realizaban búsquedas en internet
y no existía información lo cual nos complicaba mucho el trabajo.
Bibliografía.

Microsoft. (2019, 11 enero). Get the sample SQL Server databases for

ADO.NET code samples - ADO.NET. Microsoft Docs.

https://docs.microsoft.com/en-us/dotnet/framework/data/adonet/sql/linq/

downloading-sample-databases
Anexos.

También podría gustarte