Está en la página 1de 34

Práctica 05 Inteligencia de Negocios

Escuela Profesional Ingeniería de Sistemas


Universidad Católica de Santa María

Integrantes:

• Guerreros Huanca Yerson Gino Código: 2015220311


• Cayetano Zevallos César Emilio Código: 2013700311
• Rodriguez Huajardo Jhordy Jesus Código: 2015247491
• Zegarra Delgado Alonso Roberto Código: 2013247471

En este documento se va a realizar el desarrollo de la actividad 05 del curso de Inteligencia de


Negocios tanto como el Escenario desarrollador como el Escenario propuesto, se creará un cubo
OLAP utilizando analysis services, se creará un datamining utilizando analysis services, además de la
creación de los reportes.

In this document, the development of activity 05 of the Business Intelligence course will be carried out
both as the developer Scenario and the proposed Scenario, an OLAP cube will be created using
analysis services, a data mining will be created using analysis services, in addition to the creation of
reports.

Keywords: Olap, Data mining, analysis services.

I. INTRODUCCIÓN
Se va a realizar el desarrollo de la práctica 05 haciendo uso de Visual Studio 2017,
utilizando su componente analysis services para el desarrollo y creación de un cubo,
data Mining y los respectivos reportes.

II. DESARROLLO DE LA ACTIVIDAD.


Para el desarrollo de esta actividad se descargaron los archivos
AdventureWorks2014.bak, AdventureWorks2017.bak y Visual Studio 2017 analysis
services para el desarrollo del escenario desarrollado y el escenario propuesto.
Comenzamos el desarrollo de la actividad descargando e instalando la herramienta
Visual Studio 2017.
El escenario propuesto desarrollado en la siguiente práctica es:

1. En el aula virtual encontrará el archivo AdventureWorks2017.bak, restáuralo y

luego realice lo siguiente:


a) Identifique la tabla de hechos con tres o más dimensiones.

b) Cree un proyecto en el Visual Studio 2017.

c) Realice la configuración del origen de datos.

d) Cree la vista para el origen de datos.

e) Cree e Cubo con las dimensiones respectivas y agregue los campos que usted

desee mostrar de cada una de las tablas.

f) Procese el Cubo OLAP.

2. En el aula virtual encontrará el archivo Trabajando con Dataminig con Analysis

Services. Replique dicho escenario utilizando el Visual Studio 2017 y el SQL

Server 2017. Puede utilizar una base de datos de las prácticas anteriores o trabajar

con una de las bases de datos que trae la versión Express del SQL. Realice la

explicación y captura de todas pantallas en donde se evidencia las configuraciones

realizadas.

3. Crear un reporte y publicarlo en Power BI.

Comenzaremos el desarrollo del escenario desarrollado descargando los archivos e


instalando las herramientas necesarias para el avance y desarrollo de esta, a
continuación, restauraremos las bases de datos y realizaremos el ejercicio propuesto.
Primero se desarrollará la restauración de la base de datos
AdventureWorksDW2014.bak

Imagen1. Restauración de la base de datos AdventureWorksDW2014.bak


Imagen2. Selección de archivo AdventureWorksDW2014.bak
Imagen3. Carga correcta de la restauración de base de datos
Ahora procedemos con el visual studio

Imagen4. Abrimos la herramienta visual studio 2017

Imagen5. Se configura el nombre y ubicación del nuevo proyecto.


Imagen6. Se selecciona un nuevo origen de datos

Imagen 7. Vamos a la ventana de creación de nueva fuente de datos.


Imagen 8. Crea la conexión entre la base de datos restaurada y el visual studio 2017.

Imagen 9. Conexión creada exitosamente.


Imagen 10. Vista de la conexión.

Imagen 11. Cadena de la conexión.


Imagen 12. Creación de las vistas de origen de datos.

Imagen 13. Utilización del asistente de vistas para el origen de datos.


Imagen 14. Asistente para vistas del origen de datos

Imagen 15. Selección de tablas y vistas


Imagen 16. Finalización del asistente

Imagen 17. Muestras de las tablas


Imagen 18. Creación del cubo

Imagen 19. Ventana asistente para la creación del cubo


Imagen 20. Ventana asistente para la creación del cubo selección de tablas

Imagen 21. Selección de FactInternetSales


Imagen 22. Selección de Order quantity y sales amount

Imagen 23. Selección de las dimensiones DIM Date y DIM Product


Imagen 24. Finalización de la ventana con la lista de dimensiones y tablas seleccionadas

Imagen 25. Configuración del explorador de soluciones


Imagen 26. Diseño del cubo

Imagen 27. Selección de procesar en el cubo


Imagen 27. Ventana de error
Para poder solucionar este error primero se debe crear un usuario nuevo dentro de la base de
datos de SQL Server la cual nos nos permitirá ingresar como SQL Server Authentication, esto
para poder ingresar desde el Visual Studio a nuestra base de datos

Imagen 28. Ventana de Creación de usuario en SQL Server


Imagen 29. Selección del nombre del servidor

Imagen 30. Ventana de despliegue del servidor


Imagen 31. Solución del error y vinculo creado satisfactoriamente

Imagen 32. Ejecución del cubo olap con la base de datos creada en Analysis Services dentro de
SQL Server para poder vincular al Visual Studio
Imagen 33. Vista de los elementos combinados en el cubo OLAP

ESCENARIO PROPUESTO

1. En el aula virtual encontrará el archivo AdventureWorks2017.bak, restáuralo y luego realice


lo siguiente:

Imagen 34. Restauracion de la base de datos dada en clases


a) Identifique la tabla de hechos con tres o más dimensiones.

• Tabla de hechos “SalesOrderHeader”


• Dimensiones “Customer” “Store” “SalesPerson”
b) Cree un proyecto en el Visual Studio 2017.

Imagen 35. Creamos un proyecto dentro de visual studio para poder vincularlo con nuestra base
de datos
c) Realice la configuración del origen de datos.

Imagen 36. Origen de datos de la base de datos


d) Cree la vista para el origen de datos.

Imagen 37. Diseño de datos


e) Cree el Cubo con las dimensiones respectivas y agregue los campos que usted desee mostrar
de cada una de las tablas.

Imagen 38. Diseño del cubo OLAP


f) Procese el Cubo OLAP.

Imagen 39. Conexion con SQL Server

Imagen 40. Vista del cubo OLAP con sus combinaciones


2. En el aula virtual encontrará el archivo Trabajando con Dataminig con Analysis Services.
Replique dicho escenario utilizando el Visual Studio 2017 y el SQL Server 2017. Puede utilizar
una base de datos de las prácticas anteriores o trabajar con una de las bases de datos que trae la
versión Express del SQL. Realice la explicación y captura de todas pantallas en donde se
evidencia las configuraciones realizadas.
Vamos a utilizar otra base de datos de ejemplos que nos brinda microsoft en este caso sera
la AdventureWorksDw2017.bak
Imagen 41. Origen de datos de la base de datos

Imagen 42. Vista de la tabla TargetMail


Imagen 43. Vista del asistente del datamining

Imagen 44. Selección del método para la estructura del datamining


Imagen 45. Vista de las opciones “Se eligió árbol de decisión” en los algoritmos de data mining

Imagen 46. Selección de la base de datos y la tabla Target Mail


Imagen 47. Especificación del tipo de tabla

Imagen 48. Selección de los datos de entrenamiento


En la captura de pantalla anterior, la clave del cliente es la columna clave, mientras que la edad, el
comprador de bicicletas, la distancia de viaje, la educación y la ocupación son las entradas para
predecir si un comprador de bicicletas o no.
Si no tiene ninguna idea sobre su conjunto de datos, puede usar el botón Sugerir y tener una idea
sobre los atributos clave afectados.

Imagen 49. Tipo de datos de entrenamiento seleccionados

Imagen 50. Creación de un set de entrenamiento


Imagen 51. Conexión satisfactoria con sql server

Imagen 52. Data Mining, porcentaje del árbol de decisiones


Imagen 53, 54, 55. Árbol de decisiones resultante de 8 niveles
Resultados del Data MIning con la opcion de arbol de deciciones, observamos las deciones por
nivles que se escogieron de los datos de la base de datos AdventureWorksDw2017.bak,

3. Crear un reporte y publicarlo en Power BI.

Imagen 56. Conexión del Power BI con el SQL Server


Importamos la base de datos de SQL Server Analysis Services para poder generar el reporte con
los datos alamacenados

Imagen 57. Vista de las bases de datos en el PwerBI


Elegimos la base de datos con la cual vamos a generar el reporte

Imagen 58,59. Generación de los reportes de la bd AdverntureWorkDW2017

Podemos generar reportes como los dos anteriores con los elementos que se guardaron en la
base de datos del Analysis Services del SQL Server
III. CUESTIONARIO
¿Qué proporcionan las herramientas OLAP?
Que su acceso sea para solo lectura, a través de consultas, que por lo general presentan pocas
inserciones de nuevos datos, actualizaciones de los mismos o eliminaciones.

Estos datos se deben estructurar de acuerdo a las áreas de negocios de la empresa y en formatos
que se puedan integran con uniformidad en toda la empresa.

El historial de los datos almacenados debe permanecer en uso por largo plazo, en un tiempo que
puede ir de dos a cinco años.

Estas bases deben tener fuentes de alimentación que vengan de los mismos sistemas operativos
que existen en la empresa, y se buscan a través de métodos de extracción, transformación y de
carga (ETL).

2. ¿Qué es OLAP?
OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical
Processing). Es una solución utilizada en el campo de la llamada inteligencia empresarial (o
Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos.
Para ello utiliza estructuras multidimensionales (o cubos OLAP) que contienen datos
resumidos de grandes bases de datos o Sistemas Transaccionales (OLTP). Se usa en
informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas
similares.

3. ¿Qué es Datamining?
Data Mining o Knowledge Discovery in Databases (KDD) consiste en extraer información de un
conjunto de datos y transformarla en una estructura comprensible, esto es, en información útil y
accesible para que pueda ser usada posteriormente.

Data Mining es un término que está de moda y que se utiliza, en muchas ocasiones, de manera
incorrecta. Algunas de las referencias erróneas que se le atribuyen son que se trata de cualquier
forma de datos a gran escala, o de procesamiento de la información.

4. ¿Qué es el KDD?
Knowledge Discovery implica la evaluación e interpretación de patrones y modelos para tomar
decisiones con respecto a lo que constituye conocimiento y lo que no lo es. Por lo tanto, el KDD
requiere de un amplio y profundo conocimiento sobre tu área de estudio.

Por otra parte, la Minería de Datos, exploración de datos o Data Mining, no requiere tanto
conocimiento sobre el área de estudio, sino más conocimiento técnico.

Como mencionamos anteriormente, la Minería de Datos es un paso que forma parte del KDD e
implica el análisis de grandes cantidades de datos observacionales, para encontrar relaciones
insospechadas.

5. ¿Cómo define SAS al Datamining?


¿Por qué es importante la minería de datos?

¿Entonces por qué es importante la minería de datos? Ha podido apreciar los números
asombrosos – el volumen de datos producidos se duplica cada dos años. Los datos no
estructurados por sí solos conforman el 90% del universo digital. Pero más información no
significa necesariamente más conocimientos.

La minería de datos le permite:


• Filtrar todo el ruido caótico y repetitivo en sus datos.
• Entender qué es relevante y luego hacer un buen uso de esa información para evaluar resultados
probables.
• Acelerar el ritmo de la toma de decisiones informadas.
• Aprenda más acerca de técnicas de minería de datos en Minería de datos de la A a la Z,
documento que muestra cómo pueden las organizaciones utilizar la analítica predictiva y la
minería de datos para revelar nuevos insights partiendo de datos.

6. ¿Cuáles son los pasos que se deben seguir para realizar un análisis de Datamining?
1. Compresión del negocio

Esta fase inicial se enfoca en la comprensión de los objetivos y exigencias del proyecto desde
una perspectiva de negocio. Posteriormente convierte ese conocimiento de los datos en la
definición de un problema de minería de datos y en un plan preliminar diseñado para alcanzar los
objetivos.

2. Comprensión de los datos

La comprensión de los datos se encarga de la recolección de datos inicial y continúa con las
actividades que permiten familiarizarse primero con los datos, identificar sus problemas de
calidad, descubrir conocimiento preliminar en los mismos, y/o descubrir subconjuntos
interesantes para formular hipótesis. En esta fase se tienen en cuenta también las fuentes de
datos que hasta el momento no se estaban utilizando (fuentes externas, …).

3. Preparación de los datos

La fase de preparación de los datos cubre todas las actividades necesarias para construir el
conjunto de datos final (los datos que serán provistos por las herramientas de modelado). Las
tareas de preparación incluyen la selección de los datos, la limpieza de éstos, la construcción de
nuevas variables, la integración de los datos y el formateo de los mismos.

4. Modelado

Durante esta fase, se aplican las técnicas de minería de datos a nuestros datos. Se aplican varias
técnicas de modelado y los parámetros de uso de las mismas se afinan hasta alcanzar los valores
óptimos. Algunas técnicas de modelado necesitan requerimientos específicos sobre el formato de
los datos, que podrán llevarnos de nuevo a la fase de preparación de los datos.

5. Evaluación

En este caso se evalúan los modelos anteriores para determinar si son útiles a las necesidades de
negocio. En esta etapa los modelos ya están construidos y deben tener una alta calidad desde
una perspectiva de análisis de datos.

6. Despliegue

La fase de despliegue implica la explotación de los modelos dentro de un entorno de producción.


La creación de un modelo no es generalmente el final del proyecto, ya que su creación es un
proceso vivo dentro del proceso de decisiones de una organización (podría ser necesario rehacer
el modelo para tener en cuenta nuevo conocimiento en el futuro).

El uso de metodologías como CRISP-DM en proyectos Big Data no sólo agilizará su desarrollo,
sino que, además, nos asegura calidad en los datos con los que trabajamos y los resultados que
obtengamos. Desde Smartup os animamos a que utiliceis CRISP-DM en vuestros proyectos de
Big Data.
IV. REFERENCIAS

• https://blog.smartup.es/crisp-dm-6-pasos-proceso-data-mining/
• https://www.sas.com/es_pe/insights/analytics/data-mining.html
• https://mnrva.io/kdd-platform.html
• https://fractaliasystems.com/data-mining-que-es-y-para-que-sirve-2/
• https://www.businessintelligence.info/definiciones/que-es-olap.html

También podría gustarte