Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Integrantes:
In this document, the development of activity 05 of the Business Intelligence course will be carried out
both as the developer Scenario and the proposed Scenario, an OLAP cube will be created using
analysis services, a data mining will be created using analysis services, in addition to the creation of
reports.
I. INTRODUCCIÓN
Se va a realizar el desarrollo de la práctica 05 haciendo uso de Visual Studio 2017,
utilizando su componente analysis services para el desarrollo y creación de un cubo,
data Mining y los respectivos reportes.
e) Cree e Cubo con las dimensiones respectivas y agregue los campos que usted
Server 2017. Puede utilizar una base de datos de las prácticas anteriores o trabajar
con una de las bases de datos que trae la versión Express del SQL. Realice la
realizadas.
Imagen 32. Ejecución del cubo olap con la base de datos creada en Analysis Services dentro de
SQL Server para poder vincular al Visual Studio
Imagen 33. Vista de los elementos combinados en el cubo OLAP
ESCENARIO PROPUESTO
Imagen 35. Creamos un proyecto dentro de visual studio para poder vincularlo con nuestra base
de datos
c) Realice la configuración del origen de datos.
Podemos generar reportes como los dos anteriores con los elementos que se guardaron en la
base de datos del Analysis Services del SQL Server
III. CUESTIONARIO
¿Qué proporcionan las herramientas OLAP?
Que su acceso sea para solo lectura, a través de consultas, que por lo general presentan pocas
inserciones de nuevos datos, actualizaciones de los mismos o eliminaciones.
Estos datos se deben estructurar de acuerdo a las áreas de negocios de la empresa y en formatos
que se puedan integran con uniformidad en toda la empresa.
El historial de los datos almacenados debe permanecer en uso por largo plazo, en un tiempo que
puede ir de dos a cinco años.
Estas bases deben tener fuentes de alimentación que vengan de los mismos sistemas operativos
que existen en la empresa, y se buscan a través de métodos de extracción, transformación y de
carga (ETL).
2. ¿Qué es OLAP?
OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical
Processing). Es una solución utilizada en el campo de la llamada inteligencia empresarial (o
Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos.
Para ello utiliza estructuras multidimensionales (o cubos OLAP) que contienen datos
resumidos de grandes bases de datos o Sistemas Transaccionales (OLTP). Se usa en
informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas
similares.
3. ¿Qué es Datamining?
Data Mining o Knowledge Discovery in Databases (KDD) consiste en extraer información de un
conjunto de datos y transformarla en una estructura comprensible, esto es, en información útil y
accesible para que pueda ser usada posteriormente.
Data Mining es un término que está de moda y que se utiliza, en muchas ocasiones, de manera
incorrecta. Algunas de las referencias erróneas que se le atribuyen son que se trata de cualquier
forma de datos a gran escala, o de procesamiento de la información.
4. ¿Qué es el KDD?
Knowledge Discovery implica la evaluación e interpretación de patrones y modelos para tomar
decisiones con respecto a lo que constituye conocimiento y lo que no lo es. Por lo tanto, el KDD
requiere de un amplio y profundo conocimiento sobre tu área de estudio.
Por otra parte, la Minería de Datos, exploración de datos o Data Mining, no requiere tanto
conocimiento sobre el área de estudio, sino más conocimiento técnico.
Como mencionamos anteriormente, la Minería de Datos es un paso que forma parte del KDD e
implica el análisis de grandes cantidades de datos observacionales, para encontrar relaciones
insospechadas.
¿Entonces por qué es importante la minería de datos? Ha podido apreciar los números
asombrosos – el volumen de datos producidos se duplica cada dos años. Los datos no
estructurados por sí solos conforman el 90% del universo digital. Pero más información no
significa necesariamente más conocimientos.
6. ¿Cuáles son los pasos que se deben seguir para realizar un análisis de Datamining?
1. Compresión del negocio
Esta fase inicial se enfoca en la comprensión de los objetivos y exigencias del proyecto desde
una perspectiva de negocio. Posteriormente convierte ese conocimiento de los datos en la
definición de un problema de minería de datos y en un plan preliminar diseñado para alcanzar los
objetivos.
La comprensión de los datos se encarga de la recolección de datos inicial y continúa con las
actividades que permiten familiarizarse primero con los datos, identificar sus problemas de
calidad, descubrir conocimiento preliminar en los mismos, y/o descubrir subconjuntos
interesantes para formular hipótesis. En esta fase se tienen en cuenta también las fuentes de
datos que hasta el momento no se estaban utilizando (fuentes externas, …).
La fase de preparación de los datos cubre todas las actividades necesarias para construir el
conjunto de datos final (los datos que serán provistos por las herramientas de modelado). Las
tareas de preparación incluyen la selección de los datos, la limpieza de éstos, la construcción de
nuevas variables, la integración de los datos y el formateo de los mismos.
4. Modelado
Durante esta fase, se aplican las técnicas de minería de datos a nuestros datos. Se aplican varias
técnicas de modelado y los parámetros de uso de las mismas se afinan hasta alcanzar los valores
óptimos. Algunas técnicas de modelado necesitan requerimientos específicos sobre el formato de
los datos, que podrán llevarnos de nuevo a la fase de preparación de los datos.
5. Evaluación
En este caso se evalúan los modelos anteriores para determinar si son útiles a las necesidades de
negocio. En esta etapa los modelos ya están construidos y deben tener una alta calidad desde
una perspectiva de análisis de datos.
6. Despliegue
El uso de metodologías como CRISP-DM en proyectos Big Data no sólo agilizará su desarrollo,
sino que, además, nos asegura calidad en los datos con los que trabajamos y los resultados que
obtengamos. Desde Smartup os animamos a que utiliceis CRISP-DM en vuestros proyectos de
Big Data.
IV. REFERENCIAS
• https://blog.smartup.es/crisp-dm-6-pasos-proceso-data-mining/
• https://www.sas.com/es_pe/insights/analytics/data-mining.html
• https://mnrva.io/kdd-platform.html
• https://fractaliasystems.com/data-mining-que-es-y-para-que-sirve-2/
• https://www.businessintelligence.info/definiciones/que-es-olap.html