Está en la página 1de 16

INSTITUTO TECNOLÓGICO DE COMITANCILLO

INTELIGENCIA DE NEGOCIOS.

DOCENTE: Morales Matus Marisela

TRABAJO:

ACTIVIDAD 4.1 EJERCICIO MINERÍA DE DATOS

INFORME DEL LA PRACTICA

PRESENTA:

López Pineda Arturo


№C. 18710011

SEMESTRE: 8
GRUPO: “8UE”

CARRERA:
Ingeniería Informática

CON ESPECIALIDAD EN:


Tecnologías de la información.

San pedro Comitancillo, Oaxaca. domingo, 03 de mayo de 2022.

ARTURO LOPEZ PINEDA


Contenido
Introducción. ................................................................................................................................... 3
Objetivo............................................................................................................................................. 4
Desarrollo ......................................................................................................................................... 5
Crear BD en SQL server e importar los datos de Excel ......................................................... 5
Creamos un nuevo proyecto multidimensional y de mineria de datos de Analysis
Services. ........................................................................................................................................ 7
Continuamos con Power BI. ..................................................................................................... 13
Posibles problemas en la instalación de todos los procesos de creación......................... 15
Conclusión ..................................................................................................................................... 16
Introducción.

SQL Server ha sido líder en análisis predictivo desde el lanzamiento de 2000, al


proporcionar minería de datos en SQL Server Analysis Services.

La combinación de Integration Services, Reporting Services y SQL Server Data


Mining proporciona una plataforma integrada para el análisis predictivo que abarca
la limpieza y preparación de datos, el aprendizaje automático y la generación de
informes. SQL Server Data Mining incluye varios algoritmos estándar, incluidos
modelos de agrupación en clústeres EM y K-means, redes neuronales, regresión
logística y regresión lineal, árboles de decisión y clasificadores bayesianos
ingenuos.

Todos los modelos tienen visualizaciones integradas para ayudarlo a desarrollar,


refinar y evaluar sus modelos. La integración de la minería de datos en la solución
de inteligencia comercial lo ayuda a tomar decisiones inteligentes sobre problemas
complejos.
Objetivo.

El objetivo consiste en desarrollar lo que es la minería de datos con SQL server y


visual studio, desde una base de datos la cual vamos a importar desde Excel.

Originar el motor de base de datos y autentificarse, creamos la base de datos una


base de datos, en un datawarehouse, listo creamos la base de datos para poder
importar los archivos de Excel diferentes tablas verificamos.

Uno de los objetivos principales es que la realización de este trabajo es utilizar las
herramientas de Microsoft Analysis Services, Power BI y Microsoft Visual Studio
2019, las cuales nos ayudan en la realización del procesamiento y análisis de datos
de una base de datos importada desde Excel.
Desarrollo

Crear BD en SQL server e importar los datos de Excel.


Iniciamos el SQL serve con el usuario sa y la contraseña, y creamos una base de
datos llamada DW_Ventas_Motos, desde esta Base de datos podremos exportar
los datos del excel, pero es posible que marque algunos errores, a la hora de extraer
los datos, como: (El proveedor "Microsoft.ACE.OLEDB.12.0" no está registrado en
el equipo local(System.Data)), esto se debe a que si se desea poder utilizar la
versión de 64 bits del motor Microsoft ACE, tendríamos que instalar el componente
redistribuible del motor de base de datos de Access 2010.

Desde el siguiente enlace podrás descargar la versión apropiada del motor ACE de
Access 2010:
Componente redistribuible del motor de base de datos de Microsoft Access 2010
https://www.microsoft.com/es-es/download/details.aspx?id=13255
No hay que confundir el motor Jet con el motor ACE. No existe versión de 64 bits
del motor Microsoft Jet, pero sí existe la versión de 64 bits del motor Microsoft ACE
con los componentes de Access 2010 (no de Access 2007, que tampoco dispone
de versión de 64 bits), tal y como figura en el enlace indicado.
Una vez superando el error, lograremos exportar los datos de Excel a la nueva base
de datos que creamos como DW_Ventas_Motos en SQL Serve.
Especificamos si deseamos copiar una o varias tablas existentes en la base de
datos origen, la cual llamamos DatosDeClientesMotos_X_EntrenamientoF este será
el origen y el destino el servidor llamado EQUIPO1, guardamos y ejecutamos el
paquete SSIS, si hicimos todo bien nos debe de decir que se ha realizado
correctamente la ejecución.
Procedemos a hacer los mismos pasos, pero en la misma base de datos creada, a
importar el Excel llamado DatosDeClientesMotos_X_PruevaF este será el origen y
el destino el servidor llamado EQUIPO1, guardamos y ejecutamos el paquete SSIS,
si hicimos todo bien nos debe de decir que se ha realizado correctamente la
ejecución.
Podemos verificar si la carga se hizo correctamente ejecutando un scrip para ver
los datos de cada tabla.

Estos son los datos del Excel DatosDeClientesMotos_X_EntrenamientoF, así


mismo podemos hacerlo con los datos del otro Excel llamado
DatosDeClientesMotos_X_PruevaF para verificar si la carga fue exitosa.
Creamos un nuevo proyecto multidimensional y de mineria de datos de
Analysis Services.

Creamos el proyecto llamado: ProyectoMineria_VentaMotos, creamos una nueva


conexión con nuestro servidor EQUIPO1 y con la autenticacion de servico el usuario
sa, seleccionamos la Base de datos llamada DW_VentasMotos y probamos la
conexión y finalizamos.
Creamos la vista de origen de los datos, selecionamos el origen ya creado, y que
tenga el mismo nombre que el de la clave principal, selecionamos las 2 tablas que
extraimos los datos para ocupar y le damos finalizar.
Craeremos una estrructura de mineria de datos, ya no crearemos el cubo como
haciamos anteriormente en las otras practicas, seleccionamos el metodo de
definicion como de una base de datos relacional o del alamcenamiento de datos,
creamos la estructira como Arboles de decision de Microsoft y comenzamos a
especificar los tipos de tablas, nos deben de aparecer las 2 tablas que extragiumos
los datos de Excel, ocuparemos la tabla DatosDeClientesMotos_X_EntrenamientoF
y especificaremos los datos de aprendizaje, podemos hacerlo manualmente o que
nos de recomendaciones o sugerencias de las columnas relacionadas, nos arroja la
puntuacion y vamos seleccionado las entradas, le damos en siguiente hasta llegar
en permitir obtencion de detalles lo vamos a habilitar, y finalizamos.

Nos dede de quedar de la siguiente manera.


Ahora ya podemos crear nuestros modelos de mineria de datos relacionado: como
TM_Native_bayes, TM_Clustering. Una vez terminado vamos a propiedades de
nuestro proyecto para verificar que el servidor sea el que estemos ocupando
EQUIPO1.
Procedemos a ir a extensiones, modelo de mineria de datos y procesar, le damos
que si y si nos pide usaurio y contraseña es la del usuario creado en SQL Serve
llamado sa. Y solo esperamos a que procese todo y que la implementacion finalize
correctamente.
Ahora podemos analizarlo, podemos ver el Arbol de decision.

Podemos ver el perfil de cluster


Ahora el TM_native_bayes la Red de dependencias.

Está considerando como variables importante de lo que es ocupación, total de Niños


y número de autos de propiedad.
Podemos ver los perfiles del atributo.
Caracteristicas de atributo.

Algo muy importante es el valor cero, significa que no han comprado, los que tiene
mas de 3 niños la probabilidad de compra es mas baja, que a los que tiene un
numero de cero hijos, cuando la ocupacion es profecional la probabilidad aumenta
a comparacion a los que son obreros o administativos, su probabilidad de compra
es inferior.
Ahora nos iremos a la parte de Graficos de precision de mineria de datos, y grafica
de elevacion.
Vamos a la pestaña de Prediccion de modelos de mineria de datos, para hacer una
consulta desde el visual studio.

Esta sera nuestra consulta.


Vamos a ejecutar los resultados y podríamos tener nuestra probabilidad de motos
de estas clave de compra, apellido y atributos, vamos a copiar los datos a una baja
de excel.

Vamos a continuar con analizar nuestros datos de probabilidad para eso vamos a
crear una columna de resultados con la formula =SI(J2>0.8,"Muy
Alto",SI(J2>0.7,"Alto", SI(J2>0.6,"Media", "Baja"))) podemos ver que dice que si la
celda es mayor a 0,8 se parece que tiene una probabilidad muy alta, si la celda es
mayor a 0.7 es alta, si el dato de la celda es mayor a 0.6 es media, y los valores
inferiores como resultados bajos, tomamos como prueba este valor dice alto la
probabilidad de que no compre esta persona una motocicleta, tiene una probabilidad
muy alta de no comprar entonces t33333endría que tomar la decisión de quizás no
intervenir mucho en querer vender una bicicleta a esta persona en particular.

3
Continuamos con Power BI.

Obtener datos del SQL server, la base de datos que creamos y exportamos datos
del Excel, tomamos el nombre de nuestro servidor y el nombre del proyectoMineria
del Data warehouse para que nos importe los datos que hemos utilizado con
anterioridad.

Nos aparece los campos de la base de datos que creamos.

Haremos la visualización en una tabla como la vez anterior en Excel, pero esta vez
en Power BI.

Nos queda de la siguiente manera.


Ahora haremos con unas graficas.

Podemos crear varias visualizaciones con gráficos de diferente manera, utilizando


los filtros y campos para configurar lo que deseamos ver.
Posibles problemas en la instalación de todos los procesos de creación.

1. No se puede exportar los datos de Excel por un error llamado: El proveedor


"Microsoft.ACE.OLEDB.12.0" no está registrado en el equipo local
(System.Data).
2. El SQL serve Agente se detiene y no es posible procesar, tenemos que
activarlo manualmente.
3. Si deseas poder utilizar la versión de 64 bits del motor Microsoft ACE, tendrás
que instalar el componente redistribuible del motor de base de datos de
Access 2010.
4. No confundas el motor Jet con el motor ACE. No existe versión de 64 bits del
motor Microsoft Jet, pero sí existe la versión de 64 bits del motor Microsoft
ACE con los componentes de Access 2010 (no de Access 2007, que tampoco
dispone de versión de 64 bits).
5. En esta parte del sql managment puedes ver los que tienes instalados,
podrías tratar con otro proveedor, SELECT * FROM
OPENROWSET('Microsoft.ACE.OLEDB.15.0','Excel 8.0;HDR=Yes;
6. Database=c:\Libro1.xlsX', 'SELECT * FROM [Hoja1$]').
Conclusión

Desarrollar lo que es la minería de datos con SQL server y visual studio, desde una
base de datos la cual importamos desde Excel, resulto ser más difícil de lo que se
esperaba, ya que al principio marca algunos errores al extraer los datos.

Creo que uno de los objetivos principales es que la realización de este trabajo es
utilizar las herramientas de Microsoft Analysis Services, Power BI y Microsoft Visual
Studio 2019, las cuales nos ayudan en la realización del procesamiento y análisis
de datos de una base de datos importada desde Excel.

Además, estas herramientas son compatibles, se puede hacer una conexión de


datos desde Power BI a Analysis Services para trabajar directamente con un cubo
o directamente con lo que estábamos trabajando, la minería de datos, creando esta
herramienta podemos realizar consultas, también volviéndolo a pasar a Excel
realizar las consultas a través de tablas dinámicas o gráficos dinámicos y las dos
herramientas pueden crear una conexión con el gestor de base de datos Microsoft
SQL Server.

También podría gustarte