Está en la página 1de 7

PRACTICA: MINERIA DE DATOS CON SQL

¿Qué es la minería de datos?

La minería de datos es una práctica que buscará automáticamente un gran volumen de datos
para descubrir comportamientos, patrones y tendencias que no son posibles con el simple
análisis. La minería de datos debería permitir a las empresas tomar decisiones proactivas basadas
en el conocimiento que harán que el lugar sea mejor que sus competidores.
Minería de datos en SQL Server
SQL Server se utiliza principalmente como herramienta de almacenamiento en muchas
organizaciones. Sin embargo, con el aumento de las necesidades de muchas empresas, las personas
buscan diferentes características de SQL Server. La gente está mirando el almacenamiento de datos
con SQL Server. SQL Server proporciona una plataforma de minería de datos que se puede utilizar
para la predicción de datos.

Hay algunas tareas que se utilizan para resolver problemas comerciales. Esas tareas son Clasificar,
Estimar, Agrupar, pronosticar, Secuenciar y Asociar. SQL Server Data Mining tiene nueve algoritmos
de minería de datos que se pueden usar para resolver los problemas comerciales mencionados
anteriormente.
Clasificar: categorizado según los diversos atributos. Por ejemplo, si un cliente es un cliente
potencial dependiendo de otros datos como Edad, Sexo, Estado civil, Ocupación, Calificación
educativa, etc.

• Estimación: la estimación se realizará utilizando los parámetros. Por ejemplo, los precios de la
vivienda se predecirán según la ubicación de la casa, el tamaño de la casa, etc.

• Cluster: también denominado como segmentación. Dependiendo de los diversos atributos, se


realiza la agrupación natural. La segmentación de clientes es el ejemplo comercial clásico para
la agrupación.

• Pronóstico: predice la variable continua para el tiempo. La predicción del volumen de ventas
para los próximos dos años es un escenario muy común en la industria.

• Asociado: Encontrar artículos o grupos comunes en una transacción. La transacción puede ser
una venta en supermercados, medicamentos o ventas en línea.

Requerimientos:

• SQL server 2017


• base de datos AdventureWorks
• Microsoft Visual Studio
1.- Procedimiento: Crear proyecto

1.1.- Crear un proyecto de minería de datos.

1.2.- Configurar la fuente de datos para el proyecto

1.3.- Proporcionar las credenciales de la base de datos


2. Procedimiento: Crear el modelo

2.1.- Crear fuente de datos

2.2.- Abrir el asistente para la creación del modelo


2.3.- Selección de la técnica

2.4.- Seleccionar solo los atributos que cree que tendrán un impacto.
2.5.- Configurar el conjunto de datos de prueba y entrenamiento.

2.6.- Cuando se termine se creará un modelo minero visto en la siguiente pantalla

2.7.- Creación de múltiples modelos


Consultas con los modelos creados
Predicción:

SELECT

PredictTimeSeries([Forecasting].[Amount]) as [PredictedAmount]

, PredictTimeSeries([Forecasting].[Quantity]) as [PredictedQty]

FROM

[Forecasting]

Ejemplo 1: Consulta de contenido en un modelo de asociación

SELECT TOP 10 NODE_DESCRIPTION, NODE_PROBABILITY, SUPPORT

FROM <model>.CONTENT WHERE NODE_TYPE = 7

SELECT FLATTENED NODE_UNIQUE_NAME, NODE_DESCRIPTION,

(SELECT RIGHT(ATTRIBUTE_NAME, (LEN(ATTRIBUTE_NAME)-LEN('Association model name')))

FROM NODE_DISTRIBUTION
WHERE LEN(ATTRIBUTE_NAME)>2

AS RightSideProduct

FROM [<Association model name>].CONTENT

WHERE NODE_TYPE = 8

ORDER BY NODE_SUPPORT DESC

Ejemplo 2: Consulta de contenido en un modelo de árboles de decisión

SELECT Predict([Bike Buyer]), PredictNodeID([Bike Buyer])

FROM [<decision tree model name>]

PREDICTION JOIN

<input rowset>

SELECT NODE_CAPTION

FROM [<decision tree model name>]

WHERE NODE_UNIQUE_NAME= '<node id>'

REFERENCIAS

https://www.sqlshack.com/introduction-to-sql-server-data-mining/

https://docs.microsoft.com/en-us/analysis-services/data-mining/data-mining-
ssas?view=asallproducts-allversions

También podría gustarte