Está en la página 1de 5

Ejercicio 1 Medir el Desempeño del Modelo

En este ejercicio, se van a evaluar modelos de predicción mediante el uso de Lift Chart,
Classification Matriz y validación cruzada.

1. Abra el Proyecto de Modelos de Minería TK 70-448 que creó en las prácticas anteriores.

2. Haga doble clic en la estructura minera de predicción TK448 Ch09 Prediction para abrir la
ventana de Data Mining Diseñador. En la ficha Modelos de explotación minera, haga clic con el
botón secundario en el modelo de árboles de decisión filtrado (se muestra en la última columna
de la derecha) y, a continuación, seleccione Eliminar. Haga clic en Aceptar para confirmar la opción
borrado. Está eliminando el modelo para obtener un gráfico de elevación menos desordenado.

3. Despliegue y procese la solución.

4. Haga clic en la ficha Cuadro de precisión de minería.

5. En el panel superior, asegúrese de que las casillas de verificación de todos los modelos de
minería están seleccionadas en las columnas de los modelos de minería predecibles seleccionados
para mostrar en el diagrama de levantamiento y que las columnas de los modelos de minería
predecibles La casilla Sincronizar columnas y valores de predicción está activada. Verifique
también que en el área Select Data Set To Be Used For Accuracy Chart, el Use Mining Model Test
La opción Casos está seleccionada. Deje el cuadro Expresión de filtro vacío.

6. En la columna Valor Predictivo de las Columnas de Seleccionar Modelo Minero Predecible a


Mostrar En La carta de la elevación, seleccione 1 en la lista desplegable de cualquier fila. Debido a
que la casilla de verificación SincronizarPredicción de Columnas y Valores está seleccionada, debe
obtener el mismo valor en todas las filas de la columna Predecir Valor automáticamente. Su
selección completada debe ser similar a la que se muestra en la Figura 9-23.

7. Haga clic en la ficha Carta de elevación. Examine la tabla de elevación.

8. Haga clic en la ficha Matriz de clasificación. Examina la matriz.

9. Haga clic en la ficha Validación cruzada. Utilice los siguientes parámetros: Conteo doble igual a
3, Casos máximos igual a 3,000, Atributo objetivo igual a Comprador de Bicicleta, Estado objetivo
igual a 1, y Umbral objetivo igual a 0.5. Haga clic en Obtener resultados y, a continuación, examine
los resultados. Por ejemplo, compruebe la medida Verdadero Positivo para cada uno de los
modelos (la primera medida para cada uno de los modelos). La medida True Positive (Verdadero
Positivo) muestra cuántas veces las predicciones positivas (como Bike Buyer = 1) fueron realmente
positivas. Debería ver que la desviación estándar del número de las predicciones positivas
verdaderas para tres divisiones diferentes de los datos de entrenamiento es mayor para los
árboles de decisión que para la red neuronal, aunque el número de predicciones positivas
verdaderas es mayor para los árboles de decisión; esto significa que aunque los árboles de
decisión da predicciones positivas más precisas, estas predicciones no son tan estables como
Predicciones de redes neuronales cuando se utilizan diferentes conjuntos de datos.

10. Grabe el proyecto. No salir de BIDS


Ejercicio 2 Modificar la DSVEn este ejercicio, utilizará un nuevo conjunto de
datos de clientes potenciales y realizará predicciones sobre este conjunto de datos. Este
conjunto de datos se encuentra en la base de datos AdventureWorksDW2008 de
dbo.ProspectiveBuyer mesa.

1. Si usted cerró el Proyecto de Modelos de Minería TK 70-448 en BIDS, vuelva a abrirlo.

2. En el Explorador de soluciones, haga doble clic en Adventure Works DW2008 DSV para abrirlo
en el directorio Diseñador de la vista de la fuente de datos. Haga clic con el botón derecho del
ratón en el espacio en blanco del panel que contiene el icono de su DSV y, a continuación,
seleccione Agregar o quitar tablas.

3. Añada la tabla dbo.ProspectiveBuyer a la DSV.

4. Guardar, implementar y procesar el proyecto


Ejercicio 3 Crear el informe
Su próxima tarea es crear un informe con predicciones sobre el conjunto de datos del cliente
potencial.

1. En BIDS, con el Proyecto de Modelos de Minería TK 70-448 abierto, en el menú Archivo,


seleccione Añadir, Nuevo proyecto. Seleccione la plantilla Asistente de proyecto de Servidor de
informes. Tipo TK 70-448 SSRS DMX Project para el nombre del proyecto y, a continuación, guarde
el proyecto en la carpeta para esta lección.

2. En la página de bienvenida del Asistente de informes, haga clic en Siguiente.

3. En la página Seleccionar la fuente de datos, seleccione Nueva fuente de datos y, a continuación,


escriba TK 70-448 Data Mining como su nombre. En la lista desplegable Tipo, seleccione Microsoft
SQL Server Analysis Services. Haga clic en Editar y, a continuación, seleccione las siguientes
opciones:

a. Use (local) como nombre del servidor.

b. Seleccione la base de datos de Servicios de Análisis de Proyectos de Modelos de Minería TK 70-


448. Pruebe el y, a continuación, haga clic en Aceptar.

c. Haga clic en el botón Credenciales para verificar que la autenticación de Windows (Integrado
Seguridad) y, a continuación, haga clic en Aceptar.

4. Haga clic en Siguiente.

5. En la página Diseñar la consulta, haga clic en Generador de consultas.

6. Cambie el tipo de comando a DMX haciendo clic en el botón Tipo de comando (el cual se parece
a una herramienta de selección) en la barra de herramientas y, a continuación, haga clic en Sí.

7. En el panel Modelo de minería, haga clic en Seleccionar modelo. En el cuadro de diálogo


Seleccionar modelo de extracción, amplíe la predicción del TK448 Ch09 y luego seleccione la
decisión de predicción del TK448 Ch09 Modelo de árboles. Haga clic en Aceptar.

8. En el panel Seleccionar tabla(s) de entrada, haga clic en Seleccionar tabla de casos y, a


continuación, seleccione el cuadro de diálogo Comprador potencial. mesa. Haga clic en Aceptar.

9. En la lista de columnas (es decir, en la columna Fuente de la tabla en la parte inferior de la


consulta Diseñador), seleccione las columnas siguientes:

a. Comprador de bicicletas del modelo minero. Haga clic en la columna Fuente en la primera fila
de la ventana de diálogo en la parte inferior de la ventana Diseñador de consultas y desde el menú
desplegable seleccione el modelo minero TK 448 Ch09 Prediction Decision Trees. En el campo el
campo Bike Buyer debería estar seleccionado por defecto. Si no lo es, selecciónelo entre la lista
desplegable en esta columna.

b. Utilice las columnas Fuente y Campo en la segunda y tercera filas para seleccionar
ProspectAlternateKey y Apellido de la tabla Comprador potencial.
c. Utilice la columna Fuente en la cuarta fila para seleccionar la opción Función de predicción de la
lista desplegable. Seleccione la función de predicción PredictProbability en el campo Columna de
campo. Escriba Probabilidad de predicción en la columna Alias para esta función. Arrastre la
columna Bike Buyer desde el modelo de minería hasta la ventana Criterios/Argumento de la
función y, a continuación, haga clic en Aceptar para cerrar el Diseñador de consultas.

10. Revise la consulta y, a continuación, haga clic en Siguiente.

11. En la página Seleccionar el tipo de informe, seleccione Tabular y haga clic en Siguiente.

12. En la página Diseñar la mesa, agregue Bike Buyer al marco de grupo y ProspectAlternateKey,
Apellido y probabilidad de predicción en el cuadro Detalles, y

y, a continuación, haga clic en Siguiente.

13. En la página Elegir la disposición de la tabla, seleccione Escalonado. Habilite el desglose


seleccionando la casilla Habilitar desglose y, a continuación, haga clic en Siguiente.

14. En la página Elegir el estilo de tabla, seleccione el estilo de tabla Pizarra y, a continuación, haga
clic en Siguiente.

15. En la página Elegir la ubicación de implementación, compruebe la ubicación de


implementación. Nota que en SSRS 2008, normalmente se utiliza el puerto 80, a menos que SSRS
esté instalado en un ordenador en ejecución el sistema operativo Windows XP SP2 de 32 bits y los
servicios de información de Internet. En en este escenario, el puerto por defecto es el 8080. Por lo
tanto, es posible que deba modificar el Informe Opción de implementación de servidor a, por
ejemplo, http://localhost:8080/ReportServer. Tú puede comprobar la URL del servicio web de
SSRS en el gestor de configuración de Reporting Services o en SSMS haciendo clic con el botón
secundario en su Servidor de Reportes en Object Explorer y luego haciendo clic en Propiedades.
Haga clic en Siguiente.

16. En la página Completar el asistente, escriba Compradores potenciales de bicicletas como el


informe y, a continuación, haga clic en Finalizar.

17. En el Diseñador de informes, en la ventana Diseño, seleccione las propiedades del cuadro de
texto Predicción_ Probabilidad y, a continuación, cambie el formato a N4. Haga clic en Aceptar.

18. En la fila del grupo (que debe ser la segunda fila, entre la fila del encabezado y la fila de
detalles), en la columna Clave alternativa de prospecto, agregue la expresión
=Count(Fields!ProspectAlternateKey.Value) a la celda. Verá el número de casos en esta columna
para cada grupo y la clave alternativa del prospecto real en las filas de detalles al expandir el
grupo.

19. Vista previa del informe. Compruebe el número de casos de cada grupo y, a continuación,
desglose cada uno de ellos. grupo. Por ejemplo, si amplía el grupo en el que Bike Buyer es igual a
1, obtendrá compradores potenciales de bicicletas con su llave alternativa, su apellido y la
probabilidad de que la predicción sea correcta.

20. Guardar todos los proyectos y salir de BIDS


Ejercicio 4 Crear y entrenar modelos usando DMX
Ahora usará DMX para crear una estructura minera con dos modelos predictivos y luego entrenar
la estructura.

1. Abra SSMS, y luego conéctese con Analysis Services en su servidor SSAS local.

2. En el menú Archivo, seleccione Nuevo y, a continuación, Analysis Services DMX Query. Conectar
al servidor SSAS local de nuevo (para la ventana de consulta).

3. Asegúrese de seleccionar la base de datos TK 70-448 Data Mining Project Analysis Services de la
lista desplegable Databases en la esquina superior izquierda de SSMS.

4. Cree una estructura minera llamada TK 448 Ch09 DMX Prediction con lo siguiente atributos:

CustomerKey, tipo de datos LONG, contenido KEY

Género, tipo de datos TEXTO, contenido DISCRETA

Número de coches propios], tipo de datos LARGO, contenido DISCRETO

[Bike Buyer], tipo de datos LARGO, contenido DISCRETO

Puede examinar el comando CREAR ESTRUCTURA MINERA (DMX) en SQL Server 2008 Books
Online (vea Referencias) y usar el ejemplo de código aquí para ver la sintaxis del comando. Su
código debería verse así:

CREATE MINING STRUCTURE [TK 448 Ch09 DMX Prediction]

CustomerKey LONG KEY,

Gender TEXT DISCRETE,

[Number Cars Owned] LONG DISCRETE,

[Bike Buyer] LONG DISCRETE

);

461

También podría gustarte