Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En este ejercicio, se van a evaluar modelos de predicción mediante el uso de Lift Chart,
Classification Matriz y validación cruzada.
1. Abra el Proyecto de Modelos de Minería TK 70-448 que creó en las prácticas anteriores.
2. Haga doble clic en la estructura minera de predicción TK448 Ch09 Prediction para abrir la
ventana de Data Mining Diseñador. En la ficha Modelos de explotación minera, haga clic con el
botón secundario en el modelo de árboles de decisión filtrado (se muestra en la última columna
de la derecha) y, a continuación, seleccione Eliminar. Haga clic en Aceptar para confirmar la opción
borrado. Está eliminando el modelo para obtener un gráfico de elevación menos desordenado.
5. En el panel superior, asegúrese de que las casillas de verificación de todos los modelos de
minería están seleccionadas en las columnas de los modelos de minería predecibles seleccionados
para mostrar en el diagrama de levantamiento y que las columnas de los modelos de minería
predecibles La casilla Sincronizar columnas y valores de predicción está activada. Verifique
también que en el área Select Data Set To Be Used For Accuracy Chart, el Use Mining Model Test
La opción Casos está seleccionada. Deje el cuadro Expresión de filtro vacío.
9. Haga clic en la ficha Validación cruzada. Utilice los siguientes parámetros: Conteo doble igual a
3, Casos máximos igual a 3,000, Atributo objetivo igual a Comprador de Bicicleta, Estado objetivo
igual a 1, y Umbral objetivo igual a 0.5. Haga clic en Obtener resultados y, a continuación, examine
los resultados. Por ejemplo, compruebe la medida Verdadero Positivo para cada uno de los
modelos (la primera medida para cada uno de los modelos). La medida True Positive (Verdadero
Positivo) muestra cuántas veces las predicciones positivas (como Bike Buyer = 1) fueron realmente
positivas. Debería ver que la desviación estándar del número de las predicciones positivas
verdaderas para tres divisiones diferentes de los datos de entrenamiento es mayor para los
árboles de decisión que para la red neuronal, aunque el número de predicciones positivas
verdaderas es mayor para los árboles de decisión; esto significa que aunque los árboles de
decisión da predicciones positivas más precisas, estas predicciones no son tan estables como
Predicciones de redes neuronales cuando se utilizan diferentes conjuntos de datos.
2. En el Explorador de soluciones, haga doble clic en Adventure Works DW2008 DSV para abrirlo
en el directorio Diseñador de la vista de la fuente de datos. Haga clic con el botón derecho del
ratón en el espacio en blanco del panel que contiene el icono de su DSV y, a continuación,
seleccione Agregar o quitar tablas.
c. Haga clic en el botón Credenciales para verificar que la autenticación de Windows (Integrado
Seguridad) y, a continuación, haga clic en Aceptar.
6. Cambie el tipo de comando a DMX haciendo clic en el botón Tipo de comando (el cual se parece
a una herramienta de selección) en la barra de herramientas y, a continuación, haga clic en Sí.
a. Comprador de bicicletas del modelo minero. Haga clic en la columna Fuente en la primera fila
de la ventana de diálogo en la parte inferior de la ventana Diseñador de consultas y desde el menú
desplegable seleccione el modelo minero TK 448 Ch09 Prediction Decision Trees. En el campo el
campo Bike Buyer debería estar seleccionado por defecto. Si no lo es, selecciónelo entre la lista
desplegable en esta columna.
b. Utilice las columnas Fuente y Campo en la segunda y tercera filas para seleccionar
ProspectAlternateKey y Apellido de la tabla Comprador potencial.
c. Utilice la columna Fuente en la cuarta fila para seleccionar la opción Función de predicción de la
lista desplegable. Seleccione la función de predicción PredictProbability en el campo Columna de
campo. Escriba Probabilidad de predicción en la columna Alias para esta función. Arrastre la
columna Bike Buyer desde el modelo de minería hasta la ventana Criterios/Argumento de la
función y, a continuación, haga clic en Aceptar para cerrar el Diseñador de consultas.
11. En la página Seleccionar el tipo de informe, seleccione Tabular y haga clic en Siguiente.
12. En la página Diseñar la mesa, agregue Bike Buyer al marco de grupo y ProspectAlternateKey,
Apellido y probabilidad de predicción en el cuadro Detalles, y
14. En la página Elegir el estilo de tabla, seleccione el estilo de tabla Pizarra y, a continuación, haga
clic en Siguiente.
17. En el Diseñador de informes, en la ventana Diseño, seleccione las propiedades del cuadro de
texto Predicción_ Probabilidad y, a continuación, cambie el formato a N4. Haga clic en Aceptar.
18. En la fila del grupo (que debe ser la segunda fila, entre la fila del encabezado y la fila de
detalles), en la columna Clave alternativa de prospecto, agregue la expresión
=Count(Fields!ProspectAlternateKey.Value) a la celda. Verá el número de casos en esta columna
para cada grupo y la clave alternativa del prospecto real en las filas de detalles al expandir el
grupo.
19. Vista previa del informe. Compruebe el número de casos de cada grupo y, a continuación,
desglose cada uno de ellos. grupo. Por ejemplo, si amplía el grupo en el que Bike Buyer es igual a
1, obtendrá compradores potenciales de bicicletas con su llave alternativa, su apellido y la
probabilidad de que la predicción sea correcta.
1. Abra SSMS, y luego conéctese con Analysis Services en su servidor SSAS local.
2. En el menú Archivo, seleccione Nuevo y, a continuación, Analysis Services DMX Query. Conectar
al servidor SSAS local de nuevo (para la ventana de consulta).
3. Asegúrese de seleccionar la base de datos TK 70-448 Data Mining Project Analysis Services de la
lista desplegable Databases en la esquina superior izquierda de SSMS.
4. Cree una estructura minera llamada TK 448 Ch09 DMX Prediction con lo siguiente atributos:
Puede examinar el comando CREAR ESTRUCTURA MINERA (DMX) en SQL Server 2008 Books
Online (vea Referencias) y usar el ejemplo de código aquí para ver la sintaxis del comando. Su
código debería verse así:
);
461