Está en la página 1de 73

Proyecto de Mineria de datos con Analysis Services

Minera de datos

Trabajo
Subir el archivo con sus imgenes en una archivo de texto. Guarde el proyecto de Analysis Services con su apellido y Nombre Ejemplo (RuizCarlos.). Suba ambos archivos al aula virtual. NOTA: Guarde periodicamente su proyecto, para no perder el avance realizado. El trabajo es individual

Creacin del proyecto


Para crear un proyecto de Analysis Services Abra Business Intelligence Development Studio. En el men Archivo, seleccione Nuevo y haga clic en Proyecto. Compruebe que la opcin Proyectos de Business Intelligence est seleccionado en el panel Tipos de proyecto. Compruebe que Proyecto de Analysis Services est seleccionado en el panel Plantillas. En el cuadro Nombre, escriba ASDataMining2008 como nombre del nuevo proyecto. Haga clic en Aceptar. Para cambiar la instancia donde se almacenan los objetos de minera de datos En Business Intelligence Development Studio, en el men Proyecto, seleccione Propiedades. En el lado izquierdo del panel Pginas de propiedades, en Propiedades de configuracin, haga clic en Implementacin. En el lado derecho del panel Pginas de propiedades, en Destino, compruebe que el nombre de Servidor es localhost. Si usa una instancia diferente, escriba el nombre de la instancia. Haga clic en Aceptar.

Creando proyecto

Men Proyecto Propiedades Destino

Crear origen de datos


Para crear un origen de datos En el Explorador de soluciones, haga clic con el botn secundario en la carpeta Orgenes de datos y seleccione Nuevo origen de datos. En la pgina de inicio del Asistente para orgenes de datos, haga clic en Siguiente. En la pgina Seleccionar cmo definir la conexin, haga clic en Nueva para agregar una conexin a la base de datos de AdventureWorksDW2008. En la lista Proveedor del Administrador de conexiones, seleccione OLE DB nativo\SQL Server Native Client 10.0. En el cuadro Nombre del servidor, escriba o seleccione el nombre del servidor en el que instal AdventureWorksDW2008. Por ejemplo, escriba localhost , si la base de datos se hospeda en el servidor local. En el grupo Iniciar sesin en el servidor, seleccione Utilizar autenticacin de Windows.

Conexin

Crear origen de datos (Cont.)


En la lista Seleccionar o escribir un nombre de base de datos, seleccione AdventureWorksDW2008 y haga clic en Aceptar. Haga clic en Siguiente. En la pgina Informacin de suplantacin, haga clic en Utilizar la cuenta de servicio y, a continuacin, haga clic en Siguiente. En la pgina Finalizacin del asistente, observe que, de forma predeterminada, el origen de datos se denomina Adventure Works DW2008R2. Haga clic en Finalizar. El nuevo origen de datos, Adventure Works DW2008R2, aparece en la carpeta Orgenes de datos del Explorador de soluciones.

Cuenta de servicio (Analysis Services)

Fin del asistente

Crear la vista de origen de datos


Para crear una vista de origen de datos En el Explorador de soluciones, haga clic con el botn secundario en Vistas del origen de datos y seleccione Nueva vista del origen de datos. En la pgina Asistente para vistas del origen de datos, haga clic en Siguiente. En la pgina Seleccionar un origen de datos, en Orgenes de datos relacionales, seleccione el origen de datos Adventure Works DW2008R2 que cre en la ltima tarea. Haga clic en Siguiente.

Asistente de vista de origen de datos

Seleccionar el origen de datos

Crear la vista de origen de datos (cont.)


En la pgina Seleccionar tablas y vistas, seleccione los objetos siguientes y, a continuacin, haga clic en la flecha derecha para incluirlos en la nueva vista del origen de datos:
ProspectiveBuyer (dbo): la tabla de compradores probables de una bicicleta vTargetMail (dbo): la vista de datos histricos sobre los compradores de una bicicleta en el pasado

Haga clic en Siguiente. En la pgina Finalizando el asistente, la vista del origen de datos tendr el nombre Adventure Works DW2008R2, de forma predeterminada. Cambie el nombre por Targeted Mailing y, a continuacin, haga clic en Finalizar. La nueva vista del origen de datos se abre en la ficha Targeted Mailing.dsv [Design].

Seleccione las tablas

Cambiar nombre

Vista de diseo

Crear estructura de Modelo de Minera de datos


Para crear una estructura de minera de datos para un escenario de distribucin de correo directo En el Explorador de soluciones, haga clic con el botn secundario en Estructuras de minera de datos y seleccione Nueva estructura de minera de datos para iniciar el Asistente para minera de datos. En la pgina de inicio del Asistente para minera de datos, haga clic en Siguiente. En la pgina Seleccionar el mtodo de definicin, compruebe que la opcin A partir de una base de datos relacional o un almacn de datos se ha seleccionado y, a continuacin, haga clic en Siguiente. En la pgina Crear la estructura de minera de datos, en Qu tcnica de minera de datos desea utilizar?, seleccione rboles de decisin de Microsoft.

Crear estructura de MD

Asistente

A partir de una BD relacional

Definir la tcnica

Defina la vista

Definir el caso (escenario)

Crear estructura de Modelo de Minera de datos (Cont.)


Haga clic en Siguiente. En la pgina Seleccionar vista del origen de datos, en el panel Vistas del origen de datos disponibles, seleccione Targeted Mailing. Puede hacer clic en Explorar para ver las tablas de la vista del origen de datos y, a continuacin, hacer clic en Cerrar para volver al asistente. Haga clic en Siguiente. En la pgina Especificar tipos de tablas, active la casilla de la columna Caso, correspondiente a vTargetMail para usarla como tabla de casos y, a continuacin, haga clic en Siguiente. Utilizar la tabla ProspectiveBuyer posteriormente para pruebas; psela por alto por ahora. En la pgina Especificar los datos de aprendizaje, identificar al menos una columna de prediccin, una columna de clave y una columna de entrada para el modelo. Active la casilla de la columna De prediccin en la fila BikeBuyer.

Datos de aprendizaje

Crear estructura de Modelo de Minera de datos (Cont.)


Haga clic en Sugerir para abrir el cuadro de dilogo Sugerir columnas relacionadas. El botn Sugerir est habilitado siempre que se haya seleccionado al menos un atributo predecible. El cuadro de dilogo Sugerir columnas relacionadas enumera en una lista las columnas ms relacionadas con la columna predecible y ordena los atributos por su correlacin con el atributo predecible. Las columnas con una correlacin significativa (con una confianza mayor del 95%) se seleccionan automticamente para incluirse en el modelo. Revise las sugerencias y, a continuacin, haga clic en Cancelar para omitirlas.

Boton SUGERIR

Crear estructura de Modelo de Minera de datos (Cont.)


Compruebe que la casilla de la columna Key est seleccionada en la fila CustomerKey.

Datos de aprendizaje (actualizado)

Datos de aprendizaje (actualizado)

Datos de aprendizaje (actualizado)

Datos de aprendizaje (actualizado)

Crear estructura de Modelo de Minera de datos (Cont.)


Active las casillas de la columna Entrada en las filas siguientes. Puede activar varias columnas resaltando un rango de celdas y presionando CTRL mientras activa una casilla.
Age CommuteDistance EnglishEducation EnglishOccupation Gender GeographyKey HouseOwnerFlag MaritalStatus NumberCarsOwned NumberChildrenAtHome Region TotalChildren YearlyIncome

Crear estructura de Modelo de Minera de datos (Cont.)


En la columna izquierda de la pgina, active las casillas de las filas siguientes.
AddressLine1 AddressLine2 DateFirstPurchase EmailAddress FirstName LastName.

Asegrese de que estas filas slo tienen marcas en la columna izquierda. Estas columnas se agregarn a la estructura pero no se incluirn en el modelo. Sin embargo, una vez generado el modelo, estarn disponibles para la obtencin de detalles y las pruebas.

Especificar el tipo de datos y el tipo de contenido


Revisar y modificar el tipo de contenido y el tipo de datos de cada columna En la pgina Especificar el contenido y el tipo de datos de las columnas, haga clic en Detectar para ejecutar un algoritmo que determine los tipos de contenido y los datos predeterminados de cada columna. Revise las entradas de las columnas Tipo de contenido y Tipo de datos, y cmbielas si es necesario para asegurarse de que la configuracin es igual que la que se muestra en la tabla siguiente. Normalmente, el asistente detectar nmeros y asignar un tipo de datos numrico adecuado, pero hay varias situaciones en las que podra desear tratar un nmero como texto. Por ejemplo, GeographyKey se debera tratar como texto, porque no sera apropiado realizar operaciones matemticas en este identificador.

Revisar las entradas


Columna Address Line1 Address Line2 Age Bike Buyer Commute Distance CustomerKey Tipo de contenido Discrete Discrete Continuous Discrete Discrete Key Tipo de datos Text Text Long Long Text Long

DateLastPurchase
Email Address English Education English Occupation FirstName Gender Geography Key House Owner Flag Last Name Marital Status Number Cars Owned Number Children At Home Region Total Children Yearly Income

Continuous
Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Continuous

Date
Text Text Text Text Text Text Text Text Text Long Long Text Long Double

Contenido y Tipo de Datos

Contenido y Tipo de Datos (Cont.)

Especificar un conjunto de datos de pruebas


Para especificar el conjunto de pruebas En la pgina Crear conjunto de pruebas, en Porcentaje de datos para pruebas, deje el valor predeterminado 30. En Nmero mximo de casos en el conjunto de datos de prueba, escriba 1000. Haga clic en Siguiente.

Definir porcentaje

Especificar un conjunto de datos de pruebas (cont.)


Para denominar el modelo y la estructura, y especificar la obtencin de detalles En la pgina Finalizacin del asistente, en Nombre de la estructura de minera de datos, escriba Targeted Mailing. En Nombre del modelo de minera de datos, escriba TM_Decision_Tree. Active la casilla Permitir obtencin de detalles. Revise el panel Vista previa. Observe que se muestran slo las columnas seleccionadas como Clave, Entrada o De prediccin. Las otras columnas que seleccion (por ejemplo, AddressLine1) no se usan para generar el modelo, pero estarn disponibles en la estructura subyacente y se pueden consultar una vez procesado e implementado el modelo. Haga clic en Finalizar.

Asistente

Vista del proyecto

Agregar y Procesar Modelos


Para crear un modelo de minera de datos de agrupacin en clsteres Cambie a la ficha Modelos de minera de datos del Diseador de minera de datos en Business Intelligence Development Studio. Observe que el diseador muestra dos columnas: una para la estructura de minera de datos y otra para el modelo de minera de datos TM_Decision_Tree, que cre en la tarea anterior de esta leccin. Haga clic con el botn secundario en la columna Estructura y seleccione Nuevo modelo de minera de datos. En el cuadro de dilogo Nuevo modelo de minera de datos, en Nombre del modelo, escriba TM_Clustering. En Nombre del algoritmo, seleccione Agrupacin en clsteres de Microsoft. Haga clic en Aceptar.

Vista de Modelo de Minera

Nuevo modelo

Nuevo modelo Clustering

Ahora existe una nueva columna

Nuevo Modelo
Ahora aparece el modelo nuevo en la ficha Modelos de minera de datos del Diseador de minera de datos. Este modelo, integrado con el algoritmo de clsteres de Microsoft, agrupa los clientes con caractersticas similares en clsteres y predice la compra de una bicicleta en cada clster. Aunque puede modificar el uso y las propiedades de la columna para el modelo nuevo, en este tutorial no es necesario hacer cambios en el modelo TM_Clustering.

Agregar y Procesar Modelos (Cont.)


Para crear un modelo de minera de datos Bayes naive En la ficha Modelos de minera de datos del Diseador de minera de datos, haga clic con el botn secundario enla columna Estructura y seleccione Nuevo modelo de minera de datos. En el cuadro de dilogo Nuevo modelo de minera de datos, en Nombre del modelo, escriba TM_NaiveBayes. En Nombre del algoritmo, seleccione Bayes naive de Microsoft y haga clic en Aceptar. Aparece un mensaje que indica que el algoritmo Bayes naive de Microsoft no admite las columnas Age y Yearly Income, que son continuas. Haga clic en S para confirmar el mensaje y continuar. Aparece un modelo nuevo en la ficha Modelos de minera de datos del Diseador de minera de datos. Aunque puede modificar el uso y las propiedades de las columnas para todos los modelos de la ficha, en este tutorial no es necesario hacer cambios en el modelo TM_NaiveBayes.

Modelo Naive Bayes

Advertencia

Nuevo Modelo Naive Bayes

Procesar los modelos


Para establecer el valor de inicializacin de exclusin Haga clic en la ficha Estructuras de minera de datos o Modelos de minera de datos en el Diseador de minera de datos de Business Intelligence Development Studio. Estructura de minera de datos Targeted Mailing aparece en el panel Propiedades. Asegrese de que el panel Propiedades est abierto presionando F4. Asegrese de que CacheMode est establecido en KeepTrainingCases. Escriba 12 en HoldoutSeed.

Propiedades

Implementar y Procesar los Modelos


En el men Modelo de minera de datos , seleccione Procesar estructura de minera de datos y todos los modelos. Si ha realizado cambios en la estructura, se le pedir que genere e implemente el proyecto antes de procesar los modelos. Haga clic en S. En el cuadro de dilogo Procesando estructura de minera de datos: Targeted Mailing, haga clic en Ejecutar. Se abre el cuadro de dilogo Progreso del proceso para mostrar los detalles del procesamiento del modelo. El procesamiento del modelo podra tardar algn tiempo, segn el equipo. Haga clic en Cerrar en el cuadro de dilogo Progreso del proceso cuando el procesamiento de los modelos se haya completado. Haga clic en Cerrar en el cuadro de dilogo Procesando estructura de minera de datos - <estructura>.

Menu Mdelo de Minera de datos

Elija Procesar y vera la ventana

Termina la implementacin

Procesando la estructura

Procesando la estructura (Cont.)

Explorar los modelos


Cada modelo se muestra en la ficha Visor de modelos de minera de datos En caso que se presente la ventana de actualizar responda SI.

Visor de Modelos

Red de dependencias

Clustering

Perfiles de Cluster

Caractersticas del cluster

Distincin del Cluster

NaiveBayes Red de dependencias

Perfiles de Atributo

Caractersticas del atributo

Distincin del atributo

También podría gustarte