Está en la página 1de 16

Minera de Datos

PRESENTADO POR GRUPO 2:


DANNY RAMIREZ 20061006296
DENIS ROSALES 20070000844
CRISTHIAN MILLA 20070002865
JOSHUA BONILLA 20081011437
KENIA VALLADARES 20091900412
SHIRLEY MARTINEZ 20131008717
JOSHUA BENITEZ 20131000342

La minera de datos funge un rol importantsimo


en las grandes industrias y mercados alrededor del
mundo para poder encontrar la forma de saber
qu es lo que sus clientes necesitan, en que gastan
ms dinero y en que se puede obtener una ventaja
competitiva.

Existen multitud de reas que han integrado en su


actividad las tcnicas de la Minera de Datos para
Recuperar Informacin Destacan, entre las reas
que utilizan la Minera de Datos para recuperar
informacin, las siguientes:

Clculo de indicadores financieros


Anlisis de riesgos de crdito
Educacin
Procesos Industriales
Modelos de calidad
Extraccin de modelos de coste
Prediccin de fallos y accidentes
Recomendacin de frmacos
Telecomunicaciones
Establecimiento de patrones de llamadas
Turismo
Trfico
Poltica

Objetivo General:
Aprender a utilizar los mtodos de minera de datos aplicados a
una base de datos con grandes volmenes de informacin para
obtener informacin til en el proceso de toma de decisiones.
Objetivos Especficos:
Identificar mediante algoritmos especficos:
las prendas ms utilizadas por los deportistas, as como el
tiempo promedio de uso.
Predecir en que pocas del ao son ms vendidos los accesorios
y repuestos de ciclismo y a que compaas pertenecen.
Identificar a los clientes que muestran mayor crecimiento
anual.

SOFTWARE A UTILIZAR
La base de datos que se utilizar para este
proyecto est creada con el SGBD SQL
Server; y por lo tanto este es el sistema gestor
del que haremos uso a lo largo del proyecto.
Visual Studio es un conjunto completo de
herramientas de desarrollo para la generacin
de aplicaciones web ASP.NET, Servicios Web
XML, aplicaciones de escritorio y aplicaciones
mviles. Visual Basic, Visual C# y Visual C++
utilizan todos el mismo entorno de desarrollo
integrado
C# es un lenguaje orientado a objetos
elegante y con seguridad de tipos que permite
a los desarrolladores compilar diversas
aplicaciones slidas y seguras que se
ejecutan en .NET Framework.

MUESTRA Y EXPLICACIN DE LA BASE DE


DATOS A UTILIZAR
AdventureWorks se utiliza en los ejemplos de cdigo de los
Libros en pantalla de SQL Server y en los ejemplos
complementarios que se pueden descargar de la pgina
principal de Microsoft SQL Server Samples. El esquema de la
base de datos se ha diseado para mostrar las caractersticas
de SQL Server. Los nombres de esquema se incluyen con los
nombres de tabla y deben especificarse al realizar consultas en
las tablas.

Estructura de AdventureWorks:
Tabla Address
Tabla ProductModelIllustration
Tabla AddressType
Tabla ProductModelProductDescriptionCulture
Tabla AWBuildVersion
Tabla ProductPhoto
Tabla BillOfMaterials
Tabla ProductProductPhoto
Tabla Contact
Tabla ProductReview
Tabla ContactCreditCard
Tabla ProductSubcategory
Tabla ContactType
Tabla ProductVendor
Tabla CountryRegion
Tabla PurchaseOrderDetail
Tabla CountryRegionCurrency
Tabla PurchaseOrderHeader
Tabla CreditCard
Tabla SalesOrderDetail
Tabla Culture
Tabla SalesOrderHeader
Tabla Currency
Tabla SalesOrderHeaderSalesReason
Tabla CurrencyRate
Tabla SalesPerson
Tabla Customer
Tabla SalesPersonQuotaHistory
Tabla CustomerAddress
Tabla SalesReason
Tabla DatabaseLog
Tabla SalesTaxRate
Tabla Department
Tabla SalesTerritory
Tabla Document
Tabla SalesTerritoryHistory
Tabla Employee
Tabla ScrapReason

Tabla EmployeeAddress
Tabla Shift
Tabla EmployeeDepartmentHistory Tabla ShipMethod
Tabla EmployeePayHistory
Tabla ShoppingCartItem
Tabla ErrorLog
Tabla SpecialOffer
Tabla Illustration
Tabla SpecialOfferProduct
Tabla Individual
Tabla StateProvince
Tabla JobCandidate
Tabla Store
Tabla Location
Tabla StoreContact
Tabla Product
Tabla TransactionHistory
Tabla ProductCategory
TablaTransactionHistoryArchive
Tabla ProductCostHistory
Tabla UnitMeasure
Tabla ProductDescription
Tabla Vendor
Tabla ProductDocument
Tabla VendorAddress
Tabla ProductInventory
Tabla VendorContact
Tabla ProductListPriceHistory
Tabla WorkOrder
Tabla ProductModel
Tabla WorkOrderRouting

Algoritmo de rboles de decisin


El algoritmo de rboles de decisin es un algoritmo
de clasificacin y regresin proporcionado por
Microsoft SQL Server Analysis Services para el
modelado de prediccin de atributos discretos y
continuos.
Para los atributos discretos, el algoritmo hace
predicciones basndose en las relaciones entre las
columnas de entrada de un conjunto de datos. Utiliza
los valores, conocidos como estados, de estas
columnas para predecir los estados de una columna
que se designa como elemento de prediccin.
Especficamente, el algoritmo identifica las columnas
de entrada que se correlacionan con la columna de
prediccin.

La tcnica de minera de datos cuenta con una variedad de algoritmos


para implementar a la hora de manipular datos en la bsqueda de
informacin especfica como relaciones patrones, coincidencias etc.

Algoritmo de clsteres de Microsoft


El algoritmo de clsteres es un algoritmo de
segmentacin suministrado por Analysis Services. El
algoritmo utiliza tcnicas iterativas para agrupar los
casos de un conjunto de datos dentro de clsteres que
contienen caractersticas similares. Estas agrupaciones
son tiles para la exploracin de datos, la identificacin
de anomalas en los datos y la creacin de predicciones.
Los modelos de agrupacin en clsteres identifican las
relaciones en un conjunto de datos que no se podran
derivar lgicamente a travs de la observacin casual

La transformacin de los datos la hemos realizado mediante una interface


grfica de usuarios elaborada a travs del lenguaje de programacin C#, esta
interface interacta de modo que los usuarios seleccionen el tipo de tcnica o
algoritmo deseado para extraer informacin representada a travs de mtodos
grficos.

Conclusiones

La minera de datos automatiza el proceso de encontrar informacin predecible en grandes


bases de datos.

La diferencia fundamental entre las aplicaciones clsicas de la estadstica y la minera de


datos es el tamao del conjunto de datos ya que para un proceso estadstico, un conjunto
grande de datos contendr cientos o miles de datos, mientras que para un proceso de
minera de datos, millones o incluso miles de millones no es algo inesperado.

Las tcnicas de minera de datos pueden redituar los beneficios de automatizacin en las
plataformas de hardware y software existentes y pueden ser implementadas en sistemas
nuevos a medida que las plataformas existentes se actualicen y nuevos productos sean
desarrollados.

El campo de uso de la minera de datos cada vez es ms amplio, debido a que esta tcnica
permite la manipulacin de considerables volmenes de datos, con el fin de buscar patrones
o relaciones sus usos van desde: el gobierno, empresas, universidades etc.
Existe una variedad de algoritmos implementados en la minera de datos, los cuales no
suponen mayor complejidad de entendimiento, y pueden adaptarse segn las necesidades
del usuario/cliente.

Gracias por su atencin!!!

También podría gustarte