Está en la página 1de 1

Conceptos de Minería de Datos B. Análisis de patrones fraudulentos.

• Qué valores se deben utilizar para la función de minería determinada que


está utilizando

A. Pronóstico: cálculo de las ventas y predicción de las cargas del servidor o C. Identificación de patrones inusuales, hábitos y tendencias.
del tiempo de inactividad del servidor. • Dónde desea almacenar el modelo final

D. Asociación multidimensional y análisis de patrones secuenciales.


B. Riesgo y probabilidad: elección de los mejores clientes para la 3.- Prueba de un modelo y análisis de su calidad.
distribución de correo directo, determinación del punto de equilibrio
4. Análisis de datos biológicos: el campo de la biología es uno de los más beneficiados por los
probable para los escenarios de riesgo, y asignación de probabilidades a
avances de la tecnología. La genómica, la proteómica, la genómica funcional y la minería de • Se puede probar un modelo de Clasificación o Regresión. Después, se
diagnósticos y otros resultados.
datos aplicada a la investigación de los seres vivos son sólo algunos ejemplos, una lista donde puede analizar la calidad del modelo.
no hay que olvidarse de la bioinformática. La minería de datos con sus aplicaciones aporta una
C. Recomendaciones: determinación de los productos que se pueden contribución importante para el análisis de datos biológicos:
4.- Utilización de un modelo que ofrece información acerca de:
vender juntos y generación de recomendaciones.

A. Integración semántica de las bases de datos genómicos y proteómicos


• ->La visualización de los resultados.
D. Búsqueda de secuencias: análisis de los artículos que los clientes han heterogéneos distribuidos.
introducido en el carrito de la compra y predicción de posibles eventos.
• ->Puntuación de los registros de datos.
B. Alineamiento, indexación, búsqueda de similitudes y análisis comparativo
E. Agrupación: distribución de clientes o eventos en grupos de elementos de múltiples secuencias de nucleótidos.
relacionados, y análisis y predicción de afinidades. • ->Análisis de un modelo y preparación para otros pasos del proceso.
C. Descubrimiento de patrones y análisis de redes genéticas.
La generación de un modelo de minería de datos forma parte de un proceso mayor que incluye Obtención de información a través de patrones de búsqueda.
desde la formulación de preguntas acerca de los datos y la creación de un modelo para
D. Identificación de patrones de proteínas estructurales.
responderlas, hasta la implementación del modelo en un entorno de trabajo. Este proceso se
De manera general podemos decir que existen dos formas de identificar patrones, la primera es
puede definir mediante los seis pasos básicos siguientes:
a través de algoritmos y las segunda están basadas en métodos matemáticos como las
Problemas de la minería de datos
transformadas de Fourier. Sin embargo, las técnicas basadas en transformadas de Fourier
1. Definición del problema suelen ser costosas en tiempo de ejecución y en algunos casos no proveen soluciones correctas,
1. Descripción de datos y resumen ya que resulta difuso determinar el inicio y el término de un período.
2. Preparación de datos
2. Segmentación Reglas de Asociación
3. Explorar los datos
a) Técnicas de agrupamiento (clustering) La tarea de reglas de asociación, propuestas por Agrawal [14], permite obtener patrones que
tienen la representación de reglas y muestran conjuntos de elementos que co-ocurren de
4. Creación de modelos
manera frecuente en un conjunto de transacciones. Basados en la implicancia que pueden
b) Redes Neuronales
ocurrir entre conjuntos de eventos se utilizan umbrales de soporte y confianza para establecer
5. Exploración y validación de modelos identificar patrones significativos.
c) Visualización
6. Implementar y actualizar los modelos Apriori
3. Descripciones de concepto
Use los modelos para crear predicciones que luego podrá usar para tomar decisiones Propuestos por Agrawal y Srikant [16] en 1994, Apriori es un algoritmo utilizado en minería de
comerciales. SQL Server proporciona el lenguaje DMX que puede usar para crear consultas de a) Métodos de inducción de reglas datos, inicialmente desarrollado para ofrecer soluciones sobre bases de datos transaccionales,
predicción y el Generador de consultas de predicción para ayudarle a crear las consultas. Para el cual tiene como objetivo generar conjuntos de ítems frecuentes. Dichos conjuntos son
más información, vea Referencia de Extensiones de minería de datos (DMX). generados a partir de sub-conjuntos encontrados previamente en la Base de Datos con una tasa
b) Agrupamiento conceptual
de aparición suficiente.

Crear consultas de contenido para recuperar estadísticas, reglas o fórmulas del modelo. Para
4. Clasificación
obtener más información, vea Consultas de minería de datos. Técnicas y herramientas de la minería

a) Análisis de discriminante
Incrustar la funcionalidad de minería de datos directamente en una aplicación. Puede incluir 1. Árbol de decisión
Objetos de administración de análisis (AMO), que contiene un conjunto de objetos que la
aplicación pueda utilizar para crear, cambiar, procesar y eliminar estructuras y modelos de b) Métodos de inducción de regla
2. Red neuronal
minería de datos. Como alternativa, puede enviar mensajes XML for Analysis (XMLA)
directamente a una instancia de SQL Server Analysis Services. Para obtener más información,
c) Aprendizaje por árboles de Decisión
vea Desarrollo (Analysis Services - Minería de datos). 3. Modelado estadístico

d) Redes neuronales
Modelos de Minería de datos 4. Reglas de asociación

e) La K más cercana
La minería de datos tiene como objetivo analizar los datos para extraer conocimiento. Este 5. Agrupamiento
conocimiento puede ser en forma de relaciones, patrones o reglas inferidos de los datos. Estas
relaciones o resúmenes constituyen el modelo de los datos analizados. Existen muchas formas f) Razonamiento basado en caso
6. Algoritmo genético
diferentes de representar los modelos y cada una de ellas determina el tipo de técnica que
puede usarse para inferirlos.
g) Algoritmos genéticos
7. Regresión lineal
En la práctica, los modelos pueden ser de dos tipos: predictivos y descriptivos.
5.Predicción
8. Redes bayesianas
A. Los modelos predictivos pretenden estimar valores futuros o
desconocidos de variables de interés, que se denominan variables a) Análisis de regresión
objetivo, usando otras variables de la base de datos, a las que se conocen
como variables independientes. b) Árboles de regresión

B. Los modelos descriptivos, en cambio, identifican patrones que explican o c) Redes neuronales
resumen los datos, es decir, sirven para explorar las propiedades de los
datos examinados, no para predecir nuevos datos.
d) La K más cercana

Cada tarea puede ser realizada usando distintas técnicas. Por ejemplo, los modelos
inferidos por los árboles de decisión y las redes neuronales pueden inferir modelos e) Métodos de la Caja-Jenkins
predictivos. Igualmente, para una misma técnica se han desarrollado diferentes
algoritmos que difieren en la forma y criterios concretos con los que se construye el f) Algoritmos genéticos
modelo.

6.Análisis de dependencia
Aplicaciones de la minería de datos

a) Análisis de correlación
1. Análisis de datos financieros: se emplea tanto en el sector bancario como en el de las
finanzas. Se busca proveer datos que aseguren que es posible practicar análisis sistemáticos en
condiciones avanzadas y con garantías de fiabilidad. Algunos ejemplos son: b) Análisis de regresión

A. Diseño y construcción de almacenes de datos para el análisis c) Reglas de asociación


multidimensional de datos.
d) Redes bayesianas
B. Predicción de pago de préstamos y análisis de políticas de crédito de
cliente. e) Programación de lógica inductiva

C. Clasificación y el agrupamiento de los clientes para la creación de ofertas f) Técnicas de visualización


personalizadas.

Proceso de minería de datos.


D. Detección de blanqueamiento de dinero y otros delitos financieros.

El proceso de minería de datos comprende varios pasos como crear, probar y trabajar con los
2. Industria minorista: el sector retail recoge grandes cantidades de datos provenientes de las modelos de minería.
ventas, el historial de compra de los clientes o el transporte de mercancías. La cantidad de
datos recogidos continúa expandiéndose rápidamente debido al aumento de la facilidad,
disponibilidad y popularidad de la web y las transacciones online. La minería de datos con sus El proyecto de minería de datos comienza con un plan bien definido de inteligencia comercial.
aplicaciones para la industria minorista ayuda a identificar patrones de compra de los clientes y Los analistas de la empresa definen el problema a resolver y el objetivo concreto de empresa
tendencias. De esta forma, las empresas están en condiciones de proporcionar una mejor que se desea cumplir. Cuanto mejor sea esta formulación inicial, más claras serán las directrices
calidad de servicio al cliente, aumentando su satisfacción y facilitando su retención. Entre estas acerca de los datos y las funciones de minería que se utilizan para conseguir los resultados
aplicaciones destacan las que permiten: deseados.

A. El análisis multidimensional de las ventas, los clientes, los productos, el El proyecto de minería de datos consta de las fases principales siguientes:
tiempo y la región.
1.- Selección y preparación de datos.
B. Los análisis de la eficacia de las campañas de ventas.
2.- Creación del modelo de minería de datos (también denominada fase de preparación).
C. La recomendación personalizada de productos.
Un modelo de minería de datos se crea a partir de un conjunto específico de datos de entrada.
D. Las referencias cruzadas de artículos.
Durante el proceso de creación del modelo, una vez preparados los datos, debe especificar sus
3. Industria de las telecomunicaciones: en este sector, los datos son especialmente decisiones sobre:
importantes para alcanzar una buena comprensión del negocio. La minería de datos y
aplicaciones específicamente diseñadas para este área, ayudan en la identificación de los • Dónde residen los datos de entrada
patrones de telecomunicaciones, facilitan la detección de actividades fraudulentas y posibilitan
el hacer un mejor uso de los recursos, mejorando la calidad del servicio. Entre las más
ventajosas están: • Qué campos de los datos de entrada son apropiados

A. Análisis multidimensional de datos de telecomunicaciones.

También podría gustarte