Está en la página 1de 37

CONTENIDO

Introduccin: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Etapas del KDD. Minera de Datos: Qu es minera de datos? Fuentes de datos. Funciones de minera. Modelos tpicos de minera.

Ejemplos: Clustering. Asociacin.


Conclusiones.

INTELIGENCIA DE NEGOCIOS Hace referencia a un conjunto de productos y servicios para acceder a los datos, analizarlos y convertirlos en informacin. Es un paraguas bajo el que se incluye un conjunto de conceptos y metodologas cuya misin consiste en mejorar el proceso de toma de decisiones en los negocios basndose en hechos y sistemas que trabajan con hechos. HowardDresner GartnerGroup, 1989.

INTELIGENCIA DE NEGOCIOS RECURSOS Y HERRAMIENTAS

Fuentes de datos: Warehouse, Data Marts, etc.


Herramientas de administracin de datos.

Herramientas de extraccin y consulta.


Herramientas de modelizacin(Data Mining).

DESCUBRIMIENTO DE CONOCIMIENTO EN BASES DE DATOS

Es un proceso de extraccin no trivial para identificar patrones que sean vlidos, novedosos, potencialmente tiles y entendibles, a partir de los datos.
Su objetivo principal: procesar automticamente grandes cantidades de datos para encontrar conocimiento til para un usuario y satisfacer sus metas.

DESCUBRIMIENTO DE CONOCIMIENTO EN BASES DE DATOS

Jerarqua

DESCUBRIMIENTO DE CONOCIMIENTO EN BASES DE DATOS

Etapas

QU ES MINERA DE DATOS Es el proceso de exploracin y anlisis de manera automtica o semiautomtica de los datos para obtener patrones significativos y reglas de negocio. Es la aplicacin de las tcnicas de la Inteligencia Artificial. Consideraciones: Los patrones deben ser significativos. Sin automatizacin es imposible mirar grandes cantidades de datos, pero se debe dar ms nfasis a las etapas de exploracin y anlisis, que al modo de exploracin. Data Mining es un proceso.

QU NO ES MINERA DE DATOS No es un producto que se compra enlatado sino una disciplina que debe ser dominada. No es una solucin instantnea a los problemas de negocio. No es un fin en s mismo, sino un proceso que ayuda a encontrar soluciones a problemas de negocio.

EL ANALISTA DE DATOS

Tecnologa Informtica

Usuarios de Negocio

Es el vnculo entre las reas de tecnologa informtica y las reas de negocio. Habilidades requeridas: Manipulacin de datos (SQL). Conocimiento de tcnicas de minera y anlisis exploratorio. Habilidad de comunicacin (interpretacin) de los problemas de negocio.

EL ANALISTA DE DATOS

Objetivos de negocio

Tarea de Descubrimiento

Descubrimiento de conocimientos

Ideas

Descubrimiento de datos

Anlisis de los datos Modelado de los datos

Depuracin de datos Transformacin de datos

Traduce los requerimientos de informacin en preguntas apropiadas para su anlisis con las herramientas de minera.

FUENTES DE DATOS Tipos de fuentes: Transaccionales: ej. operaciones realizadas con una tarjeta de crdito. Relacionales: ej. estructura de productos que ofrece un banco. Demogrficos: ej. caractersticas del grupo familiar. Origen de datos: Bases de datos relacionales. DataWarehouses. Data Marts. Otros formatos: Excel, Access, encuestas, archivos planos.

CALIDAD DE LOS DATOS El xito de las actividades de Data Mining se relaciona directamente con la CALIDAD de los datos. Muchas veces resulta necesario pre-procesar los datos, antes de derivarlos al modelo de anlisis. El pre-proceso puede incluir transformaciones, reducciones o combinaciones de los datos.

La semntica de los datos debe ayudar para seleccionar una conveniente representacin, dado que influye directamente sobre la calidad del modelo.

FUNCIONES DE MINERA Utilizan tcnicas matemticas elaboradas para descubrir patrones ocultos en los datos. Ellas son: Asociacin. Clasificacin neuronal. Clasificacin en rbol. Clustering demogrfico. Clustering neuronal. Patrones secuenciales. Secuencias semejantes. Prediccin neuronal. Prediccin - funcin base radial.

MODELOS TPICOS DE MINERA Clustering. Clasificacin. Estimacin. Prediccin. Agrupamiento a partir de reglas de asociacin.

MODELOS TPICOS DE MINERA CLUSTERING

Agrupar a los clientes segn indicadores F (frecuencia), M (monto), etc en segmentos de comportamientos homogneos. Resultado: Clientes Buenos, Medios, Malos.
El 78% de la facturacin se concentra en el cluster Buenos. Los clientes Buenos son casados, con hijos, trabajadores autnomos con ingreso superior a s/.3000 soles.

MODELOS TPICOS DE MINERA CLASIFICACIN Y ESTIMACIN

Clasificar un nuevo cliente de acuerdo a su perfil sociodemogrfico como un cliente: Bueno. Medio. Malo.
Estimar el consumo de un determinado rubro de artculos de un grupo de clientes en el prximo trimestre.

MODELOS TPICOS DE MINERA PREDICCIN

Predecir el abandono de un cliente:


Para una compaa de telefona celular. Para una AFP. Para una tarjeta de crdito.

MODELOS TPICOS DE MINERA ASOCIACIN

Encontrar las reglas que determinan la interrelacin entre productos para clientes de un banco. Por ejemplo: Cuando un cliente se activa en Caja de Ahorros, el siguiente producto donde se activa es Prstamos Personales. Este patrn ocurre el 65 % de los casos.

ELECCIN DEL MODELO Principales objetivos del proceso de Data Mining: Prediccin. Descripcin.

El mtodo a utilizar depende de los objetivos perseguidos por el anlisis pero tambin de la calidad y cantidad de los datos disponibles.

EJEMPLOS CON DB2 INTELLIGENT MINER FOR DATA

Es un software que comprende un conjunto de funciones estadsticas, de proceso y de Minera de Datos. Ofrece herramientas de visualizacin

EJEMPLOS CON DB2 INTELLIGENT MINER FOR DATA

Clustering.

Asociacin.
Red neuronal como modelo predictivo.

CLUSTERING Es la particin del conjunto de individuos en subconjuntos lo ms homogneos posibles. El objetivo es maximizar la similitud de individuos del cluster y maximizar las diferencias entre clusters. Se aplica para segmentacin de bases de datos, identificacin de tipos de clientes, etc.

Con que criterio se agrupan estos rostros?

APORTES DEL SOFTWARE DE MINERA Determinar el nmero ptimo de clusters. Asignar a cada individuo a un nico cluster. Evaluar el impacto de las variables en la formacin del cluster. Comprender el perfil de cada cluster.

EJEMPLO DE CLUSTERING La gerencia comercial de un banco necesita identificar al segmento ms valioso de clientes de una tarjeta de crdito para organizar sus gastos de promociones y campaas de marketing directo. Datos disponibles: Frecuencia de uso de la tarjeta. Saldo promedio mensual en $. Posesin de tarjeta Gold. Monto promedio por cada transaccin. Cantidad de servicios por dbito automtico. Datos sociodemogrficos: sexo, edad, estado civil, ocupacin, hijos. Fuente de datos: transacciones del ltimo ao, tabla de clientes.

EJEMPLO DE CLUSTERING Preparacin de los datos: Definir la unidad de anlisis: cuenta o tarjeta?. Definir qu es una transaccin: cmo se consideran los ajustes?. Describir las variables a incluir en el modelo. Tabla de datos:

EJEMPLO DE CLUSTERING Medida de calidad del modelo: Criterio de Condorcet: asume un valor entre 0 y 1.

Criterios de segmentacin:
Se toman como variables activas las que corresponden al comportamiento de consumo. Se toman como variables suplementarias los atributos sociodemogrficos.

SOLUCIN DE 4 CLUSTERS

BUENOS CLIENTES CON TARJETA GOLD

BUENOS CLIENTES SIN TARJETA GOLD

ASOCIACIN Anlisis de la canasta de mercado: Objetivo: generar reglas del tipo: SI condicin ENTONCES resultado Ejemplo: SI producto A y producto C ENTONCES producto B Cun buena es una regla?. Medidas que la califican:

Soporte. Confianza. Mejora.

EJEMPLO DE ASOCIACIN El dueo de una pizzera vende 3 gustos de pizzas: peperoni, queso y hongos, y quiere armar combos con las combinaciones ms convenientes. Parte de un conjunto de 2000 tickets con los correspondientes items (gusto de pizza) incluido en cada uno.

EJEMPLO DE ASOCIACIN Clculo de las medidas de Asociacin:

CONCLUSIONES VENTAJAS

La Minera de Datos es una herramienta eficaz para dar respuestas a preguntas complejas de Inteligencia de Negocios. Las herramientas disponibles permiten automatizar gran parte de la tarea de encontrar los patrones de comportamiento ocultos en los datos. Es una buena manera de convertir datos en informacin, y esta a su vez en conocimiento, para la correcta toma de decisiones.

CONCLUSIONES DESVENTAJAS

Que los productos a significativamente costosos.

comercializar
para

son
utilizar

Que se requiera de experiencia herramientas de tecnologa.

Que sea fcil de hallar patrones equvocos triviales o no interesantes. La Privacidad.

También podría gustarte