Está en la página 1de 6

DEL DATAMINIG AL WEBMINIG

Los mbitos de aplicacin de estas tcnicas son muy variadas. Desde la investigacin mdica para el
correcto diagnsticos de enfermedades, o la lectura del mapa del genoma humana hasta la gestin
empresarial, la minera de datos ha demostrado, sobradamente su eficacia.

Datos de Clientes Anlisis Herramientas de


(Descriptivos - Predictivos) Interaccin

Data Warehouse Data Mining

Datos
Externos

Consumo Acciones de
Medio -Score fidelizacin
Repositorio
Anlisis de basadas en el
informacin de Valor del
CRM consolidado clientes conocimiento
Operacional de clientes
Cliente - Core adquirido, y
Probabilidad dirigidas a los
Tamao de Respuesta grupos objetivo
Facturacin de clientes
a la Campaa
Consumo
Oros Sistemas Reclamos
acotados para
Transaccionales Contrato Anlisis de cada modelo
Productos Riesgo
Otras

1
Copyright 2004, Juan Enrique Negri. La propiedad intelectual de este material est protegida por la ley, y no est
autorizada su distribucin o duplicacin parcial o total, por ningn medio, sin expresa autorizacin por escrito de los
autores.
E
n los ltimos aos, la informacin se ha DATAWAREWHOUSE
convertido en uno de los activos ms
importantes para las empresas y La mayora de las empresas, como consecuencia del
organizaciones. La informacin es, sin desarrollo tecnolgico, han almacenado cantidades
lugar a dudas, una ventaja competitiva sostenible a inmanejables de datos de manera creciente en el
largo plazo que asegura la competitividad corporativa tiempo. Estos datos provienen de sus sistemas
y la supervivencia empresarial. operacionales y transaccionales, es decir, son el
resultado de almacenar los miles e incluso millones
de operaciones o transacciones que su actividad
empresarial ha ido generando en el tiempo. Estos
datos emanan de los sistemas contables,
facturacin, pedidos, almacn y en algunos casos de
atencin al cliente, entre otros.

Sin embargo, estas bases de datos operacionales o


transaccionales no son accesibles en forma simple o
directa a los usuarios que demandan informacin
oportuna y fidedigna para tomar decisiones, ya que
son datos cuya nica lgica de almacenamiento, si
es que tienen alguna es la transaccin. Esto significa
que los datos operacionales presentan importantes
carencias, como la falta de homogeneidad (un
campo fecha, por ejemplo, puede tener un formato
distinto, segn la fuente de procedencia). Esta
inconsistencia se produce debido a que las fuentes
de datos no estn integradas y ni siquiera han sido
pensadas desde una perspectiva global del uso de la
informacin. En una misma compaa pueden existir
varios datos distintos para las ventas de un perodo,
segn se consulte a los sistemas contables o bien a
Comprender este proceso exige tomar total
los sistemas que administran la lgica de almacenaje
conciencia de la existencia de ciertos conceptos
y despacho.
fundamentales que deben ser analizados:

Estas carencias redundan en falta de credibilidad


Datawarehouse
sobre la informacin almacenada en los sistemas,
Datamining
baja productividad en el uso de informacin o falta de
Webmining
visin global, por citar los casos ms usuales. La

2
Copyright 2004, Juan Enrique Negri. La propiedad intelectual de este material est protegida por la ley, y no est
autorizada su distribucin o duplicacin parcial o total, por ningn medio, sin expresa autorizacin por escrito de los
autores.
solucin a esta incapacidad para conseguir Aumento del ndice de retencin de clientes.
informacin correcta, accesible y til para la toma de Mejora del surtido.
decisiones es la implementacin de un
DATAWAREHOUSE corporativo. Esto significa Otro concepto relacionado es el DATA WEBHOUSE,
implementar un almacn de informacin el cual no difiere mucho del datawarehouse, con la
estandarizada, fcilmente accesible, integrada y nica diferencia que la fuente principal de obtencin
completamente escalable que permita a los usuarios de informacin es la web.
obtener la informacin que en cada momento
necesitan para tomar decisiones correctas, sin Por su parte los DATA MARTS constituyen un
importar la cantidad, diversidad y complejidad que subconjunto de datos del Datawarehouse que hacen
presente dicha informacin. referencia a un departamento en particular y cuya
consulta requiere menor tiempo de respuesta.
La creacin de un almacn de datos de tales
caractersticas requiere un proceso de depuracin, Los METADATOS corresponden a descriptores
extraccin y modelamiento de los datos provenientes sobre la clase de informacin almacenada,
de las distintas fuentes (sistemas operacionales y explicando su codificacin, su relacin con otra
fuentes externas), que garanticen informacin informacin, as como la procedencia de origen y el
correcta a las unidades que la demanden en tiempo responsable de dicha informacin.
y costos razonables.

El proceso de depuracin y extraccin lleva asociado


la creacin de estructuras lgicas denominadas meta
datos, o descriptores sobre la clase de informacin
almacenada, incluyendo su codificacin, su relacin
con otra informacin, procedencia, responsable de
obtenerla, entre otros, as como mecanismos y
procedimientos de seguridad que garanticen la
calidad y fiabilidad de la misma.

La principal aplicacin del datawarehouse es servir


de estructura base que soporte la gestin de
informacin destinada a la toma de decisiones.
Algunos ejemplos sobre cuales son los beneficios de
desarrollar un Datawarehouse en la organizacin,
nos permitirn descubrir algunas de sus
aplicaciones, segn diferentes sectores:

Deteccin de comportamiento fraudulento.


Mejora del ratio de ventas cruzadas.

3
Copyright 2004, Juan Enrique Negri. La propiedad intelectual de este material est protegida por la ley, y no est
autorizada su distribucin o duplicacin parcial o total, por ningn medio, sin expresa autorizacin por escrito de los
autores.
La BASE DE DATOS TRANSACCIONAL U un conjunto de datos sirven para encontrar
OPERACIONAL contiene el conjunto de datos relaciones en los datos. Existen diversos algoritmos
provenientes de los sistemas operacionales que disponibles en la mayora de las soluciones
almacenen la informacin proveniente de los comerciales de Data Mining, siendo algunos de los
departamentos de contabilidad, facturacin, y ms populares los siguientes:
bodega, entre otros.
Algoritmo de Clustering
DATA MINING Algoritmo de Asociacin
Redes Neuronales Artificiales
Las Tcnicas de Data Mining o minera datos son un rboles de Decisin
conjunto de algoritmos matemticos y estadsticos, Los ALGORITMOS DE CLUSTERING permiten
de enorme complejidad, que permiten descubrir y agrupar clientes en grupos homogneos. Su
cuantificar relaciones predictivas ocultas en los aplicacin ms utilizada es la segmentacin
datos, transformando la informacin disponible en estratgica donde es posible diferenciar clientes en
conocimiento til de negocio. segmentos, teniendo en cuenta su comportamiento,
por lo cual tambin es conocido como algoritmo de
segmentacin.

Los ALGORITMOS DE ASOCIACIN son procesos


que permite detectar correlaciones entre sucesos,
identificando como un acontecimiento puede
desencadenar la aparicin de otros.

Las REDES NEURONALES son algoritmos capaces


de aprender de los datos que procesan,
enriqueciendo la bsqueda en cada proceso lo que le
Es un procedimiento automatizado, que debe operar
permite buscar y encontrar patrones de
en forma muy coordinada entre la gestin de
comportamiento, a partir de su capacidad de
informacin y la toma de decisiones, por parte de la
aprendizaje. El algoritmo muestra al analista el
direccin de la organizacin. Las tcnicas de Data
comportamiento aprendido en los datos. Su
Mining permiten descubrir patrones no visibles en los
aplicacin ms importante es la deteccin de
datos. En su procedimiento se considera que el
patrones de abandono, venta cruzada o anlisis de
analista deje trabajar al algoritmo en largos procesos
riesgos.
de bsqueda y cruce de informacin hasta que este
muestra los patrones encontrados. De esta forma, el
Los ARBOLES DE DECISIONES estn conformados
experto en el negocio selecciona aquellos que le son
por un algoritmo o conjunto de algoritmos que de
tiles.
manera jerrquica encuentran patrones de
comportamiento, respecto a una variable respuesta.
El procedimiento se basa en el desarrollo de un
conjunto de algoritmos inteligentes que aplicados a
4
Copyright 2004, Juan Enrique Negri. La propiedad intelectual de este material est protegida por la ley, y no est
autorizada su distribucin o duplicacin parcial o total, por ningn medio, sin expresa autorizacin por escrito de los
autores.
Un rbol de decisin es capaz de encontrar el Las reas de aplicacin de estas tcnicas son muy
pblico objetivo para llevar a cabo una campaa para diversas. Desde la investigacin mdica para el
la venta de un determinado producto X. Los datos diagnstico de enfermedades, o la lectura del mapa
muestran al algoritmo qu clientes consumen X y del genoma humana hasta la gestin empresarial, la
qu clientes NO consumen X y es capaz de minera de datos ha demostrado, sobradamente su
encontrar las caractersticas, en cuanto a eficacia.
comportamiento, que mejor diferencian a unos
clientes de otros. Esta informacin puesta en manos En el campo de la gestin empresarial, destacan las
del experto de negocio, le permite disear campaas aplicaciones en Marketing, Gestin Comercial,
con altas posibilidades de xito. Finanzas y Fidelizacin de Clientes.

Estas tcnicas se han mostrado sumamente valiosas Al hacer un anlisis por sectores, la banca,
para la toma de decisiones. Sin embargo, es compaas de seguros, empresas logsticas, las
aconsejable contar con un equipo multidisciplinar de telecomunicaciones y las utilities se han convertido
expertos matemticos, estadsticos y de negocio, al en usuarios recurrentes con resultados destacables.
menos en fase inicial, para obtener el rendimiento
esperado. En el mbito de la Gestin Comercial y de Marketing
han demostrado gran eficacia para la solucin de
La aplicacin de estas tcnicas requiere una problemticas como: anlisis de abandonos, up y
preparacin, depuracin y limpieza de datos muy cross-selling, gestin de carteras comerciales y
exhaustiva, lo que justifica las necesidades de campaas de marketing.
equipos de trabajo integrales y altamente calificados.
En el campo de las finanzas permiten optimizar
carteras de activos financieros, previsiones y anlisis
y simulacin de proyectos de inversin.

WEB MINING

Este concepto se refiere al descubrimiento y anlisis


de modelos de acceso de usuarios desde uno o ms
servidores mediante la extraccin de patrones e
informacin implcita en la actividad de los usuarios
en Internet. El explosivo crecimiento de Internet, y
particularmente de la World Wide Web ha llevado a
que ms y ms transacciones se realicen de manera
digital.

Tal es el tamao de las transacciones de compra y


venta en la red, que en estudios relacionados con el
comercio en Internet se predicen cifras del orden de
5
Copyright 2004, Juan Enrique Negri. La propiedad intelectual de este material est protegida por la ley, y no est
autorizada su distribucin o duplicacin parcial o total, por ningn medio, sin expresa autorizacin por escrito de los
autores.
4.500 millones de Euros para el ao 2005, a nivel minera de datos, como cualquier otra fuente de
mundial. Hoy en da, las compaas estn en datos de la compaa.
posicin de manejar fcilmente grandes cantidades La informacin que contiene, se puede analizar, al
de informacin de sus clientes. Usando Web Mining, menos, en tres dimensiones:
las compaas pueden analizar y predecir la
conducta de sus clientes. Web content mining
Web structure mining
En un estudio realizado a comienzos de este ao, Web usage mining
Forrester Research Inc. Se seala que el 16% de las
grandes compaas esperan hacer un uso ms El WEB CONTENT MINING se refiere a la bsqueda
eficaz de la informacin del cliente, as como tambin automtica de informacin y extraccin de
de la urgente necesidad de una infraestructura de conocimiento a partir del contenido y de las
"Web Intelligence". descripciones de documentos en la Web.

Como sabemos, cada accin de un cliente en un sitio Por su parte el WEB STRUTURE MINING es el
Web genera datos, no slo cuando realiza proceso destinado a inferir conocimiento, a partir de
interacciones de alto nivel como comprar algo, sino la organizacin y los vnculos o links entre
que tambin en acciones tan simples como la documentos de la World Wide Web.
bsqueda de algn contenido o simplemente al
navegar a travs de un sitio. Todas estas
interacciones entre el sitio Web y el consumidor son
guardadas en bancos de datos digitales.

Esta inmensa cantidad de datos contiene informacin


til para las estrategias de comercializacin de los
negocios en la red. El concepto de web mining hace
referencia a la aplicacin de las tcnicas de minera
de datos. Estos conjuntos de datos, a menudo
denominados fichero de datos "log", proporcionan
informacin de inters para la gestin del el canal de
interaccin con el cliente WEB.

Los ficheros "log" contienen gran cantidad de


Finalmente el WEB USAGE MINING es un tipo de
informacin relevante para encontrar pautas de
Web mining que busca descubrir y analizar patrones
comportamiento de los clientes a travs de la web.
de acceso (o hbitos) de los usuarios desde uno o
Esta informacin contiene datos sobre protocolos de
ms sitios Web, mediante la extraccin de patrones e
navegacin y comunicacin, que previamente ha de
informacin implcita en su actividad.
ser limpiada.. Una vez depurada la informacin, el
fichero log puede tratarse mediante tcnicas de

6
Copyright 2004, Juan Enrique Negri. La propiedad intelectual de este material est protegida por la ley, y no est
autorizada su distribucin o duplicacin parcial o total, por ningn medio, sin expresa autorizacin por escrito de los
autores.

También podría gustarte