Está en la página 1de 3

Julio Cesar Alcntara Delgado

Mineria de datos
Data mining
Una visin prctica

Por Salvador Gandulfo, Lder del equipo de BPM &
BI en Strategos.



Data warehouse, data mart, data mining, Olap, Molap, Rolap, Holap. Qu significa exactamente este
baile de siglas y conceptos?; qu tecnologa es la ms recomendable para cada necesidad especfica?;
cul es la utilidad real de la minera de datos?; qu aplicaciones reales existen que demuestren su
eficacia?




En el mercado suenan comnmente siglas como data warehouse, data mart, data mining, Olap, Molap, Rolap y
Holap, todas asociadas con la gestin o anlisis de los datos. Sin embargo, saber cul es la ms recomendable
para cada requerimiento particular implica conocer qu significa cada una. El primer punto a tener en cuenta es
diferenciar claramente tres conceptos: data warehouse, data mart y data mining. Un data warehouse es un
almacn en el que residen todos los datos procedentes de las distintas plataformas informticas de la
compaa. Desde el data warehouse se establecen una serie de data marts que albergan datos concretos de un
rea especfica de la compaa: marketing, finanzas, etc. El concepto es el mismo: se trata de tomar la
informacin de las distintas reas dentro del data warehouse y organizarla de tal forma que las personas de las
reas especficas puedan tener los datos que necesiten, de manera que puedan disponer de una referencia ms
ajustada. Estos ofrecen un acceso ms rpido a la informacin exacta, y tambin existe la posibilidad inversa: a
partir de una serie de data marts configurar un data warehouse corporativo.

De este modo se van solucionando los problemas de negocio ms especficos,
conociendo aspectos importantes como quin o quines son los clientes que
ms beneficios producen. Ofreciendo este concepto no es necesario remitirse a
toda la informacin. Se trata de obtener respuestas a preguntas. El data
warehouse, entendido como un big bang, puede a veces ser un error, aunque
algunos fabricantes mantengan que es la nica forma de solucionar los
problemas.

El data minig, sin embargo, consiste en algo ms preciso. Una vez que todos
los datos estn organizados, el data mining es una de las formas de
explotarlos. Existen varias herramientas para realizar esa explotacin, como heramientas Olap sistemas EIS,
query and reporting y business reporting. La minera de datos es, entonces, una de las tecnologas que
existen para explorar los datos y entender y solucionar los problemas de negocio. De hecho, es la tcnica ms
avanzada para hacerlo y encontrar informacin que no aparece a simple vista; esos esquemas y tendencias
escondidos en los datos. A travs de data mining es ms fcil cuantificar el resultado. Existen aplicaciones de
marketing, como perfiles de clientes, segmentacin de mercado u otras reas que utilizan, tcnicas de minera
de datos para saber algo ms acerca de stos. El ejemplo tpico es el anlisis de la cesta de la compra, en el
que se buscan los enlaces entre la compra de unos productos y de otros. Esto tiene como objeto optimizar el
servicio a los clientes y facilitarles la compra.


La compra de cerveza y la rentabilidad del queso feta

El ejemplo ms difundido dentro de estas tcnicas de data mining es el de los paales y la cerveza. Se observ
que los viernes por la tarde en las grandes reas comerciales se produca un aumento en las ventas de cerveza.
Al intentar analizar el porqu de este aumento pudo comprobarse que gran parte de las personas (hombres en
su mayora) que haban adquirido cerveza, tambin haban comprado paales para beb. Esto viene a decir que
Julio Cesar Alcntara Delgado

Mineria de datos
siempre que un varn de una edad determinada con hijos pequeos, va a comprar paales para el fin de
semana, compra tambin cerveza. Entonces, para facilitar el consumo de los dos artculos se colocaron en
estanteras cercanas. Las ventas de cerveza, a raz de esto, aumentaron an ms.

Otro ejemplo es el del feta, un queso griego que result ser uno de los artculos menos solicitados de toda una
superficie comercial, hasta el punto de que su comercializacin aportaba beneficios prcticamente nulos. El
supermercado en cuestin se plante la posibilidad de suprimirlo de su catlogo de ofertas. Pero al realizar un
anlisis del perfil de las pocas personas que lo compraban se dieron cuenta de que, casualmente, eran los
clientes que ms dinero se gastaban en su cesta de compra y que ms fieles eran al negocio. Por esa razn se
decidi conservar el queso feta en la oferta del supermercado.

El data mining puede ayudar a controlar la psicologa del consumidor y su
comportamiento ante los estmulos de marketing, la publicidad y todos los mtodos
de persuasin que utilizan las empresas para dirigirse a sus consumidores. Y esto es
til tanto para disear este tipo de estrategias como para analizar a posteriori sus
efectos.

Siempre resultarn ms efectivas estas tcnicas si existe un data warehouse por
detrs, ya que cuanto ms limpios estn los datos sobre los que se trabajar, de
mayor calidad y precisin ser el resultado del anlisis que se obtenga. Es muy
sencillo: cuanto mejor estn organizados los datos -y el data warehouse o el data
mart ofrecen la base para trabajar- ms rpido es el resultado.


Olap, Molap, Rolap, Holap

El procesamiento analtico de transacciones online (Olap) es una forma de explotacin de los datos. La M y la
R delante de las siglas Olap significan Multidimensional y Relational, respectivamente. Bsicamente la
diferencia es que en la tecnologa multidimensional se han predefinido y creado una serie de dimensiones,
estableciendo una visin de los datos basada en las tendencias de consulta de los usuarios. De esta forma, el
procesamiento analtico online multidimensional es ms rpido porque esta predefinido, pero es menos flexible.
En la tecnologa Rolap sucede lo contrario: es una tcnica ms flexible pero menos rpida porque hay que
acceder a todos los datos. Es un mtodo muy til, pero para los usuarios que quieren centrarse en un anlisis
especfico resulta ms complicado; entendido esto, la seleccin es sobre costo-beneficio y no siempre favorece
al costo. A estas dos tcnicas hay que sumar una nueva: Holap (Hybrid Online Analytical Processing), que viene
a ser una mezcla de las dos anteriores.
Salvador Gandulfo es Ingeniero Civil Industrial y PhD en Business Intelligence. Se ha desempeado durante ms de 10
aos como consultor en TI, con especializacin en Business Intelligence, Business Process Management, reingeniera y
IT governance. Actualmente lidera el equipo de BPM & BI en Strategos (strategos.pro) y es profesor del Diplomado en
Gestin Informtica en el Departamento de Ingeniera Informtica de la Universidad de Santiago de Chile.





Diciembre 2012

Bibliografia

Salvador Gandulfo (2012) Gerencia Vol Xll. Data mining Una visin prctica ( pp. 66)




Julio Cesar Alcntara Delgado

Mineria de datos
Comentarios
Este artculo es bueno porque te muestra de forma rpida te implica de una forma
rpida y concisa de que sirve la minera de datos asimismo, da un enfoque de
OLAP,MOLAP, ROLAP las cuales entend que son derivaciones o subderivaciones de
OLAP . Tambin en este pequeo artculo de la revista gerencia la cual es interesante
porque hablan bsicamente de todo lo relacionado con estrategias de negocios y todo
lo que se relacione a ello. Cabe sealar que este articulo viene la definicin de que es
el datamining que para marketing es muy importante en este artculo viene el ejemplo
que menciono en la clase de la cerveza el impacto que tiene el saber la interpretacin
de los datos para tomar decisiones interesantes.
Por ultimo me dio curiosidad el rengln que dice que el dataminnig ayuda controlar la
psicologa del consumidor y su comportamiento de estmulos entre el marketing
entonces yo dira que con la minera de datos se poda pronosticar o predecir las
tendencias de consumo.