Estado Del Arte Mineria de Datos

2.
1 ESTADO DEL ARTE
Las empresas de hoy tratan de construir sistemas de gestión de relaciones

con sus clientes (CRM, por sus siglas en inglés Customer Relationship
management), basados en las relaciones sociales del cliente y los
patrones de comportamiento (IH Ting, 2012). Esto con el fin de elevar el
grado de satisfacción de los clientes, lograr retenerlo y fidelizarlo a través
de un trato personalizado y adaptando los productos y servicio de la
empresa a lo que éste demanda. Las empresas aprenden a entender a sus
clientes en el contexto social más amplio y al hacerlo se genera una
hipótesis: Las predicciones de conducta de un cliente en el futuro son
comportamientos de otros clientes en el pasado. Los patrones de
comportamientos de los clientes individuales sirven para construir perfiles
analíticos de usuarios. Según este autor, una compañía puede apuntar a
un cliente específico con un mensaje específico cuando se tiene un perfil;
es decir un perfil personalizado.
Para promocionar los productos a través de diferentes medios las
compañíasestán utilizando las redes sociales disponibles, implementando
estrategias B2C (Business-to-Consumer). Éstas consisten en desarrollar
estrategias comerciales para llegar directamente al cliente o consumidor
final. Las diferentes estrategias son realizadas por el ConsumerMarketer,
quien es la persona que aplicando diversas técnicas y estrategias, apoya el
trabajo del equipo de ventas en la comercialización de un producto o
servicio [ ]. En la Figura 1 se muestra el porcentaje de Marketers B2C que
usan varias plataformas de Social Media para distribuir contenido:
Figura 1 Percentage of B2C Marketers Who Use various Social Media Platformsto
Distribute Content
Fuente: (contentmarketinginstitute.com, 2013)

De la Figura 1 se puede inferir que las empresas están muy interesadas en
usar las redes sociales como Facebook, Twiter, Instagram o Youtube, para
impulsar sus productos y tener una relación directa con sus clientes. La
información que proporcionan las redes sociales permite que las empresas
puedan analizar el comportamiento de los clientes a través de diferentes
herramientas de mercadeo, algoritmos computacionales, técnicas, modelos
estadísticos y matemáticos y así poder ajustar sus estrategias
empresariales a las necesidades del mercado. Las compañías se encargan
de crear bases de datos de gran volumen con información de los clientes
para poder aplicar técnicas de exploración y análisis que puedan encontrar
patrones significativos de los datos y tomar decisiones acertadas. Es aquí
donde se ve la importancia de implementar procesos como la minería de
datos o Data Mining en las áreas de publicidad, marketing o cualquier otra
área de trabajo en las empresas.
La Minería de datos (Data Mining) es un campo de las ciencias de la
computación que consiste en la exploración y análisis por medios
automáticos o semi-automáticos, de grandes cantidades de datos con el fin
de descubrir patrones significativos. (Tan, 2004). Otra definición de minería
de datos es la extracción de interesantes (no-trivial, implicito, previamente
desconocido y potencialmente útil) patrones o conocimiento de una enorme
cantidad de datos (Jiawei Han, 2011)
El proceso de aplicar minería de datos está dado por una serie de modelos
(predictivos y descriptivos) y unas tareas para la extracción y uso de la
información que están representados en la siguiente imagen:
Figura 2 Modelos y tareas enminería de datos
Fuente: Elaboración propia basado en (Orallo, 2004)
La aplicación de estas técnicas varía de acuerdo al tipo de proyecto a realizar,

lo que indica que cada proyecto de minería tendrá ciertas características que
harán que se apliquen diferentes técnicas como clasificación, agrupamiento o
árboles de decisión. Entre algunas de las áreas en las cuales se aplican
soluciones de minería de datos se encuentran (ALPAYDIN, 2010):
Figura 3 Áreas de aplicación Data Mining
Fuente: Elaboración propia basado en (ALPAYDIN, 2010), (Orallo, 2004)

Por otro lado, se han creado metodologías, cuyo objetivo es la implementación
de proyectos de minería de datos, entre los cuales se tienen SEMMA (Sample,
Explore, Modify, Model, Access), DMAMC (Definir, Medir, Analizar, Mejorar y
Controlar) o CRISP-DM (Cross Industry Standard ProcessFor Data Maning). La
figura 4 muestra un resumen de las metodologías de procesos de minería de
datos teniendo en cuenta las actividades que realizan:
Figura 4 Metodologías de Minería de Datos y actividades
Fuente: (Azevedo, 2008)
A continuación se presentan algunas investigaciones que han utilizado las

técnicas de minería de datos en diferentes áreas:
En el ámbito internacional se resaltan investigaciones como: Minería de Datos
y lógica difusa. Una aplicación al estudio de la rentabilidad económica de las
empresas agroalimentarias en Andalucía (Diaz, 2004), en donde se estudia qué
tan rentables son las empresas agroalimentarias de Andalucía en España, a
través de un conjunto de ratios o también llamados indicadores económicos
con el objeto de encontrar las características contables de las empresas más
rentables. Dentro de las metodologías que comprenden la aplicación se
encuentran algunas técnicas de estadística avanzada y nuevos métodos de
extracción del conocimiento en grandes bases de datos.
La información que se analizó contenía una lista de 40.611 empresas en el año
1998 clasificadas por provincia y rama de actividad con un código de 4 dígitos.
La información base trata de balances de situación, estado de pérdidas y
ganancias y las cuentas de pérdidas y ganancias analíticas. Sobre estas
empresas se tomaron 21 variables que describen el ratio financiero y un
resumen de los 37.022 casos.
Los resultados de este estudio se dieron a través de redes neuronales
artificiales aplicando el algoritmo IFN (Info-Fuzzy-Network) y reglas difusas
obtenidas a partir de la base de datos mediante la teoría computacional de la
percepción y son conclusiones congruentes con postulados de análisis
financiero. Al final del estudio, después de contar con 21 variables, se clasificó
la información en sólo 4 variables que eran las características que definían la
rentabilidad de una empresa.
En la Universidad de Wolverhampton en Ucrania se realizó un estudio acerca
del análisis de emociones en la red social MySpace (Mike Thelwall, 2009) en
donde se examinaron los comentarios públicos producidos por una muestra
aleatoria de 819 usuarios de Estados Unidos con el fin de proporcionar
información de qué tan positivos o negativos son los comentarios en esta red
social. A través de la aplicación de redes neuronales (Mapas de Khonen) se
determinó que dos tercios de los comentarios expresaban emociones positivas
y que tan sólo un 20% contenía emociones negativas. El estudio también pudo
determinar que las mujeres son propensas a dar y recibir más comentarios
positivos que los hombres.
A nivel nacional, en nuestro país en el año 2011, se publicó una investigación

de la Universidad Sergio Arboleda titulada: Aplicando minería de datos al
marketing educativo (Cadena, 2011), en la cual se implementó la minería de
datos en el sector educativo, especialmente en los registros del estudiante
desde que ingresa a la universidad y sus posibles causas de deserción en cada
periodo académico, por medio de llamadas a los estudiantes que no volvieron a
matricularse en la institución.
En este estudio se presenta la caracterización del perfil del estudiante desertor

de la Escuela de Marketing y Publicidad de la Universidad Sergio Arboleda,
bajo el estudio de variables demográficas del alumno con el registro de última
matrícula del semestre de abandono y las causas que lo generaron. En la
investigación se usó un método no supervisado, es decir que no tiene una
variable objetivo, para comprender las bases de datos con el fin de identificar
patrones y tendencias; para éstos datos se usó la técnica de Agrupamiento
bajo un método No-Jerárquico con el algoritmo K-means. Los objetivos
específicos del proyecto, partían de caracterizar, mediante modelos
descriptivos los clúster de estudiantes (graduados o que actualmente están
cursando en la Escuela) y estudiantes desertores de los programas de
Marketing & Negocios Internacionales y Publicidad Internacional. Se
encontraron variables o atributos significativos en estos grupos, entre ellos
varios clúster que mostraban las características de los estudiantes desertores y
sus perfiles.
En la ciudad de Medellín se llevó a cabo un proyecto de aplicación de técnicas

de minería de datos en el mercadeo del área textil de la ciudad (Choperena,
2014). El objetivo de este estudio fue proponer estrategias de mercadeo en el
sector de ropa para el hogar a partir del uso de la minería de datos. De acuerdo
con este objetivo, se inició el proceso de investigación con un estudio sobre el
sector textil y del mercado de ropa hogar para el cual se realizaron entrevistas
a profundidad a expertos en el tema y encuestas aleatorias a consumidores del
producto.
Para la realización de este proyecto también se utilizó Business Intelligence,
que hace referencia a la primera tarea de minería de datos, la cual es la
comprensión del negocio. Después de analizar las bases de datos el proceso
de minería permitió identificar patrones en los datos basados en el análisis de
variables de consumo, y así al obtener los resultados de los modelos de
minería utilizados, se logró definir estrategias para clientes con cierto tipo de
atributos, para luego segmentar y asociar clientes y productos. Se realizaron 3
modelos de minería basado en las técnicas de asociación, clusterización y
árboles de decisión.
A la conclusión que se llegó con esta investigación fue que el mercado de ropa
de hogar es un mercado que está siendo atendido con productos extranjeros
mediante empresas comercializadoras, también se pudo determinar que la
poca participación y especialización de empresas nacionales, ha permitido que
productos extranjeros ingresen con bajas calidades y atributos que repercuten
en un menor precio y dificultan el desarrollo del sector productor nacional.
A nivel local se encontró la investigación Análisis de factores y preparación de

datos de meteorología y contaminantes de la ciudad de Valledupar (Anaya
Díaz, 2014). La investigación recoge las muestras obtenidas en la base de
datos tanto de meteorología, como de contaminantes en la ciudad de
Valledupar en el desarrollo de las tres primeras fases: entendimiento del
negocio, entendimiento de los datos y preparación de los datos, teniendo en
cuenta la metodología CRISP-DM.
Se hizo un estudio a los registros meteorológicos y contaminantes de la ciudad
de Valledupar de los años 2009 hasta 2012. Se realizó la detección de datos
atípicos, formateo de tablas, limpieza total de atributos, normalización,
integración de tablas y la construcción definitiva del conjunto de datos. Durante
este proceso se extrajeron hipótesis preliminares, como que el contaminante
PM10 casi exclusivamente presenta valores altos, cuando no existen
precipitaciones. Otra hipótesis extraída en el análisis de los datos, son los
valores bajos que toman los contaminantes de PM10 y CO cuando los vientos
vienen del Norte, noreste y del este, indicando que los contaminantes al
parecer son provenientes del resto de direcciones.

Estado Del Arte Mineria de Datos

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estado Del Arte Mineria de Datos

Cargado por

Copyright:

Formatos disponibles

2.

1 ESTADO DEL ARTE

Las empresas de hoy tratan de construir sistemas de gestión de relaciones

Fuente: (contentmarketinginstitute.com, 2013)

Figura 2 Modelos y tareas enminería de datos

Fuente: Elaboración propia basado en (Orallo, 2004)

La aplicación de estas técnicas varía de acuerdo al tipo de proyecto a realizar,

Fuente: Elaboración propia basado en (ALPAYDIN, 2010), (Orallo, 2004)

Fuente: (Azevedo, 2008)

A continuación se presentan algunas investigaciones que han utilizado las

A nivel nacional, en nuestro país en el año 2011, se publicó una investigación

En este estudio se presenta la caracterización del perfil del estudiante desertor

En la ciudad de Medellín se llevó a cabo un proyecto de aplicación de técnicas

A nivel local se encontró la investigación Análisis de factores y preparación de

También podría gustarte