Las empresas de hoy tratan de construir sistemas de gestión de relaciones
con sus clientes (CRM, por sus siglas en inglés Customer Relationship management), basados en las relaciones sociales del cliente y los patrones de comportamiento (IH Ting, 2012). Esto con el fin de elevar el grado de satisfacción de los clientes, lograr retenerlo y fidelizarlo a través de un trato personalizado y adaptando los productos y servicio de la empresa a lo que éste demanda. Las empresas aprenden a entender a sus clientes en el contexto social más amplio y al hacerlo se genera una hipótesis: Las predicciones de conducta de un cliente en el futuro son comportamientos de otros clientes en el pasado. Los patrones de comportamientos de los clientes individuales sirven para construir perfiles analíticos de usuarios. Según este autor, una compañía puede apuntar a un cliente específico con un mensaje específico cuando se tiene un perfil; es decir un perfil personalizado. Para promocionar los productos a través de diferentes medios las compañíasestán utilizando las redes sociales disponibles, implementando estrategias B2C (Business-to-Consumer). Éstas consisten en desarrollar estrategias comerciales para llegar directamente al cliente o consumidor final. Las diferentes estrategias son realizadas por el ConsumerMarketer, quien es la persona que aplicando diversas técnicas y estrategias, apoya el trabajo del equipo de ventas en la comercialización de un producto o servicio [ ]. En la Figura 1 se muestra el porcentaje de Marketers B2C que usan varias plataformas de Social Media para distribuir contenido: Figura 1 Percentage of B2C Marketers Who Use various Social Media Platformsto Distribute Content
Fuente: (contentmarketinginstitute.com, 2013)
De la Figura 1 se puede inferir que las empresas están muy interesadas en usar las redes sociales como Facebook, Twiter, Instagram o Youtube, para impulsar sus productos y tener una relación directa con sus clientes. La información que proporcionan las redes sociales permite que las empresas puedan analizar el comportamiento de los clientes a través de diferentes herramientas de mercadeo, algoritmos computacionales, técnicas, modelos estadísticos y matemáticos y así poder ajustar sus estrategias empresariales a las necesidades del mercado. Las compañías se encargan de crear bases de datos de gran volumen con información de los clientes para poder aplicar técnicas de exploración y análisis que puedan encontrar patrones significativos de los datos y tomar decisiones acertadas. Es aquí donde se ve la importancia de implementar procesos como la minería de datos o Data Mining en las áreas de publicidad, marketing o cualquier otra área de trabajo en las empresas. La Minería de datos (Data Mining) es un campo de las ciencias de la computación que consiste en la exploración y análisis por medios automáticos o semi-automáticos, de grandes cantidades de datos con el fin de descubrir patrones significativos. (Tan, 2004). Otra definición de minería de datos es la extracción de interesantes (no-trivial, implicito, previamente desconocido y potencialmente útil) patrones o conocimiento de una enorme cantidad de datos (Jiawei Han, 2011) El proceso de aplicar minería de datos está dado por una serie de modelos (predictivos y descriptivos) y unas tareas para la extracción y uso de la información que están representados en la siguiente imagen:
Figura 2 Modelos y tareas enminería de datos
Fuente: Elaboración propia basado en (Orallo, 2004)
La aplicación de estas técnicas varía de acuerdo al tipo de proyecto a realizar,
lo que indica que cada proyecto de minería tendrá ciertas características que harán que se apliquen diferentes técnicas como clasificación, agrupamiento o árboles de decisión. Entre algunas de las áreas en las cuales se aplican soluciones de minería de datos se encuentran (ALPAYDIN, 2010): Figura 3 Áreas de aplicación Data Mining
Fuente: Elaboración propia basado en (ALPAYDIN, 2010), (Orallo, 2004)
Por otro lado, se han creado metodologías, cuyo objetivo es la implementación de proyectos de minería de datos, entre los cuales se tienen SEMMA (Sample, Explore, Modify, Model, Access), DMAMC (Definir, Medir, Analizar, Mejorar y Controlar) o CRISP-DM (Cross Industry Standard ProcessFor Data Maning). La figura 4 muestra un resumen de las metodologías de procesos de minería de datos teniendo en cuenta las actividades que realizan: Figura 4 Metodologías de Minería de Datos y actividades
Fuente: (Azevedo, 2008)
A continuación se presentan algunas investigaciones que han utilizado las
técnicas de minería de datos en diferentes áreas: En el ámbito internacional se resaltan investigaciones como: Minería de Datos y lógica difusa. Una aplicación al estudio de la rentabilidad económica de las empresas agroalimentarias en Andalucía (Diaz, 2004), en donde se estudia qué tan rentables son las empresas agroalimentarias de Andalucía en España, a través de un conjunto de ratios o también llamados indicadores económicos con el objeto de encontrar las características contables de las empresas más rentables. Dentro de las metodologías que comprenden la aplicación se encuentran algunas técnicas de estadística avanzada y nuevos métodos de extracción del conocimiento en grandes bases de datos. La información que se analizó contenía una lista de 40.611 empresas en el año 1998 clasificadas por provincia y rama de actividad con un código de 4 dígitos. La información base trata de balances de situación, estado de pérdidas y ganancias y las cuentas de pérdidas y ganancias analíticas. Sobre estas empresas se tomaron 21 variables que describen el ratio financiero y un resumen de los 37.022 casos. Los resultados de este estudio se dieron a través de redes neuronales artificiales aplicando el algoritmo IFN (Info-Fuzzy-Network) y reglas difusas obtenidas a partir de la base de datos mediante la teoría computacional de la percepción y son conclusiones congruentes con postulados de análisis financiero. Al final del estudio, después de contar con 21 variables, se clasificó la información en sólo 4 variables que eran las características que definían la rentabilidad de una empresa. En la Universidad de Wolverhampton en Ucrania se realizó un estudio acerca del análisis de emociones en la red social MySpace (Mike Thelwall, 2009) en donde se examinaron los comentarios públicos producidos por una muestra aleatoria de 819 usuarios de Estados Unidos con el fin de proporcionar información de qué tan positivos o negativos son los comentarios en esta red social. A través de la aplicación de redes neuronales (Mapas de Khonen) se determinó que dos tercios de los comentarios expresaban emociones positivas y que tan sólo un 20% contenía emociones negativas. El estudio también pudo determinar que las mujeres son propensas a dar y recibir más comentarios positivos que los hombres.
A nivel nacional, en nuestro país en el año 2011, se publicó una investigación
de la Universidad Sergio Arboleda titulada: Aplicando minería de datos al marketing educativo (Cadena, 2011), en la cual se implementó la minería de datos en el sector educativo, especialmente en los registros del estudiante desde que ingresa a la universidad y sus posibles causas de deserción en cada periodo académico, por medio de llamadas a los estudiantes que no volvieron a matricularse en la institución.
En este estudio se presenta la caracterización del perfil del estudiante desertor
de la Escuela de Marketing y Publicidad de la Universidad Sergio Arboleda, bajo el estudio de variables demográficas del alumno con el registro de última matrícula del semestre de abandono y las causas que lo generaron. En la investigación se usó un método no supervisado, es decir que no tiene una variable objetivo, para comprender las bases de datos con el fin de identificar patrones y tendencias; para éstos datos se usó la técnica de Agrupamiento bajo un método No-Jerárquico con el algoritmo K-means. Los objetivos específicos del proyecto, partían de caracterizar, mediante modelos descriptivos los clúster de estudiantes (graduados o que actualmente están cursando en la Escuela) y estudiantes desertores de los programas de Marketing & Negocios Internacionales y Publicidad Internacional. Se encontraron variables o atributos significativos en estos grupos, entre ellos varios clúster que mostraban las características de los estudiantes desertores y sus perfiles.
En la ciudad de Medellín se llevó a cabo un proyecto de aplicación de técnicas
de minería de datos en el mercadeo del área textil de la ciudad (Choperena, 2014). El objetivo de este estudio fue proponer estrategias de mercadeo en el sector de ropa para el hogar a partir del uso de la minería de datos. De acuerdo con este objetivo, se inició el proceso de investigación con un estudio sobre el sector textil y del mercado de ropa hogar para el cual se realizaron entrevistas a profundidad a expertos en el tema y encuestas aleatorias a consumidores del producto. Para la realización de este proyecto también se utilizó Business Intelligence, que hace referencia a la primera tarea de minería de datos, la cual es la comprensión del negocio. Después de analizar las bases de datos el proceso de minería permitió identificar patrones en los datos basados en el análisis de variables de consumo, y así al obtener los resultados de los modelos de minería utilizados, se logró definir estrategias para clientes con cierto tipo de atributos, para luego segmentar y asociar clientes y productos. Se realizaron 3 modelos de minería basado en las técnicas de asociación, clusterización y árboles de decisión. A la conclusión que se llegó con esta investigación fue que el mercado de ropa de hogar es un mercado que está siendo atendido con productos extranjeros mediante empresas comercializadoras, también se pudo determinar que la poca participación y especialización de empresas nacionales, ha permitido que productos extranjeros ingresen con bajas calidades y atributos que repercuten en un menor precio y dificultan el desarrollo del sector productor nacional.
A nivel local se encontró la investigación Análisis de factores y preparación de
datos de meteorología y contaminantes de la ciudad de Valledupar (Anaya Díaz, 2014). La investigación recoge las muestras obtenidas en la base de datos tanto de meteorología, como de contaminantes en la ciudad de Valledupar en el desarrollo de las tres primeras fases: entendimiento del negocio, entendimiento de los datos y preparación de los datos, teniendo en cuenta la metodología CRISP-DM. Se hizo un estudio a los registros meteorológicos y contaminantes de la ciudad de Valledupar de los años 2009 hasta 2012. Se realizó la detección de datos atípicos, formateo de tablas, limpieza total de atributos, normalización, integración de tablas y la construcción definitiva del conjunto de datos. Durante este proceso se extrajeron hipótesis preliminares, como que el contaminante PM10 casi exclusivamente presenta valores altos, cuando no existen precipitaciones. Otra hipótesis extraída en el análisis de los datos, son los valores bajos que toman los contaminantes de PM10 y CO cuando los vientos vienen del Norte, noreste y del este, indicando que los contaminantes al parecer son provenientes del resto de direcciones.