El 80% de los datos que actualmente producen diversas compaas se encuentra
en formatos no estructurados, es decir, dicha informacin est escrita o impresa en palabras con diversos significados segn el sentido de los pensamientos y opiniones que se quieren expresar en una frase o prrafo lo que la hace difcil de analizar para determinar si la idea es positiva o negativa. Es muy importante comprender este tipo de formatos para conocer el punto de vista de diversos clientes que utilizan variados productos o servicios para determinar un nivel de satisfaccin o insatisfaccin en su uso ya que de este tipo de anlisis depende el mantener a un cliente o perderlo dentro del negocio lo que afectara los ingresos de la compaa. Comprender el lenguaje humano con minera de textos est basado en la lingstica conocido como Natural Language Processing (NPL). Este procesamiento permite extraer trminos, incluyendo frases compuestas, que permite clasificarlos dentro de grupos relacionados de palabras para extraer los conceptos ms relevantes en una serie de frases o prrafos. SPSS Modeler Premium permite realizar el anlisis de minera de textos al aplicar estas reglas de lingstica para extraer conocimiento e informacin relevante que representan conceptos y trminos clave y que son agrupados en categoras que representan el nivel ms alto de las ideas contenidas en los textos con los objetivos de 1) analizarlas ms rpidamente ya que debido a su gran volumen es muy difcil y laborioso realizarlo por los analistas y 2) utilizar dichos resultados para desarrollar modelos y predecir el comportamiento de los clientes. Algunas aplicaciones de la minera de datos incluyen: CRM (Customer Relationship Management). La informacin es extrada de las opinions de los clients en call centers, correos y encuestas para determinar el nivel de satisfaccin, lo que se conoce como anlisis de sentimientos. Anlisis de blogs y minera web. La minera de textos permite extraer informacin de comentarios en formato libre de sitios web y blogs para proveer tendencias de opinin sobre diversos temas de inters en internet. Deteccin de fraudes. El fraude potencial puede ser descubierto al analizar patrones y anomalas en datos de texto para salud, seguros y gobierno. Volver arriba Minera de Textos con SPSS Modeler Premium SPSS Modeler Premium contiene varios nodos especializados para manejar diferentes formatos de texto como son archivos Word, pdf, Excel, .txt, HTML, RRS, etc. Otra funcionalidad importante es el nodo traductor Translate para idiomas como ruso, chino o rabe hacia el idioma ingls adems de contener diccionarios de palabras en diversos idiomas como espaol, alemn, francs y portugus con conceptos positivos y negativos para analizar y determinar el sentido del texto que se est analizando. Por ltimo, los nodos para realizar la minera de texto al extraer los conceptos y encontrar relaciones entre las palabras. El objetivo del modelo de text mining es analizar los comentarios acerca del servicio que ofrece una compaa a los clientes que han llamado al call center en un periodo dado para conocer su opinin y detectar a aquellos clientes con comentarios negativos; el efecto de este tipo de comentarios puede afectar la relacin cliente-empresa ya que si varios clientes se encuentran inconformes con el servicio recibido, stos podran cancelarlo lo que se vera reflejado en las ventas. La idea es identificar a este tipo de clientes para que el rea de marketing realice campaas especficas de mejora del servicio en base los resultados del anlisis. Volver arriba Modelo de Minera de Textos Los datos demogrficos de los clientes y sus comentarios son agregados a SPSS Modeler Premium, debido a que se encuentran en tablas distintas, se deber realizar el cruce de informacin para obtener una sola tabla analtica como se muestra en la siguiente figura: En este artculo verificaremos la instalacin accediendo a las herramientas de WCS (para mayor informacin sobre otros mtodos, referirse a la seccin de Recursos de este artculo). Figura 1. Diagrama del modelo
La variable comments ser utilizada para el anlisis de datos no estructurados que contiene las opiniones de los clientes; este tipo de anlisis es conocido como Anlisis de Sentimientos. Es importante recalcar que con SPSS Modeler Premium es posible anlisis textos en diversos idiomas, no solamente en ingls como en nuestro ejemplo: Figura 2. Comentarios
Haga clic para ampliar la imagen El siguiente paso es definir el tipo de categoras y recursos a utilizar, SPSS Modeler Premium contiene una serie paquetes de anlisis de texto (TAP) bsicos con diversas palabras relacionadas, segn el caso, al tema a analizar, el usuario puede modificarlos o regionalizarlos para definir nuevas palabras e inclusive crear sus propios diccionarios de palabras. En este ejemplo nos interesa clasificar las opiniones positivas y negativas en base al diccionario Product Satisfaction: Figura 3. Seleccin del diccionario de datos
Ya cargado en SPSS Modeler Premium, los datos y el diccionario a utilizar se ejecuta el modelo, es posible realizar el anlisis de dos maneras, de modo interactivo donde es posible hacer las modificaciones pertinentes a los diccionarios en base a la clasificacin inicial de los conceptos y generar directamente un diamante los resultados. Es importante destacar que el resultado final depender de la afinacin de dichos diccionarios por lo que este es un proceso iterativo de anlisis como se muestra en la siguiente figura de la seccin Resource editor: Figura 4. Editor de Recursos
Haga clic para ampliar la imagen La siguiente imagen muestra el resultado del anlisis donde la pantalla se divide en 4 secciones: 1. La parte inferior izquierda es el panel de resultados extrados donde se encuentran los conceptos o trminos que el sistema clasifica en el anlisis y que pueden ser editados y refinados. 2. En la parte inferior derecha es el panel de datos y que es utilizado para presentar los datos de texto identificados para cada uno de los conceptos, es decir, contiene los registros donde el trmino fue encontrado. 3. El panel de categoras ubidado en la parte superior izquierda presenta la tabla de categoras que han sido creadas junto con su frecuencia de aparicin en el texto. 4. En la parte superior derecha se encuentra el panel de visualizacin que provee la representacin grfica de cada una de las categoras. En la figura se muestra para la categora phone su relacin con otras categoras. Figura 5. Anlisis de la categora
Haga clic para ampliar la imagen Como se mencion anteriormente, el objetivo es identificar a los clientes con opiniones relacionadas al concept bad. Dentro de este concepto se encuentran todas las palabras clasificadas de tipo negativo o como malas dentro de los comentarios. En el mapa se observa que dicho concepto es mencionado 84 veces y est relacionado fuertemente con otros como handset (modelo de celular), dislike o reception (seal celular). Figura 6. Concepto bad y su relacin con los trminos
Haga clic para ampliar la imagen Como se coment anteriormente, el otro modo de realizar el anlisis y que nos servir para obtener a los clientes que buscamos al identificarlos segn su edad y gnero (sexo) es generar directamente un diamante de resultados como se muestra en la figura 1. Al abrir el diamante se observan cada uno de los conceptos obtenidos en el anlisis; en la parte inferior se observa el concepto bad y todos los trminos definidos dentro de l en la figura 7: Figura 7. Resultado de text mining
Volver arriba Resultado En la siguiente figura proveniente de todo el diagrama de anlisis dentro de SPSS Modeler Premium, podemos ver un grfico donde se observa a los clientes clasificados segn su gnero y edad y que emitieron una opinin negativa acerca del servicio siendo un total de 84 y que representa un 5.7% de la base total (1477), de este grupo, las personas que ms se quejan del servicio son aquellas cuyo rango de edad esta entre los 50 y 59 aos donde la proporcin entre hombres y mujeres es similar (16 clientes). Figura 8. Resultado de text mining
Para dar continuidad al proceso de negocio, el analista de minera de textos debe enviar un reporte donde se explique las causas de las quejas as como la lista de clientes al rea de marketing para que se tomen las acciones necesarias para el mejoramiento del servicio as como realizar una campaa one to one para dichos clientes y satisfacer as sus demandas. Volver arriba Conclusiones El anlisis de minera de textos con SPSS Modeler Premium es una poderosa solucin para conocer las opiniones de los clientes e identificar a aquellos que no estn de acuerdo o se quejan del servicio o producto proporcionado as como los que lo apoyan. Es muy importante como estrategia de negocio tener la visin total del cliente y su sentir hacia nuestra empresa ya que esto nos permitir ir ms all en la mejora continua as como el incremento en las ventas y la permanencia dentro del mercado.