Está en la página 1de 10

Acerca de este tutorial

El 80% de los datos que actualmente producen diversas compaas se encuentra


en formatos no estructurados, es decir, dicha informacin est escrita o impresa
en palabras con diversos significados segn el sentido de los pensamientos y
opiniones que se quieren expresar en una frase o prrafo lo que la hace difcil de
analizar para determinar si la idea es positiva o negativa. Es muy importante
comprender este tipo de formatos para conocer el punto de vista de diversos
clientes que utilizan variados productos o servicios para determinar un nivel de
satisfaccin o insatisfaccin en su uso ya que de este tipo de anlisis depende el
mantener a un cliente o perderlo dentro del negocio lo que afectara los ingresos
de la compaa.
Comprender el lenguaje humano con minera de textos est basado en la
lingstica conocido como Natural Language Processing (NPL). Este
procesamiento permite extraer trminos, incluyendo frases compuestas, que
permite clasificarlos dentro de grupos relacionados de palabras para extraer los
conceptos ms relevantes en una serie de frases o prrafos.
SPSS Modeler Premium permite realizar el anlisis de minera de textos al aplicar
estas reglas de lingstica para extraer conocimiento e informacin relevante que
representan conceptos y trminos clave y que son agrupados en categoras que
representan el nivel ms alto de las ideas contenidas en los textos con los
objetivos de 1) analizarlas ms rpidamente ya que debido a su gran volumen es
muy difcil y laborioso realizarlo por los analistas y 2) utilizar dichos resultados
para desarrollar modelos y predecir el comportamiento de los clientes.
Algunas aplicaciones de la minera de datos incluyen:
CRM (Customer Relationship Management). La informacin es
extrada de las opinions de los clients en call centers, correos y
encuestas para determinar el nivel de satisfaccin, lo que se conoce
como anlisis de sentimientos.
Anlisis de blogs y minera web. La minera de textos permite extraer
informacin de comentarios en formato libre de sitios web y blogs para
proveer tendencias de opinin sobre diversos temas de inters en
internet.
Deteccin de fraudes. El fraude potencial puede ser descubierto al
analizar patrones y anomalas en datos de texto para salud, seguros y
gobierno.
Volver arriba
Minera de Textos con SPSS Modeler Premium
SPSS Modeler Premium contiene varios nodos especializados para manejar
diferentes formatos de texto como son archivos Word, pdf, Excel, .txt, HTML, RRS,
etc. Otra funcionalidad importante es el nodo traductor Translate para idiomas
como ruso, chino o rabe hacia el idioma ingls adems de contener diccionarios
de palabras en diversos idiomas como espaol, alemn, francs y portugus con
conceptos positivos y negativos para analizar y determinar el sentido del texto que
se est analizando. Por ltimo, los nodos para realizar la minera de texto al
extraer los conceptos y encontrar relaciones entre las palabras.
El objetivo del modelo de text mining es analizar los comentarios acerca del
servicio que ofrece una compaa a los clientes que han llamado al call center en
un periodo dado para conocer su opinin y detectar a aquellos clientes con
comentarios negativos; el efecto de este tipo de comentarios puede afectar la
relacin cliente-empresa ya que si varios clientes se encuentran inconformes con
el servicio recibido, stos podran cancelarlo lo que se vera reflejado en las
ventas. La idea es identificar a este tipo de clientes para que el rea de marketing
realice campaas especficas de mejora del servicio en base los resultados del
anlisis.
Volver arriba
Modelo de Minera de Textos
Los datos demogrficos de los clientes y sus comentarios son agregados a SPSS
Modeler Premium, debido a que se encuentran en tablas distintas, se deber
realizar el cruce de informacin para obtener una sola tabla analtica como se
muestra en la siguiente figura:
En este artculo verificaremos la instalacin accediendo a las herramientas de
WCS (para mayor informacin sobre otros mtodos, referirse a la seccin de
Recursos de este artculo).
Figura 1. Diagrama del modelo

La variable comments ser utilizada para el anlisis de datos no estructurados que
contiene las opiniones de los clientes; este tipo de anlisis es conocido como Anlisis de
Sentimientos. Es importante recalcar que con SPSS Modeler Premium es posible anlisis
textos en diversos idiomas, no solamente en ingls como en nuestro ejemplo:
Figura 2. Comentarios

Haga clic para ampliar la imagen
El siguiente paso es definir el tipo de categoras y recursos a utilizar, SPSS Modeler
Premium contiene una serie paquetes de anlisis de texto (TAP) bsicos con diversas
palabras relacionadas, segn el caso, al tema a analizar, el usuario puede modificarlos o
regionalizarlos para definir nuevas palabras e inclusive crear sus propios diccionarios de
palabras. En este ejemplo nos interesa clasificar las opiniones positivas y negativas en base
al diccionario Product Satisfaction:
Figura 3. Seleccin del diccionario de datos

Ya cargado en SPSS Modeler Premium, los datos y el diccionario a utilizar se ejecuta el
modelo, es posible realizar el anlisis de dos maneras, de modo interactivo donde es
posible hacer las modificaciones pertinentes a los diccionarios en base a la clasificacin
inicial de los conceptos y generar directamente un diamante los resultados. Es importante
destacar que el resultado final depender de la afinacin de dichos diccionarios por lo que
este es un proceso iterativo de anlisis como se muestra en la siguiente figura de la seccin
Resource editor:
Figura 4. Editor de Recursos

Haga clic para ampliar la imagen
La siguiente imagen muestra el resultado del anlisis donde la pantalla se divide en 4
secciones:
1. La parte inferior izquierda es el panel de resultados extrados donde se
encuentran los conceptos o trminos que el sistema clasifica en el anlisis y
que pueden ser editados y refinados.
2. En la parte inferior derecha es el panel de datos y que es utilizado para
presentar los datos de texto identificados para cada uno de los conceptos, es
decir, contiene los registros donde el trmino fue encontrado.
3. El panel de categoras ubidado en la parte superior izquierda presenta la tabla
de categoras que han sido creadas junto con su frecuencia de aparicin en el
texto.
4. En la parte superior derecha se encuentra el panel de visualizacin que provee
la representacin grfica de cada una de las categoras. En la figura se muestra
para la categora phone su relacin con otras categoras.
Figura 5. Anlisis de la categora

Haga clic para ampliar la imagen
Como se mencion anteriormente, el objetivo es identificar a los clientes con opiniones
relacionadas al concept bad. Dentro de este concepto se encuentran todas las palabras
clasificadas de tipo negativo o como malas dentro de los comentarios. En el mapa se
observa que dicho concepto es mencionado 84 veces y est relacionado fuertemente con
otros como handset (modelo de celular), dislike o reception (seal celular).
Figura 6. Concepto bad y su relacin con los trminos

Haga clic para ampliar la imagen
Como se coment anteriormente, el otro modo de realizar el anlisis y que nos servir para
obtener a los clientes que buscamos al identificarlos segn su edad y gnero (sexo) es
generar directamente un diamante de resultados como se muestra en la figura 1. Al abrir el
diamante se observan cada uno de los conceptos obtenidos en el anlisis; en la parte
inferior se observa el concepto bad y todos los trminos definidos dentro de l en la figura
7:
Figura 7. Resultado de text mining

Volver arriba
Resultado
En la siguiente figura proveniente de todo el diagrama de anlisis dentro de SPSS
Modeler Premium, podemos ver un grfico donde se observa a los clientes
clasificados segn su gnero y edad y que emitieron una opinin negativa acerca
del servicio siendo un total de 84 y que representa un 5.7% de la base total (1477),
de este grupo, las personas que ms se quejan del servicio son aquellas cuyo
rango de edad esta entre los 50 y 59 aos donde la proporcin entre hombres y
mujeres es similar (16 clientes).
Figura 8. Resultado de text mining

Para dar continuidad al proceso de negocio, el analista de minera de textos debe enviar un
reporte donde se explique las causas de las quejas as como la lista de clientes al rea de
marketing para que se tomen las acciones necesarias para el mejoramiento del servicio as
como realizar una campaa one to one para dichos clientes y satisfacer as sus demandas.
Volver arriba
Conclusiones
El anlisis de minera de textos con SPSS Modeler Premium es una poderosa
solucin para conocer las opiniones de los clientes e identificar a aquellos que no
estn de acuerdo o se quejan del servicio o producto proporcionado as como los
que lo apoyan. Es muy importante como estrategia de negocio tener la visin total
del cliente y su sentir hacia nuestra empresa ya que esto nos permitir ir ms all
en la mejora continua as como el incremento en las ventas y la permanencia
dentro del mercado.


http://www.gratispeliculas.org/descargar/diario-de-una-pasion-espanol-latino-dvdrip/
http://depositfiles.org/files/nvcqiw5pt
http://turbobit.net/download/free/cnonfypf2hb6
http://blog-peliculas.com/2011/04/diario-de-una-pasion-dvdrip-latino.html

También podría gustarte