Está en la página 1de 4

La minera de datos textuales, este campo de investigacin es que tiene aos de estudios, dentro

de este campo tambin se estudia el sentiment analysis o anlisis sentimental, y tambin estudia
el anlisis de datos textuales en redes sociales como twitter o Facebook, etc.
Para poder comprender la minera de datos textuales, primero hay que entender que es la minera
de datos. La minera de datos tiene el propsito de ayudar en la comprensin de los contenidos
en una base de datos, una vez comprendido esto podemos hablar sobre Para qu sirve la
Minera de Textos o Text Mining? Cules son sus usos? Es til para la recuperacin y
organizacin de la informacin?
Para lo cual deberemos ver la siguiente cita.
Es muy til para todas la compaas, administraciones y organizaciones en general que por las
caractersticas propias de su funcionamiento, composicin y actividades generan gran cantidad de
documentos y que estn interesadas en obtener informacin a partir de todo ese volumen de datos. Les
puede servir para conocer mejor a sus clientes, cuales son sus hbitos, preferencias,...
Un ejemplo claro de la utilizacion de las tecnicas de minera de textos lo realiz Hearst en 1999 y es incluido
como ejemplo en el articulo en Data mining: torturando a los datos hasta que confiesen de Luis Carlos
Molina Flix. En el describe como Don Swanson trato de extraer informacin a partir de colecciones de texto
y demostr cmo cadenas de implicaciones causales dentro de la literatura mdica pueden conducir a
hiptesis para enfermedades poco frecuentes, como por ejemplo ocurrio con la migraa. Se pudieron extraer
evidencias a partir de varios articulos de literatura biomedica y algunas de las claves fueron:
1. El estrs est asociado con la migraa.
2. El estrs puede conducir a la prdida de magnesio.
3. Los bloqueadores de canales de calcio previenen algunas migraas.
4. El magnesio es un bloqueador natural del canal de calcio.
5. La depresin cortical diseminada (DCD) est implicada en algunas migraas.
6. Los niveles altos de magnesio inhiben la DCD.
7. Los pacientes con migraa tienen una alta agregacin plaquetaria.
8. El magnesio puede suprimir la agregacin plaquetaria.

Estas evidencias permitieron crear una hiptesis que no exista en la literatura cientfica como tal pero que se
pudo encontrar de manera indirecta haciendo un anlisis diferente de los textos. Segn Swanson (Swanson y
otros, 1994), estudios posteriores probaron experimentalmente esta hiptesis obtenida por text mining con
buenos resultados.
De la misma manera, analizando por ejemplo las fichas de entrada en una fabrica es posible obtener
informacin sobre los trabajadores que sellan al entrar y al salir. Estudindolas detenidamente se podra
averiguar si existe algn da en el que esos trabajadores entran o salen mas tarde de lo normal, si existe
algn departamento en el que los trabajadores suelen salir mas tarde, la incidencia de faltas o retrasos en
funcin de las fechas, etc. (Ollero)



Como se puede ver en la cita el campo en el que la minera textual de datos, es muy til para la
investigacin en diferentes ramas de otros campos cientficos, a travs del anlisis sentimental se
pueden identificar diferentes emociones y estados de nimo como se hizo en el informe de la cita.
La minera textual ha estado avanzando en cuanto a las tcnicas de recoleccin de datos textuales,
una parte muy importante de estas nuevas tcnicas se aplican a las redes sociales.
En general, para descubrir redes sociales a partir de datos textuales, se dan los siguientes pasos:
Descubrimiento del nodo. Se identifican todas las referencias a las personas usando nombres, pronombres y
direccin de correo electrnico.
Correferencia y resolucin del alias. Las ambigedades sobre las personas se resuelven, por ejemplo,
diferenciando entre personas con el mismo nombre y creando una identidad individual para esos mltiples
alias.
Descubrimiento del enlace. Las conexiones sociales estn determinadas entre las personas identificadas en
los dos primeros pasos.
I dentificacin de la relacin y del rol. Se identifica los tipos de vnculos (ej.: amigo, compaero de
trabajo, compaero de clase, etc.) y se asignan los roles (ej.: gestor, subordinado, etc.) para cada persona
sobre la base del contenido o patrones de la comunicacin. (Gonzlez, 2012)


Visualizacin de una minera de datos en BIGDATA

Aunque estas tcnicas y aplicaciones no son nada nuevas, tiene muchos aos y el campo de la
minera de datos textuales estuvo rezagado por muchos aos entre disciplinas como al inteligencia
artificial, la evolucin que ha tenido en esto ltimos aos con el crecimiento de las bases de datos
a echo que cobre una mayor relevancia, ya que sin un anlisis adecuado de los BIGDATA sera
imposible los avances de hoy en da en el campo de la investigacin de diversos campos
cientficos.









Bibliografa
Csari, M. I. (s.f.). DID diagnostico por imagen y textos. Recuperado el 10 de septiembre de 2014,
de DID diagnostico por imagen y textos: http://micesari.blogspot.com/2008/04/dtm-
minera-de-datos-y-textos-lebart.html
Gonzlez, F. S. (1 de enero de 2012). Reflexiones sobre ecologas y espacios del aprendizaje,
anlisis del aprendizaje y anlisis de redes sociales, visualizacin de datos, Big Data y otros
temas emergentes. Recuperado el 10 de septiembre de 2014, de Reflexiones sobre
ecologas y espacios del aprendizaje, anlisis del aprendizaje y anlisis de redes sociales,
visualizacin de datos, Big Data y otros temas emergentes:
http://fernandosantamaria.com/blog/2012/01/mineria-de-texto-el-auge-por-el-analisis-
textual-y-la-analitica-de-las-interacciones-sociales/
Ollero, I. F. (s.f.). Mineria de Textos o Text Mining. Recuperado el 10 de septiembre de 2014, de
Mineria de Textos o Text Mining: http://textmining.galeon.com/

También podría gustarte