Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(Text Mining)
MINERÍA DE TEXTOS
Con billones de páginas en la red, se requieren de
nuevas tecnologías para encontrar, clasificar y
detectar particulares patrones en la información
disponible.
La esencia de los métodos de la minería de datos
aplicados a los datos numéricos, puede también
ser aplicada a datos de texto.
Estudios recientes indican que el ochenta por
ciento de la información de una compañía está
almacenada en forma de documentos.
MINERÍA DE TEXTOS
Este campo de estudio es muy vasto, por
lo que técnicas como la categorización de
texto, el procesamiento de lenguaje
natural.
La extracción y recuperación de la
información o el aprendizaje automático,
entre otras, apoyan al Text Mining
(minería de texto).
MINERÍA DE TEXTOS
El Text Mining se refiere a examinar una
colección de documentos y descubrir
información no contenida en ningún
documento individual de la colección.
MINERÍA DE TEXTOS
Es una tecnología emergente cuyo objeto es la
búsqueda de conocimiento en grandes colecciones
de documentos no estructurados.
Se refiere al proceso de derivar información nueva de
textos.
Consiste en descubrir, a partir de cantidades de texto
grandes, el conocimiento que no está literalmente
escrito en cualquiera de los documentos.
Esto incluye buscar tendencias, promedios,
desviaciones, dependencias, etc.
MINERÍA DE TEXTOS
Este campo de estudio es muy vasto. Las
técnicas usadas tenemos :
La categorización de texto
El procesamiento de lenguaje natural
La extracción y recuperación de la
información
El aprendizaje automático
UTILIDAD DE LA MINERÍA DE
TEXTOS
Cuando hacemos una consulta en Internet, como
respuesta de los buscadores, recibimos una gran
cantidad de información y quizás deseamos
solamente quedarnos con los aspectos más
relevantes de dicha información.
Por esta razón, se ha buscado desarrollar
herramientas computacionales que permitan
identificar los aspectos que nos son importantes de
los textos y con ellos obtener la información deseada.
UTILIDAD DE LA MINERÍA DE
TEXTOS
Por estos motivos, los lingüistas han
adoptado perspectivas de análisis
basadas en sus conocimientos de la
estructura del idioma.
4. WORDSTAT:
Se utiliza para realizar análisis de competencia en sitios web,
análisis de sentimientos y contenido en preguntas abiertas.
Software y Herramientas de
Text Mining
5. ESTEATTENSITY:
Este software de análisis y minería de texto se utiliza para
analizar la información y la inteligencia colectiva en redes
sociales y foros.
6. AEROTEXT:
Es una herramienta o biblioteca con aplicaciones de
minería de textos para realizar análisis de contenido para
textos en diversos idiomas.
Software y Herramientas de
Text Mining
7. PIMIENTO:
Esta herramienta en desarrollo esta siendo elaborada por
la Universidad del Pais Vasco.