Está en la página 1de 2

METODO DE TEXT MINING (MINERIA DE LOS TEXTOS)

La minería de texto se encarga de aprovechar y desarrollar métodos


automatizados para procesar documentos digitales no estructurados de forma
rápida y eficiente, con la finalidad de organizarlos y analizarlos, permitiendo la
agrupación de los documentos sobre un mismo tema a partir de características
similares, este método se puede realizar de manera manual o automatizada con
ayuda de distintos softwares.
METODOLOGIA DE TEXT MINING
Para su desarrollo será necesario el cumplimiento de varias etapas, partiendo de
la búsqueda de información
Establece una serie de etapas o pasos descritos a continuación:
1. Recolección de información: Consiste en la recopilación de datos
mediante diferentes recursos, tales como entrevistas, correos electrónicos,
comentarios de personas, entre otros. En donde dependiendo de la
aplicación, el desarrollo de la etapa podrá ser completamente automatizado
o guiado por una persona encargada de realizar este proceso.
2. Limpieza de textos: Será necesario eliminar los datos que no ayudan al
propósito del objeto de estudio, proceso realizado mediante alguna de las
siguientes acciones: Análisis léxico, tratamiento y separación de palabras
vacías. A partir de la recolección se obtendrán una serie de datos, los
cuales, generalmente por el método de recolección utilizado, podrán estar
una forma desordenada, esta información se recolecta y se valida el
contenido de la misma, después de ello se realiza la extracción de las
características más representativas.
3. Extracción de datos clave: Tiene el objetivo de extraer datos específicos
en un texto, como palabras clave, nombres propios, direcciones. Esto
permite evitar tener que clasificar los datos manualmente y, por tanto, se
gana tiempo.
4. Procesamiento de los datos: En esta fase se realiza la recuperación de
información, en la que se buscan e identifican las fuentes más relevantes,
para el objetivo de estudio de la minería de texto.
5. Análisis y Resultados: Los resultados del procesamiento, serán
mostrados y analizados, a través de resúmenes, marcadores de texto,
relaciones, taxonomías y visualización, lo que ayuda para su interpretación.
También se puede almacenar la información procesada en bases de datos
para su recuperación posterior.
Recolección de
información.

Limpieza de
textos.

Extracción de
datos clave.

Procesamiento
de datos.

Análisis y
Resultados.

Esquema de la metodología de método minería de texto.

También podría gustarte