Está en la página 1de 2

INURRIA MORALES, Adriana

Itinerario Ciencia Cognitiva

Minería de Textos

1- Conocimiento Base:

Mi conocimiento sobre la minería de textos es prácticamente nulo. Sé es una rama específica de


la minería de datos que se refiere al proceso de analizar e inferir información nueva de textos, a
través de la identificación de patrones o correlaciones entre los términos se logra encontrar
información que no está explícita en el texto.
Parándome a pensar sobre el tema, me he dado cuenta de que utilizo varias aplicaciones o
programa que utilizan la minería de textos. El sistema Android de los teléfonos permiten
deducir tus frases conforme escribes a raíz de todos los datos acumulados que tiene de tu
escritura y forma, los softwares que traducen automáticamente palabras escritas de un idioma a
otro, etc.

2- Conocimientos nuevos:

A través de esta lectura he podido comprender en qué consiste la minería de textos, cuáles son
sus características y conceptos concretos, y sus aplicaciones en otras disciplinas (como la
lingüística computacional, entre otras).
La minería de textos se usa como herramienta para el análisis de información no estructurada.
Sin embargo, no se puede extraer conocimiento implícito debido a su falta de sistemas de
razonamiento lógico. Por otro lado, la principal diferencia entre la minería de datos y la minería
de textos es que la primera analiza información estructurada, y la textual analiza información no
estructurada.
Por último, la lectura nos aporta información sobre los usos de este tipo de minería, como puede
ser el feature extraction, que trata de identificar hechos y datos puntuales de los textos. También
nos resume las principales herramientas existentes en el mercado que más se utilizan, como
SAS Text Miner, o SPSS LexiQuest.

3- Crítica al texto:

Este artículo me parece perfecto como introducción a la minería de textos. Tiene una
perspectiva didáctica explicativa que ha hecho que entienda muy bien en qué consiste el tema,
sin perderme en tecnicismos ni en conceptos o explicaciones teóricas nivel experto. Como
primera lectura sobre el tema, me parece muy acertada. La única pega sería el hecho de que el
artículo fue publicado en el año 2004, y quizás esté algo desactualizado.
4- Aportación propia:

Las redes sociales se han convertido en herramientas imprescindibles para nuestro día a día.
Además, son las herramientas que más datos almacena de nosotros. Por ello, en este campo las
aplicaciones son múltiples. En su tesis, Justicia de la Torre (2017) expone los usos primordiales
de la minería textual en el área de las redes sociales: filtrado de emails, personalización de
perfiles web, y detección de comunidades web y teorías sociales.
El filtrado de emails consiste en la organización en carpetas de los correos electrónicos. El
funcionamiento sería el siguiente: “cada mensaje se tokeniza con las 15 palabras más
interesantes, entendiendo por interesante aquella palabra que tiene poca probabilidad de ser
spam” (Justicia de la Torre, M.C., 2017). Así, la herramienta ejecutará esa operación y decidirá
si el mensaje es o no spam. Parece algo sencillo, pero si pensamos en la cantidad de correos que
se reciben al día, es una herramienta bastante útil para personas con alto nivel de correos
electrónicos.
En cuanto a la personalización de perfiles web, consiste en utilizar un recuperador de
documentos interesantes de las páginas web de noticias deseadas, y clasificar los artículos en
función de varios temas (conocidos con anterioridad). Mediante un cluster, los documentos
entrarán en una u otra categoría basándose en la similitud entre ellos. Teniendo en cuenta que, a
cada minuto, incluso segundo, van saliendo noticias de última hora, y teniendo en cuenta la
enorme cantidad de páginas web que son fuentes de noticia, esta aplicación de la minería textual
es de gran utilidad para las editoriales, las cuales deben dedicar mucho tiempo para determinar
si cada información es útil o no. Además, “estos artículos podrían mezclarse para obtener uno
nuevo, o bien se podrían obtener cabeceras de noticias interesantes” (Weiss et al., 2010).
Por otro lado, está la minería de redes sociales para aplicar teorías sociales, y la detección de
comunidades web. A cada momento hay millones de personas interactuando y sociabilizando
online, donde se desarrollan nuevas formas de comunicación y cooperación. Estas aplicaciones
son muy abundantes en la red social Twitter, ya que ésta es un reflejo constante de lo que
sucede al momento. En estas aplicaciones a Twitter concretamente, se suele realizar Opinion
Mining y Sentiment Analysis, dos medidas diferenciadas, una de la opinión y otra de los
sentimientos (positivos, negativos, o neutros) . Así, se pueden realizar estudios en los que se
conectan medidas de opinión pública con medidas de valencia de sentimientos expresados
dentro de los tweets. Y con ello, realizar estudios sobre tendencias, gustos, o problemáticas
sociales actuales.

5- Bibliografía:

Weiss, S. M., Indurkhya, N., & Zhang, T. (2010). Fundamentals of predictive text mining. Vol.
41. Springer
Justicia de la Torre, M.C. (2017). Nuevas técnicas de minería de textos. Aplicaciones. (Tesis
doctoral)

También podría gustarte