Está en la página 1de 14

Minera de textos

Minera textual
Text Mining

Integrantes:
- Samuel Silva Abuhadba
- Marcelo Valdivia Paredes

Qu es ?
O La Minera de Textos es una tecnologa

emergente cuyo objetivo es la bsqueda de


conocimiento en grandes colecciones de
documentos no estructurados.
O El 80% de la informacion de las

organizaciones esta almacenada en forma


textual no estructurada como : informes , email , actas de reuniones, etc.

Aplicaciones y Usos
O Categorizacin de la informacin existente ,

filtrado y enrutado ; e-mails , deteccin de


informacin similar o duplicada

O Utilizados en empresas para identificar el

contenido de los e-mails enviados por los


clientes y redirigirlos a los departamentos
correspondientes
O Usos mas avanzados el sistema identifica el

contenido de una consulta frecuente hecha


por e-mail y enva una respuesta estndar
sin necesidad de intervencin humana.

O Vigilancia Tecnolgica

O Inteligencia de negocios

Tres pasos
fundamentales de la
minera de textos:
1.-Recuperacin de informacin, es decir, seleccionar los
textos pertinentes.
2.-Extraccin de la informacin incluida en esos textos:
hechos, acontecimientos, datos clave, relaciones entre ellos,
etc.
3.-Por ultimo se realizara lo que antes definamos como
minera de datos para encontrar asociaciones entre esos
datos claves previamente extrados de entre los textos

Como hacer la minera de textos?


O Es una tcnica relativamente nueva, cambiante y

que puede adaptarse a diferentes situaciones y


casos, por lo que no existe un mtodo estricto a
seguir siempre. Sin embargo, en trminos
generales se podra decir que estas son las cuatro
etapas principales

Primera

Determinacin de los objetivos. Aclarar que es lo


que se esta buscando con esta investigacin,
acotando hasta que punto se quiere profundizar
en la misma y definiendo claramente los limites.

Segunda

Preprocesamiento de los datos, que seria la


seleccin, anlisis y reduccin de los textos o
documentos de los que se extraer la
informacin. Esta etapa consume la mayor parte
del tiempo.

Tercera

Determinacin del modelo. Segn los objetivos


planteados y la tarea que debe llevarse a cabo,
pueden utilizarse unas tcnicas u otras.

Cuarta

Anlisis de los resultados. A partir de los datos


extraidos se tratara de ver su coherencia y se
buscaran evidencias, similitudes, excepciones,
etc, que puedan servir al especialista o al
usuario que haya encargado el estudio para
extraer conclusiones que pueda utilizar para
mejorar algn aspecto de su empresa,
compaa, administracin u organizacin en
general.

Data mining: torturando a los datos


hasta que confiesen
Luis Carlos Molina Flix

Ejemplo: Migraa
O Se pudieron extraer evidencias a partir de varios artculos

de literatura biomdica y algunas de las claves fueron:


O El estrs est asociado con la migraa.
O El estrs puede conducir a la prdida de magnesio.
O Los bloqueadores de canales de calcio previenen algunas
O
O
O
O
O

migraas.
El magnesio es un bloqueador natural del canal de calcio.
La depresin cortical diseminada (DCD) est implicada en
algunas migraas.
Los niveles altos de magnesio inhiben la DCD.
Los pacientes con migraa tienen una alta agregacin
plaquetaria.
El magnesio puede suprimir la agregacin plaquetaria

O Estas evidencias permitieron crear una hiptesis que

no exista en la literatura cientfica como tal pero que


se pudo encontrar de manera indirecta haciendo un
anlisis diferente de los textos. Estudios posteriores
probaron experimentalmente esta hiptesis obtenida
por text mining con buenos resultados.
O Ejemplo: Las fichas de entrada en una fabrica.
O Departamento donde salen mas tarde.
O Incidencia de faltas
O Retrasos en funcin de las fechas.

Resumen
O En resumen, la minera de textos pueden ayudar a

O
O
O
O

que la informacin implcita en los documentos ms


explcitos se puede hallar de manera rpida. Esto
hace que ahorremos tiempo y dinero.. El text
mining se apoya en otras tcnicas como:
extraccin y recuperacin de la informacin
aprendizaje automtico
procesamiento de lenguaje natural
categorizacin de texto

Conclusiones:
O La minera de textos es una tecnologa recuperacin y

organizacin de la informacin que aunque todava es


emergente y necesita ser mejor desarrollada, nos
sirve para obtener un tipo de informacin muy til en
cualquier tipo de organizacin publica o privada.
O Econmicamente es una tcnica que puede utilizarse
para ahorrar dinero y abrir oportunidades de negocio
a las empresas.
O En cualquier organizacin, las conclusiones a las que
se puede llegar a travs del text mining pueden ser
utilizadas para la toma de decisiones

También podría gustarte