Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TEMA 3:
PRESENTA:
A la casa de estudios.
A los docentes.
A mi familia.
Por creer en mí y apoyar este proyecto que empiezo a emprender, que, si bien no
se veía con el mejor de los panoramas, siempre me motivaron a seguir adelante
para seguir creciendo de manera profesional y personal.
Contenido
Agradecimiento. .................................................................................................................................. 2
Introducción. ....................................................................................................................................... 5
Minería. ............................................................................................................................................... 6
Minería de datos. ................................................................................................................................ 7
Historia. ........................................................................................................................................... 7
Recopilación de datos. 1960........................................................................................................ 8
Acceso a los datos. 1980 ............................................................................................................. 8
Depósito de los datos y contribución a las decisiones. Principios de 1990 ................................ 8
Minería de Datos conocida en la actualidad. Finales de 1990. ................................................... 8
Áreas en donde es aplicada............................................................................................................. 8
Medicina. ..................................................................................................................................... 8
Banca y proveedores de servicios. .............................................................................................. 8
Seguridad y detección de fraude. ................................................................................................ 9
Recuperación de información no numérica. ............................................................................... 9
Ciencias Ambientales. ................................................................................................................. 9
Ciencias Sociales. ......................................................................................................................... 9
Metodología para el descubrimiento de conocimiento en bases de datos (KDD). ......................... 9
Técnicas. ........................................................................................................................................ 10
Técnica predictiva. ..................................................................................................................... 10
Técnica descriptiva. ................................................................................................................... 10
Minería de textos. ............................................................................................................................. 11
Etapas. ........................................................................................................................................... 11
Determinar el propósito de estudio. ......................................................................................... 11
Recolectar, identificar, recoger y validar información. .............................................................. 12
Procesamiento de texto. ........................................................................................................... 12
Extracción y análisis de clases. .................................................................................................. 12
Presentación de resultados. ...................................................................................................... 12
Minería de sentimientos. .................................................................................................................. 13
Minería de textos y minería de sentimientos................................................................................ 13
Paquete syuzhet. ....................................................................................................................... 13
Paquete sentimentr. .................................................................................................................. 13
Tipos de tareas. ............................................................................................................................. 14
Detección de la polaridad.......................................................................................................... 14
Análisis del sentimiento basado en características. .................................................................. 14
Aplicación. ..................................................................................................................................... 14
Política. ...................................................................................................................................... 14
Empresarial................................................................................................................................ 14
Conclusión. ........................................................................................................................................ 15
Referencias ........................................................................................................................................ 16
Introducción.
Con el paso del tiempo y los avances tecnológicos, los datos informáticos se han
acumulado en gran cantidad, hasta llegar a niveles considerablemente extremos,
por lo tanto, en la actualidad si se requiere realizar un análisis de temas en los cuales
ya se haya profundizado desde años atrás, serán muchos los datos que se
obtengan, lo cual hará complejo el entendimiento y análisis de todos esos datos, y
la complejidad de esto ira en incremento por los nuevos autores o investigadores
que profundicen en el tema.
Gracias a las actividades mineras, se tienen gran parte de las cosas que
alcanzamos a ver en nuestro día a día, si analizamos detenidamente los
componentes que contiene una casa, podremos darnos cuenta que en su mayoría
son productos minerales, que en conjunto crean un objeto de mucho mayor
magnitud como es una casa, igualmente podemos ver los beneficios de la minería
al momento de pagar un producto o servicio, pues las monedas esta hechas de
cobre.
Con la minería de datos se exploran bases de datos magnas para logra comprender
a profundidad el conjunto considerablemente grande de la información recabada,
para que con esta se puedan localizar patrones, tendencias y hacer la observación
de cómo se relacionan ciertos aspectos entre sí, a fin de encaminar a la localización
de información estratégica que permita crear predicciones sobre los
comportamientos presentados [3].
Historia.
La información es considerada como un puente base para lograr llegar a desenlaces
óptimos de los datos y con ella poder transformar estos datos en información de alta
relevancia, por lo tanto, la minería de datos surge con la finalidad de ser una
herramienta de apoyo para la comprensión de una cantidad enorme de datos y con
que con esta comprensión se puedan plantear una serie de conclusiones que
contribuyan en la mejora del tema en cuestión.
Esta herramienta se ha empezado a trabajar desde hace algunos años atrás para
lograr llegar a como la conocemos actualmente, su evolución es dividida en cuatro
etapas trascendentales [4].
Recopilación de datos. 1960
Durante este tiempo los expertos de estadística e investigación de operaciones
realizaban el denominado data fising o pesca de datos, para realizar un análisis con
la finalidad de localizar alguna relación de los datos.
Medicina.
La minería de datos es empleada para diagnosticar algunas enfermedades y
conocer la eficiencia de los utilizados.
Ciencias Ambientales.
Se utiliza para identificar los modelos en los cuales funciona un ecosistema natural
o artificial con el propósito de lograr una mejora en su gestión y control.
Ciencias Sociales.
Puesta en práctica para estudiar la opinión pública sobre algún tema en específico
y saber cómo se pueden ser sobrellevadas las nuevas tendencias.
Técnicas.
La minería de datos se clasifica en tres técnicas, las cuales son ejecutadas en
función al propósito de la información requerida.
Técnica predictiva.
Como su nombre lo dice, tiene la propiedad de predecir algún valor, en ella son
utilizados los modelos de regresión, análisis de la varianza, series temporales,
análisis discriminantes, árbol de decisiones, redes neuronales.
Técnica descriptiva.
Los datos son analizados para poder hacer un reporte de su evolución y su
comportamiento para que futuros usuarios puedan tomar el resultado de esto como
base para nuevos estudios. Se hace uso del análisis cluster, escalamiento
multidimensional, escalamiento optimo, reducción de la dimensión y la
segmentación.
Técnicas auxiliares.
Etapas.
Para llevar a cabo el proceso que requiere la minería de textos, se establecen una
serie de pasos, los cuales ayudaran al procesamiento de los textos y a la extracción
de información relevante para el uso requerido. Los pasos establecidos se muestran
a continuación [7].
Procesamiento de texto.
Este paso es ejecutado con el fin de depurar la información y desechar la que no
genere valor al propósito establecido previamente, se realiza un análisis léxico, un
tratamiento y separación de palabras, tratamiento de términos redundantes
tratamiento de palabras compuestas, normalización de palabras y etiquetado de
palabras, además se corrigen algunos problemas de formato, polisemia, homonimia
y sinonimia.
Presentación de resultados.
Los resultados obtenidos son expuestos a través de la realización de un resumen,
resaltando los textos considerados de importancia, dando relación a los
antecedentes asociados al tema central y toda esta información procesada es
almacenada para sus futuras consultas.
Minería de sentimientos.
La minería de sentimiento al igual que la minería de textos, proviene del surgimiento
de la minería de datos y al igual que ellas este tipo de minería es complementada
por los dos primeros, pues estos tres conceptos en conjunto logran la obtención de
mejores resultados sobre los datos que se pretenden lograr.
Este tipo de minería puede ser localizada bajo varios nombres, por ejemplo, análisis
de sentimientos, opinion mining o minería de opinión, sin embargo, todos estos
conceptos se centran en la aplicación de herramientas que ayuden a procesar el
lenguaje humano utilizado para diferenciar el tono emocional que se presenta
acompañado de un discurso y así lograr entender emociones, el origen de las
opiniones planteadas y el porqué de actitudes tomadas.
Los datos que se hacen notar con la minería de sentimientos son sumamente
importantes, debido a que pueden ser utilizados y explotados por empresas
privadas que brindar algún producto o servicio para dar un margen de como
deberían realizar su trabajo de marketing, por ejemplo, elegir la propaganda idónea
según las preferencias u opiniones de la gente o encontrar el producto mejor
valorado por los usuarios [8].
Paquete syuzhet.
El paquete syuzhet proporciona las funciones necesarias para extraer la trama
emocional de un texto.
Paquete sentimentr.
Proporciona las funciones para el cálculo del sentido y polaridad de un texto en
función del enfoque establecido en el léxico.
Tipos de tareas.
Se destacan dos vertientes de la minería de opiniones.
Detección de la polaridad.
Con esta tarea se determina si una opinión es positiva o negativa, con la
implementación de encuestas para conocer puntualmente en donde se encuentra
el producto o servicio en cuestión.
Aplicación.
Se pueden resaltar dos áreas de relevancia en las cuales la minería de opinión toma
un papel muy importante.
Política.
Aquí se hace uso de la minería de datos para conocer las preferencias de la
población sobre un candidato u otro y para conocer la opinión de la población sobre
un tema político, el ejemplo más claro que se tiene son las actualmente conocidas
consultas ciudadanas.
Empresarial.
En esta área quizá sea reflejada la minería de datos con mayor claridad, pues para
la mejora continua o cubrir los estándares de calidad de un producto o servicio, es
imperativo conocer la opinión de los usuarios.
Conclusión.
La minería de datos, textos y sentimientos es una herramienta altamente
competitiva y eficiente para la actualidad, pues la mayoría de los datos requeridos
ya tienen antecedentes por uno o varios autores, la mayoría de ellos despaldados
por casos prácticos, sin embargo, también se pueden encontrar hipótesis o
supuestos de la misma información, que siendo objetivos no son de utilidad si se
busca tomar una decisión empresarial o tomarlos como base para crear otro informe
científico.
Con ayuda de estas herramientas se puede hacer un análisis hasta cierto punto
rápido para localizar los informes con soporte científico y en los cuales nos podemos
apoyar con plena confianza para realizar reportes científicos, tomar decisiones
dentro de un entorno en el que se requiera o simplemente tomar estos datos como
base para nuevas investigaciones.
[ M. C. Barrera, «Minería de texto: una visión actual,» Biblioteca Universitaria, vol. 17, nº 2, pp.
7 129-138, 2014.
]