Está en la página 1de 17

Instituto Tecnológico de Orizaba

Fundamentos de ingeniería administrativa

TEMA 3:

Minería de datos, minería de textos, minería de


sentimientos y su aplicación.

PRESENTA:

Lic. Evelin Edith Dector Rosas

Orizaba, Veracruz 06 de septiembre de 2023


Agradecimiento.

A la casa de estudios.

Por brindarme la oportunidad de ser mejor a nivel profesional, con las


exigencias y enseñanzas que me brindan, y a nivel personal por los valores que
son inculcados y puestos en práctica siempre, todo esto para que el día de
mañana puedo lograr brindarle a la sociedad un poco de lo aprendido aquí.

A los docentes.

Los presentes y futuros, por compartir su conocimiento y experiencias,


enriqueciendo mi formación cada día, por el respeto y el valor que me dan como
estudiante y sobre todo por el apoyo que siempre me brindan.

A mi familia.

Por creer en mí y apoyar este proyecto que empiezo a emprender, que, si bien no
se veía con el mejor de los panoramas, siempre me motivaron a seguir adelante
para seguir creciendo de manera profesional y personal.
Contenido
Agradecimiento. .................................................................................................................................. 2
Introducción. ....................................................................................................................................... 5
Minería. ............................................................................................................................................... 6
Minería de datos. ................................................................................................................................ 7
Historia. ........................................................................................................................................... 7
Recopilación de datos. 1960........................................................................................................ 8
Acceso a los datos. 1980 ............................................................................................................. 8
Depósito de los datos y contribución a las decisiones. Principios de 1990 ................................ 8
Minería de Datos conocida en la actualidad. Finales de 1990. ................................................... 8
Áreas en donde es aplicada............................................................................................................. 8
Medicina. ..................................................................................................................................... 8
Banca y proveedores de servicios. .............................................................................................. 8
Seguridad y detección de fraude. ................................................................................................ 9
Recuperación de información no numérica. ............................................................................... 9
Ciencias Ambientales. ................................................................................................................. 9
Ciencias Sociales. ......................................................................................................................... 9
Metodología para el descubrimiento de conocimiento en bases de datos (KDD). ......................... 9
Técnicas. ........................................................................................................................................ 10
Técnica predictiva. ..................................................................................................................... 10
Técnica descriptiva. ................................................................................................................... 10
Minería de textos. ............................................................................................................................. 11
Etapas. ........................................................................................................................................... 11
Determinar el propósito de estudio. ......................................................................................... 11
Recolectar, identificar, recoger y validar información. .............................................................. 12
Procesamiento de texto. ........................................................................................................... 12
Extracción y análisis de clases. .................................................................................................. 12
Presentación de resultados. ...................................................................................................... 12
Minería de sentimientos. .................................................................................................................. 13
Minería de textos y minería de sentimientos................................................................................ 13
Paquete syuzhet. ....................................................................................................................... 13
Paquete sentimentr. .................................................................................................................. 13
Tipos de tareas. ............................................................................................................................. 14
Detección de la polaridad.......................................................................................................... 14
Análisis del sentimiento basado en características. .................................................................. 14
Aplicación. ..................................................................................................................................... 14
Política. ...................................................................................................................................... 14
Empresarial................................................................................................................................ 14
Conclusión. ........................................................................................................................................ 15
Referencias ........................................................................................................................................ 16
Introducción.
Con el paso del tiempo y los avances tecnológicos, los datos informáticos se han
acumulado en gran cantidad, hasta llegar a niveles considerablemente extremos,
por lo tanto, en la actualidad si se requiere realizar un análisis de temas en los cuales
ya se haya profundizado desde años atrás, serán muchos los datos que se
obtengan, lo cual hará complejo el entendimiento y análisis de todos esos datos, y
la complejidad de esto ira en incremento por los nuevos autores o investigadores
que profundicen en el tema.

Considerando esta necesidad que ira en incremento, surge primeramente la minería


de datos, iniciada en los años sesenta y presentándose como herramienta de apoyo
para el análisis de un tema en especifico entre una gran cantidad de datos y
extrayendo únicamente los que se consideren de impacto para el fin que se
establezca, de ahí el nombre “minería de datos” pues como la minería convencional
se hacen extracciones de lo que realmente se considera importante.

Posterior a la minería de datos se presenta la minería de textos, que es un


complemento del primer tema, se consideran únicamente los escritos de alto
impacto para el propósito de la investigación con la finalidad de hacer un resumen,
reporte o simplemente resaltas la información de relevancia que será útil para hacer
predicciones del tema en cuestión, tomar decisiones, describir el tema con un
enfoque distinto etc.

Finalmente se tiene la minería de sentimientos que igualmente llega a


complementar los dos temas anteriores, brindando un plus, pues con esta minería
se podrá dar otro sentido a los datos recabados con ayuda de la dirección lingüística
y contextualización, o bien conocer la opinión directamente de usuario con ayuda
de encuestas y así mismo poder tomar decisiones.
Minería.
En términos generales, la minería se puede clasificar como una actividad
económica, que se encarga de la extracción, explotación y aprovechamiento de los
minerales [1], estos minerales pueden ser clasificados en tres categorías, los
metálicos, no metálicos y combustibles o energéticos. Entre los productos metálicos
se encuentra el oro, plata y cobre; en el grupo de los no metálicos se incluye la
arena, roca y cal, y en los combustibles o energéticos se pueden agrupar los que
son originados por restos fósiles, como el gas y el petróleo.

Gracias a las actividades mineras, se tienen gran parte de las cosas que
alcanzamos a ver en nuestro día a día, si analizamos detenidamente los
componentes que contiene una casa, podremos darnos cuenta que en su mayoría
son productos minerales, que en conjunto crean un objeto de mucho mayor
magnitud como es una casa, igualmente podemos ver los beneficios de la minería
al momento de pagar un producto o servicio, pues las monedas esta hechas de
cobre.

Igualmente, y en cierto nivel se puede apreciar la minería en la tecnología, pues es


bien sabido que para los avances tecnológicos que se aprecian en el mundo los
metales toman un papel de máxima relevancia y lo podemos visualizar en un
producto tan común como lo es el teléfono celular, que al igual que la casa se
compone de ciertos materiales que se obtienen a través de la minería como el
plástico, cobre, hierro, entre otros, y que estos en conjunto hacen un producto de
alto valor que ayuda a la comunicación, investigación, entretenimiento, etc.
Minería de datos.
Ahora bien, una vez definida la minería como concepto general podemos
profundizar en la minería de datos, textos y sentimientos. La minería de datos o
Data Mining es considerada un área de estudios científicos, la cual tiene altas
expectativas para los investigadores [2], pues concentra una serie de técnicas que
se emplean para ubicar esas aportaciones de alto impacto, entre la inmensidad de
la información asociada al tema de interés, conocimientos que son enriquecidos y
que posteriormente “heredados” a las generaciones futuras de investigadores.

La minería de datos es una herramienta tecnológica que incluye una serie de


acciones efectuadas para apoyar la localización de puntos clave o aspectos
importantes de un tema en específico del que se quiera saber, o bien hacer la
conjunción de los subtemas de relevancia para poderlos globalizar en una idea
general desde otro punto de vista al establecido ya en los datos que se encontraron.

Con la minería de datos se exploran bases de datos magnas para logra comprender
a profundidad el conjunto considerablemente grande de la información recabada,
para que con esta se puedan localizar patrones, tendencias y hacer la observación
de cómo se relacionan ciertos aspectos entre sí, a fin de encaminar a la localización
de información estratégica que permita crear predicciones sobre los
comportamientos presentados [3].

Historia.
La información es considerada como un puente base para lograr llegar a desenlaces
óptimos de los datos y con ella poder transformar estos datos en información de alta
relevancia, por lo tanto, la minería de datos surge con la finalidad de ser una
herramienta de apoyo para la comprensión de una cantidad enorme de datos y con
que con esta comprensión se puedan plantear una serie de conclusiones que
contribuyan en la mejora del tema en cuestión.

Esta herramienta se ha empezado a trabajar desde hace algunos años atrás para
lograr llegar a como la conocemos actualmente, su evolución es dividida en cuatro
etapas trascendentales [4].
Recopilación de datos. 1960
Durante este tiempo los expertos de estadística e investigación de operaciones
realizaban el denominado data fising o pesca de datos, para realizar un análisis con
la finalidad de localizar alguna relación de los datos.

Acceso a los datos. 1980


El termino data mining empieza a ser reconocido y con ello la “búsqueda”, pues ya
se tienen los primeros accesos a bases de datos, así mismo la relación entre
organizaciones de trabajo académico y organizaciones de negocios empieza a
tomar mayor peso por el apoyo que tenían una con la otra en búsqueda de nuevos
conocimientos y hacer más robusta a la minería de datos.

Depósito de los datos y contribución a las decisiones. Principios de 1990


La minería de datos toma mayor notabilidad por las empresas que invierten en ella
con la idea de acrecentar su impacto y propagación, no solo a nivel empresarial,
pues las revistas dedicaban algunas páginas para hablar sobre esto.

Minería de Datos conocida en la actualidad. Finales de 1990.


Con la expansión del internet y el desarrollo tecnológico, la localización de tácticas
competitivas para adquirir ventajas sobre los otros es mucho más fácil, ya que la
minería de datos empieza a trascender y llegar a muchos más usuarios.

Áreas en donde es aplicada.


La minería de datos se ha verificado como una herramienta sumamente útil en la
actualidad, por tanto, puede ser aplicada en prácticamente cualquier actividad
realizada por el ser humano y en la cual se genere algún tipo de datos, algunas de
las áreas más importantes para el uso de la minería de datos son las siguientes [2].

Medicina.
La minería de datos es empleada para diagnosticar algunas enfermedades y
conocer la eficiencia de los utilizados.

Banca y proveedores de servicios.


Se le da uso para la segmentación de los clientes, análisis de riesgos y predicción
de las ventas.
Seguridad y detección de fraude.
Es utilizada para el reconocimiento facial, identificación biométricas y accesos a
redes restringidas

Recuperación de información no numérica.


El uso de la minería en esta área motiva al surgimiento de las reconocidas “minería
de texto” y “minería web”, igualmente dentro de la información numérica ayuda a
la identificación de videos, imágenes y voz en bases de datos multimedia.

Ciencias Ambientales.
Se utiliza para identificar los modelos en los cuales funciona un ecosistema natural
o artificial con el propósito de lograr una mejora en su gestión y control.

Ciencias Sociales.
Puesta en práctica para estudiar la opinión pública sobre algún tema en específico
y saber cómo se pueden ser sobrellevadas las nuevas tendencias.

Metodología para el descubrimiento de conocimiento en bases de


datos (KDD).
Dentro de esta metodología se puede observar cómo es llevada a cabo la minería
de datos, aquí mismo es reconocida la minería en una de las fases, sin embargo,
dentro de esta fase no solo se contempla la minería de datos, igualmente se puede
hacer uso de la minería de textos, minería de redes y minería de sentimientos [5].

• Selección. Esta fase consiste en el aprendizaje del dominio del conocimiento


y es en donde se reconoce a toda aquella información que de relevancia para
lograr las metas de aplicación.
• Preprocesamiento. Aquí se realiza la preparación de los datos obtenidos,
depurando los que no se consideran de gran aporte para mantener
únicamente la información de calidad.
• Transformación. Consiste en convertir en etiquetas lingüísticas a las bases
de datos numéricos para una mejor representación.
• Minería. Es la fase clave de todo el proceso, pues se hace uso de la minería
de textos, minería de datos y minería de redes para clasificar y resumir la
información obtenida, recuperar imágenes o extraer las reglas asociadas al
tema.
• Análisis de resultados. Los resultaos son examinados y se procede a la
realizar un resumen con los nuevos conocimientos obtenidos, los cuales
sirven para la toma de decisiones.

Técnicas.
La minería de datos se clasifica en tres técnicas, las cuales son ejecutadas en
función al propósito de la información requerida.

Técnica predictiva.
Como su nombre lo dice, tiene la propiedad de predecir algún valor, en ella son
utilizados los modelos de regresión, análisis de la varianza, series temporales,
análisis discriminantes, árbol de decisiones, redes neuronales.

Técnica descriptiva.
Los datos son analizados para poder hacer un reporte de su evolución y su
comportamiento para que futuros usuarios puedan tomar el resultado de esto como
base para nuevos estudios. Se hace uso del análisis cluster, escalamiento
multidimensional, escalamiento optimo, reducción de la dimensión y la
segmentación.

Técnicas auxiliares.

En esta técnica se hace utiliza el proceso analítico de transición (OLAP) y el


reporting.
Minería de textos.
La minería de textos es una “rama” de la minería de datos, ambos conceptos son
complementados uno con el otro para la obtención e identificación de algunos
patrones encontrados en un tema en específico y posteriormente llegar a una serie
de conclusiones que a vez servirán para hacer nuevos estudios, por lo tanto, su
desenlace podría considerarse como un ciclo.

Se considera como el proceso llevado a cabo para la obtención de información


escrita considerada de “alta calidad”, igualmente conocida como análisis de textos,
sin embargo, la minería de textos requiere mayor complejidad, pues implica
descubrir nueva información que previamente era considerada como desconocida,
todo esto con ayuda de la minería de datos, pues es aquí donde se extraerá la
información.

Algunos autores la clasifican como una poderosa herramienta para analizar


comportamientos, rastrear tendencias y hacer predicciones [6], pues se visualiza
como la encargada de estudiar de la información de los documentos textuales que
se encuentran digitalizados, con el objetivo de obtener conocimientos nuevos entre
una gran cantidad de información que no se encuentra bien estructurada, para lograr
darle da estructura idónea o bien hacer una conjunción de ideas y generar un
conocimiento nuevo.

Etapas.
Para llevar a cabo el proceso que requiere la minería de textos, se establecen una
serie de pasos, los cuales ayudaran al procesamiento de los textos y a la extracción
de información relevante para el uso requerido. Los pasos establecidos se muestran
a continuación [7].

Determinar el propósito de estudio.


Saber específicamente el tema del cual se requiere información y que tipo de
información es la que servirá. Definición del tema central y los subtemas que se
podrían tomar a consideración.
Recolectar, identificar, recoger y validar información.
Evaluación y localización de los datos que contienen las fuentes con mayor impacto
para el estudio requerido y que estén estructurados con un mejor formato, para
poder realizar las observaciones necesarias en el texto.

Procesamiento de texto.
Este paso es ejecutado con el fin de depurar la información y desechar la que no
genere valor al propósito establecido previamente, se realiza un análisis léxico, un
tratamiento y separación de palabras, tratamiento de términos redundantes
tratamiento de palabras compuestas, normalización de palabras y etiquetado de
palabras, además se corrigen algunos problemas de formato, polisemia, homonimia
y sinonimia.

Extracción y análisis de clases.


Dentro de esta fase se buscan antecedentes de los conceptos utilizados en el texto,
con la finalidad de dar relación o secuencia al tema central para brindarle mayor
validez y un soporte científico.

Presentación de resultados.
Los resultados obtenidos son expuestos a través de la realización de un resumen,
resaltando los textos considerados de importancia, dando relación a los
antecedentes asociados al tema central y toda esta información procesada es
almacenada para sus futuras consultas.
Minería de sentimientos.
La minería de sentimiento al igual que la minería de textos, proviene del surgimiento
de la minería de datos y al igual que ellas este tipo de minería es complementada
por los dos primeros, pues estos tres conceptos en conjunto logran la obtención de
mejores resultados sobre los datos que se pretenden lograr.

Este tipo de minería puede ser localizada bajo varios nombres, por ejemplo, análisis
de sentimientos, opinion mining o minería de opinión, sin embargo, todos estos
conceptos se centran en la aplicación de herramientas que ayuden a procesar el
lenguaje humano utilizado para diferenciar el tono emocional que se presenta
acompañado de un discurso y así lograr entender emociones, el origen de las
opiniones planteadas y el porqué de actitudes tomadas.

Los datos que se hacen notar con la minería de sentimientos son sumamente
importantes, debido a que pueden ser utilizados y explotados por empresas
privadas que brindar algún producto o servicio para dar un margen de como
deberían realizar su trabajo de marketing, por ejemplo, elegir la propaganda idónea
según las preferencias u opiniones de la gente o encontrar el producto mejor
valorado por los usuarios [8].

Minería de textos y minería de sentimientos.


Actualmente existen una serie de paquetes tecnológicos dedicados al análisis de
textos y brindarles sentido o la emoción que requiere, dichos paquetes buscan cubrir
todos los enfoques de los sentimientos, por lo cual utilizan técnicas distintas [9].

Paquete syuzhet.
El paquete syuzhet proporciona las funciones necesarias para extraer la trama
emocional de un texto.

Paquete sentimentr.
Proporciona las funciones para el cálculo del sentido y polaridad de un texto en
función del enfoque establecido en el léxico.
Tipos de tareas.
Se destacan dos vertientes de la minería de opiniones.

Detección de la polaridad.
Con esta tarea se determina si una opinión es positiva o negativa, con la
implementación de encuestas para conocer puntualmente en donde se encuentra
el producto o servicio en cuestión.

Análisis del sentimiento basado en características.


Aquí se determina la opinión puntual de las distintas características del producto o
servicio que se esté evaluando, las opiniones serán escritas directamente por el
usuario, lo cual no permite crear sistematización sobre los distintos comentarios.

Aplicación.
Se pueden resaltar dos áreas de relevancia en las cuales la minería de opinión toma
un papel muy importante.

Política.
Aquí se hace uso de la minería de datos para conocer las preferencias de la
población sobre un candidato u otro y para conocer la opinión de la población sobre
un tema político, el ejemplo más claro que se tiene son las actualmente conocidas
consultas ciudadanas.

Empresarial.
En esta área quizá sea reflejada la minería de datos con mayor claridad, pues para
la mejora continua o cubrir los estándares de calidad de un producto o servicio, es
imperativo conocer la opinión de los usuarios.
Conclusión.
La minería de datos, textos y sentimientos es una herramienta altamente
competitiva y eficiente para la actualidad, pues la mayoría de los datos requeridos
ya tienen antecedentes por uno o varios autores, la mayoría de ellos despaldados
por casos prácticos, sin embargo, también se pueden encontrar hipótesis o
supuestos de la misma información, que siendo objetivos no son de utilidad si se
busca tomar una decisión empresarial o tomarlos como base para crear otro informe
científico.

Con ayuda de estas herramientas se puede hacer un análisis hasta cierto punto
rápido para localizar los informes con soporte científico y en los cuales nos podemos
apoyar con plena confianza para realizar reportes científicos, tomar decisiones
dentro de un entorno en el que se requiera o simplemente tomar estos datos como
base para nuevas investigaciones.

La minería de sentimientos es sobresaliente porque se podría considerar como un


tema relativamente nuevo en cuanto a información establecida, sin embargo es
muy prometedor no solo para el entorno académico o empresaria, si no para las
relaciones humanas y coque podría ser complementada con la llegada de la
inteligencia artificial.
Referencias

[ INEGI, «Cuentame de México,» - - 2019. [En línea]. Available:


1 https://cuentame.inegi.org.mx/economia/secundario/mineria/default.aspx?tema=e#:~:text=La
] %20miner%C3%ADa%20es%20una%20actividad,y%20aprovechamiento%20de%20los%20miner
ales.. [Último acceso: 01 septimebre 2023].

[ J. C. Riquelme, R. Ruiz y K. Gilbert, «Minería de Datos: Conceptos y Tendencias,» Revista


2 Iberoamericana de Inteligencia Artificial, vol. 10, nº 29, pp. 11-18, 2006.
]

[ C. y. V. S. Romero, Data Mining in E-Learning, Southampton: WIT Press, 2005.


3
]

[ H. F. V. Ballesteros y R. M. V. Edelmira Guevara Iñiguez, «Minería de Datos,» Revista Científica


4 Mundo de la Investigación y el Conocimiento, vol. 2, nº especial, pp. 339-349, 2018.
]

[ V. H. M. Domínguez, J. G. Sosa, M. E. C. Bolaños y J. W. C. Pérez, «Uso de la minería de datos


5 para la caracterización de investigadores y cuerpos académicos.,» Revista Iberoamericana para
] la Investigación y el Desarrollo Educativo., vol. 12, nº 24, pp. 23-34, 2022.

[ R. Dorr, J. J. Casal y R. Toriano, «Minería de texto en publicaciones científicas con autores


6 Argentinos,» Medicina, vol. 81, nº 2, pp. 25-32, 2021.
]

[ M. C. Barrera, «Minería de texto: una visión actual,» Biblioteca Universitaria, vol. 17, nº 2, pp.
7 129-138, 2014.
]

[ J. Fernández, J. M. Gómez, E. Boldrini y P. Martínez, «Análisis de Sentimientos y Minería de


8 Opiniones,» Sociedad Española para el Procesamiento del Lenguaje Natural, Vols. %1 de %2-, nº
] 47, pp. 179-187, 2011.
[ A. Alaminos, «Introducción a la minería de texto y análisis de sentimiento con R,» Universidad
9 de Alicante, España, 2023.
]

También podría gustarte