Está en la página 1de 1

Optimizando búsquedas de información

en bibliotecas médicas con el algoritmo


LSA de MATLAB
Eliana Cecilia Cristancho Cordero – Eliana.cristancho@campusucc.edu.co
Carlos Hernán Amaya Ramírez – Carlos.amayar@campusucc.edu.co
Director 1: Andrea Cristina Martínez Ardila – andreacris.martinez@campusucc.edu.co
Director 2: Fredy Angarita Reina - fredy.angarita@campusucc.edu.co
Expositor: Cristian Camilo González Ríos - cristian.gonzalezri@campusucc.edu.co
En concordancia con el nuevo rol de las bibliotecas científicas como
generador y apoyo de conocimiento para los diferentes usuarios, este Resultados
proyecto busca incursionar en el uso del TIC Machine Learning para
Para llegar al resultado esperado se desarrollaron las siguientes
entrenar un algoritmo sobre MATLAB que arroje búsquedas de calidad
actividades:
sin importar la experiencia y el conocimiento en lenguaje técnico de
1. Compilación del tesauro con términos especializados en oncología el
los usuarios
cual inició con 177 registros
Objetivo general:
2. Preprocesamiento a través de un algoritmo, se filtraron 13 datos
Diseñar una Guía metodológica TI que contribuya a la búsqueda especializada
nulos con filas vacías sin sinónimos quedando una tabla nueva de 162
en tesauros de oncología bajo el concepto de machine learning.
registros
Objetivos específicos: 3. Implementación

COMPILACIÓN
➢ Seleccionar los términos especializados de oncología presentes en los
tesauros de salud: Mesh y Desh desde 1966.
➢ Caracterizar los algoritmos de entrenamiento existentes que apoyen la
búsqueda especializada en tesauros de oncología
➢ Diseñar guía metodológica bajo el concepto de machine learning que
permita la búsqueda especializada en tesauros de oncología.
➢ Validar la guía metodológica a través de diferentes entrenamientos de
machine learning.

Estado del arte Marco teórico


El Instituto de Salud Carlos III – ISCIII • Inteligencia artificial aplicada
participa en el proyecto europeo MESINESP2 a bibliotecas
está investigando la utilización de técnicas de Brun, R. E. (2021).
inteligencia artificial aplicadas a la minería de
textos y semántica del lenguaje, con el objetivo • Machine Learning: Análisis de
de facilitar la búsqueda y manejo de literatura
científica
lenguajes de programación y
herramientas para desarrollo PREPROCESAMIENTO
Rojas, E.M. (2020).
➢ de Prensa ISCIII, (2021)

Metodología: Diseño de tipo experimental -


descriptivo
➢ Hábitos en consulta de información de usuarios
➢ Términos normalizados en oncología
ANÁLISIS

IMPLEMENTACIÓN
➢ Lenguajes y algoritmos empleados en bibliotecas
➢ Estado del arte de machine Learning en bibliotecas
EXPLORACIÓN

ITEM ACCIÓN
➢ Tesauro especializado en oncología
1 Para todas las filas, dividir el conjunto de sinónimos en palabras separadas,
➢ Filtrado de tabla en Excel con tesauro para eliminar
elementos vacíos o no relevantes para el futuro algoritmo utilizando caracteres de espacio o tabulación.
CARACTERIZACIÓN
2 Homogeneizar los datos sacando la diferenciación que implica el uso de
mayúsculas, permitiendo al algoritmo encontrar relaciones entre palabras con el
➢ Nueva tabla (tesauro) con información depurada mismo significado, pero que incluyen mayúsculas y sin sintácticamente distintas.
➢ Documento tokenizado con colección de palabras que usarán 3 declaración y filtrado de “stop words” para excluir aquellas palabras que no
ENTRENAMIENTO para el análisis del texto permiten encontrar diferencias entre los documentos, sino que los hacen
➢ BagOfWords (Maleta de Palabras) semejantes por su alta recurrencia, consecuencia de los datos recopilados que
para este caso están relacionados con cáncer. también se declararon y
➢ Selección de modelo LSA excluyeron conectores que para el nivel de complejidad del algoritmo LSA
➢ Matriz de relacionamiento entre documentos de 4 Creación del conjunto de palabras vocabulario y descripción vectorial de la
GUÍA entrenamiento – DocumentStores
METODOLÓGICA recurrencia de estas palabras en cada categoría del tesauros
➢ Documento paso a paso con entrenamiento, resultados,
porcentaje de detección de palabras y gráfica estadística de 5 Para variadas configuraciones de componentes (inicio10:salto5:final160) se
entrenamiento de datos entrena el modelo midiendo la cantidad de documentos que cierta ecuación de
búsqueda, el algoritmo describe como totalmente relacionados con un
porcentaje del 100 %
Bibliografía
Brun, R. E. (2021). Inteligencia artificial en bibliotecas: oportunidades como usuarios, y posibles
contribuciones. CLIP de SEDIC: Revista de la Sociedad Española de Documentación e Información
Científica, (83), 1-8.
Conclusiones
de Prensa ISCIII, G. (2021). La Biblioteca del ISCIII participa en un proyecto de
inteligencia artificial para mejorar la búsqueda y manejo de información La aplicación del algoritmo LSA en bibliotecas optimiza la búsqueda y recuperación de
científica información al capturar la similitud semántica y descubrir relaciones semánticas ocultas
entre los documentos. Esto permite una organización más eficiente de las colecciones y
Ro j a s , E . M . ( 2 0 2 0 ) . M a c h i n e L e a r n i n g : a n á l i s i s d e l e n g u a j e s d e p r o g r a m a c i ó n
y h e r r a m i e n t a s p a r a d e s a r r o l l o . Re v i s t a I b é r i c a d e S i s t e m a s e Te c n o l o g i a s d e
una experiencia de búsqueda más específica incluso para usuarios poco expertos.
Informação, (E28), 586-599.

También podría gustarte