Documentos de Académico
Documentos de Profesional
Documentos de Cultura
COMPILACIÓN
➢ Seleccionar los términos especializados de oncología presentes en los
tesauros de salud: Mesh y Desh desde 1966.
➢ Caracterizar los algoritmos de entrenamiento existentes que apoyen la
búsqueda especializada en tesauros de oncología
➢ Diseñar guía metodológica bajo el concepto de machine learning que
permita la búsqueda especializada en tesauros de oncología.
➢ Validar la guía metodológica a través de diferentes entrenamientos de
machine learning.
IMPLEMENTACIÓN
➢ Lenguajes y algoritmos empleados en bibliotecas
➢ Estado del arte de machine Learning en bibliotecas
EXPLORACIÓN
ITEM ACCIÓN
➢ Tesauro especializado en oncología
1 Para todas las filas, dividir el conjunto de sinónimos en palabras separadas,
➢ Filtrado de tabla en Excel con tesauro para eliminar
elementos vacíos o no relevantes para el futuro algoritmo utilizando caracteres de espacio o tabulación.
CARACTERIZACIÓN
2 Homogeneizar los datos sacando la diferenciación que implica el uso de
mayúsculas, permitiendo al algoritmo encontrar relaciones entre palabras con el
➢ Nueva tabla (tesauro) con información depurada mismo significado, pero que incluyen mayúsculas y sin sintácticamente distintas.
➢ Documento tokenizado con colección de palabras que usarán 3 declaración y filtrado de “stop words” para excluir aquellas palabras que no
ENTRENAMIENTO para el análisis del texto permiten encontrar diferencias entre los documentos, sino que los hacen
➢ BagOfWords (Maleta de Palabras) semejantes por su alta recurrencia, consecuencia de los datos recopilados que
para este caso están relacionados con cáncer. también se declararon y
➢ Selección de modelo LSA excluyeron conectores que para el nivel de complejidad del algoritmo LSA
➢ Matriz de relacionamiento entre documentos de 4 Creación del conjunto de palabras vocabulario y descripción vectorial de la
GUÍA entrenamiento – DocumentStores
METODOLÓGICA recurrencia de estas palabras en cada categoría del tesauros
➢ Documento paso a paso con entrenamiento, resultados,
porcentaje de detección de palabras y gráfica estadística de 5 Para variadas configuraciones de componentes (inicio10:salto5:final160) se
entrenamiento de datos entrena el modelo midiendo la cantidad de documentos que cierta ecuación de
búsqueda, el algoritmo describe como totalmente relacionados con un
porcentaje del 100 %
Bibliografía
Brun, R. E. (2021). Inteligencia artificial en bibliotecas: oportunidades como usuarios, y posibles
contribuciones. CLIP de SEDIC: Revista de la Sociedad Española de Documentación e Información
Científica, (83), 1-8.
Conclusiones
de Prensa ISCIII, G. (2021). La Biblioteca del ISCIII participa en un proyecto de
inteligencia artificial para mejorar la búsqueda y manejo de información La aplicación del algoritmo LSA en bibliotecas optimiza la búsqueda y recuperación de
científica información al capturar la similitud semántica y descubrir relaciones semánticas ocultas
entre los documentos. Esto permite una organización más eficiente de las colecciones y
Ro j a s , E . M . ( 2 0 2 0 ) . M a c h i n e L e a r n i n g : a n á l i s i s d e l e n g u a j e s d e p r o g r a m a c i ó n
y h e r r a m i e n t a s p a r a d e s a r r o l l o . Re v i s t a I b é r i c a d e S i s t e m a s e Te c n o l o g i a s d e
una experiencia de búsqueda más específica incluso para usuarios poco expertos.
Informação, (E28), 586-599.