Documentos de Académico
Documentos de Profesional
Documentos de Cultura
net/publication/361039087
CITATIONS READS
0 33
4 authors, including:
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Víctor Hugo Menéndez Domínguez on 02 June 2022.
Coordinadores
AVANCES Y TENDENCIAS EN INGENIERÍA PARA EL DESARROLLO ECONÓMICO Y
SOCIAL
Primera Edición, marzo de 2022. Salinas de Hidalgo, San Luis Potosí, México.
López Martínez, Laura Araceli; Guerra García, César Arturo; Ortega Morales, María
Azucena; Ontañón García Pimentel, Luis Javier.
E-BOOK
Edición: Armando Sánchez Macías y Virginia Azuara Pugliese
Se permite la copia y distribución por cualquier medio siempre que se mantenga el
reconocimiento de sus autores, no se haga uso comercial de las obras y no se realice
ninguna modificación a las mismas.
ISBN: 978-607-535-269-5
Todos los capítulos que se presentan en esta obra fueron sometidos a un arbitraje
doble ciego por parte de los expertos del Comité Científico.
PRESENTACIÓN
El desarrollo tecnológico ha crecido a pasos gigantescos en las últimas dos décadas, coadyuvando con
ello en mejorar el bienestar de las personas en muchos sentidos, económico, social y personal. Los
trabajos que se incluyen en esta obra pretenden aportar nuevo conocimiento, además de su aplicación en
ambientes reales.
Esta obra es producto del uso de técnicas de investigación y procesos académicos que se realizan dentro
de la Universidad Autónoma de San Luis Potosí y de otras instituciones académicas, se conforma de dos
apartados diferenciados por su enfoque, el primero denominado, Procesos en Agroindustria, el cual
integra seis capítulos cuyos temas relacionados a la formulación de productos alimentarios y no
alimentarios, son estudiados desde la perspectiva de su aplicación en la mejora de distintos productos
propios de la región, las aportaciones de los autores representan propuestas de investigación aplicadas a
la solución de problemáticas reales.
Estos trabajos representan un intento más para contribuir con una variedad de conocimientos y
propuestas tecnológicas, que propicien un mejor ambiente de desarrollo hacia las nuevas tendencias
tecnológicas y de innovación, generando así, una mejora en el quehacer de las personas, y por
consecuencia en la sociedad en general.
Dr. César Arturo Guerra García, Salinas de Hidalgo, San Luis Potosí, marzo de 2022.
Contenido
1. Introducción
Es indudable el crecimiento de Internet en términos de la información que almacena,
existe un gran incremento en las aportaciones digitales y día con día continúan aumentando.
Estos recursos digitales son generados por diversas entidades principalmente para la
investigación científica, la educación, el entretenimiento, etc. Estos recursos suelen estar
disponibles en repositorios especializados siempre y cuando se cuente con la autorización para
su acceso y el visor adecuado de los diversos formatos de imágenes, videos, texto, audio, etc.
Los repositorios son la infraestructura clave para el desarrollo, almacenamiento,
administración, localización y recuperación de todo tipo de contenido digital (ADL, 2002).
Generalmente, se conciben como un conjunto de servicios que una institución ofrece a una
comunidad para difundir el conocimiento producido por esta (Barrueco & García, 2009) pero
con la característica de no se tiene un conocimiento previo de su estructura interna (Hatala et
al., 2004).
Recursos
Metadatos Metadatos
Repositorio de Repositorio de
metadatos metadatos y recursos
Recursos
Sitio web
| 150
en la Web (Arms et al., 2002). DC se formalizó en 2003 como la norma ISO 15836-2003. Desde
2007, compone la norma ANSI/NISO Z39.85-2007 y IETF RFC 5013.
El estándar DC define un conjunto base de 15 metadatos que constituyen el nivel simple.
Estos metadatos describen el contenido del documento, la propiedad intelectual y la información
para la creación de instancias (En la Tabla 1, las celdas en gris).
El nivel cualificado incorpora tres nuevos metadatos (audience, provenance y
rightHolder) al nivel simple. También define un conjunto de atributos que clarifican la
representación semántica de los recursos descritos para una fácil recuperación. Estas
propiedades refinan las descripciones de metadatos y están limitadas a ciertos elementos,
pudiendo utilizar vocabularios asociados o descripciones en lenguaje natural.
Tabla 1. Metadatos del estándar Dublin Core (elaboración propia).
Esquema de
Tipo Metadato Elemento de refinamiento
codificación
title alternative
subject LCSH, MESH, DDC,
LCC, UDC
description tableOfContents, abstract
source URI
language ISO 639-2, RFC 3066
Contenido
intelect
ual
ad
publisher
| 151
contributor
rights accessRights, license URI
dateSubmitted
type DCMI-typeVocabulary
format extent, médium IMT
identifier bibliographicCitation URI
audience mediator, educationLevel
provenance
rightHolder
En Dublin Core, cada elemento es opcional y puede repetirse. No hay un orden
específico de aparición. Su contenido puede regirse por esquemas de codificación, vocabularios
controlados o estar abierto a las descripciones de texto en lenguaje natural.
El estándar proporciona un conjunto de directrices para su implementación en los
formatos XHTML, XML y RDF, que pueden almacenarse fuera o dentro del documento con el
propósito de facilitar la interoperabilidad entre sistemas (Cuba Rodríguez & Olivera Batista,
2018).
El problema de interoperabilidad se refiere a la dificultad de integrar sistemas de
información heterogéneos y distribuidos. La interoperabilidad es la capacidad de dos o más
sistemas o componentes para intercambiar la información y utilizarla (IEEE, 1991). Desde este
punto de vista computacional, la interoperabilidad permite generar un enlace
entre sistemas de software para las diferentes tecnologías de información existentes,
promoviendo una sana convivencia y operatividad (Vargas & Santamaría, 2008).
En cuanto a los estándares de interoperabilidad, son numerosos los protocolos
desarrollados a través de los años como Z39.50 (Lynch, 1997), SDLIP (Paepcke et al., 2000),
Harvest (Bowman et al., 1995), etc.
Sin embargo, sólo algunos se han consolidado internacionalmente como estándares
aceptados, son usados de manera masiva y su desarrollo se encuentra avalado por iniciativas
| 152
tanto públicas como privadas, como es el caso del protocolo OAI-PMH (Open Archives
Initiative Protocol for Metadata Harvesting) (Lagoze & Van de Sompel, 2003).
El protocolo OAI-PMH es una iniciativa apoyada por la National Science Foundation,
la Coalition for Networked Information y la Digital Library Federation (Gómez & Arias, 2002).
Se desarrolló como una alternativa que busca promover el libre acceso a la información
científica de manera ordenada y normalizada en los repositorios institucionales de documentos
y bibliotecas digitales existentes.
OAI-PMH opera sobre el protocolo HTTP en conjunto con la tecnología XML (Lagoze
& Van de Sompel, 2003). Como respuesta a una petición HTTP efectuada desde cualquier
consumidor o colector de metadatos, el proveedor de datos genera un XML que contiene una
colección de metadatos Dublin Core de los recursos coincidentes con la solicitud. Los mensajes
de error se basan en HTTP (Figura 2).
| 153
El uso del protocolo es muy prometedor dentro de la estrategia de los archivos abiertos.
El beneficio más conocido es servir de sustento a un nuevo modelo de comunicación académica
y científica conocido como Ciencia Abierta (Vicente-Saez & Martinez-Fuentes, 2018). Aunque
el OAI-PMH es técnicamente muy simple, la construcción coherente de servicios que satisfagan
las necesidades de los usuarios sigue siendo compleja.
Si bien existen varias soluciones (Bueno de la Fuente & Rodríguez Mateos, 2007) que
permiten la creación de repositorios OAI o componentes de software dirigidos a la
implementación integral de archivos o repositorios que cumplan con el protocolo OAI-PMH, su
principal desventaja radica en la complejidad de su configuración o su obsolencencia, además
de la incertidumbre en términos de su eficiencia con respecto a su integración en sistemas
existentes que requieren exponer su información según el protocolo OAI-PMH.
La propuesta que se presenta en este trabajo implementa la API del protocolo OAI-PMH
en un framework que gestiona las solicitudes y automatiza la conversión de los metadatos de
los recursos almacenados en un repositorio al formato del estándar Dublin Core. El marco de
trabajo emplea un esquema de transformación fácilmente adaptable a través de un archivo de
configuración, lo que permite la interoperabilidad entre repositorios heterogéneos simplificando
el flujo y acceso de la información sin requerir modificar la arquitectura base de un sistema de
información.
2.- Metodología
En esta sección se presenta el enfoque metodológico que dirigió el trabajo. Aunque
pareciera tratarse de un proceso sin interés teórico, hay que considerar que la definición acertada
de una problemática real y un método riguroso para la selección de información relevante dan
validez a los resultados obtenidos.
Definición de la problemática. Un primer vistazo desde un punto de vista empírico y
la consulta de referencias básicas motivó a realizar el trabajo sobre la problemática descrita en
la primera parte de este documento, proponiendo un framework para la recuperación de los
recursos que se encuentran almacenados en repositorios heterogéneos utilizando un protocolo
| 154
estándar de interoperabilidad. Dicha solución contempla el empleo de metodologías y
tecnologías que refuerzan los aspectos computacionales de esta área.
Análisis del estado del arte. Para la selección de las mejores fuentes de referencia para
definir el proyecto se utilizó la técnica de revisión sistemática en el contexto de la Ingeniería de
Software (Kitchenham, Budgen, & Brereton, 2015), que es una guía para realizar estudios
exhaustivos acerca de un tema. Se procede identificando, evaluando e interpretando todas las
investigaciones relevantes afines a una problemática.
Diseño del framework. Al comienzo de esta etapa se definieron los requerimientos
funcionales del sistema. Uno de los más importantes fue que el framework tuviera un nivel de
acomplamiento muy bajo, con el fin de afectar lo menos posible su integración con la
arquitectura de un sistema existente y facilite que una base de datos basada en SQL exponga sus
datos conforme al protocolo OAI-PMH. Durante esta etapa también se modelaron y
documentaron los componentes del marco de trabajo.
Construcción. Para la implementación del framework se utilizaron diversas tecnologías
y entornos para brindar características importantes como son la disponibilidad, compatibilidad
y eficiencia. El framework requiere que el repositorio donde se implemente el servicio cuente
con un servidor Web como Apache, un gestor de bases de datos basado en el lenguaje SQL,
como MySQL, y un intérprete de comandos PHP. La implementación del framework requirió
de diversas bibliotecas que facilitan la ejecución de algunas tareas, tanto internas como externas
en el proceso de ejecución del protocolo OAI-PMH como ADOdb (https://adodb.org/) y OAI
V2 Data-Provider (http://physnet.uni-oldenburg.de/oai/). Dichas bibliotecas de libre
distribución agilizaron y facilitaron el proceso de desarrollo.
Pruebas y validación. La obtención de métricas de un producto software resulta en
información valiosa para la mejora de sus atributos de calidad. Las pruebas realizadas para
validar el desempeño se describen más adelante.
3.- Resultados
| 155
De forma breve, la presente propuesta se centra en el uso del protocolo OAI-PMH y el
estándar de metadatos Dublin Core para especificar una arquitectura que facilite la “conversión”
entre los metadatos específicos de un repositorio y los solicitados por OAI-PMH para que
puedan ser consumidos por un cliente o un proveedor de servicios.
Con la finalidad de satisfacer esta propuesta se diseñó un esquema para el procesamiento
de una petición a través del protocolo OAI-PMH, en la cual, la petición es procesada por
componentes que constituyen una capa de acceso.
A continuación, se presenta la arquitectura desde el punto de vista de sus componentes,
características y funcionalidades (Figura 3). Se utiliza una estructura basada en un modelo de
capas para cada uno de los componentes principales. Esto posibilita y al mismo tiempo mantiene
la estructura establecida en la propuesta. La implementación de cada uno de los módulos se hizo
considerando que hubiera independencia entre sí, facilitando modificaciones o mejoras en un
futuro.
| 157
El sistema desarrollado busca satisfacer las diversas estructuras de datos existentes. Sin
embargo, dado que las opciones de esquemas relacionales pueden ser infinitas, se enfocó en
satisfacer esquemas de bases de datos basados en la primera forma normal (1FN) hasta la tercera
forma normal (3FN).
Prueba de procesamiento. Con la finalidad de tener un marco de referencia con
respecto al procesamiento y eficiencia del marco desarrollado, se procedió a realizar un estudio
comparativo entre el marco propuesto y un modelo convencional. Para efectuar el estudio se
definieron los datos que serían colectados para validar el proyecto, basándose en las métricas
que a continuación se enlistan:
• TP=Tiempo de procesamiento del servidor.
• TRP=Tiempo de trasferencia de petición y respuesta.
• TT=Tiempo total de petición de inicio a fin.
Estas métricas fueron seleccionadas debido a que proporcionan información sobre el
procesamiento y eficiencia, necesarios para efectuar la comparativa entre el Marco
Arquitectónico desarrollado y el modelo convencional. El punto fuerte de este estudio es la
comparativa entre los tiempos de procesamiento en ambos modelos.
Escenario de prueba 1. El primer escenario de prueba está centrado en un modelo
convencional gestionando las peticiones a través de la librería OAI V2 Data-Provider con ligeras
adaptaciones para ejecutarse sobre PHP5+.
El escenario de prueba consiste en dos componentes: un servidor de datos basado en
MySQL y un cliente colector basado en OAI-PMH. En el servidor se encuentra una instancia
de la librería OAI V2 Data-Provider que recibe y procesa las diversas peticiones. Del lado del
cliente se encuentra la aplicación JMeter (https://jmeter.apache.org/) que permite realizar
peticiones al servidor y registrar la información generada en esta transferencia.
Para la obtención de las medidas se efectuaron 1,000 transacciones del tipo
“listRecords”, este tipo de petición se seleccionó debido a que para fines de procesamiento es el
más representativo, al gestionar la devolución de los registros del sistema de datos. Cada registro
de respuesta era resultado a una consulta que integraba campos de varias tablas de la base de
datos. Todas las peticiones fueron independientes entre sí, teniendo una petición por segundo.
| 158
Los resultados de las mediciones efectuadas tras concluir las 1000 transacciones se aprecian en
las tablas 2 y 3.
Tabla 2. Resultados del escenario 1.
Variables Frecuencia Promedio Desviación Mediana Mínimo Máximo Rango
Estándar
TPR0 1000 70.14 26.52 63.88 48.75 342.39 293.63
TP0 1000 114.11 46.45 111.09 95.26 1146.90 1051.64
TT0 1000 184.25 54.45 176.50 151.00 1246.00 1095.00
4.- Conclusiones
En este trabajo se abordaron varias temáticas que rodean el concepto de
interoperabilidad: metadatos, repositorios y estándares de protocolos de acceso, específicamente
el protocolo OAI-PMH.
El framework presentado es una propuesta para integrar de forma fácil y eficiente el
protocolo OAI-PMH en repositorios heterogéneos, permitiendo el acceso y flujo de la
información de una forma genérica con aplicaciones existentes que soporten el protocolo de
acceso abierto. Al emplear una gestión de acceso a los datos por niveles, su arquitectura permite
optimizar consultas al sistema de datos del repositorio permitiendo una interoperabilidad
efectiva y eficiente.
En general, los resultados obtenidos en el experimento mostraron un impacto positivo
sobre el marco propuesto: se demostró que el marco de trabajo desarrollado mejora el tiempo
de procesamiento respecto a un modelo convencional.
Existen diversas líneas de investigación para mejor los resultados obtenidos hasta este
momento, siendo estas a nivel conceptual y de implementación del modelo. Algunas de estas
son: comparar diversos modelos de acceso a datos con el fin de reducir el tiempo de respuesta
para recuperar la información de la base de datos así como emplear esquemas de compresión de
| 161
datos y el manejo de caché; adicionar al marco propuesto el multi-soporte de protocolos de
acceso a datos genéricos, aumentando así las prestaciones de este al facilitar la implementación
de diversos protocolos de interoperabilidad y desarrollar una aplicación o servicio que permita
generar el archivo de configuración desde una interfaz visual, evitando al usuario involucrarse
con archivos XML.
Referencias
ADL (2002). Advanced Distributed Learning Emerging and Enabling Technologies for the
Design of Learning Object Repositories Report v. 1.
http://xml.coverpages.org/ADLRepositoryTIR.pdf. Acceso 13/01/2022.
Arms, W. A., Hillman, D., Lagoze, C., Krafft, D., Marisa, R., Saylor, J., ... & Sompel, H. V. D.
(2002). A spectrum of interoperability, the site for science prototype for the NSDL. D-Lib
magazine; 2002 (8) 1.
Barrueco, J. M., & García, C. (2009). Repositorios institucionales universitarios: evolución y
perspectivas. Zaragoza: Fesabid, XI Jornadas Españolas de Documentación.
Berners-Lee, T., Cailliau, R., Luotonen, A., Nielsen, H. F., & Secret, A. (1994). The world-wide
web. Communications of the ACM, 37(8), 76-82.
Bowman, C. M., Danzig, P. B., Hardy, D. R., Manber, U., & Schwartz, M. F. (1995). The
Harvest information discovery and access system. Computer networks and ISDN Systems, 28(1-
2), 119-125.
Brand A, Daly F, & Meyers B (2003) Metadata demystified. The Sheridian and NISO Press,
http://www.niso.org/standards/resources/Metadata_Demystified.pdf, pp 1–19. ISBN: 1-
880124-59-9.
Bueno-de-la-Fuente, G., Rodriguez-Mateos, D. (2007). Herramientas de software para OAI-
PMH. In: Bueno-de-la-Fuente, Gema (coord.) La Iniciativa de Archivos Abiertos (OAI):
situación y perspectivas en España y Latinoamérica. Bogotá: Rojas Eberhard, ISBN978-958-
9121-89-4, 247-302
| 162
Carpenter, L., Heery, P. H., Nicholson, D., Nixon, W., Child, P., & Gadd, E. (2002). Open
Archives Forum: Project Deliverable D3. 2
Cuba Rodríguez, Y., & Olivera Batista, D. (2018). Los metadatos, la búsqueda y recuperación
de información desde las Ciencias de la Información. E-Ciencias de la Información, 8(2), 146-
158.
Gómez, N., & Arias, O. (2002). El cambio de paradigma en la comunicación científica.
Información, Cultura y Sociedad, (6): 93-102.
Hatala, M., Richards, G., Eap, T., & Willms, J. (2004, May). The interoperability of learning
object repositories and services: standards, implementations and lessons learned. Proceedings
of the 13th international World Wide Web conference on Alternate track papers & posters (pp.
19-27).
IEEE (1991). IEEE Standard Computer Dictionary: A Compilation of IEEE Standard Computer
Glossaries, in IEEE Std 610 . DOI: 10.1109/IEEESTD.1991.106963.
Kitchenham, B. A., Budgen, D., & Brereton, P. (2015). Evidence-based software engineering
and systematic reviews (Vol. 4). CRC press.
Lagoze, C., & Van de Sompel, H. (2003). The making of the open archives initiative protocol
for metadata harvesting. Library hi tech.
Lynch, C. A. (1997). The Z39. 50 information retrieval standard. D-lib Magazine, 3(4).
OAIbiblio. (2000). Obtenido de http://www.ibiblio.org/.
Paepcke, A., Brandriff, R., Janee, G., Larson, R., Ludaescher, B., Melnik, S., & Raghavan, S.
(2000). Search middleware and the simple digital library interoperability protocol. DLIB
Magazine., 6(3).
Vargas, G. A. T., & Santamaría, B. J. (2008). Los sistemas de organización del conocimiento y
el manejo de contenidos digitales. Biblioteca Universitaria, 11(1), 3-12.
Vicente-Saez, R., & Martinez-Fuentes, C. (2018). Open Science now: A systematic literature
review for an integrated definition. Journal of business research, 88, 428-436.
| 163