Está en la página 1de 24

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/361039087

Un marco de trabajo basado en OAI-PMH para la


interoperabilidad de repositorios

Chapter · March 2022

CITATIONS READS

0 33

4 authors, including:

Víctor Hugo Menéndez Domínguez César Guerra-García


Universidad Autónoma de Yucatán Universidad Autónoma de San Luis Potosí
173 PUBLICATIONS   588 CITATIONS    40 PUBLICATIONS   120 CITATIONS   

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

CONFERENCIA CONJUNTA IBEROAMERICANA SOBRE APRENDIZAJE CON TIC View project

AGORA: ayuda para la gestión de objetos reutilizables de aprendizaje View project

All content following this page was uploaded by Víctor Hugo Menéndez Domínguez on 02 June 2022.

The user has requested enhancement of the downloaded file.


AVANCES Y TENDENCIAS EN
INGENIERÍA PARA EL DESARROLLO
ECONÓMICO Y SOCIAL

Laura Araceli López Martínez


César Arturo Guerra García
María Azucena Ortega Morales
Luis Javier Ontañón García Pimentel

Coordinadores
AVANCES Y TENDENCIAS EN INGENIERÍA PARA EL DESARROLLO ECONÓMICO Y
SOCIAL
Primera Edición, marzo de 2022. Salinas de Hidalgo, San Luis Potosí, México.

López Martínez, Laura Araceli; Guerra García, César Arturo; Ortega Morales, María
Azucena; Ontañón García Pimentel, Luis Javier.
E-BOOK
Edición: Armando Sánchez Macías y Virginia Azuara Pugliese
Se permite la copia y distribución por cualquier medio siempre que se mantenga el
reconocimiento de sus autores, no se haga uso comercial de las obras y no se realice
ninguna modificación a las mismas.

COORDINACIÓN ACADÉMICA REGIÓN ALTIPLANO OESTE. UNIVERSIDAD AUTÓNOMA


DE SAN LUIS POTOSÍ
CUERPO ACADÉMICO “ADMINISTRACIÓN Y AGROINDUSTRIA” UASLP-CA-284.
CUERPO ACADÉMICO “SISTEMAS DINÁMICOS Y CRIPTOGRAFÍA” UASLP-CA-268.
Carretera Salinas-Santo Domingo # 200, C.P. 78600 Tel. +52(496)963.4030
Salinas de Hidalgo, S.L.P. México
Email: carao@cro.uaslp.mx
© 2022 Todos los derechos reservados

ISBN: 978-607-535-269-5

Impreso y hecho en México. Printed and made in Mexico.


COMITÉ CIENTÍFICO
Dr. Marco Tulio Ramírez Torres Dr. Carlos Soubervielle Montalvo
Coordinación Académica Región Altiplano Facultad de Ingeniería, UASLP.
Oeste, UASLP.
Dr. Héctor Gerardo Pérez González
Dr. Juan Antonio Rendón Huerta
Facultad de Ingeniería, UASLP.
Coordinación Académica Región Altiplano
Dr. Ismael Hernández Ríos
Oeste, UASLP.
Colegio de Postgraduados, Campus San Luis
Dra. María Zenaida Saavedra Leos
Potosi.
Coordinación Académica Región Altiplano,
Dr. Carlos Alberto Fernández y Fernández
UASLP.
Universidad Tecnológica de la Mixteca.
Dra. Dianelys Nogueira Rivera
Dr. Yamil Omar Díaz Bustos
Universidad de Matanzas, Cuba.
Universidad Nacional Autónoma de México
Dra. Claudia Álvarez Salas
Dr. Ricardo Eliú Lozoya Ponce
Facultad de Ingeniería, UASLP.
Instituto Tecnológico de Chihuahua
Dr. Isaac Campos Cantón
Facultad de Ciencias, UASLP.

Todos los capítulos que se presentan en esta obra fueron sometidos a un arbitraje
doble ciego por parte de los expertos del Comité Científico.
PRESENTACIÓN

El desarrollo tecnológico ha crecido a pasos gigantescos en las últimas dos décadas, coadyuvando con
ello en mejorar el bienestar de las personas en muchos sentidos, económico, social y personal. Los
trabajos que se incluyen en esta obra pretenden aportar nuevo conocimiento, además de su aplicación en
ambientes reales.

Esta obra es producto del uso de técnicas de investigación y procesos académicos que se realizan dentro
de la Universidad Autónoma de San Luis Potosí y de otras instituciones académicas, se conforma de dos
apartados diferenciados por su enfoque, el primero denominado, Procesos en Agroindustria, el cual
integra seis capítulos cuyos temas relacionados a la formulación de productos alimentarios y no
alimentarios, son estudiados desde la perspectiva de su aplicación en la mejora de distintos productos
propios de la región, las aportaciones de los autores representan propuestas de investigación aplicadas a
la solución de problemáticas reales.

En el segundo apartado, llamado Automatización y Sistemas Computacionales, se concentran seis


capítulos relacionados a propuestas tecnológicas aplicadas a una variedad de áreas del conocimiento,
tales como, sistemas y dispositivos electrónicos, repositorios de objetos de aprendizaje, robótica y
gestión del conocimiento, todos ellos proponen ideas y soluciones innovadoras capaces de afrontar
problemas específicos.

Estos trabajos representan un intento más para contribuir con una variedad de conocimientos y
propuestas tecnológicas, que propicien un mejor ambiente de desarrollo hacia las nuevas tendencias
tecnológicas y de innovación, generando así, una mejora en el quehacer de las personas, y por
consecuencia en la sociedad en general.

Dr. César Arturo Guerra García, Salinas de Hidalgo, San Luis Potosí, marzo de 2022.
Contenido

Parte 1. Procesos en Agroindustria ...................................................................................... 2


Capítulo 1. Aplicación de nanofitosomas de aceite esencial de Citrus sinensis en un queso
petit-suisse .......................................................................................................................... 2
Jesús Dario Rodríguez Arvizu, Dalia Abigail García Flores y Magdalena Alvarado Galván
Capítulo 2. Efecto del Secado por Aspersión en los Antioxidantes de Sechium edule .......... 13
Luis Fernando Ramírez García y Claudia Álvarez Salas
Capítulo 3. Inducción de callos de orégano y optimización del enraizamiento de brotes .... 29
Marco Antonio Balderas Hernández y María del Socorro Carmen Santos Díaz
Capítulo 4. Formulación de un producto ergogénico gelificado con cafeína ....................... 43
Jorge Robledo Palomo
Capítulo 5. Prototipos de Automatización Rural Para Mejorar la Calidad de la Leche de
Cabra en la Región ............................................................................................................ 61
Carla Enimia Rocha Ipiña, Hermelindo García Espinoza y Elizabeth Reynaga Hernández
Capítulo 6. El nopal: usos y aplicaciones en la industria alimentaria y no alimentaria ........ 84
Janet María León Morales, María Azucena Ortega Amaro y Laura Araceli López Martínez
Parte 2. Automatización y sistemas computacionales ........................................................ 94
Capítulo 7. Control de brazo robótico desarrollado en SolidWorks mediante LabVIEW ...... 95
Roberto Carlos Martínez Montejano, José Jimmy Jaime Rodríguez y Raymundo Donjuan Meza
Capítulo 8. Implementación electrónica del sistema de Hindmarsh-Rose de una neurona
mediante computación analógica.................................................................................... 105
Luis Javier Ontañón García Pimentel, Adriana Bernal González, Marco Tulio Ramírez Torres,
Roberto Carlos Martínez Montejano y Ricardo Eliu Lozoya Ponce
Capítulo 9. Optimización del consumo de agua en la agricultura con dispositivos
electrónicos ..................................................................................................................... 123
Rafael Aguilar González, Marco Cárdenas Juárez y Juan Carlos Rodríguez Ortiz
Capítulo 10. Implementación electrónica del sistema de Hindmarsh-Rose de una neurona
mediante computación analógica.................................................................................... 132
Luis Javier Ontañón García Pimentel, César Arturo Guerra García y Marco Tulio Ramírez
Torres
Capítulo 11. Un marco de trabajo basado en OAI-PMH para la interoperabilidad de
repositorios………………………………..………………………………………………………………….……………… 149
Víctor Hugo Menéndez Domínguez, Ángel Antonio Medina Moreno, María Enriqueta
Castellanos Bolaños y César Arturo Guerra García
Capítulo 12. Modelo de calidad de datos aplicado a objetos de
aprendizaje………………………………..………………………………………………………………….……………… 164
César Arturo Guerra García, Héctor Gerardo Pérez González, Francisco Eduardo Martínez
Pérez y Alberto Núñez Varela
Capítulo 11. Un marco de trabajo basado en OAI-PMH para la
interoperabilidad de repositorios

Víctor Hugo Menéndez Domínguez


Universidad Autónoma de Yucatán
mdoming@correo.uady.mx

Ángel Antonio Medina Moreno


Universidad Autónoma de Yucatán
astre369@gmail.com

María Enriqueta Castellanos Bolaños


Universidad Autónoma de Yucatán
enriqueta.c@correo.uady.mx

César Arturo Guerra García


Universidad Autónoma de San Luis Potosí
cesar.guerra@uaslp.mx
Resumen
El constante incremento de información en Internet ha generado un cambio radical en
la gestión de los recursos almacenados en repositorios, tomando un enfoque hacia la
estandarización mediante el uso de metadatos y protocolos de interoperabilidad. Los
beneficios de utilizar un enfoque basado en estándares estriban en la posibilidad de
facilitar el flujo y acceso a la información almacenada. Esto posibilita crear sistemas
especializados que integran la información de diversos orígenes, brindando una
interfaz unificada de acceso. Se presenta un framework para la implementación de la
Iniciativa de Archivos Abiertos (OAI) y el Protocolo para la Recolección de Metadatos
(PMH) con la finalidad de favorecer la creación de sistemas de software que brinden
prestaciones o servicios más especializados a partir de información almacenada en
| 148
repositorios heterogéneos y con ello facilitar la difusión del conocimiento. La
propuesta ha sido valorada en términos de su efectividad y eficiencia.

Palabras clave: repositorios, interoperabilidad, OAI-PMH

1. Introducción
Es indudable el crecimiento de Internet en términos de la información que almacena,
existe un gran incremento en las aportaciones digitales y día con día continúan aumentando.
Estos recursos digitales son generados por diversas entidades principalmente para la
investigación científica, la educación, el entretenimiento, etc. Estos recursos suelen estar
disponibles en repositorios especializados siempre y cuando se cuente con la autorización para
su acceso y el visor adecuado de los diversos formatos de imágenes, videos, texto, audio, etc.
Los repositorios son la infraestructura clave para el desarrollo, almacenamiento,
administración, localización y recuperación de todo tipo de contenido digital (ADL, 2002).
Generalmente, se conciben como un conjunto de servicios que una institución ofrece a una
comunidad para difundir el conocimiento producido por esta (Barrueco & García, 2009) pero
con la característica de no se tiene un conocimiento previo de su estructura interna (Hatala et
al., 2004).

Recursos

Metadatos Metadatos

Repositorio de Repositorio de
metadatos metadatos y recursos

Recursos

Sitio web

Figura 1. Tipos de repositorios (elaboración propia).


En cuanto a su estructura interna, es decir, su tipo de almacenamiento; los repositorios
pueden dividirse en dos tipos (Figura 1):
| 149
• Contenedores de recursos y sus metadatos. En éstos, los documentos y sus
descriptores se encuentran dentro de un mismo sistema e incluso dentro de un mismo
servidor. Este es el modelo clásico de un repositorio.
• Contenedores de metadatos. En este caso, el repositorio contiene sólo los
descriptores y se accede al recurso a través de una referencia a su ubicación real, la
cual puede estar en otro sistema o repositorio. Su uso está orientado para la creación
de redes de repositorios.
Una de las funcionalidades más importantes de los repositorios es la recuperación de los
recursos almacenados. Para ello, los recursos se describen y registran con metadatos adecuados,
para que posteriormente sea posible llevar a cabo consultas de acuerdo a diversos criterios de
búsqueda.
Los metadatos constituyen información estructurada que describe un recurso de
información (Brand, Daly, & Meyers, 2003). Su finalidad es ayudar en la identificación,
descripción y localización utilizando una representación simplificada que podría tener un
propósito adminsitrativo, descriptivo o estructural (Berners-Lee et al., 1994)
Dicha situación ha originado el surgimiento de diversos estándares y protocolos con la
finalidad de dar un acceso estandarizado a dichos recursos, lo que facilita al usuario final acceder
a la información o recursos a través de diversos proveedores de servicios de búsqueda, filtrado,
etc., de acuerdo con sus preferencias y necesidades. Entre los estándares que se han
implementado están diversos esquemas de metadatos, que permiten describir a un recurso de
manera sistemática basándose en su contenido, finalidad, tecnología, etc., permitiendo
automatizar decisiones a partir de estos metadatos.
En los últimos años se ha observado un uso está muy extendido en la web del estándar
Dublin Core (DC) para describir recursos producidos por empresas, gobiernos y organizaciones
con el fin de apoyar sus servicios o para la gestión del conocimiento interno. DC se enfoca a la
descripción de cualquier documento digital.
El estándar Dublin Core (DC) nació en la ciudad de Dublin, Ohio (Estados Unidos) en
1995 como un conjunto simple de metadatos pensado para facilitar las búsquedas de recursos

| 150
en la Web (Arms et al., 2002). DC se formalizó en 2003 como la norma ISO 15836-2003. Desde
2007, compone la norma ANSI/NISO Z39.85-2007 y IETF RFC 5013.
El estándar DC define un conjunto base de 15 metadatos que constituyen el nivel simple.
Estos metadatos describen el contenido del documento, la propiedad intelectual y la información
para la creación de instancias (En la Tabla 1, las celdas en gris).
El nivel cualificado incorpora tres nuevos metadatos (audience, provenance y
rightHolder) al nivel simple. También define un conjunto de atributos que clarifican la
representación semántica de los recursos descritos para una fácil recuperación. Estas
propiedades refinan las descripciones de metadatos y están limitadas a ciertos elementos,
pudiendo utilizar vocabularios asociados o descripciones en lenguaje natural.
Tabla 1. Metadatos del estándar Dublin Core (elaboración propia).
Esquema de
Tipo Metadato Elemento de refinamiento
codificación
title alternative
subject LCSH, MESH, DDC,
LCC, UDC
description tableOfContents, abstract
source URI
language ISO 639-2, RFC 3066
Contenido

relation isVersionOf, hasVersion, isReplacedBy, URI


replaces, isRequiredBy, requires, isPartOf,
hasPart, isReferencedBy, references,
isFormatOf, hasFormat, conformsTo
coverage spatial, temporal DCMI-Point, ISO 3166,
DCMI-Box, TNG,
DCMI-Period, W3C-
DTF
creator
Propied

intelect
ual
ad

publisher

| 151
contributor
rights accessRights, license URI

date created, valid, available, issued, modified, DCMI-period, W3C-


dateAccepted, dateCopyrighted, DTF
Instanciación

dateSubmitted
type DCMI-typeVocabulary
format extent, médium IMT
identifier bibliographicCitation URI
audience mediator, educationLevel
provenance
rightHolder
En Dublin Core, cada elemento es opcional y puede repetirse. No hay un orden
específico de aparición. Su contenido puede regirse por esquemas de codificación, vocabularios
controlados o estar abierto a las descripciones de texto en lenguaje natural.
El estándar proporciona un conjunto de directrices para su implementación en los
formatos XHTML, XML y RDF, que pueden almacenarse fuera o dentro del documento con el
propósito de facilitar la interoperabilidad entre sistemas (Cuba Rodríguez & Olivera Batista,
2018).
El problema de interoperabilidad se refiere a la dificultad de integrar sistemas de
información heterogéneos y distribuidos. La interoperabilidad es la capacidad de dos o más
sistemas o componentes para intercambiar la información y utilizarla (IEEE, 1991). Desde este
punto de vista computacional, la interoperabilidad permite generar un enlace
entre sistemas de software para las diferentes tecnologías de información existentes,
promoviendo una sana convivencia y operatividad (Vargas & Santamaría, 2008).
En cuanto a los estándares de interoperabilidad, son numerosos los protocolos
desarrollados a través de los años como Z39.50 (Lynch, 1997), SDLIP (Paepcke et al., 2000),
Harvest (Bowman et al., 1995), etc.
Sin embargo, sólo algunos se han consolidado internacionalmente como estándares
aceptados, son usados de manera masiva y su desarrollo se encuentra avalado por iniciativas
| 152
tanto públicas como privadas, como es el caso del protocolo OAI-PMH (Open Archives
Initiative Protocol for Metadata Harvesting) (Lagoze & Van de Sompel, 2003).
El protocolo OAI-PMH es una iniciativa apoyada por la National Science Foundation,
la Coalition for Networked Information y la Digital Library Federation (Gómez & Arias, 2002).
Se desarrolló como una alternativa que busca promover el libre acceso a la información
científica de manera ordenada y normalizada en los repositorios institucionales de documentos
y bibliotecas digitales existentes.
OAI-PMH opera sobre el protocolo HTTP en conjunto con la tecnología XML (Lagoze
& Van de Sompel, 2003). Como respuesta a una petición HTTP efectuada desde cualquier
consumidor o colector de metadatos, el proveedor de datos genera un XML que contiene una
colección de metadatos Dublin Core de los recursos coincidentes con la solicitud. Los mensajes
de error se basan en HTTP (Figura 2).

Figura 2. Protocolo OAI-PMH (elaboración propia).


Los argumentos de la petición HTTP se envían como parámetros GET o POST. OAI-
PMH soporta seis tipos de petición llamados verbos y es compatible con cualquier formato de
metadatos codificados en XML, siendo Dublin Core el formato mínimo especificado para una
interoperabilidad básica.
Los proveedores de datos pueden definir una jerarquía lógica de conjuntos de metadatos
que comparten un atributo o característica, como el tipo de contenido o temática (sets), buscando
brindar granularidad en la recolección. Las fechas de registro indican el último cambio en los
metadatos y por tanto, proporcionan un mayor soporte a la granularidad de la recolección.
Es importante resaltar que OAI-PMH no proporciona una búsqueda a través de estos
datos, simplemente permite reunir los datos. Para ofrecer un servicio de búsqueda, el método de
la recolección debe combinarse con otros mecanismos (Carpenter et al., 2002)

| 153
El uso del protocolo es muy prometedor dentro de la estrategia de los archivos abiertos.
El beneficio más conocido es servir de sustento a un nuevo modelo de comunicación académica
y científica conocido como Ciencia Abierta (Vicente-Saez & Martinez-Fuentes, 2018). Aunque
el OAI-PMH es técnicamente muy simple, la construcción coherente de servicios que satisfagan
las necesidades de los usuarios sigue siendo compleja.
Si bien existen varias soluciones (Bueno de la Fuente & Rodríguez Mateos, 2007) que
permiten la creación de repositorios OAI o componentes de software dirigidos a la
implementación integral de archivos o repositorios que cumplan con el protocolo OAI-PMH, su
principal desventaja radica en la complejidad de su configuración o su obsolencencia, además
de la incertidumbre en términos de su eficiencia con respecto a su integración en sistemas
existentes que requieren exponer su información según el protocolo OAI-PMH.
La propuesta que se presenta en este trabajo implementa la API del protocolo OAI-PMH
en un framework que gestiona las solicitudes y automatiza la conversión de los metadatos de
los recursos almacenados en un repositorio al formato del estándar Dublin Core. El marco de
trabajo emplea un esquema de transformación fácilmente adaptable a través de un archivo de
configuración, lo que permite la interoperabilidad entre repositorios heterogéneos simplificando
el flujo y acceso de la información sin requerir modificar la arquitectura base de un sistema de
información.

2.- Metodología
En esta sección se presenta el enfoque metodológico que dirigió el trabajo. Aunque
pareciera tratarse de un proceso sin interés teórico, hay que considerar que la definición acertada
de una problemática real y un método riguroso para la selección de información relevante dan
validez a los resultados obtenidos.
Definición de la problemática. Un primer vistazo desde un punto de vista empírico y
la consulta de referencias básicas motivó a realizar el trabajo sobre la problemática descrita en
la primera parte de este documento, proponiendo un framework para la recuperación de los
recursos que se encuentran almacenados en repositorios heterogéneos utilizando un protocolo

| 154
estándar de interoperabilidad. Dicha solución contempla el empleo de metodologías y
tecnologías que refuerzan los aspectos computacionales de esta área.
Análisis del estado del arte. Para la selección de las mejores fuentes de referencia para
definir el proyecto se utilizó la técnica de revisión sistemática en el contexto de la Ingeniería de
Software (Kitchenham, Budgen, & Brereton, 2015), que es una guía para realizar estudios
exhaustivos acerca de un tema. Se procede identificando, evaluando e interpretando todas las
investigaciones relevantes afines a una problemática.
Diseño del framework. Al comienzo de esta etapa se definieron los requerimientos
funcionales del sistema. Uno de los más importantes fue que el framework tuviera un nivel de
acomplamiento muy bajo, con el fin de afectar lo menos posible su integración con la
arquitectura de un sistema existente y facilite que una base de datos basada en SQL exponga sus
datos conforme al protocolo OAI-PMH. Durante esta etapa también se modelaron y
documentaron los componentes del marco de trabajo.
Construcción. Para la implementación del framework se utilizaron diversas tecnologías
y entornos para brindar características importantes como son la disponibilidad, compatibilidad
y eficiencia. El framework requiere que el repositorio donde se implemente el servicio cuente
con un servidor Web como Apache, un gestor de bases de datos basado en el lenguaje SQL,
como MySQL, y un intérprete de comandos PHP. La implementación del framework requirió
de diversas bibliotecas que facilitan la ejecución de algunas tareas, tanto internas como externas
en el proceso de ejecución del protocolo OAI-PMH como ADOdb (https://adodb.org/) y OAI
V2 Data-Provider (http://physnet.uni-oldenburg.de/oai/). Dichas bibliotecas de libre
distribución agilizaron y facilitaron el proceso de desarrollo.
Pruebas y validación. La obtención de métricas de un producto software resulta en
información valiosa para la mejora de sus atributos de calidad. Las pruebas realizadas para
validar el desempeño se describen más adelante.

3.- Resultados

| 155
De forma breve, la presente propuesta se centra en el uso del protocolo OAI-PMH y el
estándar de metadatos Dublin Core para especificar una arquitectura que facilite la “conversión”
entre los metadatos específicos de un repositorio y los solicitados por OAI-PMH para que
puedan ser consumidos por un cliente o un proveedor de servicios.
Con la finalidad de satisfacer esta propuesta se diseñó un esquema para el procesamiento
de una petición a través del protocolo OAI-PMH, en la cual, la petición es procesada por
componentes que constituyen una capa de acceso.
A continuación, se presenta la arquitectura desde el punto de vista de sus componentes,
características y funcionalidades (Figura 3). Se utiliza una estructura basada en un modelo de
capas para cada uno de los componentes principales. Esto posibilita y al mismo tiempo mantiene
la estructura establecida en la propuesta. La implementación de cada uno de los módulos se hizo
considerando que hubiera independencia entre sí, facilitando modificaciones o mejoras en un
futuro.

Figura 3. Arquitectura detallada del marco (elaboración propia).


| 156
El propósito de dividir la arquitectura en dos grandes componentes es brindar una
independencia entre las principales funcionalidades del protocolo OAI-PMH y el repositorio al
cual se le incorpora el protocolo. Esto permitirá implementar el protocolo en diversos
repositorios de forma sencilla sin importar el estándar de metadatos usados para el registro de
sus recursos.
Componente de procesamiento. Se encarga de las funciones principales del protocolo
OAI-PMH, es decir, descomposición de parámetros, creación de mensajes de error y respuestas
en formato XML. De forma general, está conformado por diversos módulos internos que le
ayudan a cumplir con tareas como son la recepción de las peticiones OAI, validación, ejecución
y retorno de una respuesta a dicha petición.
Cabe resaltar que la implementación del componente tiene como base la biblioteca OAI
V2 Data-Provider debido a que esta proporciona todas las funcionalidades básicas solicitadas
como parte del procesamiento del protocolo OAI-PMH. Se hizo un proceso de reingeniería
inversa para adaptarla y modificarla con el fin de mejorar su claridad y diseño hacia un
paradigma orientado objetos, a través de la generación de clases y métodos para encapsular sus
funcionalidades. De igual forma, al hacer esta restructuración del código se buscó mejorar la
compatibilidad de la biblioteca con la última versión de PHP, sin perder de vista el objetivo de
satisfacer las necesidades de la propuesta.
Componente de recuperación. Es el punto medular de la arquitectura propuesta. Se
encarga de obtener los recursos solicitados del repositorio, efectuando la conversión entre el
esquema de descripción de los recursos del repositorio y el estándar Dublin Core, conforme a
un archivo de configuración. Para el acceso a los distintos repositorios se utilizó la biblioteca
ADOdb que proporciona un acceso uniforme a bases de datos basadas en el lenguaje SQL.
El componente incluye un gestor de consultas, el cual se encarga de encapsular el
proceso de consulta a alto nivel, el gestor del archivo de configuración, y un módulo de gestión
de nivel de acceso que se encarga de optimizar las consultas a la base de datos por medio de la
obtención de los atributos que están en un mismo nivel de acceso y transformándolas a
sentencias SQL eficientes.

| 157
El sistema desarrollado busca satisfacer las diversas estructuras de datos existentes. Sin
embargo, dado que las opciones de esquemas relacionales pueden ser infinitas, se enfocó en
satisfacer esquemas de bases de datos basados en la primera forma normal (1FN) hasta la tercera
forma normal (3FN).
Prueba de procesamiento. Con la finalidad de tener un marco de referencia con
respecto al procesamiento y eficiencia del marco desarrollado, se procedió a realizar un estudio
comparativo entre el marco propuesto y un modelo convencional. Para efectuar el estudio se
definieron los datos que serían colectados para validar el proyecto, basándose en las métricas
que a continuación se enlistan:
• TP=Tiempo de procesamiento del servidor.
• TRP=Tiempo de trasferencia de petición y respuesta.
• TT=Tiempo total de petición de inicio a fin.
Estas métricas fueron seleccionadas debido a que proporcionan información sobre el
procesamiento y eficiencia, necesarios para efectuar la comparativa entre el Marco
Arquitectónico desarrollado y el modelo convencional. El punto fuerte de este estudio es la
comparativa entre los tiempos de procesamiento en ambos modelos.
Escenario de prueba 1. El primer escenario de prueba está centrado en un modelo
convencional gestionando las peticiones a través de la librería OAI V2 Data-Provider con ligeras
adaptaciones para ejecutarse sobre PHP5+.
El escenario de prueba consiste en dos componentes: un servidor de datos basado en
MySQL y un cliente colector basado en OAI-PMH. En el servidor se encuentra una instancia
de la librería OAI V2 Data-Provider que recibe y procesa las diversas peticiones. Del lado del
cliente se encuentra la aplicación JMeter (https://jmeter.apache.org/) que permite realizar
peticiones al servidor y registrar la información generada en esta transferencia.
Para la obtención de las medidas se efectuaron 1,000 transacciones del tipo
“listRecords”, este tipo de petición se seleccionó debido a que para fines de procesamiento es el
más representativo, al gestionar la devolución de los registros del sistema de datos. Cada registro
de respuesta era resultado a una consulta que integraba campos de varias tablas de la base de
datos. Todas las peticiones fueron independientes entre sí, teniendo una petición por segundo.

| 158
Los resultados de las mediciones efectuadas tras concluir las 1000 transacciones se aprecian en
las tablas 2 y 3.
Tabla 2. Resultados del escenario 1.
Variables Frecuencia Promedio Desviación Mediana Mínimo Máximo Rango
Estándar
TPR0 1000 70.14 26.52 63.88 48.75 342.39 293.63
TP0 1000 114.11 46.45 111.09 95.26 1146.90 1051.64
TT0 1000 184.25 54.45 176.50 151.00 1246.00 1095.00

Tabla 3. Resultados del escenario 1.


Variables Primer cuartil Segundo cuartil Tercer cuartil Rango intercuartil
(Q1) (Q2) (Q3) (IQR)
TPR0 58.81 63.88 72.03 13.22
TP0 107.72 111.55 115.90 8.17
TT0 169 176.5 186 17
Con los resultados listados en la Tabla 3 se efectuó un análisis de datos donde se pudieron
apreciar las siguientes características:
• El 25% (250) de las mediciones son menores que el primer cuartil; TPR0=58.13 ms,
TP0=107.72 ms, y TT0=169 ms, respectivamente.
• El 50% (500) de las mediciones son menores que el segundo cuartil; TPR0=63.88
ms, TP0=11.55 ms, y TT0=176.5 ms.
• El 75% (7500) de las mediciones son menores que el tercer cuartil; TPR0=72.03 ms,
TP0=115.90 ms, y TT0=186 ms.
A partir de estas medidas se puede concluir que en promedio el procesamiento del
modelo convencional estudiado es de 114.11 ms teniendo un criterio de desviación estándar de
46.45 ms.
Escenario de prueba 2. Es similar al escenario 1 salvo que en este se utilizó el marco
de trabajo propuesto utilizando el mismo servidor de datos y el colector. Los resultados de las
mediciones efectuadas tras concluir las 1000 transacciones se aprecian en la Tabla 4 y 5:
Tabla 4. Resultados del escenario 2.
| 159
Variables Frecuencia Promedio Desviación Mediana Mínimo Máximo Rango
Estándar
TPR1 1000 63.6522 16.6077 60.76 45.519 436.049 390.53
TP1 1000 94.7068 46.9196 91.708 79.885 1157.99 1078.11
TT1 1000 158.359 49.8718 153 129.0 1232.0 1103.0

Tabla 5. Resultados del escenario 2.


Variables Primer cuartil Segundo cuartil Tercer cuartil Rango inter-cuartil
(Q1) (Q2) (Q3) (IQR)
TPR1 56.13 60.78 67.50 11.36
TP1 88.84 91.67 94.97 6.12
TT1 147 153 161 14
Con los resultados listados en la Tabla 5 se efectuó un análisis de datos donde se pudieron
apreciar las siguientes características:
• El 25% (250) de las mediciones son menores que el primer cuartil; TPR1=56.13 ms,
TP1=88.84 ms, y TT1=147 ms, respectivamente.
• El 50% (500) de las mediciones son menores que el segundo cuartil; TPR1=60.78
ms, TP1=91.67 ms, y TT1=153 ms, respectivamente.
• El 75% (7500) de las mediciones son menores que el tercer cuartil; TPR1=67.50 ms,
TP1=94.97 ms, y TT1=161 ms, respectivamente.
A partir de estas medidas se puede concluir que en promedio el procesamiento del marco
desarrollado es de 94.70 ms teniendo un criterio de desviación estándar de 46.91 ms.
Comparación de mediciones. Con la información colectada se realizó un análisis
comparativo entre los dos modelos que se probaron:
• El tiempo de transacción (TPR) es muy similar en ambos modelos, se aprecia que la
diferencia entre las medias de ambos escenarios es mínima con solo 6.49 ms de
diferencia. Esto bien porque las peticiones que se efectuaron son similares. Sin
embargo hay una desviación estándar ligeramente superior para el escenario 2, razón
por la cual la diferencia entre las medias de las transacciones en ambos casos es
levemente diferente.
| 160
• El tiempo de procesamiento (TP) es la medida principal a evaluar, el prototipo
implementado tiene una media de procesamiento (TP1) ligeramente más eficiente,
teniendo 19.40 ms de ventaja sobre el modelo convencional (TP0: Librería OAI V2
Data-Provider). Lo cual indica que el procesamiento es aproximadamente 20.48%
más rápido que en el modo convencional. En cuanto a la desviación estándar sobre
el parámetro, en ambos casos es muy similar dando una diferencia mínima, lo cual
indica que la dispersión de los datos medidos en ambos casos es similar.
• Finalmente a nivel global se puede percibir que el sistema desarrollado en tiempo
total del proceso de respuesta a una petición (TT1) es 25 ms aproximadamente más
rápido que el modelo convencional (TT0).

4.- Conclusiones
En este trabajo se abordaron varias temáticas que rodean el concepto de
interoperabilidad: metadatos, repositorios y estándares de protocolos de acceso, específicamente
el protocolo OAI-PMH.
El framework presentado es una propuesta para integrar de forma fácil y eficiente el
protocolo OAI-PMH en repositorios heterogéneos, permitiendo el acceso y flujo de la
información de una forma genérica con aplicaciones existentes que soporten el protocolo de
acceso abierto. Al emplear una gestión de acceso a los datos por niveles, su arquitectura permite
optimizar consultas al sistema de datos del repositorio permitiendo una interoperabilidad
efectiva y eficiente.
En general, los resultados obtenidos en el experimento mostraron un impacto positivo
sobre el marco propuesto: se demostró que el marco de trabajo desarrollado mejora el tiempo
de procesamiento respecto a un modelo convencional.
Existen diversas líneas de investigación para mejor los resultados obtenidos hasta este
momento, siendo estas a nivel conceptual y de implementación del modelo. Algunas de estas
son: comparar diversos modelos de acceso a datos con el fin de reducir el tiempo de respuesta
para recuperar la información de la base de datos así como emplear esquemas de compresión de

| 161
datos y el manejo de caché; adicionar al marco propuesto el multi-soporte de protocolos de
acceso a datos genéricos, aumentando así las prestaciones de este al facilitar la implementación
de diversos protocolos de interoperabilidad y desarrollar una aplicación o servicio que permita
generar el archivo de configuración desde una interfaz visual, evitando al usuario involucrarse
con archivos XML.

Referencias
ADL (2002). Advanced Distributed Learning Emerging and Enabling Technologies for the
Design of Learning Object Repositories Report v. 1.
http://xml.coverpages.org/ADLRepositoryTIR.pdf. Acceso 13/01/2022.
Arms, W. A., Hillman, D., Lagoze, C., Krafft, D., Marisa, R., Saylor, J., ... & Sompel, H. V. D.
(2002). A spectrum of interoperability, the site for science prototype for the NSDL. D-Lib
magazine; 2002 (8) 1.
Barrueco, J. M., & García, C. (2009). Repositorios institucionales universitarios: evolución y
perspectivas. Zaragoza: Fesabid, XI Jornadas Españolas de Documentación.
Berners-Lee, T., Cailliau, R., Luotonen, A., Nielsen, H. F., & Secret, A. (1994). The world-wide
web. Communications of the ACM, 37(8), 76-82.
Bowman, C. M., Danzig, P. B., Hardy, D. R., Manber, U., & Schwartz, M. F. (1995). The
Harvest information discovery and access system. Computer networks and ISDN Systems, 28(1-
2), 119-125.
Brand A, Daly F, & Meyers B (2003) Metadata demystified. The Sheridian and NISO Press,
http://www.niso.org/standards/resources/Metadata_Demystified.pdf, pp 1–19. ISBN: 1-
880124-59-9.
Bueno-de-la-Fuente, G., Rodriguez-Mateos, D. (2007). Herramientas de software para OAI-
PMH. In: Bueno-de-la-Fuente, Gema (coord.) La Iniciativa de Archivos Abiertos (OAI):
situación y perspectivas en España y Latinoamérica. Bogotá: Rojas Eberhard, ISBN978-958-
9121-89-4, 247-302

| 162
Carpenter, L., Heery, P. H., Nicholson, D., Nixon, W., Child, P., & Gadd, E. (2002). Open
Archives Forum: Project Deliverable D3. 2
Cuba Rodríguez, Y., & Olivera Batista, D. (2018). Los metadatos, la búsqueda y recuperación
de información desde las Ciencias de la Información. E-Ciencias de la Información, 8(2), 146-
158.
Gómez, N., & Arias, O. (2002). El cambio de paradigma en la comunicación científica.
Información, Cultura y Sociedad, (6): 93-102.
Hatala, M., Richards, G., Eap, T., & Willms, J. (2004, May). The interoperability of learning
object repositories and services: standards, implementations and lessons learned. Proceedings
of the 13th international World Wide Web conference on Alternate track papers & posters (pp.
19-27).
IEEE (1991). IEEE Standard Computer Dictionary: A Compilation of IEEE Standard Computer
Glossaries, in IEEE Std 610 . DOI: 10.1109/IEEESTD.1991.106963.
Kitchenham, B. A., Budgen, D., & Brereton, P. (2015). Evidence-based software engineering
and systematic reviews (Vol. 4). CRC press.
Lagoze, C., & Van de Sompel, H. (2003). The making of the open archives initiative protocol
for metadata harvesting. Library hi tech.
Lynch, C. A. (1997). The Z39. 50 information retrieval standard. D-lib Magazine, 3(4).
OAIbiblio. (2000). Obtenido de http://www.ibiblio.org/.
Paepcke, A., Brandriff, R., Janee, G., Larson, R., Ludaescher, B., Melnik, S., & Raghavan, S.
(2000). Search middleware and the simple digital library interoperability protocol. DLIB
Magazine., 6(3).
Vargas, G. A. T., & Santamaría, B. J. (2008). Los sistemas de organización del conocimiento y
el manejo de contenidos digitales. Biblioteca Universitaria, 11(1), 3-12.
Vicente-Saez, R., & Martinez-Fuentes, C. (2018). Open Science now: A systematic literature
review for an integrated definition. Journal of business research, 88, 428-436.

| 163

View publication stats

También podría gustarte