Está en la página 1de 62

Flujos de trabajo en la gestin de

un repositorio institucional
Antonio Juan Prieto Jimnez
Jordi Serrano-Muoz
Universitat Politcnica de Catalunya
Quines somos?
Sumario
Razn de ser La UPC en cifras
Biblioteca? Repositorios en la UPC
Agentes
Empezamos?
Check-list
Como organizarlo
Interoperabilidad e
integracin
Sostenibilidad
Soporte
Infraestructura TIC
Mas tareas
Repositorios: Razn de ser (I)
Ofrecer a nuestra comunidad una herramienta o
aplicacin para publicar sus trabajos acadmicos,
en acceso abierto y en texto completo en Internet
Garantizar el acceso perpetuo a los trabajos
archivados mediante su almacenamiento en
servidores seguros mantenidos y gestionados por
la Biblioteca?
Mejorar la visibilidad de la organizacin y sus
autores en la red.
Repositorios: Razn de ser (II)
De verdad necesitamos crear, gestionar y
mantener un repositorio?
Analicemos las implicaciones:
Est la organizacin madura?
Dimensiones
Capacidades
Recursos: personas, infraestructura,
econmicos, .
Repositorios: Razn de ser (y III)
No lo necesitamos:
Esperamos la oportunidad
Creamos las condiciones
Preparamos el terreno
No hacemos nada
Si lo necesitamos
Podemos hacerlo?
Lo tenemos claro
Alianzas / Colaboraciones
Repositorios: Biblioteca? (I)
La implementacin, gestin,
organizacin no es solo una
responsabilidad de la biblioteca
Es de toda la institucin
Requiere un compromiso institucional
Si no hay compromiso. Para que
queremos un repositorio?
Repositorios: Biblioteca? (y II)

La institucin debe comprometerse


con el control y la proteccin de su
produccin intelectual en soporte
digital

Alicia Lpez Medina (UNED)


Repositorios: Agentes (I)
Implicacin a diferentes niveles:
rganos de gobierno
Gestores / administradores
Docentes / investigadores,
Oficina de apoyo a la investigacin y
transferencia de tecnologa
Sistemas de informacin
..
Y tambin biblioteca
Repositorios: Agentes (y II)
Necesitamos la complicidad y el
compromiso de nuestro entorno
No debemos lanzarnos a la piscina
solos, en ese caso lo mas probable es que
fracasemos
Cada uno de los agentes tiene su
responsabilidad, su tarea y
evidentemente diferentes niveles de
implicacin
Repositorios: Empezamos?
Habr que hacer pasillos y cafs
Crear complicidades
Explicar cuales son los beneficios para el
investigador / docente y para la organizacin
tambin para la sociedad
Implicar un cambio cultural
Pensemos en la lista de tareas e implicaciones
Y naturalmente en asignarle un presupuesto
Atencin: esto no es un proyecto!
Repositorios: Check-list (I) /

Visin, misin, objetivo del repositorio


Qu representa el repositorio para la
organizacin?
Qu contenidos?
Hemos identificado a los agentes?
La organizacin tiene una poltica sobre la
propiedad intelectual?
Se han analizado los riesgos?
Repositorios: Check-list (II)
No habr ya por ah algn repositorio?
Tenemos el soporte institucional? Est la
institucin madura?
La organizacin y los agentes, Estn
preparados? Estn capacitados?
Tenemos algn champion como cmplice?
Hemos definido roles, responsabilidades,
etc.. para el desarrollo del repositorio?
Repositorios: Check-list (y III)
Hay financiacin?
Qu estadsticas, datos e informes
facilitaremos del repositorio?
Y el ROI?

Fuente:
JISC: Planning Checklist - Before You Start
Repositories Support Project
Repositorios: Como organizarlo (I)
Identificar comunidades, usuarios,
contenidos,
Quien deposita o almacena
Procedimientos:
Flujos y roles: aceptacin,
moderador/validador, revisor
Mandato
Licencias
Repositorios: Como organizarlo (II)
Metadatos, normalizacin,
Polticas de preservacin
migracin de formatos
Dominio, hosting, backup/copias de
seguridad, actualizaciones,
migraciones
No estamos solos en esto
Repositorios: Como organizarlo (III)
Diferentes implicaciones = diferentes
niveles:
Polticos
Tecnolgicos
Gestin
Se trata de una carrera de fondo:
Empezamos por un piloto? . pero .
.. De verdad que necesitamos el
repositorio?
Repositorios: Como organizarlo (IV)
Modelo centralizado nico repositorio para
todos los contenidos
Modelo diversificado:
Ajustar los modelos de metadatos.
Adaptarse a la naturaleza de los contenidos.
Trabajar las particularidades de los documentos.
Facilitar su integracin con otros sistemas de
informacin.
Adaptarlos a la organizacin de la biblioteca
Desarrollo tecnolgico mas flexible
Repositorios: Como organizarlo (y V)
Modelo centralizado:
Fcil de gestionar
Incidencias con las "excepciones"
Modelo diversificado:
Incremento en los costes de
mantenimiento.
Dispersin de contenidos y posible
confusin en la comunidad de usuarios
Conocer la organizacin la decisin es
de todas las partes
Interoperabilidad e integracin (I)
Con otros sistemas de informacin:
De la organizacin
Externos
Podemos compartir / reusar informacin
Se pueden generar nuevas aplicaciones /
utilidades
Mejoramos tareas / flujos de trabajo
Todos ponen / Todos ganan
Disponemos de estndares
No inventemos la rueda
Interoperabilidad e integracin (y II)
OAI-PMH
Dublin Core
SWORD
SOA
IMS
SCORM
.incluso el MARC
Sostenibilidad
Estamos preparados respecto a:
Crecimiento de repositorio
Infraestructura TIC
Presupuesto asignado
Personal y su gestin
Updates / Migraciones
Preservacin
Calculemos a medio / largo plazo
Soporte
Legal, TIC, Gestin ..
Modelo(s) de metadatos
Plataforma(s)
Polticas de colecciones y de acceso
Gestin usuarios roles, flujos
Interaccin con los agentes
Capacidad de respuesta (compromiso)
Infraestructura TIC
In house / externalizado
Cloud
Compartido
Atencin a los SLA (la letra pequea)
Backup
Evaluar costes.
Ms tareas
Mandato Work in progress?
Autores Estn dispuestos a colaborar?
Algn tipo de incentivo
Difusin interna / externa
Alta directorios / Google Scholar
......
de verdad que necesitamos un
repositorio?
La UPC en cifras 2010-2011 (I)
Comunidad Titulaciones
44.221 estudiantes 69 titulaciones de grado
2.780 personal docente e 19 dobles titulaciones
investigador 85 convenios
1.694 personal de internacionales de doble
administracin y titulacin
servicios 61 programas de mster
Distribuida en 46 programas de
11 campus y centros doctorado
territoriales 363 programas de
23 escuelas y facultades formacin continua
(msteres UPC y cursos
de posgrado)
13 bibliotecas
+/-100 personas
La UPC en cifras 2010-2011 (II)
Departamentos, institutos y Investigacin
centros de investigacin 64.164.414 Ingresos por
42 departamentos proyectos I+D+i y transferencia
6 institutos de investigacin tecnolgica
183 grupos de investigacin 101 Distinciones cientfico-
tcnicas recibidas
17 centros especficos de
investigacin 843 nuevos convenios y
proyectos de investigacin
19 Centros de investigacin
en la red TECNIO 2.070 artculos publicados en
revistas cientficas
19 Centros de investigacin
vinculados 78 patentes
Universidad y Empresa
2.680 empresas y entidades con convenio de colaboracin
14 empresas creadas y participadas (Programa Innova y Innova 31)
21 ctedras y aulas de empresa
La UPC en cifras 2010-2011 (y III)
13 bibliotecas
+/-120 personas
Modelo diversificado
2 TB. Contenidos
+/-64.000 documentos
Desde CRIS 9.700 documentos revisados / ao
47% personal implicado en estas tareas
En algunos casos representa el 25% de su
tarea
Repositorios en la UPC
Modelo diversificado:
2001: TDX
2002: Archivo Grfico de la ETSAB
2003: Videoteca Digital de la UPC
2004: Trabajos acadmicos
2005: Revistas y congresos
2006: E-prints
2007: OCW Materiales docentes
2010: Fondo histrico bibliotecas UPC
2011: Nuevo OCW
2012: Depsito de exmenes
Integracin
Recuperar la informacin donde se genera o
introduce por primera vez
Evitar duplicar tareas
Actualizaciones => Estndares (SWORD, OAI,
RSS, etc.)
Importancia en el crecimiento repositorio
Estndares: extraer informacin
OAI-PMH
Nuevos formatos de metadatos aadidos
Mdulo OAIExtended: sets especficos (driver,
OpenAIRE, etc.)

RSS
Ampliado para casos especficos (ItunesU,
Universia, etc.)
Estndares: Carga de datos

Simple Web-services Offering Repository Deposit


Un protocolo para depositar en repositorios entre aplicaciones
Proyecto financiado por JISC iniciado en 2007

Implementado para diversas plataformas (DSpace, Eprints, Fedora,

IntraLibrary)
Creado por encima del protocolo Atom Publishing Protocol (APP o ATOMPUB)

Dos operaciones bsicas

Servicedocument

Deposit
SWORD: formato METS (I)
Llamada HTTP en la que se enva un archivo ZIP comprimido en formato estndar
METS que contiene:
- Archivo xml con las datos del recurso (archivo mets.xml)
- Documentos propios del recurso

Memoria.pdf
Mets.xml
(datos del recurso: Annex.pdf
-Autor
-Tutor
-Titulo
-Fechas
-Palabras clave )
SWORD: formato METS (II)

Cabecera

Metadatos descriptivos en formato MODS/SWAP/etc.

Licencia Creative Commons

Lista archivos

Mapa estructural

--

--
SWORD Llamada deposit

HTTP POST
POST /deposit/123456789/18 HTTP/1.1
Host:eprints.upc.es/pfc-sword
Content-Type: application/zip
Authorization: Basic ZGFmZnk6c2VjZJldA==
Content-length: nnn
Content-MD5: md5-digest
Content-Disposition: filename=mydeposit.zip
Servidor
Cliente X-Format-Namespace: METS SWORD
UPCommons

RESP HTTP 201 CREATED


<?xmlversion="1.0" encoding="UTF-8"?>
<atom:entryxmlns:atom="http://www.w3.org/2005/At
om"xmlns:sword="http://purl.org/net/sword/">
<atom:id>info:something:1</atom:id>

</atom:entry>
Puesta en marcha

Pasos inciales
Ver las necesidades de datos a enviar
Explicacin del protocolo y formato
Preparar un entorno de desarrollo
Creacin de un wiki con informacin
sobre:
Datos necesarios para el envo del recurso
Como se mapean estas datos dentro del
formato METS
Como se envan (SWORD)
Enlaces a libreras en diferentes formatos de
programacin
Otras
No siempre existen los estndares adecuados
Debemos hacer cambios especficos para
casos concretos (solo si no hay ms
remedio)
Exportacin de bases de datos, cargas
manuales, etc.
Cambios bien documentados
Portal produccin
cientfica
BD EXPORT
DRAC
Visin General
Doctorat

Catlogo
Atenea

GD Escuelas
GD Escuelas SWORD

BD EXPORT
PRISMA

ITunesU

GD Escuelas
MediaTIC

OJS MDC
E-prints UPC

Integracin con DRAC (CRIS de la UPC)


Portal produccin cientfica UPC
Driver / OpenAIRE
Integracin DRAC
DRAC, el Descriptor de la Recerca i lActivitat
Acadmica de la UPC: http://drac.upc.edu/info
Sistema que registra la actividad acadmica de la UPC
Generacin CVN
Intervencin del SBD en la definicin del proyecto y
posterior participacin en los workflows de revisin de
datos
Integrado con UPCommons
Poltica institucional de acceso abierto: acceso, visibilidad,
impacto y preservacin de la produccin acadmica de la
UPC en Internet
Modelo de integracin
Integracin en dos fases:
1. Envo:
Introduccin metadatos bsicos en DRAC
Obligatoriedad de introducir enlace o archivo
Si se introduce archivo, se conecta a UPCommons
2. Revisin:
Revisin de metadatos bsicos en DRAC
Revisin de metadatos propios de UPCommons, validacin de
las condiciones de acceso y publicacin final

Autenticacin simultnea en ambas aplicaciones


mediante CAS
Integracin DRAC: Pasos
Integracin DRAC: Pasos

PASO 1: Carga archivo PASO 2: Aceptacin licencia


Integracin DRAC: Pasos
Integracin DRAC: Pasos
Integracin DRAC: Pasos
Portal Produccin cientfica
Portal de la Produccin cientfica de la UPC
http://bibliotecnica.upc.edu/producciocientifica
Portal Produccin cientfica
Evolucin E-prints UPC

10000

9000

8000
Antes de DRAC
7000 2262 reg. (4 aos)

6000
Con DRAC
5000
4214 reg. en abierto (2 aos)
4000 2804 reg. acceso restringido (2
aos)
3000

2000
Drac restringido
1000 Drac abierto
Envo directo

0
5-11

6-04

6-09

7-01

7-05

7-09

8-01

8-05

8-09

9-01

9-05

9-09

0-01

0-05

0-09

1-01

1-05

1-09
200

200

200

200

200

200

200

200

200

200

200

200

201

201

201

201

201

201
Trabajos acadmicos UPC

Envo de los PFC/TFC desde las aplicaciones de


gestin de las escuelas
Proceso de carga de registros al catlogo
Envo de PFC/TFC
Diferentes escuelas disponen de aplicaciones
para la gestin de las lectura de PFC/TFC
Recogen los archivos del proyecto y metadatos
necesarios
Nos envan a travs de SWORD
De momento 4 escuelas => en proyecto
hacerlo con todas a travs de la E-
administracin
Envo de registro al catlogo
Evitar catalogar los trabajos dos veces
Carga semanal de registros del repositorio al
catlogo
Exportacin de registro MARCXML mediante
OAI
Ms en el Pecha Kucha de maana!
Revistas y Congresos UPC

Envo de nmeros de revistas desde OJS


Exportacin/importacin con RACO (Revistes
Catalanes amb Acces Obert)
OJS (I)
Proyecto de IDP: Servici de publicaciones de
la UPC
Soporte al sistema de revisin de revistas
editadas en la UPC
Gestin y asignacin de DOI
OJS (II)

SWORD
OJS SWAP
UPCommons
OAI-PMH Revistas y Congresos
PAM MESSAGE
R
E
G
I
S
T
R
O
Resolucin DOI

DOI
Videoteca UPC

Mediatic
ItunesU
Mediatic

Proyecto de colaboracin entre Servicio


informticos del Campus de Terrassa y la
Biblioteca del Campus de Terrassa
Envo a travs de SWORD
ItunesU UPC
Videoteca UPC posible
fuente de contenido
Adaptacin del RSS para
hacerlo compatible con
ItunesU (soportado en
las ltimas versiones de
DSpace)
OCW y Exmenes UPC

Desarrollados con Drupal


IDP: Servicio de publicaciones de la UPC
Integraciones
Integracin con Sistema de Gestin Acadmica (PRISMA): extracciones de
tablas de la base de datos
RSS Universia, MDX y OCW Consortium
Campus Virtual
PRISMA
Informacin sobre asignaturas, plan docente
. mediante importacin de base de datos
Va SOA, PRISMA captura datos bibliogrficos
del catlogo de documentos recomendados
en la gua docente
Re-uso de esos datos bibliogrficos en el OCW
Futuro
Trabajar en el envo de Tesis
Exportacin de registros de fondo Antiguo a
Memoria Digital de Catalunya
Aplicar el modelo de carga de PFC SWORD a
ms escuelas (proyecto de e-administracin)
Exportacin al catlogo con otros repositorios
Datos?
Muchas gracias por la atencin!

Seguimos en el Pecha Kucha ;-)

También podría gustarte