Documentos de Académico
Documentos de Profesional
Documentos de Cultura
un repositorio institucional
Antonio Juan Prieto Jimnez
Jordi Serrano-Muoz
Universitat Politcnica de Catalunya
Quines somos?
Sumario
Razn de ser La UPC en cifras
Biblioteca? Repositorios en la UPC
Agentes
Empezamos?
Check-list
Como organizarlo
Interoperabilidad e
integracin
Sostenibilidad
Soporte
Infraestructura TIC
Mas tareas
Repositorios: Razn de ser (I)
Ofrecer a nuestra comunidad una herramienta o
aplicacin para publicar sus trabajos acadmicos,
en acceso abierto y en texto completo en Internet
Garantizar el acceso perpetuo a los trabajos
archivados mediante su almacenamiento en
servidores seguros mantenidos y gestionados por
la Biblioteca?
Mejorar la visibilidad de la organizacin y sus
autores en la red.
Repositorios: Razn de ser (II)
De verdad necesitamos crear, gestionar y
mantener un repositorio?
Analicemos las implicaciones:
Est la organizacin madura?
Dimensiones
Capacidades
Recursos: personas, infraestructura,
econmicos, .
Repositorios: Razn de ser (y III)
No lo necesitamos:
Esperamos la oportunidad
Creamos las condiciones
Preparamos el terreno
No hacemos nada
Si lo necesitamos
Podemos hacerlo?
Lo tenemos claro
Alianzas / Colaboraciones
Repositorios: Biblioteca? (I)
La implementacin, gestin,
organizacin no es solo una
responsabilidad de la biblioteca
Es de toda la institucin
Requiere un compromiso institucional
Si no hay compromiso. Para que
queremos un repositorio?
Repositorios: Biblioteca? (y II)
Fuente:
JISC: Planning Checklist - Before You Start
Repositories Support Project
Repositorios: Como organizarlo (I)
Identificar comunidades, usuarios,
contenidos,
Quien deposita o almacena
Procedimientos:
Flujos y roles: aceptacin,
moderador/validador, revisor
Mandato
Licencias
Repositorios: Como organizarlo (II)
Metadatos, normalizacin,
Polticas de preservacin
migracin de formatos
Dominio, hosting, backup/copias de
seguridad, actualizaciones,
migraciones
No estamos solos en esto
Repositorios: Como organizarlo (III)
Diferentes implicaciones = diferentes
niveles:
Polticos
Tecnolgicos
Gestin
Se trata de una carrera de fondo:
Empezamos por un piloto? . pero .
.. De verdad que necesitamos el
repositorio?
Repositorios: Como organizarlo (IV)
Modelo centralizado nico repositorio para
todos los contenidos
Modelo diversificado:
Ajustar los modelos de metadatos.
Adaptarse a la naturaleza de los contenidos.
Trabajar las particularidades de los documentos.
Facilitar su integracin con otros sistemas de
informacin.
Adaptarlos a la organizacin de la biblioteca
Desarrollo tecnolgico mas flexible
Repositorios: Como organizarlo (y V)
Modelo centralizado:
Fcil de gestionar
Incidencias con las "excepciones"
Modelo diversificado:
Incremento en los costes de
mantenimiento.
Dispersin de contenidos y posible
confusin en la comunidad de usuarios
Conocer la organizacin la decisin es
de todas las partes
Interoperabilidad e integracin (I)
Con otros sistemas de informacin:
De la organizacin
Externos
Podemos compartir / reusar informacin
Se pueden generar nuevas aplicaciones /
utilidades
Mejoramos tareas / flujos de trabajo
Todos ponen / Todos ganan
Disponemos de estndares
No inventemos la rueda
Interoperabilidad e integracin (y II)
OAI-PMH
Dublin Core
SWORD
SOA
IMS
SCORM
.incluso el MARC
Sostenibilidad
Estamos preparados respecto a:
Crecimiento de repositorio
Infraestructura TIC
Presupuesto asignado
Personal y su gestin
Updates / Migraciones
Preservacin
Calculemos a medio / largo plazo
Soporte
Legal, TIC, Gestin ..
Modelo(s) de metadatos
Plataforma(s)
Polticas de colecciones y de acceso
Gestin usuarios roles, flujos
Interaccin con los agentes
Capacidad de respuesta (compromiso)
Infraestructura TIC
In house / externalizado
Cloud
Compartido
Atencin a los SLA (la letra pequea)
Backup
Evaluar costes.
Ms tareas
Mandato Work in progress?
Autores Estn dispuestos a colaborar?
Algn tipo de incentivo
Difusin interna / externa
Alta directorios / Google Scholar
......
de verdad que necesitamos un
repositorio?
La UPC en cifras 2010-2011 (I)
Comunidad Titulaciones
44.221 estudiantes 69 titulaciones de grado
2.780 personal docente e 19 dobles titulaciones
investigador 85 convenios
1.694 personal de internacionales de doble
administracin y titulacin
servicios 61 programas de mster
Distribuida en 46 programas de
11 campus y centros doctorado
territoriales 363 programas de
23 escuelas y facultades formacin continua
(msteres UPC y cursos
de posgrado)
13 bibliotecas
+/-100 personas
La UPC en cifras 2010-2011 (II)
Departamentos, institutos y Investigacin
centros de investigacin 64.164.414 Ingresos por
42 departamentos proyectos I+D+i y transferencia
6 institutos de investigacin tecnolgica
183 grupos de investigacin 101 Distinciones cientfico-
tcnicas recibidas
17 centros especficos de
investigacin 843 nuevos convenios y
proyectos de investigacin
19 Centros de investigacin
en la red TECNIO 2.070 artculos publicados en
revistas cientficas
19 Centros de investigacin
vinculados 78 patentes
Universidad y Empresa
2.680 empresas y entidades con convenio de colaboracin
14 empresas creadas y participadas (Programa Innova y Innova 31)
21 ctedras y aulas de empresa
La UPC en cifras 2010-2011 (y III)
13 bibliotecas
+/-120 personas
Modelo diversificado
2 TB. Contenidos
+/-64.000 documentos
Desde CRIS 9.700 documentos revisados / ao
47% personal implicado en estas tareas
En algunos casos representa el 25% de su
tarea
Repositorios en la UPC
Modelo diversificado:
2001: TDX
2002: Archivo Grfico de la ETSAB
2003: Videoteca Digital de la UPC
2004: Trabajos acadmicos
2005: Revistas y congresos
2006: E-prints
2007: OCW Materiales docentes
2010: Fondo histrico bibliotecas UPC
2011: Nuevo OCW
2012: Depsito de exmenes
Integracin
Recuperar la informacin donde se genera o
introduce por primera vez
Evitar duplicar tareas
Actualizaciones => Estndares (SWORD, OAI,
RSS, etc.)
Importancia en el crecimiento repositorio
Estndares: extraer informacin
OAI-PMH
Nuevos formatos de metadatos aadidos
Mdulo OAIExtended: sets especficos (driver,
OpenAIRE, etc.)
RSS
Ampliado para casos especficos (ItunesU,
Universia, etc.)
Estndares: Carga de datos
IntraLibrary)
Creado por encima del protocolo Atom Publishing Protocol (APP o ATOMPUB)
Servicedocument
Deposit
SWORD: formato METS (I)
Llamada HTTP en la que se enva un archivo ZIP comprimido en formato estndar
METS que contiene:
- Archivo xml con las datos del recurso (archivo mets.xml)
- Documentos propios del recurso
Memoria.pdf
Mets.xml
(datos del recurso: Annex.pdf
-Autor
-Tutor
-Titulo
-Fechas
-Palabras clave )
SWORD: formato METS (II)
Cabecera
Lista archivos
Mapa estructural
--
--
SWORD Llamada deposit
HTTP POST
POST /deposit/123456789/18 HTTP/1.1
Host:eprints.upc.es/pfc-sword
Content-Type: application/zip
Authorization: Basic ZGFmZnk6c2VjZJldA==
Content-length: nnn
Content-MD5: md5-digest
Content-Disposition: filename=mydeposit.zip
Servidor
Cliente X-Format-Namespace: METS SWORD
UPCommons
Pasos inciales
Ver las necesidades de datos a enviar
Explicacin del protocolo y formato
Preparar un entorno de desarrollo
Creacin de un wiki con informacin
sobre:
Datos necesarios para el envo del recurso
Como se mapean estas datos dentro del
formato METS
Como se envan (SWORD)
Enlaces a libreras en diferentes formatos de
programacin
Otras
No siempre existen los estndares adecuados
Debemos hacer cambios especficos para
casos concretos (solo si no hay ms
remedio)
Exportacin de bases de datos, cargas
manuales, etc.
Cambios bien documentados
Portal produccin
cientfica
BD EXPORT
DRAC
Visin General
Doctorat
Catlogo
Atenea
GD Escuelas
GD Escuelas SWORD
BD EXPORT
PRISMA
ITunesU
GD Escuelas
MediaTIC
OJS MDC
E-prints UPC
10000
9000
8000
Antes de DRAC
7000 2262 reg. (4 aos)
6000
Con DRAC
5000
4214 reg. en abierto (2 aos)
4000 2804 reg. acceso restringido (2
aos)
3000
2000
Drac restringido
1000 Drac abierto
Envo directo
0
5-11
6-04
6-09
7-01
7-05
7-09
8-01
8-05
8-09
9-01
9-05
9-09
0-01
0-05
0-09
1-01
1-05
1-09
200
200
200
200
200
200
200
200
200
200
200
200
201
201
201
201
201
201
Trabajos acadmicos UPC
SWORD
OJS SWAP
UPCommons
OAI-PMH Revistas y Congresos
PAM MESSAGE
R
E
G
I
S
T
R
O
Resolucin DOI
DOI
Videoteca UPC
Mediatic
ItunesU
Mediatic