Está en la página 1de 10

Open data y Linked open data: su impacto en el

rea de bibliotecas y documentacin

Fernanda Peset, Antonia Ferrer-Sapena e Imma Subirats-Coll

Fernanda Peset es licenciada en geografa e historia (1990) y doctora en documentacin (2002).


Profesionalmente viene del mundo de las unidades de informacin y desde 1997 es profesora
titular de la Universidad Politcnica de Valencia. Su trabajo y publicaciones se orientan a la co-
municacin cientfica, acceso abierto e implantacin del protocolo OAI-PMH, normalizacin de la
informacin, descripcin de documentos, sistemas de documentacin de museos, etc. Es respon-
sable del Posgrado Oficial Industrias Culturales y de la Comunicacin. Participa en proyectos como
IraLIS, E-LIS y el Grupo Ciepi.
Universidad Politcnica de Valencia
Camino de Vera, s/n. 46022 Valencia
mpesetm@upv.es

Antonia Ferrer-Sapena, licenciada en geografa e historia en la especialidad de historia contem-


pornea por la Universidad de Valencia y doctora en tcnicas y mtodos actuales en informacin
y documentacin, es profesora titular de la Universidad Politcnica de Valencia (UPV) y coordina-
dora de investigacin en Florida Universitaria. Ha coordinado numerosos proyectos nacionales
e internacionales. De los ltimos proyectos dirigidos cabe destacar el portal de economa social
EcSocial (http://www.ecsocial.com) y la Biblioteca Digital del Cooperativismo Valenciano (http://
www.focoop.es).
Depto. de Comunicacin Audiovisual, Documentacin e Historia del Arte, UPV
Camino de Vera, s/n. 46022 Valencia
anfersa@upv.es

Imma Subirats-Coll es especialista en gestin de la informacin en la Food and Agriculture Orga-


nization (FAO) de la ONU desde 2006. Antes trabaj en el Gobierno de Catalunya en Barcelona.
Estudi historia y ciencias de la informacin en la Universidad de Barcelona. Participa activamente
en la promocin del acceso abierto en las ciencias agrcolas y afines, especialmente a travs de la
red Ciard, asegurando la calidad de los contenidos publicados en repositorios de documentos a
travs de la aplicacin de estndares de metadatos y vocabularios. Participa y es co-fundadora de
proyectos como E-LIS, el Grupo Ciepi e IraLIS.
Food and Agriculture Organization (FAO)
Viale delle Terme di Caracalla, 00153 Roma, Italia
imma.subirats@gmail.com

Resumen
Se da cuenta de los primeros pasos de las iniciativas Open data y Linked open data como generadoras de innovacin en el sector
de la gestin de la informacin. Tal y como supusieron los movimientos Open access (OA) y Open archives initiative (OAI) hace
unos aos, estas dos iniciativas constituirn un revulsivo que potenciar la innovacin tecnolgica y la estructura de la Web.
Nuestro trabajo presenta el panorama mundial de Open data, as como los proyectos nacionales relacionados con los datos de
los gobiernos. Cuatro administraciones espaolas han comenzado ya a liberar sus datos, por orden cronolgico: Asturias, Euska-
di, Catalua y el Ayuntamiento de Zaragoza. En el caso de Linked open data se ofrece tambin el panorama mundial, con 203 pro-
yectos registrados. Describimos con ms profundidad el trabajo que el W3C est llevando a cabo en el mbito de las bibliotecas.
Por ltimo se presentan las implicaciones que pueden suponer estos nuevos avances para nuestro sector, la documentacin.

Palabras clave
Linked open data, Open data, Open government, Library Linked Data Incubator Group, Datos abiertos, Web semntica,
Datos enlazados.

Title: Linked open data and Open data. Its impact in the field of libraries and information science

Abstract
We show the first steps of the initiatives Open data and Linked open data as sources of innovation in the field of information
management. As the Open Access movement (OA) and the Open Archives Initiative (OAI) implied some years ago, these two
Artculo recibido el 15-02-11
Aceptacin definitiva: 07-03-11

El profesional de la informacin, 2011, marzo-abril, v. 20, n. 2 165

Revista EPI v.20 n.2.indd 165 16/03/2011 18:41:48


Fernanda Peset, Antonia Ferrer-Sapena e Imma Subirats-Coll

initiatives constitute a shock that reverberated in technological innovation and the structure of the Web. We present a glo-
bal overview of open data and national projects related to government data. Four Spanish local or regional administrations
have already begun to release their data: in chronological order, Asturias, Euskadi, Zaragoza and Catalonia. In the case of
Linked open data we also provide a global picture, with 203 registered projects. We describe in more detail the work that
the W3C is currently carrying out in the field of libraries. Finally we present the consecuences these new developments can
have for librarianship and information science.

Keywords
Linked open data, Open data, Open government, Library Incubator Group Linked Data, Semantic web.

Peset, Fernanda; Ferrer-Sapena, Antonia; Subirats-Coll, Imma. Open data y Linked open data: su impacto en el rea de
bibliotecas y documentacin. El profesional de la informacin, 2011, marzo-abril, v. 20, n. 2, pp. 165-173.
DOI: 10.3145/epi.2011.mar.06

Introduccin: contexto y definiciones El sector de la documentacin no se define, sin embargo,


por desarrollar productos y servicios. Ms bien trabaja con
El trmino acceso abierto hasta ahora, en el mundo de la in- normalidad con protocolos estandarizados para gestionar
formacin y las bibliotecas, se ha aplicado mayoritariamente sus fondos, por lo que a esta comunidad le resultara fcil
a la promocin del acceso a la documentacin cientfica. Pero participar con sus contenidos en la web semntica a travs
hoy da est yendo ms all y se habla del acceso abierto a del uso de Linked data para publicar sus datos. Este concep-
los datos, refirindose especficamente a la preparacin y ex- to tiene una vertiente tcnica, relacionada con la descrip-
posicin de contenidos usables y reutilizables para la web se- cin de datos estructurados y su publicacin en la web para
mntica. Los dos conceptos clave son Open data (OD) y Linked que puedan estar interconectados y ser ms tiles (Bizer;
data o Linked open data (LOD), traducible al espaol como Heath; Berners-Lee, 2007). Las bibliotecas constituyen un
datos abiertos vinculados (o enlazados). Ambos se derivan gran potencial de datos de calidad y fiables, en el sentido
de las declaraciones del creador de la web, Tim Berners-Lee utilizado por Hannemann y Kett (2010) para establecer los
(2006), asesor del gobierno britnico. Y adems el segundo diferentes niveles de confianza y persistencia de los datos;
se relaciona con la familia de estndares del W3Consortium pero hasta ahora slo los han producido y compartido en
(2010) para la construccin de la web semntica. su propio medio, con poco contacto con otros colectivos. La
OD es un movimiento que promueve la liberacin de datos, oportunidad de participar en la web semntica puede abrir
generalmente no textuales y en formatos reutilizables como las puertas de nuestra comunidad al mundo web o hace-
CSV (comma separated values), procedentes de organiza- mos perder el tren de las tendencias mundiales.
ciones; el segundo se refiere a la exposicin de esos u otros
datos en la web, descritos en RDF (resource description fra-
mework) y con indicacin de la relacin que puede existir La diferencia entre la web del hipertexto
entre esos datos y otros. Los datos liberados pueden ser de y la web semntica es que mientras una
cualquier temtica: geogrficos, meteorolgicos, cientfi- vincula pginas o documentos en html,
cos, de trfico, y fue el gobierno britnico quien comenz la segunda enlaza datos estructurados
a hacerlo con su Opening up Government (2010). Adems el
30 de septiembre de 2010 cre una licencia para su reuti-
lizacin: Open government licence (2010). Por su parte, la Principios bsicos del LOD
Unin Europea hace aos ya haba comenzado a interesarse
La principal diferencia entre la web del hipertexto y la web
por la reutilizacin de los datos, como muestra su Directiva
semntica es que mientras la primera vincula pginas o
sobre estos aspectos en el sector pblico (2003).
documentos en html, la segunda aboga por ir ms all del
Si bien los conceptos son diferentes entre s, la filosofa OD concepto documento y enlaza datos estructurados. En 2006
engloba LOD, que puede aportar gran cantidad de conte- Berners-Lee defini cuatro reglas para la publicacin de
nidos de inters en la web semntica. El movimiento Open Linked data:
government se est convirtiendo en una iniciativa ciudada-
1. usar URIs (uniform resource identifiers) identificando los
na que aboga por la transparencia de la administracin e
recursos de forma unvoca;
incluso tiene derivaciones en temas de alcance social como
el debate sobre Wikileaks o la liberacin forzada de datos 2. usar URIs http para que la gente pueda acceder a la infor-
pblicos (Belanche, 2009). macin del recurso;
En todo caso los resultados de este movimiento depende- 3. ofrecer informacin sobre los recursos usando RDF;
rn del tipo de datos que se liberen, y tambin de cmo se
4. incluir enlaces a otros URIs, facilitando el vnculo entre
analicen o combinen (Alonso, 2009). Las posibilidades de
distintos datos distribuidos en la web.
innovacin que se abren no tienen lmites, pero necesitan
nuevos proyectos que pongan en valor estos datos as como Estos principios estn definidos como reglas, pero en reali-
otras formas de visualizacin que estn por explorar. dad son ms bien recomendaciones o buenas prcticas para

166 El profesional de la informacin, 2011, marzo-abril, v. 20, n. 2

Revista EPI v.20 n.2.indd 166 16/03/2011 18:41:48


Open data y Linked open data: su impacto en el rea de bibliotecas y documentacin

el desarrollo de la web semntica. Es posible publicar datos Public sector information (PSI), que recopila los paquetes de
que cumplan slo los tres primeros principios, pero el he- datos que liberan las administraciones.
cho de no aplicar el cuarto los convierte en menos visibles y,
En Espaa cabe citar las siguientes aplicaciones creadas, se-
como consecuencia, menos reutilizables.
gn el proyecto Aporta:
RDF es el marco de descripcin de recursos para metadatos
mapa de predicciones meteorolgicas del Portal de datos
en la Web elaborado por el W3C (Mndez, 1999). Se basa
abiertos de la Generalitat de Catalua;
en la idea de declarar recursos usando la expresin en la
mapa de incidencias de trfico de Open data Euskadi, que
forma sujeto-predicado-objeto. Esta expresin es conocida
incluye consejos para la reutilizacin de los datos y el m-
en la terminologa RDF como triple o triplete. Un triplete
todo seguido;
RDF contiene tres componentes, todos con referencia en un
callejero del Portal de Datos Abiertos de Gijn;
URI:
planificador de visitas del portal de Datos Abiertos de Za-
sujeto, una referencia URI, una persona, o un nodo, es el ragoza, realizada con Dnde (en) Zaragoza DND zgz, apli-
ente al cual nos referimos; cacin desarrollada para mviles.
predicado es la propiedad o relacin que se desea esta-
Algunas acciones de referencia en Espaa son el concurso
blecer acerca del sujeto;
Desafo AbreDatos 2010 para creacin de APIs (application
objeto es el valor de la propiedad o del otro recurso con el
programming interface), los cursos de MediaLab Prado de
que se establece la relacin.
visualizacin de informacin, el trabajo de la Fundacin CTIC
y el proyecto Aporta financiado por el plan Avanza del Mi-
nisterio de Industria, Turismo y Comercio (Micyt).
Como acciones de referencia a escala mundial (Mazzo,
2010) encontramos:

Figura 1. Representacin grfica de un triplete,


http://www.w3.org/TR/rdf-concepts
Open Knowledge Foundation, iniciativa europea para gene-
rar nuevo conocimiento mediante el tratamiento de datos
El hecho de utilizar URIs para enlazar los datos convierte la
liberados o disponibles en la web. Lidera varios proyectos
web semntica en una especie de gran base de datos que
como The open definition, que sienta las bases tericas;
permite que las personas y las mquinas puedan explorar
Data commons que ofrece soluciones legales; o CKAN, que
la informacin referenciada e interconectada entre s en la
registra los conjuntos de datos y los proyectos de open
Web, lo que al mismo tiempo fomenta su crecimiento.
knowledge para facilitar que se encuentren y se usen. Whe-
El uso de LOD permite publicar informacin migrada des- re does my money go? es un desarrollo de gran xito, con
de diferentes fuentes en las que se encuentra almacenada, informacin sobre el destino de los impuestos britnicos, y
como por ejemplo bases de datos, ficheros, hojas de clcu- KForge ofrece las utilidades que son utilizadas en ocasiones
lo..., siempre usando el lenguaje RDF, para permitir enlazarla para sus propios proyectos construidos sobre conocimiento
con otros datos, de forma que aumente la conectividad en- abierto.
tre la informacin y se facilite as la recuperacin y la agre-
gacin de informacin relacionada (Bizer; Cyganiak; Heath,
2007). La web basada en LOD es un avance en la sindicacin
de contenidos, que utiliza fuentes externas de datos para
crear nuevos servicios.
Open Data Foundation, norteamericana, lleva a cabo pro-
La web basada en LOD es un avance en yectos con datos estadsticos con la intencin de crear es-
la sindicacin de contenidos, que utili- tndares vlidos para el tratamiento de este tipo de infor-
macin.
za fuentes externas de datos para crear
nuevos servicios

Situacin actual
Los recursos disponibles en Open data estn experimentan-
El W3C contribuye en este movimiento con un grupo sobre
do un enorme crecimiento por diferentes sectores (Domn-
eGovernment
guez, 2010). La delantera en este campo la llevan el Reino
Unido y EUA. Para conocer el avance de las fuentes de datos En cuanto a Linked open data, desde 2007 el nmero de
en todo el mundo podemos consultar el proyecto europeo paquetes de datos estructurados se ha incrementado es-

El profesional de la informacin, 2011, marzo-abril, v. 20, n. 2 167

Revista EPI v.20 n.2.indd 167 16/03/2011 18:41:50


Fernanda Peset, Antonia Ferrer-Sapena e Imma Subirats-Coll

pectacularmente. Las figuras 2 y 3 representan esta evolu- aunque sin parar de aumentar la cantidad de paquetes de
cin (Cyganiak; Jentzsch, 2007-2010). DBpedia es una de datos que apuntan a DBpedia y al resto de ncleos de flujo;
las principales fuentes de datos que la comunidad usa para 4) el ltimo diagrama muestra ya los datos clasificados por
aplicar el cuarto principio LOD, y se sita como eje funda- familias, siendo la ms numerosa Publicaciones y la menos,
mental de este proceso. los Contenidos generados por los usuarios.
Con slo la observacin de las figuras 2 y 3, y cuatro aos de En estos momentos no contamos con estudios sobre los m-
historia, se constata: 1) la rpida extensin de la iniciativa; todos que pueden utilizarse para analizar este fenmeno.
2) la importancia de los proyectos adheridos (por citar algu- Los diagramas incluidos en este trabajo se han generado
no, el censo de poblacin norteamericana); 3) la progresiva sobre registros del CKAN, si bien estamos convencidos de
madurez del sistema, que evoluciona desde la centralidad que se abrirn lneas de investigacin en este sentido con el
de una estrella DBpedia en 2007, junto a FOAF y RDF book objetivo de refinar los mtodos de anlisis.
mashup a la explosin de otros proyectos que se convier-
Sin entrar todava en el mundo de las bibliotecas, obser-
ten en nodos centrales de desarrollos colaterales en 2009,
vamos que existen ya grandes depsitos de datos estruc-
turados en RDF y listos para ser utilizados por cualquier
servicio. Para conocer qu recursos de informacin han
sido publicados siguiendo los cuatro principios del Linked
data se debe acceder al registro Datasets in the next LOD

Figura 2. Diagrama de la Linking data cloud en 2007 Figura 4. Nube de etiquetas de los 1.672 paquetes de datos registrados en
http://lod-cloud.net CKAN (febrero de 2011), http://ckan.net

Figura 3. Diagrama de la Linking data cloud en 2010, http://richard.cyganiak.de/2007/10/lod/lod-datasets_2010-09-22_colored.html

168 El profesional de la informacin, 2011, marzo-abril, v. 20, n. 2

Revista EPI v.20 n.2.indd 168 16/03/2011 18:41:54


Open data y Linked open data: su impacto en el rea de bibliotecas y documentacin

Linked Data Incubator Group (LLD-XG)


tiene como misin analizar la situacin
de los modelos y esquemas de meta-
datos y los estndares y protocolos de
interoperabilidad que se deberan usar
para la publicacin y uso de LOD con
datos de bibliotecas. A su vez anima a
la comunidad bibliotecaria a publicar
sus registros bibliogrficos y control de
autoridades como Linked data.
El LLD-XG considera las bibliotecas
como un proveedor de contenidos con
gran potencial. El origen de esta for-
taleza se encuentra obviamente en la
informacin bibliogrfica de tipo refe-
rencial, que se genera mediante nor-
mativas consolidadas que aseguran su
calidad, capacidad de compartir y sos-
tenibilidad. Adems trabajan con voca-
bularios controlados y con ficheros nor-
malizados de autoridades nombres
de persona, entidades, etc., lo que re-
sulta de gran utilidad para enriquecer
otros datos y para favorecer el correcto
desarrollo de la web semntica.
En septiembre 2010 el LLD-XG solicit
estudios de casos, entendidos como
iniciativas de divulgacin y difusin di-
Figuras 5 y 6. Aplicacin realizada mediante tweets (http://rodalia.info/es) (arriba) que Manel Garca
reutiliza junto con otras fuentes para crear una web para iPhone en http://r.odali.es (abajo) rigidas a la comunidad bibliotecaria y
los sectores afines. Durante la primera
cloud, mantenido desde la Freie Universitt Berlin, pues el reunin en noviembre 2010 los casos recibidos se agrupa-
registro CKAN hace referencia a Open data en general. A ron en seis temas:
fecha de hoy Datasets contiene 203 elementos, con ms
de 25.000.000.000 triples RDF totales y mencin a sus out- Datos bibliogrficos
links (enlaces salientes) y sus inlinks (enlaces entrantes). Listas de autoridades
Entre ellos destacan: DBPedia (se sita en el 7 puesto en Vocabularios
datasets, en el 5 por outlinks y en el 11 por sus inlinks); la Archivos y datos heterogneos
migracin de la BBC (12 en inlinks); as tambin incluye el Citas
proyecto Genoma, el conocido proyecto Gutenberg, la ofi- Objetos digitales
cina Eurostat, el censo norteamericano (4 en datasets ) o Colecciones
PubMed (8 en datasets). Usos sociales

Todava hay pocos grupos espaoles trabajando en esto, y La participacin espaola fue escasa. Adems del caso pre-
por lo tanto pocos contenidos disponibles en la Web. Pero sentado por Ciepi (IraLIS-International Registry for Authors),
estn ya convertidos a RDF y son referente ciertas bases de
datos de la Universidad Politcnica de Madrid y algn otro
ejemplo, como http://rodalia.info/es que ofrece tweets cla-
sificados sobre incidencias en los trenes Renfe de cercanas
catalanes, que se reutilizan en http://r.odali.es. Tambin hay
que citar los trabajos de la Asociacin Espaola de Linked
Data (Aelid), y del Ontology Engineering Group (OEG) de la
UPM y su proyecto GeoLinked data.

Iniciativas relacionadas con bibliotecas


A escala internacional, el W3C identific la comunidad bi-
bliotecaria como uno de sus focos de inters y a travs de
sus Incubator groups grupos dinmicos que se utilizan
para detectar nuevos nichos de actuacin, cre en mayo
de 2010 uno orientado a la publicacin de datos estructu- Figura 7. Normativas en bibliotecas identificadas por el LLD-XG
rados en Linked data procedentes de bibliotecas. El Library http://www.w3.org/2005/Incubator/lld/wiki/File:LayeredModelV3.pdf

El profesional de la informacin, 2011, marzo-abril, v. 20, n. 2 169

Revista EPI v.20 n.2.indd 169 16/03/2011 18:41:56


Fernanda Peset, Antonia Ferrer-Sapena e Imma Subirats-Coll

estuvo la Biblioteca Virtual Ignacio Larramendi-Coleccin de


polgrafos y el grupo de vocabularios de la Fundacin Botn,
con la Ontologa cultural de Cantabria, asociadas al trabajo
de Agenjo-Bulln y Hernndez-Carrascal (2010), de Larra-
mendi-Digibis.
Como muestra de la influencia que va a tener el informe
final de LLD-XG sealamos que otros casos de estudio los
presentaron la Bibliothque nationale de France (BnF), Vir-
tual International Authority File (VIAF), la Deutsche Natio-
nalbibliothek (DNB), el tesaurus Agrovoc, la base de datos
Agris, y Europeana, que ha comenzado a migrar los catlo-
gos multimedia de museos y bibliotecas.
En mayo 2011 el LLD-XG publicar un informe con los resul-
tados del estudio de la situacin que deber de servir como
punto de referencia para que la comunidad de bibliotecarios
comience a participar en la web semntica no slo como
usuaria sino como productora de datos.
Estrechamente relacionada con los objetivos de LLD-XG
pero ampliada a museos y archivos, se ha convocado una
cumbre en San Francisco para el 2-3 de junio de 2011 con
la intencin de reunir representantes clave de sectores del
mundo de las bibliotecas, archivos y museos y debatir las
posibilidades en estas comunidades, al que asistir Ciepi.
Los temas a tratar, de indudable inters, son:

herramientas y tcnicas para publicar y trabajar con Linked


open data;
polticas de licencias y copyright;
publicacin de metadatos de bibliotecas, archivos y mu-
seos;
publicacin de la terminologa y promocin de los casos
de uso presentados en octubre;
promocin de LOD en las instituciones.
Como conjuntos de metadatos ya implementados en la co-
munidad bibliotecaria destacamos tres proyectos: las auto-
ridades y vocabularios de la Library of Congress (EUA); el
servicio LOD de la Deutsche Nationalbibliothek (DNB); y Li-
bris, el trabajo realizado en el catlogo colectivo de Suecia.

Library of Congress. Authorities and vocabularies


Como parte de sus investigaciones para agregar valor e
innovar en nuevos mtodos de distribucin de la informa-
cin, la Library of Congress ha expuesto sus vocabularios
y listas de autoridades en la Web. La ms conocida es su
lista de materias LCSH, pero tambin ofrece otros recur-
sos sobre lenguajes (ISO 639-1, 639-2 y 639-5 y la Lista Figuras 8 y 9. Presentaciones textual y grfica para el trmino Library
administrators, http://id.loc.gov/authorities/sh85076660
MARC), sobre reas geogrficas (MARC List for geographic
areas) o el tesauro para materiales grficos (Thesaurus of
graphic materials). En este sentido, no queremos dejar de mencionar nues-
La asignacin de URIs a los valores de sus vocabularios tro propio trabajo en la conversin a SKOS de JITA-Classi-
permite aumentar su utilizacin para otros fines, con una fication schema of library and information science, utili-
poltica clara sobre su reutilizacin, tanto de los valores zada en el repositorio E-prints in Library and Information
individuales como de los vocabularios enteros. Lo que Science (E-LIS). Fue convertido a SKOS recientemente a
hace es proporcionar una interfaz web para la bsque- instancias de Christophe Dupriez y publicado en el Vo-
da humana, pero esta conversin permite adems que cBench, herramienta de la FAO para la gestin de voca-
cuando las mquinas solicitan la URI de un descriptor se bularios controlados. Contamos con varias traducciones
carguen datos referentes a otros modelos de descripcin hechas por el equipo internacional de editores de E-LIS
como SKOS o JSON, enlaces a otros vocabularios, como y esperamos inscribirlo como conjunto de datos en el re-
puede verse en el ejemplo de las figuras 8 y 9. gistro CKAN.

170 El profesional de la informacin, 2011, marzo-abril, v. 20, n. 2

Revista EPI v.20 n.2.indd 170 16/03/2011 18:41:56


Open data y Linked open data: su impacto en el rea de bibliotecas y documentacin

Linked data service de la Bi-


blioteca Nacional de Alema-
nia
Por su parte, el Linked data
service de la Deutsche Natio-
nalbibliothek tiene la inten-
cin de exponer todos sus
datos bibliogrficos y de au-
toridades, sin perder de vista
a medio plazo la necesidad
de clarificar en qu trminos
se ofrece el uso de sus datos
a servicios comerciales web.
Este enfoque, liderado por
Hannemann, es novedoso en
la comunidad bibliotecaria y
est basado en las lecciones
aprendidas y reflexiones que
se suscitaron durante la pues-
ta en marcha del servicio.
Desde esta institucin se ha Figura 10. Ejemplo de RDF/XML para JITA
acometido un proyecto rea-
lista, limitado a 3,5 millones de datos sobre autoridades ontologas y esquemas de datos a utilizar por entidades
(vocabularios-personas-entidades) con el objeto de sen- que ya intercambian datos masivamente con otros forma-
tar las bases para posteriores retos. Conecta sus datos tos;
con fuentes externas como la Wikipedia alemana y DB- acuerdos legales y licencias para permitir la utilizacin de
pedia, VIAF, LCSH o Rameau (de la Bibliothque nationale estos datos; y en general,
de France). Y utiliza como esquema de datos principal el falta de documentacin detallada sobre los procedimien-
propuesto en RDA (resource description and access). tos a seguir.
Esta experiencia ha sacado a la luz otros aspectos que
Existe un proyecto que quiere facilitar la publicacin de
hasta ahora estaban oscurecidos por la concentracin de
Linked data por parte de las bibliotecas y especialmente ha-
los esfuerzos en las cuestiones tcnicas, que abordaremos
cer hincapi en la toma de decisiones en lo que respecta la
sucintamente en el siguiente apartado.
codificacin de los datos. Aunque est orientado al sector
Libris, catlogo colectivo sueco de la agricultura, Virtual open access in agriculture and ac-
El proyecto sueco constituye una aproximacin pragm- quaculture repository (VOA3R), puede ser de utilidad para
tica a la produccin de su catlogo colectivo en formato cualquier biblioteca. Se trata de un proyecto europeo que
LOD. En 2009 Malmsten present unos resultados con tiene como objetivo el desarrollo de una plataforma para
el objeto de compartir su experiencia y hacer accesibles el intercambio de informacin. Tiene una duracin de tres
los datos, aunque sin la intencin de que los metadatos aos, 2010-2013, y participan 14 instituciones de 10 pases
fueran perfectos. Segn el registro LOD mencionado an- europeos. En el marco de VOA3R, y concretamente con el
teriormente, con ello han obtenido 5 millones de tripletes nimo de facilitar este intercambio, naci la idea de asistir
con 3 millones de enlaces externos. a las bibliotecas para decidir qu propiedades usar en la co-
Entre sus experiencias y lecciones aprendidas estn: de- dificacin de los datos bibliogrficos y producir Linked data.
sarrollar un API ajeno al sistema bibliotecario que era Responde a cuestiones como qu propiedad debo usar
comercial, capaz de extraer de ste los datos necesarios; para ttulo, o para localizacin del recurso?, o cmo debo
exportacin a MARC XML de los datos, y exportacin con codificar el campo autor?
URIs de las relaciones entre los datos; construccin de
Para ello se han establecido las Recomendaciones LODE, ela-
identificadores; transformacion del MARC21 a RDF Abo-
borada por Marcia Lei-Zeng, Kent State University, EUA, e
gan por empezar a construir conocimiento al tiempo que
Imma Subirats-Coll, FAO, que ayuda a los proveedores de
se experimenta y se aprende.
datos en la seleccin de las estrategias ms apropiadas para
codificar de acuerdo con sus necesidades. Usa diagramas
Retos para la comunidad bibliotecaria para facilitar la toma de decisiones y escoger las propieda-
A tenor de todo lo expuesto no cabe duda que las bibliote- des ms usadas en la descripcin de los recursos. Las Reco-
cas pueden y deben participar con sus contenidos en la web mendaciones LODE se presentan tanto a nivel grfico como
semntica. Y aqu viene el problema, cmo hacerlo con en texto. Como los proveedores de datos cuentan con diver-
recursos y conocimientos tcnicos limitados? La conversin sas estructuras de datos bibliogrficos y, por tanto, no hay
de recursos a LOD no es slo un reto tcnico, existen otros una solucin vlida para todos, se ofrecen sugerencias ml-
aspectos (Hannemann, 2010) como la falta de experiencia y tiples para la codificacin de los datos. Las Recomendacio-
recomendaciones sobre: nes LODE sern publicadas en mayo 2011, y posteriormente
las propias utilidades tecnolgicas para la conversin; revisadas acorde con las sugerencias recibidas hasta finales

El profesional de la informacin, 2011, marzo-abril, v. 20, n. 2 171

Revista EPI v.20 n.2.indd 171 16/03/2011 18:41:56


Fernanda Peset, Antonia Ferrer-Sapena e Imma Subirats-Coll

de 2011. Aunque nacieron dentro


del marco de un proyecto para la
creacin de un motor de bsque-
da como VOA3R, el objetivo es
que sean aplicables para la comu-
nidad bibliotecaria en general.
En un sentido ms amplio, Co-
yle (2011) identifica lo que ha
de suceder primero para que se
produzca el siguiente paso (figura
11):
1. Con FRBR y RDA, y la comuni-
dad detectando la obsolescencia
del MARC, tenemos una oportu-
nidad.
Figura 11. A needs pyramid for LLD, http://kcoyle.net/temp/issuePyramid.jpg
2. No podremos hacer uso de ella
si no tenemos lo necesario: tiempo y dinero.
3. Incluso si lo tenemos, no podremos tener xito si no te- Referencias
nemos las herramientas necesarias.
Aelid, http://www.aelid.es
4. Estas herramientas no conseguirn sus objetivos sin un
Agenjo-Bulln, Xavier; Hernndez-Carrascal, Francisca. La
liderazgo claro dentro de la comunidad.
Biblioteca Virtual Larramendi: fuente de informacin biblio-
5. Y la comunidad no empezar a moverse sin una motiva- grfica para el pensamiento iberoamericano en la Web 3.0.
cin fuerte. En: Jornadas virtuales iberoamericanas de bibliotecologa,
2010, http://www.jornadasbibliotecas.bibar.org/index.php
Conclusiones ?id=9&cid=95&fid=20&task=download&option=com_flexi
content
Est claro que el movimiento Open data revolucionar en V Congreso nacional de bibliotecas pblicas, Gijn (Espaa),
pocos aos el mundo del acceso a los datos. En su vertiente 3-5 nov. 2010, http://eprints.rclis.org/handle/10760/14719
vinculada a la administracin pblica se aprecia ya un movi-
miento imparable liderado por los propios gobiernos en aras Agenjo-Bulln, Xavier; Hernndez-Carrascal, Francisca.
de conseguir su imbricacin con el mundo Web. Esta filosofa, La construccin de esquemas semnticos para bibliotecas
que impregna tambin el segundo aspecto tratado en este tra- virtuales. En: I Jornada profesional Lenguajes y gestin de
bajo, Linked open data, obtendr sus mejores resultados si la informacin, organizada por Sedic y el Instituto Cervantes,
informacin se suministra adems descrita de manera estn- 17 junio 2010, http://goo.gl/3gMo9
dar para fomentar la reutilizacin. Y consideramos que es en Alonso, Jos-Manuel. Towards a linked government data
este aspecto en el que nuestra comunidad profesional debe cloud (Hacia una nube de datos pblicos enlazados). En:
estar presente desde un principio, abriendo sus almacenes de Seminario Visualizar09: Datos pblicos, datos en pblico,
datos a otros agentes ajenos a su entorno profesional. 12-13 nov. 2009, http://medialab-prado.es/article/semina
Es indudable la importancia del papel que pueden desem- rio_visualizar09_datos_publicos_datos_en_publico
pear las bibliotecas y otras instituciones que conservan el Belanche-Alonso, Xavier. data404: producir, liberar, remez-
patrimonio en este escenario de la web semntica, por el clar y representar la informacin pblica. En: Seminario Vi-
uso de programas y normas, por la calidad del trabajo que sualizar09: Datos pblicos, datos en pblico, 12-13 nov. 2009,
realizan sus profesionales, y por la estabilidad en los datos http://medialab-prado.es/article/seminario_visualizar09_
de sus catlogos. Para las bibliotecas, a su vez, se percibe datos_publicos_datos_en_publico
la oportunidad de hacer mucho ms visible su trabajo y su
Berners-Lee, Tim. Linked data, 2006, http://www.w3.org/
informacin, pero tambin de asumir el papel protagonista
DesignIssues/LinkedData.html
que les corresponde. Las instituciones de la memoria ofre-
cen un mapa congruente de la cultura de los pases, algo Biblioteca Virtual Ignacio Larramendi. Coleccin de polgrafos,
que actualmente aparece desagregado en la Web. http://www.larramendi.es/i18n/estaticos/contenido.cmd?
pagina=estaticos/bibliotecaIL
Compartir datos de forma masiva y estable adems ayuda
en su propio trabajo, como en la deteccion de duplicados, Bizer, Christian; Cyganiak, Richard; Heath, Tom. How to
la desambiguacin terminolgica, el enriquecimiento de publish linked data on the web, 2007, http://www4.wiwiss.
los datos o en suministrar su informacin en formatos ms fu-berlin.de/bizer/pub/LinkedDataTutorial
transparentes a los usuarios ajenos a nuestra comunidad
Bizer, Christian; Heath, Tom; Berners-Lee, Tim (en prensa).
profesional.
Linked data - The story so far. Intl journal on semantic web
Es el momento oportuno y detectamos una motivacin en el and information systems (Ijswis).
sector: es nuestra hora, y debemos participar. http://linkeddata.org/docs/ijswis-special-issue

172 El profesional de la informacin, 2011, marzo-abril, v. 20, n. 2

Revista EPI v.20 n.2.indd 172 16/03/2011 18:41:56


Open data y Linked open data: su impacto en el rea de bibliotecas y documentacin

http://tomheath.com/papers/bizer-heath-berners-lee- Library Linked Data Incubator Group, http://www.w3.org/


ijswis-linked-data.pdf 2005/Incubator/lld
Callejero de Gijn, http://www.gijon.es/callejero/#0 Library standards and linked data. Library Linked Data Incu-
bator Group, http://www.w3.org/2005/Incubator/lld/wiki/
Casos de uso. Library Linked Data Incubator Group, http:// Library_standards_and_linked_data
www.w3.org/2005/Incubator/lld/wiki/UseCases
Linked data - Connect distributed data across the Web,
CKAN - the Data Hub, http://ckan.net http://linkeddata.org
Coyle, Karen. A needs pyramid for LLD, 2011, http://kcoyle. Linked Data Service, http://www.d-nb.de/eng/hilfe/service/
net/temp/issuePyramid.jpg linked_data_service.htm
Cyganiak, Richard; Jentzsch, Anja. Linking open data cloud Malmsten, Martin. Exposing library data as linked data,
diagram, http://lod-cloud.net 2009. En: IFLA 2009 satellite meetings in Florence, http://
Datasets in the next LOD Cloud, http://www4.wiwiss.fu-ber www.ifla2009satelliteflorence.it/meeting3/program/as
lin.de/lodcloud sets/MartinMalmsten.pdf
MARC List for geographic areas, http://id.loc.gov/vocabu
Datos abiertos de la Generalitat de Catalunya, http://dade
lary/geographicAreas
sobertes.gencat.cat/es/
Mazzo-Iturriaga, Rodrigo. Open data: qu es y ejemplos en
Datos abiertos de Zaragoza, ttp://www.zaragoza.es/ciudad/risp/
el mundo, 2010, http://www.bcn.cl/de-que-se-habla/open-
DBpedia, http://dbpedia.org/About data-link-data
Directiva 2003/98/CE del Parlamento Europeo y del Consejo, Mndez, Eva. RDF: un modelo de metadatos flexible para
de 17 nov. 2003, relativa a la reutilizacin de la informacin las bibliotecas digitales del prximo milenio. En: 7es Jorna-
del sector pblico. Diario oficial, n. L 345, de 31/12/2003, p. des catalanes de documentaci, 1999, http://www.cobdc.
0090-0096, http://eur-lex.europa.eu/LexUriServ/LexUriServ. org/jornades/7JCD/1.pdf
do?uri=CELEX:32003L0098:ES:HTML Ontology Engineering Group, http://www.oeg-upm.net
Domnguez, Eva. Open data, se abre la caja de Pandora?. Open Data Euskadi, http://opendata.euskadi.net/w79-home/es
El cuarto bit, 19 nov. 2010.
Open Data Foundation, http://www.opendatafoundation.
Dnde (en) Zaragoza DND zgz, http://www.dndzgz.com/ org
web/index.html
Open Government Licence, http://www.nationalarchives.
Dunsire, Gordon; Willer, Mirna. Initiatives to make stand- gov.uk/doc/open-government-licence
ard library metadata models and structures available to the
semantic web. 76th IFLA general conf and assembly, 10- Open Knowledge Foundation, http://okfn.org
15 August 2010, Gothenburg, Sweden, ttp://www.ifla.org/ Opening up Government, http://data.gov.uk
files/hq/papers/ifla76/149-dunsire-en.pdf
Planificador de visitas, http://www.zaragoza.es/turruta/Tu
eGovernment, http://www.w3.org/egov rruta/index_Ruta
FOAF Friend of a friend, http://www.foaf-project.org Portal de datos abiertos de Gijn, http://datos.gijon.es
Fundacin CTIC, http://datos.fundacionctic.org Prediccin Catalua, http://dadesobertes.gencat.cat/es/da
des-obertes/dataset_000070.html
GeoLinked Data, http://geo.linkeddata.es/web/guest/home
Proyecto Aporta, http://aporta.es/web/guest/index
Guidelines for collecting metadata on linked datasets in CKAN,
http://esw.w3.org/TaskForces/CommunityProjects/Linking Public Sector Information (PSI), Data catalogues (by govern
OpenData/DataSets/CKANmetainformation ments) (Direct access to data), http://www.epsiplatform.
eu/psi_data_catalogues/category_1_public_sector_informa
Hannemann, Jan; Kett, Jrgen. Linked data for libraries. tion_psi_data_catalogues_by_governments_direct_access_
En: 76th IFLA general conf and assembly, 10-15 August to_data Updated: 21 November 2010
2010, Gothenburg, Sweden, http://www.ifla.org/files/hq/
papers/ifla76/149-hannemann-en.pdf Thesaurus of graphic materials, http://id.loc.gov/vocabulary/
graphicMaterials
Incidencias de trfico en Gipuzkoa, http://opendata.blog.
VIAF The virtual international authority file, http://viaf.org
euskadi.net/es/demo/trafiko-gertaerak-gipuzkoan/
VOA3R, http://voa3r.eu
Iralis, http://www.iralis.org
W3C (2010). Semantic web, http://www.w3.org/standards/
Iralis. Use case International registry for authors, http://
semanticweb
www.w3.org/2005/Incubator/lld/wiki/Use_Case_Interna
tional_Registry_for_Authors Wikileaks, http://wikileaks.info

El profesional de la informacin, 2011, marzo-abril, v. 20, n. 2 173

Revista EPI v.20 n.2.indd 173 16/03/2011 18:41:56


Revista EPI v.20 n.2.indd 174 16/03/2011 18:41:59