Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Página 1 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
Contenidos
1. Introducción ............................................................................................................................... 4
3. Dublin Core.............................................................................................................................. 12
Página 2 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
5. Conclusiones ........................................................................................................................... 39
Página 3 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
1. Introducción
Entre las aplicaciones del lenguaje XML en el ámbito de las bibliotecas, archivos y centros de
documentación, cobra especial importancia su utilización como formato para la gestión de
descripciones de recursos. En este sentido podemos identificar dos líneas de trabajo: a) la
utilización de XML como formato de intercambio de descripciones basadas en MARC (Machine
Readable Cataloging) y b) la utilización de XML como formato para codificar, almacenar y
difundir descripciones de recursos creadas con otros sistemas de metadatos, entre los que
cobra especial relevancia Dublín Core.
Existen diferencias en el contenido de las descripciones dependiendo del tipo de recurso que
se describa. Por ejemplo, en la descripción de artículos académicos, noticias de prensa, etc.,
las descripciones suelen incorporar un resumen del que carecen las descripciones de
monografías o publicaciones seriadas; en el ámbito de los archivos se da una gran importancia
al contexto y los datos históricos y biográficos de la entidad, familia o persona que generó la
documentación que se describe, etc.
Página 4 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
2.2. Metadatos
El término metadatos suele definirse como datos acerca de los datos. Metadatos sería
cualquier información que podemos dar sobre un recurso de información para facilitar su
posterior localización y gestión. Al redactar descripciones de recursos estamos consignando
metadatos sobre los mismos. Podemos hablar de metadatos con independencia del tipo de
recurso que se describa (monografías, artículos científicos, tesis, piezas de un museo, una
colección de manuscritos, etc.) y de su disponibilidad en formato electrónico 1.
1 . En la práctica, siempre que contemos con una descripción que facilite la identificación,
localización y acceso del recurso, podremos afirmar que estamos trabajando con metadatos.
Página 5 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
La finalidad que persigue con él, los recursos y contexto en los que son aplicables.
El tipo de información que pueden tomar como valor los datos anteriores, y si estos
valores se deben tomar de listas pre-establecidas.
Sin embargo, una definición formal del término no aceptaría esta acepción, ya que el término
metadatos se refiere formalmente, a la información que se mantiene sobre los propios datos
descriptivos de algo. Así, sería correcto hablar de metadatos para referirnos a una descripción
detallada del contenido, tipo, restricciones aplicables, etc., de las propiedades que conforman
una descripción. En este caso sí estaríamos hablando realmente de “datos sobre los datos”.
2 Por ejemplo, para relacionar descripciones de recursos bibliográficos que se citan entre sí,
otros tipos de relaciones como versiones anteriores, previas, revisadas o no revisadas, etc., y
las relaciones entre descripciones de recursos bibliográficos y registros de autoridad.
Página 6 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
De esta forma, un sistema de metadatos abarcará distintos aspectos relacionados con la forma
de redactar, almacenar y difundir las descripciones, y cómo está previsto asegurar la evolución
del sistema en el futuro.
La aproximación más común a los metadatos consiste en entenderlos como una serie de
propiedades que caracterizan a los recursos de información. Estas propiedades se obtendrían
a partir de una abstracción de los recursos de información de un mismo tipo, de forma que
todas ellas serán aplicables a la mayoría de los recursos que se pretende describir.
Por ejemplo, en el caso de las tesis doctorales, podríamos afirmar que cualquier tesis puede
describirse mediante una serie de propiedades aplicables a la mayoría de ellas, y que son
datos que las caracterizan. Así, las tesis tendrán un título, una fecha de lectura, un doctorando,
un tribunal compuesto por una serie de miembros, un director, y estará vinculada a una
universidad, departamento y programa de doctorado. Las distintas propiedades sobre las que
podemos hacer una afirmación constituirán los metadatos aplicables a ese tipo de recurso.
Al redactar la descripción de una tesis en particular, asignaremos un valor a cada una de esas
propiedades; los valores corresponderán a la instancia en cuestión que estamos describiendo.
Por ejemplo, la descripción de una tesis disponible en formato electrónico podría incluir los
siguientes metadatos o propiedades: título, doctorando, director, fecha lectura, área de
conocimiento, universidad, departamento, programa, tribunal, palabras clave, resumen, etc.
Continuando con nuestro ejemplo anterior, en las descripciones que hacemos de las tesis
podríamos incorporar elementos adicionales, como un listado predefinido de áreas de
conocimiento (con lo que aseguraremos que todas las personas que describen recursos utilizan
los mismos términos en la codificación de los temas), o referencias cruzadas a registros que
describen con mayor detalle las características de los departamentos, directores, etc. De esta
forma, nuestro sistema incorporaría descripciones de otros recursos que podríamos enlazar
Página 7 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
entre sí para constituir un sistema de información más sofisticado y con mayores opciones de
explotación3.
Página 8 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
Dentro de este apartado debemos mencionar las opciones orientadas a la identificación de los
recursos. Esta información formará parte habitualmente de la descripción. En el caso de
recursos electrónicos, contamos con distintos sistemas de identificación: URL (Uniform
Resource Locator), DOI (Digital Object Identifiers), etc. Es aconsejable que el sistema de
metadatos especifique qué mecanismos de identificación se aplicarán y cómo diferenciar el uso
de unos u otros.
Por ejemplo, la propiedad título puede usarse en un sistema para recoger el título asignado a
un recurso por su autor, y en otro sistema podría recoger el tratamiento que se asigna a una
persona, o el título que asigna el centro catalogador en un segundo idioma.
Si pensamos en el intercambio de datos entre sistemas, debemos contar con algún mecanismo
que nos permita diferenciar de forma inequívoca los metadatos de distintos sistemas de
descripción que tengan una designación común.
En el ámbito de Internet y la World Wide Web, esta problemática se resuelve mediante los
llamados espacios de nombres XML. Cada espacio de nombres estará identificado de forma
única mediante un URI (Uniform Resource Identifier) y agrupará un conjunto de designaciones
o nombres de elementos y atributos4.
4 El concepto de URI es similar al de URL (Uniform Resource Locutor). De hecho las URL son
un caso particular de URI. Podríamos definirlo como un nombre único en la web. Por ejemplo,
en un sistema ficticio de metadatos para la descripción de tesis, podríamos establecer un
espacio de nombres asociado al URI http://www.tesisMetadatos.com/tesis. Otro sistema de
metadatos podría así utilizar propiedades homónimas; éstas estarán vinculadas a otro espacio
de nombres, por ejemplo http://www.catalog.es/informes.academicos/, por lo que no habría
posibilidad de malentendidos o conflictos, y sería posible diferenciar de qué sistema proceden
las propiedades que se usen en las descripciones. El nombre completo de cada propiedad
sería diferente. El título para las tesis del primer espacio de nombres quedaría identificado por
el nombre:
http://www.tesisMetadatos.com/tesis#titulo
Página 9 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
Distintos sistemas de metadatos pueden optar por aplicar pautas diferentes para completar los
valores de cada propiedad, por lo que establecer unos criterios comunes u optar formalmente
por una u otra forma sería otra de las áreas donde se hace necesaria la normalización.
mientras que el título para los informes de investigación utilizado en el segundo sistema de
metadatos tendría como nombre:
http://www.catalog.es/informes.academicos#titulo
Página 10 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
sus especificaciones –información sobre cómo se deben editar, almacenar e intercambiar las
descripciones de los recursos. Por ejemplo, el sistema Dublin Core, por ejemplo, no propone un
único sistema de codificación de las descripciones, sino que permite distintas alternativas y nos
da recomendaciones para el uso de distintos formatos: HTML, XML, RDF, etc.
Podríamos hablar así de metadatos sobre los propios metadatos. Este punto constituye otro de
los apartados que debe tratarse y para facilitar el intercambio de metadatos de forma
consistente.
En los sistemas basados en texto completo, las aplicaciones informáticas generan índices con
todos los términos que aparecen en los documentos. El usuario busca los documentos que
contienen una combinación de términos determinada. Este modelo dista de ser óptimo. Los
problemas se deben a la falta de estructura del texto completo y a la dificultad de que coincidan
los términos usados en la redacción de los documentos con los usados por el usuario al
formular su búsquedas. Si no existe dicha correspondencia, el sistema no podrá identificar
documentos relevantes.
Por otra parte, la búsqueda texto completo está restringida a recursos disponibles en formato
electrónico, con contenido textual, y no permite acotar el contexto en el que debe aparecer un
término. A modo de ejemplo, en un sistema texto completo ¿podríamos diferenciar los
documentos que tratan sobre la Universidad de Santiago de los que están publicados por esta
institución?
Disponer de descripciones basados en metadatos permite acotar con precisión las búsquedas
y restringirlas a propiedades específicas, con lo que se obtiene más precisión y menos ruido.
Otra ventaja del uso de metadatos es que el sistema podrá mostrar al usuario un perfil de los
documentos recuperados como un paso previo a la visualización de su texto completo o a la
Página 11 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
solicitud del recurso. Este perfil estará formado por los metadatos que se hayan asignado al
recurso durante su descripción. Con él, el usuario podrá juzgar la utilidad potencial del recurso
sin tener que acceder al mismo.
Metadatos para la preservación: tienen como finalidad facilitar el uso del recurso en
el futuro, especificando los requisitos técnicos para su acceso y lectura, las
operaciones realizadas para asegurar su conservación, etc.
Página 12 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
propósito general, para describir cualquier tipo de recurso, si bien su objetivo inicial se centró
en la catalogación de páginas web.
El nombre correcto para hacer referencia a este conjunto de metadatos es Dublin Core
Metadata Element Set o DCMES. La primera versión – con el nombre de DC1 – se publicó en
en 1998 en el documento IETF (Internet Engineering Task Force) RFC 24135.
La versión actual del DCMES es la 1.1, y se convirtió en norma internacional, ISO 15836:2003
“Information and documentation—The Dublin Core metadata element set, en febrero del 2003.
También es norma norteamericana ANSI Z39.85 desde septiembre del 2001.
Del mantenimiento de este sistema se encarga la Dublin Core Metadata Initiative – en adelante
DCMI –, que se auto-describe como una organización independiente e internacional dedicada a
la promoción y desarrollo de estándares sobre metadatos, y que estuvo vinculada inicialmente
a la OCLC (Online Computer Library Center) norteamericana. Algunos autores han señalado un
interés comercial por parte de la OCLC en el diseño de Dublin Core, para establecer una nueva
línea de negocio dedicada a la venta de registros catalográficos de recursos web [CITA].
Ante este incremento en el número de materiales publicados, y ante la imposibilidad de que las
bibliotecas y los centros de documentación tradicionales afrontasen el reto de catalogar lo que
se publica en la web, se planteó la necesidad de contar con un sistema de descripción de
recursos fácil de usar, que no exigiese complejos conocimientos previos. El nuevo sistema para
la descripción de recursos debería permitir crear registros con facilitad, de forma intuitiva, para
que fuesen los mismos creadores de la documentación los que pudiesen catalogarla.
Dublin Core también se planteó como una respuesta ante la ineficacia de los sistemas de
indexación y recuperación en texto completo característicos de los motores de búsqueda en
Internet. Estos sistemas – basados normalmente en la ponderación de los términos a partir de
la frecuencia con la que aparecen en los documentos – no ofrecen una precisión similar al que
puede obtenerse en los sistemas de recuperación bibliográficos basados en registros
estructurados y lenguajes controlados. Así, podemos decir que Dublin Core pretendía ofrecer
5 http://www.ietf.org/rfc/rfc2413.txt
Página 13 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
Uno de los principios de Dublin Core es el principio 1-1 o one-to-one en inglés. Según este
principio, las distintas representaciones de un mismo objeto constituyen recursos
independientes, que contarán con descripciones separadas.
Los recursos contarán con unas propiedades, que se definen formalmente como “aspectos,
características, atributos o relaciones que se usan para describir un recurso”. Vemos que el
sistema otorga importancia a las relaciones entre el recurso que se describe y otros, como
medio para facilitar su recuperación.
7 DCMI Glossary. Otras definiciones que se dan en este apartado se han tomado de este
documento disponible en:
http://dublincore.org/documents/2001/04/12/usageguide/glossary.shtml
Página 14 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
3.2.1. Generalidad
Dublin Core establece un conjunto de propiedades o metadatos aplicables a cualquier tipo de
recurso, con independencia de su tipo o formato. Los metadatos Dublin Core podrían utilizarse
para describir cualquier material: páginas web, artículos o contribuciones a un congreso,
monografías, piezas de un museo, grabaciones, etc. Como consecuencia de esta
aproximación se identificaron quince elementos que constituyen el llamado núcleo del DCMES.
Son elementos genéricos que pueden usarse en la descripción de cualquier recurso.
Esta independencia permite optar por codificar los metadatos como parte integrante del recurso
de información o fuera de él. Por ejemplo, en una página HTML podríamos codificar metadatos
Dublin Core como parte de la propia página, aunque también podríamos incluir un enlace en la
página HTML que nos llevase a un documento con sus metadatos.
3.2.3. Extensibilidad
Se refiere a la capacidad de ampliar los metadatos iniciales para dar cabida a nuevas
aplicaciones. La extensibilidad también permite combinar metadatos Dublin Core con otros
procedentes de otros sistemas8. Se obliga a mantener la singularidad de los quince elementos
que conforman el núcleo para así garantizar un nivel de compatibilidad mínimo entre las
distintas implementaciones y usos que se haga de Dublin Core.
8 Este principio está relacionado con las conclusiones del segundo encuentro celebrado por la
OCLC y UKOLN (UK Office for Library & Information Networking) en Warwick (Reino Unido) en
abril de 1996. Entre las conclusiones de este encuentro se encontraba que Dublin Core fuese
compatible con otros sistemas de metadatos. Este planteamiento se plasmó en el llamado
Warwick Framework, que planteaba un modelo en el que un contenedor pudiese agrupar
distintos conjuntos de metadatos. El planteamiento surge ante la necesidad de dar cabida a
distintos sistemas de metadatos que describan un mismo recurso pero con propósito diferente.
Véase [DEMPSEY, 1996]: http://www.dlib.org/dlib/july96/07weibel.html.
Página 15 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
3.2.4. Economía
Hace referencia al bajo coste que tiene la creación de descripciones usando este sistema. La
sencillez de Dublin Core y la posibilidad de que cualquier persona pueda crear descripciones
sin una costosa formación previa. Esta característica permitiría catalogar recursos con rapidez
y dar respuesta al crecimiento exponencial de los recursos disponibles en la web 9.
El documento IETF RFC 2413 se identifica con la versión 1.0 de Dublin Core. La versión actual
del DCMES, la 1.1, se publicó el 2 de julio de 1999. Desde entonces se han publicado distintas
revisiones de esta versión, sin cambios sustanciales.
Página 16 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
Coverage
Título o nombre dado al recurso que se describe. Normalmente, éste título lo asignará al autor
y será explícito en el documento.
Tema del que trata el recurso. Equivaldría a la materia. Se recomienda que el valor de este
elemento proceda de una lista de encabezamientos de materia, sistema de clasificación o
vocabulario controlado.
Resumen del contenido del recurso. Puede recoger también una tabla de contenidos o
sumario.
Fecha de un evento en el ciclo de vida del recurso. Este evento puede ser la publicación (sería
su uso más habitual), aprobación formal, creación, etc. Se recomienda codificar el valor de este
Página 17 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
campo según especifica la norma ISO 8061, es decir, AAAA-MM-DD (año, mes, día), por
ejemplo, 2006-03-02 sería el dos de marzo del 2006.
Dataset: se define como información codificada de forma estructurada, que podría ser
procesada directamente por un ordenador (por ejemplo, una base de datos quedaría
incluida en este grupo)
InteractiveResource: recurso que exige la interacción del usuario para poder ser
comprendido y utilizado, como puede ser un sitio web, un componente multimedia, etc.
Service: Se define como un sistema que ofrece funciones a unos usuarios. Se citan
como ejemplos un sistema de préstamo interbibliotecario, un servidor web, un Z39.50,
etc.
11 http://www.dublincore.org/documents/dcmi-type-vocabulary
Página 18 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
Formato físico en el que se encuentra el documento o recurso que se describe. Por ejemplo,
HTML, PDF, Word, etc. Se recomienda codificarlo usando los tipos MIME 12.
Identificador asignado al recurso. Lo identificará de forma inequívoca: por ejemplo, una URL,
un DOI, el ISBN para libros impresos, etc.
Hace referencia al recurso del cual procede el recurso que se está describiendo. Se usará
normalmente cuando el recurso que se describe es un resumen de otro documento, una
traducción o el resultado de la digitalización.
Idioma del recurso. Para indicarlo se utilizará el método y los códigos definidos en el
documento RFC 3066 y en la norma ISO 639-2:1998 Codes for the representation of names of
languages. Alpha-3 code 13.
Recoge un recurso relacionado con el recurso que se está describiendo. Cada ocurrencia del
elemento relation establece una relación entre dos recursos. Las relaciones pueden ser de
distinto tipo: versiones, traducciones, relaciones parte-todo, cambios en formatos, etc.
Cobertura geográfica o temporal recurso, respecto al tema que trata. Indica de qué área
geográfica o periodo de tiempo trata el contenido del recurso. Por ejemplo, un documento
http://www.iana.org/assignments/media-types/
http://www.ietf.org/rfc/rfc3066.txt
http://www.loc.gov/standards/iso639-2/langhome.html
Página 19 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
titulado El desempleo en España 1970-1975 tendría como cobertura geográfica España y como
cobertura temporal el periodo comprendido entre 1970 y 1975.
Nota relativa a los derechos sobre el recurso, términos y condiciones de acceso, reproducción,
etc. Puede tomar como valor una URL que apuntase a un documento externo con esa
información.
Como ejemplo del primer uso de los calificadores, hemos señalado que el elemento date
recoge una fecha relacionada con un evento. Esto puede hacer referencia a distintas fechas:
creación, aprobación, publicación, etc. Los calificadores permiten expresar con más detalle a
qué tipo de fecha nos referimos. Los calificadores que cumplen esta función reciben el nombre
refinements en inglés.
14 Entre los medios recomendados en el documento de Dublin Core se citan la norma ISO 3166
– Codes for the representation of names of countries, y el Thesaurus Getty de Nombres
Geográficos, disponible en:
http://www.getty.edu/research/conducting_research/vocabularies/tgn/
Página 20 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
Debemos señalar que la documentación de Dublin Core habla de términos Dublin Core (Dublin
Core terms en inglés) para hacer referencia tanto a los elementos como a los calificadores,
cualquiera que sea su tipo.
En la creación de descripciones basadas en Dublin Core se puede optar por usar o no los
calificadores definidos por la DCMI. Cuando se utilicen diremos que se está usando el Dublin
Core calificado (qualified Dublin Core). Cuando no se apliquen y sólo se usen los quince
elementos del núcleo, diremos que se está utilizando el Dublin Core simple15.
15 El uso de calificadores está vinculado al llamado principio dumb-down. Este indica que una
descripción de un recurso en Dublin Core calificado, podría omitir todos los calificadores y
seguir siendo comprensible y procesable.
16 http://www.dublincore.org/documents/2000/07/11/dcmes-qualifiers/
Página 21 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
http://dublincore.org/documents/dc-citation-guidelines/
Página 22 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
http://www.iso.org/iso/en/prods-services/iso3166ma/02iso-3166-code-lists/list-en1.html
http://lcweb.loc.gov/standards/iso639-2/langhome.html
Página 24 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
W3CDTF Date Permite codificar fechas y horas. Se basa en la ISO 8601 23.
Coverage
temporal
24 Véase http://dublincore.org/resources/faq/
Página 25 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
En cuanto se utilice en una descripción cualquiera de los elementos citados en este apartado,
debemos decir que se está usando el Dublin Core calificado. De esta forma, el sistema de
metadatos Dublin Core incorpora más de quince elementos – en total contaríamos veintidós –
si bien únicamente quince de ellos forman parte del llamado núcleo.
Para indicar que estos términos pertenecen a Dublin Core se han definido tres espacios de
nombres reservados. Recordamos que la función de los espacios de nombres es indicar de qué
Página 26 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
http://purl.org/dc/elements/1.1/
En él se agruparían los nombres de los elementos que forman el núcleo. Esto quiere
decir que el identificador completo del elemento subject, por ejemplo, sería:
http://purl.org/dc/elements/1.1/subject
De esta forma podríamos diferenciarlo de otros elementos con idéntico nombre que se
hayan definido en otros sistemas de metadatos
http://purl.org/dc/terms/
Engloba los nombres del resto de elementos (es decir, los que no forman parte de los
quince del núcleo) y los calificadores.
http://purl.org/dc/dcmitype/
y recoge los valores o términos que se pueden utilizar para indicar el tipo de un recurso
(es decir, los valores que se asignarán al elemento type)
Página 27 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
En el área de las bibliotecas se ha desarrollado el perfil DC-Lib por el grupo de trabajo DCMI-
Libraries Working Group; su última versión está disponible desde el 10 de septiembre del
200426.
Se recomienda indicar el idioma en el que está escrito el valor de los metadatos mediante
atributos xml:lang.
El calificador alternative se usará para codificar títulos uniformes o cualquier otro título
alternativo.
http://www.loc.gov/marc/sourcecode/relator/relatorlist.html
Se han registrado las listas de materias y sistemas de clasificación LCSH, MeSH, DDC,
LCC y UDC para el elemento subject.
Página 28 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
ediciones o adaptaciones que afectan al contenido de la obra. Por otra parte isFormatOf
se utilizará para relacionar el recurso con otro de idéntico contenido pero en distinto
formato.
El perfil DC-Lib aconseja el uso conjunto de los elementos Dublin Core con los de otro
sistema de metadatos: MODS. Se incorporan los siguientes metadatos de MODS:
Edition – para indicar la edición o versión del recurso que se describe; la edición se
refiere al concepto de edición tradicional.
Otra convención que debemos seguir es incluir, en el elemento <head> de la página XHTML,
un atributo profile con la siguiente forma:
<head profile=”http://dublincore.org/documents/dcq-html/”>
En la literatura sobre Dublin Core es posible encontrar referencias a otras formas ya obsoletas
de incluir metadatos Dublin Core en páginas HTML. Por ejemplo, escribir la letra inicial de los
metadatos Dublin Core en mayúscula, obviar el uso de elemento <link> para recoger
metadatos cuyo valor es una URI de otro recurso o escribir el nombre de los cualificadotes
precedidos del nombre del elemento al que cualifican. Destacamos este punto porque es
posible encontrar estas aproximaciones, como decimos ya obsoletas, en artículos dedicados a
este tema.
Página 30 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
http://purl.org/dc/elements/1.1/
http://purl.org/dc/terms/
Si en la descripción se usa el Dublin Core simple, únicamente se tendrá que incluir la referencia
al primero. Si se usa el calificado, será preciso incluir las referencias a los dos espacios de
nombres. La forma que tendrán los elementos <link> será ésta:
Por convención, los alias que se asignan a estos espacios de nombres, y que precederán a los
nombres de elementos y calificadores, son DC (para los quince elementos del núcleo) y
DCTERMS (para los calificadores, esquemas de codificación y elementos que no forman parte
del núcleo).
De esta forma, una descripción Dublin Core incrustada en una página XHTML tendría el
siguiente aspecto:
<head profile=”http://dublincore.org/documents/dcq-html/”>
</head>
Vemos que los nombres de los elementos del núcleo se escriben precedidos por el prefijo DC, y
los de calificadores por DCTERMS.
Para indicar que el valor de un elemento Dublin Core se toma de un vocabulario controlado o
que se codifica siguiendo una pauta particular, se debe añadir al elemento <meta>
correspondiente un atributo scheme que tomará como valor el nombre del esquema de
codificación que se aplique. Por ejemplo, para indicar el formato de la fecha que se usa, o que
la materia se toma de la Library of Congress Subject Headings, se usaría el atributo scheme
de la siguiente forma:
Página 31 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
Nótese que el valor asignado al atributo scheme, al tratarse de términos registrados como parte
del Dublin Core calificado, también se escribe precedido por el prefijo DCTERMS.
Para concluir este apartado, señalaremos una excepción a las reglas anteriores; en aquellos
casos en los cuales un elemento o calificador vaya a recoger una URI de un recurso en lugar
de un valor textual, en lugar del elemento <meta> se recomienda usar el elemento <link>.
Esta situación se puede dar en el caso del metadato relation y sus calificadores. El
elemento <link> irá acompañado por un atributo rel que recogería el nombre del elemento
o calificador (precedido por los prefijos DC o DCTERMS) y por un atributo href con la URL
del recurso al que se hace referencia.
Por ejemplo, si queremos indicar una relación entre el recurso que describimos y otro recurso
identificado por una URL, lo haríamos de la siguiente forma:
<link rel="DCTERMS.references"
href="http://www.example.org/publications/2002/176459.pdf" />
La recomendación también nos permite indicar el idioma en el que está escrito el valor
asignado a un metadato mediante los atributos:
Para incluir este vínculo se recomienda usar la etiqueta <link>, asignando como valor de su
atributo href la URL del archivo RDF/XML con los metadatos. Este vínculo sería similar al
siguiente:
Página 32 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
La recomendación aconseja utilizar esquemas en lugar de DTD, y especifica que los metadatos
Dublin Core se deben agrupar en un elemento contenedor, si bien no se obliga a usar uno en
concreto (en los ejemplos que se dan se usa el elemento <metadata>, aunque podría usarse
cualquier otro). Dentro de este elemento contenedor se situarán los metadatos Dublin Core
propiamente dichos, todos en el mismo nivel jerárquico.
Cada metadato Dublin Core se codificará mediante elementos XML independientes. Sus
nombres se escribirán en minúsculas e irán precedidos por el alias del espacio de nombres
reservado para Dublin Core, que deberá haberse declarado previamente. Los elementos XML
contendrán el valor asignado al metadato. Por ejemplo, para codificar el título de un recurso
con el metadato title, se usaría un elemento como el siguiente:
Si un elemento Dublin Core recogiese más un más de un valor, se repetirá el elemento XML.
Así, un documento con dos materias incluiría dos elementos <dc:subject>:
<dc:subject>Bibliotecas</dc:subject>
<dc:subject>Archivos</dc:subject>
Un registro Dublin Core de ejemplo codificado en XML podría tener el siguiente aspecto (el
ejemplo se ha tomado de la citada recomendación). En el ejemplo podemos ver cómo se ha
declarado el espacio de nombres reservado para Dublin Core simple –
http://purl.org/cd/elements/1.1/ - asignándole el alias dc:
<?xml version="1.0"?>
<metadata xmlns:dc="http://purl.org/dc/elements/1.1/">
<dc:title>UKOLN</dc:title>
<dc:description>
UKOLN is a national focus of expertise in digital information
http://dublincore.org/documents/2003/04/02/dc-xml-guidelines/
Página 33 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
El esquema recomendado por la DCMI para metadatos Dublin Core simple en XML puede
descargarse del sitio web Dublin Core29. Su representación gráfica es la siguiente:
Vemos que se para cada metadato Dublin Core se declara un elemento de tipo texto, que
puede ir acompañado opcionalmente por un atributo xml:lang. Este esquema no podría
usarse directamente. Para poder utilizarlo, tenemos que crear un nuevo esquema XSD e
importar el esquema simpledc20021212.xsd. El esquema desde el cual importamos
declarará el elemento contenedor de los metadatos Dublin Core. En la declaración del
elemento contenedor se indicará que su modelo de contenido es el grupo dcElementsGroup.
A continuación recogemos un ejemplo de esquema XML que hace uso del esquema para
Dublin Core simple:
29 http://dublincore.org/schemas/xmls/simpledc20021212.xsd
Página 34 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
<dcterms:modified>2006-11-20</dcterms:modified>
En el caso de los calificadores que indican la procedencia del valor asignado a un metadato, se
usará el atributo xsi:type. Por ejemplo, para indicar que la materia se toma de la CDU, se
haría lo siguiente:
<dc:subject xsi:type="dcterms:UDC">062</dc:subject>
El valor del atributo xsi:type se escribe precedido del alias dcterms.
Página 35 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
<?xml version="1.0"?>
<metadata
xmlns="http://example.org/myapp/"
xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance”
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/">
<dc:title>UKOLN</dc:title>
<dcterms:alternative>UK Office for Library and Information
Networking</dcterms:alternative>
<dc:subject xsi:type="dcterms:DDC">062</dc:subject>
<dc:subject xsi:type="dcterms:UDC">061(410)</dc:subject>
<dc:description xml:lang="fr">
UKOLN est un centre national d'expertise dans la gestion de
l'information digitale.
</dc:description>
<dc:publisher>UKOLN, University of Bath</dc:publisher>
<dcterms:isPartOf xsi:type="dcterms:URI">
http://www.bath.ac.uk/</dcterms:isPartOf>
<dc:identifier xsi:type="dcterms:URI">http://www.ukoln.ac.uk/
</dc:identifier>
<dcterms:modified>2001-07-18</dcterms:modified>
<dc:format>text/html</dc:format>
<dcterms:extent>14 Kbytes</dcterms:extent>
</metadata>
Página 36 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
El esquema propuesto para Dublin Core calificado en XML consta de tres archivos xsd:
dc.xsd, dcterms.xsd y dcmitype.xsd31. Para usarlos debemos crear un nuevo
esquema donde se declarará el elemento contenedor de los metadatos Dublin Core. Desde
este nuevo esquema se importará el esquema dcterms.xsd, se declararán los espacios de
nombres para Dublin Core y se indicará que el elemento contenedor tiene como tipo uno de los
grupos definidos en el esquema dcterms.xsd.
RDF en un vocabulario XML ideado por el W3C para el intercambio de metadatos de cualquier
tipo. Está estrechamente ligado a la llamada web semántica. RDF establece un tipo de
documento XML que actúa como un sobre o contenedor que puede recoger descripciones
creadas con distintos sistemas de metadatos. El documento RDF recogerá elementos propios
del vocabulario RDF junto con los elementos correspondientes a metadatos Dublin Core. Para
diferenciar unos de otros se usarán los espacios de nombres.
El elemento raíz del documento RDF/XML será <rdf:RDF>, y contendrá uno o más elementos
<rdf:description> para cada recurso que se describa. Los elementos
<rdf:description> contarán con un atributo about que tomará como valor la URL o el
identificador del recurso.
32 Escrito por Dave Beckett, Eric Millar y Dan Brickley el 31 de julio del 2002, está disponible
en: http://dublincore.org/documents/dcmes-xml/.
Este documento se refiere únicamente a la codificación de metadatos Dublin Core simple. Hay
otro documento Expressing Qualified Dublin Core in RDF / XML que describe la codificación
RDF/XML de metadatos calificados, pero que no ha alcanzado el estado de Recomendación en
el momento de redactar este capítulo.
Página 37 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
La recomendación incluye una DTD y los esquemas con los que se pueden validar las
descripciones33:
El siguiente ejemplo tomado del sitio web de la DCMI muestra cómo codificar metadatos Dublin
Core en un RDF/XML. En el ejemplo, el recurso que se describe es la página web ficticia
http://purl.org/DC/docs/notes-cox-816.htm.
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description about="http://purl.org/DC/docs/notes-cox-816.htm">
HTML</dc:title>
model.</dc:description>
<dc:date>1999-08-18</dc:date>
<dc:format>text/html</dc:format>
<dc:language>en</dc:language>
http://dublincore.org/docuemnts/2002/07/31/dcmes-xml/dcmes-xml-dtd.dtd
Debemos señalar que estas DTD y esquemas se incluyen a título informativo, y se señala que
no forman parte del estándar propiamente dicho.
Página 38 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
</rdf:Description>
</rdf:RDF>
En primer lugar podemos ver el uso de una declaración de tipo de documento que contiene una
referencia a la URL donde se encuentra la DTD (se trata de la segunda línea del documento,
que comienza por la palabra <!DOCTYPE...). Se puede apreciar también el uso del elemento
contenedor <rdf:Description> y su atributo about para recoger la URL del recurso.
Al igual que sucedía con la codificación de metadatos Dublin Core en XML sin usar RDF, en
este modelo también podemos utilizar el atributo xml:lang con cualquier elemento para
indicar en qué idioma está escrito su valor.
5. Conclusiones
Dublin Core constituye la alternativa más popular dentro de los sistemas de metadatos surgidos
como consecuencia de la generalización de la Web. En este capítulo se han descrito las
características de los metadatos, su finalidad, ventajas, y las características de Dublin Core. Si
bien Dublin Core no obliga a utilizar un formato de codificación y transferencia de registros
determinado, sí se permite el uso de XML y se han publicado recomendaciones para la
codificación de metadatos Dublin Core en este formato.
En el capítulo se han comentado los medios recomendados para codificar descripciones Dublin
Core simple y calificado en formato XML, y también el uso de RDF/XML, si bien éste último
cuenta con aspectos que aún no han sido publicados en forma de recomendación. Podemos
concluir señalando que la DCMI ha puesto a disposición de la comunidad unas pautas para la
codificación de descripciones Dublin Core en XML. Estas descripciones podría crearse con
herramientas de edición XML especializadas o con utilidades similares a la propuesta por la UK
Office for Library and Information Networking (UKOLN) de la Universidad de Bath en
Inglaterra34, y que permiten generar un documento XML a partir de un formulario web.
Página 39 de 40
Capítulo 3: XML y la gestión de descripciones bibliográficas. Dublin Core Ricardo Eito Brun
y universitario. En estos repositorios, Dublin Core constituye una pieza clave ya que se quiere
que sean los autores de los documentos quienes completen una descripción básica de los
recursos, y no el personal especializado de las bibliotecas. De esta forma se agiliza el proceso
de descripción y se asegura la pronta disponibilidad de los materiales. Dublin Core ofrece un
sistema rápido, fácil e intuitivo para que los autores puedan completar esa descripción de sus
documentos antes de añadirlos al repositorio institucional.
No son estas las dos únicas aplicaciones de Dublin Core, si bien son las más significativas y
las que han situado a Dublin Core en un lugar prioritario en la práctica profesional.
Página 40 de 40