Está en la página 1de 135

Metadatos y aplicacin en la descripcin de

recursos


Autor Javier Calzada Prado
Tutor Esther Prez Delgado





Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus






Pgina 1

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Mdulo 1. Contextos y vas de acceso a la
informacin digital
1.1. Problemas asociados a la recuperacin en Internet
Si la imprenta de tipos mviles supuso en el siglo XV el fin del monopolio intelectual
de una lite, ha sido la red de redes la que ha revolucionado y democratizado de
manera definitiva la difusin y el acceso a la informacin. Nunca antes haba sido
tan fcil para cualquier ser humano comunicar un mensaje informativo de manera
que pudiera ser recibido por un nmero potencial de receptores tan amplio. Esto ha
potenciado el crecimiento exponencial de la Web, generando un vasto cuerpo de
conocimiento al que, sin embargo, resulta imposible acceder en su totalidad o con
la precisin necesaria. Los sistemas de recuperacin implementados hasta el
momento (directorios y buscadores, principalmente), basados en tcnicas cuyo
funcionamiento ha demostrado ser especialmente eficiente en sistemas de
informacin finitos, resultan insuficientes (existe, ciertamente, una web invisible)
frente al siempre cambiante, siempre inabarcable espacio informativo de la red.
Se han propuesto varias metforas para describir dicho espacio, entre ellas la
metfora de las islas y archipilagos de informacin. La metfora de las islas
de informacin, utilizada desde hace tiempo (por ejemplo, por Atherton en 2002
en el proyecto britnico Seamless UK), se refiere al hecho de que en la web
existan espacios informativos, generalmente organizados en forma de sistemas de
informacin, que se encuentran aislados entre s, lo que limita la capacidad de
recuperacin de informacin.
En la actualidad, la principal tendencia es precisamente afrontar el problema de
abajo a arriba, es decir, empezando por crear islas, espacios limitados en los que
los recursos estn organizados y controlados para, en la medida de lo posible, ir
aumentando la red y el tamao de dichas islas as como sus interconexiones para,
finalmente crear espacios informativos conectados cada vez ms amplios que
posibiliten la implementacin de servicios de informacin digital para la Sociedad
del Conocimiento.
La clave de este proceso radica en el desarrollo de un conjunto de estndares que
regulen todos los aspectos implicados en l, entre los que se encuentran los
estndares de metadatos como va para la ptima descripcin de recursos.
1.2. Repositorios y bibliotecas digitales. Concepto y
diferenciacin
Desde que se empez a hablar de ellas a principios de los aos noventa, han
aparecido numerosas definiciones de biblioteca digital. A partir de un detallado
anlisis de las mismas, Borgman (1999) diferenci dos mbitos de procedencia:






Pgina 2

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Las definiciones procedentes del mbito bibliotecario, que enfatizan el
papel de los servicios a los usuarios.
Las procedentes del mbito informtico, que ponen su nfasis en el
almacenamiento y acceso a los contenidos.
De este doble origen se deriva una doble concepcin de biblioteca digital:
La biblioteca digital entendida como extensin o evolucin de la biblioteca
tradicional. Comprende definiciones stricto sensu como las de la Digital Library
Federation (DLF, 1998), la UNESCO Digital Library Taskforce.
La biblioteca digital entendida como simple almacn o base de datos. Sera,
por tanto, la ms cercana al concepto de repositorio, y comprende
definiciones lato sensu como la del IMS.
En las diferentes definiciones se identifican cuatro dimensiones, que conforman la
concepcin actual de biblioteca digital:
1. Comunidad. Referida al contexto social, poltico, legal y cultural en que se
desarrolla la biblioteca digital.
2. Tecnologa. Considerada el motor de la biblioteca digital, del avance en su
desarrollo depende el desarrollo de las potencialidades de la biblioteca
digital.
3. Contenido. Referida a cualquier tipo de documentos, tanto digitales como
no digitales (lo que alude al concepto de biblioteca hbrida).
4. Servicios. El diseo de formas de acceso adecuadas representa la finalidad
ltima de la biblioteca digital, que en el futuro deber facilitar servicios de
referencia digital, respuesta en tiempo real, alfabetizacin informacional,
etc.
Entre las instituciones que han promovido su desarrollo se encuentran:
Digital Library I nitiative (DLI). Financiada por el gobierno de EE. UU. e
iniciada en 1994, actualmente se encuentra en su segunda fase.
Digital Library Federation (DLF). Consorcio de instituciones
estadounidenses, principalmente acadmicas. Iniciada en 1995.
DELOS Network of Excellence on Digital Libraries. Financiada por la
Comisin Europea e iniciada en 2004. Fin previsto: 2008.
Online Computer Library Center (OCLC). Entidad sin nimo de lucro
estadounidense fundada en 1967 que ha desarrollado varios proyectos
relacionados con bibliotecas digitales.






Pgina 3

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
J oint I nformation Systems Committee (JISC). Organizacin creada en
1993 para el desarrollo de TIC en Educacin.1.3. Bibliografa
ATHERTON, L. (2002). Seamless UK: building bridges between information islands.
New Library World, vol. 103, n. 11/12, p. 467-474.
BORGMAN, C. L. (1999). What are digital libraries? Competing visions. Information
Processing and Management, vol. 35, n. 3, p. 227-243.
DLF (Digital Library Federation) (1998). A working definition of digital library [en lnea].
[Consulta: 22 de febrero de 2007]. Disponible en:
<http://www.diglib.org/about/dldefinition.htm>.






Pgina 4

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Mdulo 2. El papel de la descripcin: qu son los
metadatos?
2.1. Definicin y conceptos bsicos
Al hablar de metadatos, la primera, ms intuitiva y a la vez ya casi manida idea que
se nos suele presentar es la de datos sobre datos, trada de su etimologa (del
griego meta, ms all, que en Informtica denota sobre y el latn datum, que en
su acepcin actual recogida en el DRAE se relaciona con documento o informacin
tratable mediante ordenadores, esto es, digital). Sin embargo, si bien esta
definicin sirvi para popularizar el trmino desde mediados de los aos 90, hoy no
resulta ya especialmente til -ms all del contacto inicial- ni estrictamente vlida.
Greenberg (2003) aporta una definicin que consideramos ms completa:
metadatos son datos estructurados sobre un objeto, que soportan
funciones asociadas al objeto designado. Con esta definicin, la autora quiere
destacar tres aspectos relevantes: 1) la estructuracin de los datos conforme a
unas normas (que se denominan esquemas de metadatos), 2) la referencia de
esos datos estructurados a un objeto, que puede ser tanto fsico como lgico
(digital), al que se suele hacer referencia como DLO (Document Like Object u
objeto asimilable a un documento) y 3) la finalidad de los metadatos, que no es
otra que contribuir a que la funcin primordial del documento, que es la
comunicacin del mensaje informativo que le dio origen (Rodrguez Bravo, 2002),
sea desempeada de manera ptima a travs de los procesos de recuperacin de
informacin.
El trmino metadatos, que se emplea como tal en el mbito informtico desde los
aos 80 (Caplan, 2003, p.1), ha suscitado en la ltima dcada el inters de los
profesionales de la Documentacin. Diversos autores, entre ellos Lancaster (2002,
p. xi), han criticado el entusiasmo de stos con los metadatos, entendiendo que no
es sino un trmino de moda, trado de la mano de otras disciplinas, y que hace
referencia a tcnicas clsicas de las Ciencias Documentales: la descripcin formal
y de contenido. Sin embargo, el propio Lancaster reconoce que con la adopcin
del nuevo trmino se quiere atender a una realidad, la de los contenidos digitales
en red, que comporta una complejidad que quiz supera los lmites
tradicionalmente asignados a la descripcin bibliogrfica (Lancaster, 2002, p. 346).
De hecho, cuando se habla de metadatos se suele sobreentender que se est
haciendo referencia a la descripcin de recursos de informacin, es decir,
documentos digitales.
2.1.1. Registros y esquemas de metadatos
De esta manera, podemos definir los metadatos como descripciones normalizadas
de recursos que sirven para que stos puedan ser correctamente identificados y
recuperados en sistemas de informacin digital (SID).






Pgina 5

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Formalmente, los metadatos adoptan la forma de registros (en ingls, metadata
records), que presentan secuencias de pares atributo - valor". Los atributos son
las caractersticas o propiedades genricas de una clase de objetos que se han de
representar, mientras que los valores son propios y distintivos de cada recurso. As,
por ejemplo, para un sitio web se pueden identificar como atributos bsicos:
nombre o ttulo, autor, fecha, localizacin y tema. En un caso concreto, tomara los
siguientes valores:
Atributos Valores
Nombre o ttulo
Sitio web de la Universidad Carlos III de
Madrid
Autor Universidad Carlos III de Madrid
Fecha o fecha de
actualizacin
2007
Localizacin (URL)
http://www.uc3m.es
Tema Educacin Superior, Universidades, Madrid
En la prctica, los atributos constituyen elementos de los esquemas de metadatos,
y los valores asignables a los recursos descritos pueden ser bien de libre asignacin
o bien ser tomados de listas de valores o vocabularios controlados.
Los registros de metadatos se realizan de acuerdo a modelos descriptivos de
referencia denominados esquemas de metadatos (en ingls, metadata scheme).
Existen mltiples esquemas de metadatos, en funcin del tipo de recursos que
describan, si bien uno de los de mayor difusin es el Dublin Core Metadata Element
Set (DCMES), que trataremos en detalle ms adelante. Un esquema de metadatos
se puede definir como el conjunto de reglas y elementos que constituyen un
modelo de metadatos. Los esquemas determinan tanto la sintaxis como la
semntica. Respecto a la sintaxis, establecen los elementos y orden en que habrn
de disponerse stos as como el formato de etiquetado o codificado de los
metadatos. En cuanto a la semntica, ofrecen recomendaciones de uso de los
elementos, de vocabularios especializados o acepciones especficas de trminos en
determinados dominios (es el caso de los perfiles de aplicacin). En un esquema de
metadatos se recogen, en definitiva, cules son las caractersticas ms
representativas de los objetos que trata de describir as como la forma de elaborar
los registros de metadatos correspondientes.






Pgina 6

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
2.1.2. Descripcin mediante metadatos
La descripcin de fgbxdfbhfgbndhrecursos mediante metadatos se puede realizar
de dos maneras: una interna, mediante su integracin en el cdigo fuente del
recurso (en ingls este tipo se denomina embedded metadata), y otra externa
(stand-alone metadata), bien mediante la utilizacin de los elementos de
descripcin en un archivo HTML o XML independiente o bien como campos de una
base de datos que mantiene un enlace al documento descrito.
Un ejemplo de metadatos internos lo encontramos en el propio sitio web de la
Iniciativa Dublin Core de Metadatos (http://dublincore.org/). Si visualizamos su
cdigo fuente (Ver > Cdigo fuente), podremos acceder al registro de metadatos
correspondiente, realizado segn el esquema DC.







Pgina 7

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Un ejemplo de metadatos externos lo encontramos, por ejemplo, en el repositorio
de contenidos educativos MERLOT. En l se observa que los registros de metadatos
han servido para disear la base de datos que constituye el repositorio, de manera
que los atributos se han convertido en campos de la base para posibilitar la
bsqueda de recursos en funcin de los valores asignados previamente. As, en el
ejemplo seleccionado, Visual Chemistry Laboratory, se recogen caractersticas
como el tipo de material de que se trata, su formato, su coste de uso, fecha, autor,
categora temtica, etc. Asimismo, recoge un enlace al recurso descrito.






Pgina 8

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus







Pgina 9

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

La utilizacin de uno u otro tipo de metadatos suele depender de la naturaleza de
los recursos y del uso que se pretenda hacer de los mismos. Los metadatos
internos se suelen generar en el momento de creacin de los recursos (como en el
caso del fichero de audio que se muestra ms abajo); por su parte, en los externos
stos se generan con posterioridad, y, en el caso de metadatos aplicados al diseo
de bases de datos se suelen emplear para dar acceso a recursos ajenos, no
modificables, mientras que los externos anejos a los recursos en archivos
independientes se suelen emplear en el intercambio de registros (un ejemplo lo
veremos ms adelante con los paquetes de contenidos SCORM).






Pgina 10

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus







Pgina 11

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

2.2. Tipos de metadatos
Actualmente existe una gran diversidad en el campo de los metadatos, por lo que
no es fcil realizar una clasificacin de los mismos. Se suelen mencionar, entre
otros, criterios como su origen (humanos o automticos), forma (internos o
externos), estructuracin (de libre asignacin o estructurados en funcin de un
esquema concreto), nivel de descripcin (colecciones o recursos) o funcionalidad
(administrativos, descriptivos, etc.), si bien ninguno de ellos nos puede ofrecer sino
una aproximacin parcial.
En general, podemos decir que los recursos informativos poseen tres aspectos
fundamentales que pueden ser representados (descritos) mediante metadatos
(Gilliland-Swetland, 2000):
Su contenido: su mensaje informativo.






Pgina 12

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Su contexto: los agentes y circunstancias de creacin del recurso.
Su estructura: relaciones existentes entre recursos o partes de recursos
entre s.
Sin embargo, adems de los metadatos referentes al recurso en s, hay otros tipos
de metadatos que son necesarios para la gestin de recursos en sistemas de
informacin. Desde que un recurso es incorporado a un SID, pasa por diversos
momentos (vase debajo el grfico que representa el ciclo de vida de los
documentos) en los que intervienen diversos agentes y procesos, tanto manuales
como automatizados, que van agregando capas de metadatos relativos a dicho
objeto. As, en un primer momento, se le aaden datos relativos a su entrada en el
sistema (fecha, responsable, etc.), su estado (si es original o versin de otro
documento) y elementos pertinentes de descripcin (autora, fecha, indizacin o
categorizacin temtica, derechos de autor asociados al recurso, etc.).
Posteriormente, y a medida que el recurso es recuperado o modificado, se van
incorporando o actualizando los datos que componen el registro de metadatos. As,
suele ser necesario actualizar peridicamente los datos de localizacin del recurso
(en caso de que el recurso no cuente con DOI o sistema de identificacin similar) o
recoger informacin sobre el uso que ha recibido (nmero y tipo de usuarios que lo
han utilizado, anotaciones o valoraciones que han realizado stos, contextos en los
que se ha empleado -en relacin a la gestin de derechos de autor, etc.).

2.2.1. Clasificacin de Gilliland-Swetland
Una de las clasificaciones ms aceptadas de los distintos tipos de metadatos
implicados es la de Gilliland-Swetland (2000), que atendiendo a su funcin
distingue:
Tipo Uso Ejemplos
Administrativos
Se emplean en la gestin
de los recursos en
sistemas de informacin
Informacin sobre la
adquisicin del recurso
Registro de derechos de






Pgina 13

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
autor
Documentacin de requisitos
legales de acceso
Informacin sobre la
localizacin del recurso
Criterios de seleccin para la
digitalizacin
Control y diferenciacin de
versiones
Descriptivos
Se utilizan para
identificar recursos y
representar su contenido
informativo
Registros catalogrficos
Ayudas en las bsquedas
ndices especializados
Hiperenlaces entre recursos
Anotaciones de usuarios
De
conservacin
Recogen informacin
relevante para la gestin
de la conservacin de los
recursos
Documentacin del estado de
conservacin de los recursos
Documentacin de las
acciones necesarias para
preservar las versiones tanto
fsicas como digitales de los
recursos
Tcnicos
Recogen las
caractersticas tcnicas
del recurso y los
sistemas necesarios para
su utilizacin
Documentacin de hardware
y software requeridos
Informacin sobre la
digitalizacin (formato, ratio
de compresin, etc.)
Datos de autenticacin y
seguridad (claves, cdigos de
encriptacin, etc.)
De uso
Se emplean para
determinar el tipo y nivel
Registro de usuarios y del
uso que hacen de los






Pgina 14

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
de uso de los recursos recursos
Registro de los contextos de
reutilizacin
2.2.2. Clasificacin de Caplan
Caplan (2003), por su parte, considera los siguientes tipos:
Tipo Funcin/subtipo Descripcin
Recuperacin
Facilitan encontrar recursos
pertinentes
Identificacin
Facilitan la individualizacin y
distincin entre recursos similares
Seleccin
Permiten determinar cules son
los recursos que mejor responden
a una necesidad de informacin
concreta
Colocacin Permiten agrupar recursos
AdquisicinPermiten
localizar el recurso o una
copia del mismo


Evaluacin
Proporcionan valoraciones de los
recursos, bien de los autores de
los recursos o registros de
metadatos o bien de los usuarios
Relacin
Permiten registrar las relaciones
existentes entre los recursos
descritos y otras versiones o
recursos
Descriptivos
Usabilidad
Recogen informacin sobre las
caractersticas tcnicas del






Pgina 15

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
recurso que facilitan su uso
Gestin de derechos
Recogen las condiciones de uso
del recurso en funcin de la
proteccin de derechos de autor
Preservacin
Permiten conocer el estado de los
recursos y sus requisitos de
preservacin
Administrativos
Tcnicos
Recogen las caractersticas
tcnicas de los recursos tales
como formato, duracin, etc.
Estructurales Vinculacin
Permiten registrar las relaciones
existentes entre las partes
componentes de los recursos
descritos
2.2.3. Tipos de metadatos (a efectos prcticos)
En la prctica, se observa que la mayor parte de los esquemas de metadatos
recogen informacin relativa a la mayora de los tipos mencionados, si bien el
tratamiento (nivel de detalle o anlisis) que reciben en cada caso es diferente, en
funcin del tipo de recursos que traten de describir.
A la vista de las aportaciones reseadas, cabr distinguir, a efectos prcticos, los
siguientes tipos de metadatos:
Metadatos relativos a la gestin de recursos en SID
Adquisicin
Datos de incorporacin del recurso al SID
(identificador, fecha de incorporacin en el
SID, responsable, etc.)
Tcnicos
Caractersticas tcnicas del recurso (formato,
extensin, etc.)
Administrativos
Gestin de
derechos
Restricciones de uso en virtud de los
derechos de autor asociados (materiales
protegidos, adquisicin del licencias, etc.)






Pgina 16

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Preservacin
Estado de los recursos y sus requisitos de
preservacin
Metadatos relativos a los recursos
Identificacin
Datos bsicos de identificacin del recurso
(autor, ttulo o nombre, fecha de creacin o
actualizacin, etc.)
Representacin
Palabras clave, descriptores o clasificacin
temtica del recurso
Descriptivos
Relacin
Vnculos entre partes componentes de un
recurso, versiones y otros recursos
relacionados
Metadatos relativos al uso de los recursos
Registro de
usuarios
Nmero, tipo y nivel de usuarios que
acceden al recurso
De uso
Valoracin
Anotaciones realizadas por los usuarios
respecto al recurso
2.3. Bibliografa
CAPLAN, P. (2003). Metadata basics. En: CAPLAN, P. Metadata Fundamentals for All
Librarians. Chicago: American Library Association, p. 116-128.
GILLILAND-SWETLAND, A. J. (2000). Introduction to Metadata: Setting the Stage
[en lnea]. En: BACA, M. (ed.). Introduction to metadata: pathways to digital
information. Los Angeles: Getty Information Institute, p. 1-8. Disponible en:
http://www.getty.edu/research/conducting_research/standards/intrometadata/setti
ng.pdf.
GREENBERG, J. (2003). Metadata and the world wide web. En: BATES, M. J.;
MAACK, M. N. y DRAKE, M. (eds.). Encyclopedia of Library and Information
Science. New York: Dekker, p. 1876-1888.
RODRGUEZ BRAVO, B. (2002). El documento: entre la tradicin y la renovacin.
Gijn: Trea
LANCASTER, F. W. (2003). Indexing and abstracting in theory and practice.






Pgina 17

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
London: Facet. ISBN 1856044823.
Bibliografa bsica en castellano
BACA, M. (ed.) (1999). Introduccin a los metadatos: vas a la informacin digital.
Los ngeles: J. Paul Getty Trust. ISBN ISBN 0892365358
MNDEZ RODRGUEZ, E. M. (2002). Metadatos y recuperacin de informacin:
estndares, problemas y aplicabilidad en bibliotecas digitales. Gijn: Trea






Pgina 18

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Mdulo 3. Interoperabilidad y estndares
3.1. Concepto y tipos de interoperabilidad
Sealbamos en la primera leccin la necesidad de integracin de los sistemas y
servicios de informacin digital. Pues bien, esta integracin pasa por hacer posible
su capacidad de trabajar de forma conjunta, a lo cual se denomina genricamente
interoperabilidad. El concepto de interoperabilidad es un concepto complejo, que se
aplica en mltiples contextos, referido desde, por ejemplo, la posibilidad de utilizar
un dispositivo como una memoria USB (pendrive) y los datos que en l se
almacenan en diversas mquinas con diferentes configuraciones (sistemas
operativos, etc.), a la posibilidad de realizar bsquedas simultneas en varios
catlogos de bibliotecas (lo que se conoce como bsqueda federada o federated
search). En relacin a los metadatos, el objetivo primordial es precisamente hacer
posible que recursos que han sido descritos mediante diferentes esquemas puedan
ser recuperados ms all de los diferentes sistemas locales en que se generaron
dichas descripciones. Para ello, ser necesario que los metadatos se hagan
conforme a estndares o conformable a estndares de uso comn en su mbito de
aplicacin.
Desde el punto de vista tecnolgico, la interoperabilidad se define como la
capacidad de dos o ms sistemas o componentes para intercambiar informacin y
usar la informacin que han intercambiado (IEEE, 1990).
Desde el punto de vista del diseo de sistemas de informacin, la interoperabilidad
se entiende como la labor de construir servicios coherentes para usuarios cuando
los componentes individuales son tcnicamente diferentes y estn gestionados por
diferentes organizaciones (Arms, 2000).
La interoperabilidad se manifiesta, por tanto en (Borgman, 2000):
La capacidad de los sistemas para trabajar entre s en tiempo real.
La capacidad del software para trabajar en diferentes sistemas.
La capacidad de los datos para ser intercambiados entre diferentes sistemas
(portabilidad).
Para ello, se ha de potenciar el desarrollo de (Arms, 2000):
Formatos estandarizados de documentos.
Formatos estandarizados de metadatos.
Formatos estandarizados de protocolos de comunicacin y recuperacin.
Medios estandarizados de autenticacin y seguridad.






Pgina 19

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
3.1.1. Tipos de interoperabilidad
En relacin a los metadatos, se diferencian dos tipos de interoperabilidad: la
interoperabilidad sintctica y la interoperabilidad semntica. La primera hace
referencia a la interoperabilidad basada en la utilizacin de formatos estandarizados
de codificacin de documentos (formatos como XML y RDF, que veremos ms
adelante), mientras que la segunda hace referencia a la utilizacin de instrumentos
de representacin semntica estandarizados (esquemas, ontologas y vocabularios).
Un concepto relevante a la hora de hablar de interoperabilidad semntica es el
concepto de crosswalks (pasarelas o tablas de correspondencia). La DCMI define
crosswalk como una tabla que mapea las relaciones y equivalencias entre dos o
ms esquemas de metadatos (Woodley, 2003). Se trata, pues, de buscar
correspondencias entre los elementos de al menos dos esquemas, identificando las
coincidencias en la semntica que intentan representar los distintos elementos, con
la finalidad de que dos o ms sistemas de informacin que utilizan esquemas
descriptivos distintos logren alcanzar el mximo grado de interoperabilidad entre s.
Un ejemplo de crosswalk sera, por ejemplo, el realizado por la Biblioteca del
Congreso de los Estados Unidos entre el esquema Dublin Core y el formato MARC
que se presenta a continuacin (tomado de
http://www.loc.gov/marc/marc2dc.html):
Elementos DC Campos MARC
Title 245
100, 110, 111, 700, 710, 711
Creator
720
Subject 600, 610, 611, 630, 650, 653
Description 500-599, excepto 506, 530, 540, 546
Contributor
Publisher 260$a$b
Date 260$c
Type Leader06, Leader07






Pgina 20

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
655
Format 856$q
Identifier 856$u
Source 786$o$t
008/35-37
Language
546
Relation 530, 760-787$o$t
651
Coverage
752
Rights 506, 540
Fig. 1: Mapeo DC-MARC realizado por la Library of Congress
Al proceso de conversin (de alguna manera, traduccin) entre esquemas
distintos del que se derivan los crosswalks se denomina mapeo (mapping).
Obviamente, este proceso no est exento de dificultades, ya que, como seala
Cromwell-Kessler (Baca, 1999:22) algunas de las cuestiones ms difciles de
resolver pueden ser, entre otras:
La existencia de dos o ms conceptos que puedan estar representados por
un nico elemento en el otro esquema con el que se quiere realizar el
mapeado (target scheme).
La existencia de informacin que en un esquema se encuentra consignada en
elementos tipo notas y que en el esquema de destino est recogida en
elementos especficos.
Que no existan equivalencias para determinados elementos.
3.2. Estndares: identificacin y localizacin (DOI, URI,
PURL)
La normalizacin de las formas de identificacin y localizacin de recursos digitales






Pgina 21

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
trata de proporcionar estabilidad a los mismos. Por su especial implicacin en en
desarrollo de metadatos, trataremos, al menos brevemente, tres de los principales
estndares: DOI, URI y PURL.
DOI ( Digital Obj ect I dentifier)
Definido por el estndar NISO Z39.84: DOI Syntax, que fue desarrollado por dos
asociaciones de editores estadounidenses, el DOI trata de proporcionar enlaces
permanentes a los recursos a los que se refiere. Cada cdigo de identificacin de un
recurso est registrado en un directorio global gestionado por la International DOI
Foundation (www.doi.org). Dicho registro deber ser actualizado en funcin de los
distintos cambios de ubicacin que experimenten los recursos.
Cada DOI est compuesto por un prefijo, que es un cdigo asignado a cada
organizacin que lo solicite, y un sufijo, que puede ser un identificador preexistente
(por ejemplo, el ISBN) u otro creado ad hoc. Ejemplos de DOI seran:
10.1234/NP5678
10.5678/ISBN-0-7645-4889-4
10.2224/2004-10-ISO-DOI
URI ( Universal Resource I dentifier)
El URI es una cadena de caracteres que identifican a un recurso en la red. El tipo de
URI ms habitual es el ya ms que conocido URL (Uniform Resource Locator), que
especifica el protocolo de comunicacin (http, ftp, gopher, etc.) y la ubicacin del
recurso.
PURL ( Persistent Uniform Resource Locator)
Similar al DOI, fue desarrollado por la OCLC (http://www.purl.org/). Se trata de
una URL referida a un recurso que apunta no al recurso en s directamente, sino a
un servicio intermedio que gestiona los cambios de ubicacin de los recursos,
redireccionando al usuario a la ltima ubicacin registrada para dicho recurso. Una
forma tpica de PURL sera: http://purl.oclc.org/OCLC/PURL/FAQ.
3.3. Estndares: lenguajes de marcado (HTML, XML, RDF)
En esta seccin realizaremos una breve aproximacin a los lenguajes de marcado,
exponiendo sus principales conceptos y aportaciones, pero sin entrar en el
procedimiento de codificacin en s, que excedera los lmites del presente curso.
Los estndares de codificacin ms relevantes para el tema que nos ocupa son:
HTML (HyperText Markup Language)
XML (Extensible Markup Language)






Pgina 22

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
RDF (Resource Description Framework)
3.3.1. HTML (hyperText Markup Language)
Este lenguaje de codificacin, nacido a principios de los aos 90, es una
simplificacin de un lenguaje mucho ms complejo denominado SGML (Standard
Generalized Markup Language). HMTL es un estndar (vase el documento en que
se describe su estructura bsica: http://www.w3.org/TR/REC-
html40/struct/global.html#h-7.4.4.2) que trata de facilitar la publicacin de
contenidos en la web mediante su codificacin con etiquetas (tags). Sus principales
ventajas son que, al igual que su predecesor SGML, HTML es un formato no
propietrario (no depende de una empresa concreta) y que es independiente de
plataformas hardware o software especficas, lo que facilita el intercambio de
informacin en sistemas distribuidos. Su principal limitacin radica en su falta de
capacidad expresiva, ya que el nmero de marcas que se pueden utilizar en la
codificacin de un documento est limitado a las que se han predefinido en el
estndar, orientadas adems en su mayora a aspectos relativos a la presentacin
de los documentos y no a su contenido. Sin embargo, hoy da HTML sigue siendo el
lenguaje ms comnmente utilizado para la publicacin de documentos en la Web,
en gran medida debido a su sencillez de uso para usuarios no expertos.
3.3.2. XML (extensible Markup Language)
Desde su primera aparicin pblica en el ao 1996, XML ha sido protagonista
destacado del desarrollo de aplicaciones y servicios para la web. A medio camino
entre la simplicidad de HTML y la expresividad de SGML, se trata de un estndar
desarrollado por el Consorcio Web (W3C o World Wide Web Consortium) que ofrece
un modelo para representar el contenido informativo de los recursos de manera que
ste sea fcilmente procesable por distintas aplicaciones. De hecho, XML no sera
de gran utilidad sin un conjunto de aplicaciones relacionadas que se ocupan de la
forma en que se han de procesar los documentos XML, lo que otorga utilidad
prctica al estndar.
Una de las principales caractersticas de XML es que, a diferencia de HMTL, permite
diferenciar entre la forma de presentacin de los documentos, su estructura y su
contenido informativo. Este hecho tiene importantes repercusiones: por una parte,
posibilita un control ms eficiente y a la vez sencillo de las caractersticas de
presentacin a travs de hojas de estilo (CSS); por otra, permite utilizar un nmero
ilimitado de etiquetas en la descripcin del contenido, siempre que stas se
encuentren definidas en su correspondiente DTD (Document Type Definition), que
es el documento en que se especifica el conjunto de marcas que pueden ser
utilizadas para codificar un determinado tipo de documento. De hecho, para que un
sistema pueda procesar un documento XML, ste habr de referir la DTD en que se
basa.
As, en el ejemplo del sitio web de la Iniciativa Dublin Core de Metadatos
(http://dublincore.org/), observamos la siguiente estructura:






Pgina 23

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0
Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-
transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml"
lang="en-US" xml:lang="en-US">
Declaracin de tipo de
documento, sealando las
DTD correspondientes
<head> Inicio de la cabecera
<title>Dublin Core Metadata Initiative (DCMI)</title> Etiqueta de ttulo
<link rel="schema.DC"
href="http://purl.org/dc/elements/1.1/" />
Etiqueta de enlace al
esquema DC
<meta name="DC.title" content="Dublin Core
Metadata Initiative (DCMI) Home Page" />
<meta name="DC.description" content="The Dublin
Core Metadata Initiative is an open forum ()" />
<meta name="DC.date" content="2007-05-07" />
<meta name="DC.format" content="text/html" />
<meta name="DC.contributor" content="Dublin Core
Metadata Initiative" />
<meta name="DC.language" content="en" />
()
Etiquetas de metadatos
(meta tags) del estandar
empleadas en la
descripcin del recurso
</head> Cierre de la cabecera
<body>
()
</body>
Cuerpo del documento
</html> Cierre del documento html
En la prctica, HTML y XML se pueden llegar a utilizar incluso de forma combinada
(XHTML), ya que aunque XML ofrece interesantes ventajas y ha recibido un
tratamento entusiasta por parte de la comunidad web en los ltimos aos, esto no
quiere decir que haya sustituido a HTML, ya que en principio ambos atienden a
funcionalidades distintas.
3.3.3. RDF (Resource Description Frameworks)
Se trata de una recomendacin (no estndar propiamente dicho) del Consorcio Web






Pgina 24

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
orientada a representar la semntica implcita en los documentos de manera que
sta pueda ser procesada y comprendida por mquinas. Presenta un modelo
conceptual en funcin del cual se pueden representar los metadatos referentes a
los recursos, sus propiedades y valores con otros lenguajes, generalmente XML.
Junto a este ltimo, es considerado la base de la denominada Web semntica,
como se muestra en la siguiente figura:

Fig. 2: Estructura (layer-cake) de la web semntica (Daconta, Obrst & Smith, 2003)
Un ejemplo de registro DC codificado en RDF (XML) sera el siguiente:
<?xml version="1.0" ?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description about="http://purl.org/DC/documents/notes-cox-816.htm">
<dc:title>Recording qualified Dublin Core metadata in HTML</dc:title>
<dc:description> We describe a notation for recording qualified Dublin Core
metadata in HTML meta elements. The syntax includes recommended usage of the
standard HTML syntax to record the different classes of qualification needed to
represent the model.</dc:description>
<dc:date>1999-08-18</dc:date>
<dc:format>text/html</dc:format>
<dc:language>en</dc:language>
<dc:publisher>Dublin Core Metadata Initiative</dc:publisher>
</rdf:Description>
</rdf:RDF>







Pgina 25

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
3.4. Estndares: protocolos (Z39.50, OAI-PMH)
Los protocolos establecen un conjunto de reglas que regulan la comunicacin entre
sistemas informticos (dos conocidos protocolos son el HTTP o Hypertext Transport
Protocol y el FTP o File Transfer Protocol). En esta seccin destacamos dos
protocolos especialmente relevantes para la recuperacin de informacin en SID:
Z39.50 y OAI-PMH.
3.4.1. Z39.50
Se trata de un estndar utilizado principalmente en el mbito bibliotecario que hace
posible que dos sistemas informticos en la red puedan comunicarse con el
propsito de intercambiar y recuperar informacin, de manera que los usuarios
finales puedan realizar bsquedas en varias bases de datos (por ejemplo, catlogos
de bibliotecas) de manera simultnea a travs de un interfaz comn y sin necesidad
de conocer la sintaxis de bsqueda empleada en cada una de ellas.
Su origen est en el proyecto LSP (Linked System Project) desarrollado en la
dcada de 1980 con objeto de normalizar la bsqueda en los catlogos de la OCLC,
LOC (Library of Congress), RLG (Research Library Group) y la WLN (Western
Library Network). Recogido en 1988 en la norma NISO de la que toma su nombre
(ANSI/NISO Z39.50-1995: Information Retrieval, Application Service Definition and
Protocol Specification), en 1997 se aprob como estndar ISO 23950 la tercera
versin del protocolo, siendo la NISO del ao 2003 la ltima presentada hasta el
momento (texto de la misma accesible en: http://www.loc.gov/z3950/agency/Z39-
50-2003.pdf). De su mantenimiento se encarga la LOC Z39.50 Maintenance Agency
(http://www.loc.gov/z3950/agency/) y el grupo de implementadores ZIG (Z39.50
Implementors Group, http://www.loc.gov/z3950/agency/zig/zig-meetings.html).
El sistema que define el protocolo est basado en una estructura cliente/servidor.
Tanto la aplicacin cliente, denominada Zclient, que es aquella desde la que se
formulan las consultas, como la aplicacin servidor o Zserver, que es la que ejecuta
las consultas contra su base de datos y devuelve los resultados correspondientes,
deben ser capaces de interpretar el protocolo.
El protocolo normaliza los mensajes que estas dos aplicaciones deben enviarse, su
semntica y formato de transferencia de datos. En primer lugar, la aplicacin
cliente traduce la estrategia de bsqueda planteada por el usuario a un conjunto de
mensajes vlidos segn el protocolo, y a continuacin las enva al servidor. El
servidor recibe entonces el mensaje, lo traduce al lenguaje comprensible para la
base de datos de destino, ejecuta la bsqueda y devuelve los resultados al cliente
en un formato vlido segn el protocolo Z39.50, que de nuevo es interpretado en la
aplicacin inicial.
La adopcin del protocolo por parte de los principales proveedores de Sistemas
Integrados de Gestin de Bibliotecas (SIGB) mediante la implementacin en los






Pgina 26

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
mismos de software Zserver y Zclient ha permitido alcanzar un ms que
satisfactorio grado de interoperabilidad entre catlogos de bibliotecas de todo el
mundo. Sin embargo, el potencial del protocolo va ms all, y son varios los
proyectos que, desde finales del 2001, fecha en que se aprob el programa ZING
(Z39.50 International Next Generation) para definir la evolucin del protocolo en el
marco de la Web, abordan su aplicacin en distintos mbitos: SRW
(Search/Retrieve Service), CQL (Common Query Language), ZOOM (Z39.50 Object-
Oriented Model), etc.
Cabe mencionar que el protocolo Z39.50 es un estndar de aplicacin compleja, por
lo que se han desarrollado los denominados perfiles. Los perfiles especifican las
partes, funciones y caractersticas del protocolo que una implementacin especfica
debe soportar. Se han desarrollado perfiles para informacin gubernamental
(GILS), datos geoespaciales (GEO) o la navegacin de tesauros (Zthes). Una
completa lista de perfiles del protocolo se puede encontrar en:
http://www.loc.gov/z3950/agency/profiles/profiles.html.
3.4.2. Open Archives Initiative Protocol for Metadata
Harvesting (OAI-PMH)
En cumplimiento de su misin estratgica, desarrollar y promover estndares de
interoperabilidad que busquen facilitar la difusin eficiente de contenidos
(http://www.openarchives.org/), la Open Archives Initiative (OAI), ha desarrollado
un protocolo especfico que permite intercambiar registros de metadatos de
publicaciones acadmicas (artculos, informes, etc. producidos en el mbito
acadmico, normalmente conocidos como e-prints) entre los distintos repositorios
de acceso abierto que los pudieran albergar.
La OAI propuso con este protocolo una tecnologa alternativa al Z39.50 para la
bsqueda bibliogrfica simultnea en varias bases de datos. Su protocolo trata de
salvar la dificultad que plantea a Z39.50 la recuperacin sobre mltiples bases de
datos al mismo tiempo (bsqueda distribuida), y para ello plantea el uso del
harvesting o recoleccin de registros de metadatos hacia una base de datos
centralizada (Service Provider), que acta como intermediaria entre los repositorios
que los contienen (Data Providers) y el usuario final.
La comunicacin que se establece entre los sistemas implicados se basa en la
utilizacin de instrucciones del protocolo http para emitir preguntas y obtener
respuestas (GET / POST). Un ejemplo de peticin y respuesta entre cliente y
servidor sera el siguiente (Barrueco y Subirats, 2003):
Peticin:
http://an.oa.org/OAI-script?
verb=GetRecord&identifier=oai:arXiv:hep-th/9901001&metadataPrefix=oai_dc






Pgina 27

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Respuesta:
<?xml version="1.0" encoding="UTF-8" ?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/
http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
<responseDate>2002-05-01T19:20:30Z</responseDate>
<request verb="GetRecord" identifier="oai:arXiv:hep-th/9901001"
metadataPrefix="oai_dc">http://an.oa.org/OAI-script</request>
<GetRecord>
<record>
<header>
<identifier>oai:arXiv:cs/0112017</identifier>
<datestamp>2001-12-14</datestamp>
<setSpec>cs</setSpec>
<setSpec>math</setSpec>
</header>
<metadata>
<oai_dc:dc
xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/
http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
<dc:title>Using Structural Metadata to Localize Experience of Digital
Content </dc:title>
<dc:creator>Dushay, Naomi</dc:creator>
<dc:subject>Digital Libraries</dc:subject>
<dc:description>With the increasing technical sophistication of
both information consumers and providers, there is
increasing demand for more meaningful experiences of digital
information. We present a framework that separates digital
object experience, or rendering, from digital object storage
and manipulation, so the rendering can be tailored to
particular communities of users.
</dc:description>
<dc:description>Comment: 23 pages including 2 appendices,
8 figures</dc:description>
<dc:date>2001-12-14</dc:date>
</oai_dc:dc>
</metadata>
</record>
</GetRecord>
</OAI-PMH>
Como se puede observar en este ejemplo, el formato de intercambio es XML, y el






Pgina 28

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
esquema de metadatos empleado es Dublin Core no cualificado, si bien este
protocolo admite la utilizacin de otros esquemas adicionales.
3.5. Estndares de metadatos: desarrollo y tipologa
Una norma se puede definir como un documento de aplicacin voluntaria que
contiene especificaciones tcnicas basadas en el resultado de la experiencia y del
desarrollo tecnolgico; fruto del consenso entre todas las partes interesadas e
involucradas en la actividad objeto de la misma (AENOR,
http://www.aenor.es/desarrollo/normalizacion/quees/ventajas.asp). En efecto, el
desarrollo de normas sigue un proceso complejo, que podra ser resumido
grficamente de la siguiente manera:

Fig. 3: Esquema de desarrollo de estndares
Como se puede observar, las necesidades de nuevos productos o servicios
expresadas por determinadas comunidades de uso (usuarios, organizaciones, etc.)
al sector industrial propicia el desarrollo de especificaciones (normas de facto), que
a la larga pueden dar lugar a normas (normas de iure) en las que se recogen las
experiencias y prcticas previas, y que son publicadas por entidades de
normalizacin nacionales e internacionales (por ejemplo, ISO). La validez de estas
normas est sujeta a la utilidad que posean para las comunidades de uso, y en la
medida en que sirvan a sta pueden dar lugar a nuevas especificaciones y normas.






Pgina 29

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
En el contexto de los metadatos, se diferencian tres tipos de esquemas:
Estndares: esquemas normalizados, aprobadas por organismos oficiales de
normalizacin (ISO, ANSI, AENOR, etc.) y que son adoptadas por los distintos
sectores afectados. Es el caso del estndar Dublin Core (ISO 15836:2003) o la
norma del IEEE para objetos de aprendizaje (IEEE 1484.12.1-2002, aprobada por
ANSI el 14 de noviembre de 2002) .
Especificaciones: esquemas desarrollados por consorcios, principalmente de
entidades industriales. Su utilidad reside en hacer llegar a los rganos de
normalizacin las necesidades de los distintos sectores implicados o afectados.
Pueden servir, por tanto, de base para la elaboracin de normas. Es el caso, por
ejemplo, de las especificaciones del IMS o ADL (SCORM).
Implementaciones: tambin llamados perfiles de aplicacin, son esquemas
transformados en atencin a las necesidades especficas de determinadas
comunidades de usuarios. Recogen elementos de uno o varios estndares y/o
especificaciones, y se implementan bien aplicando restricciones de uso (nmero de
elementos o repeticiones de los mismos) o bien aadiendo extensiones (nuevos
elementos o vocabularios/espacios de nombres, namespaces).
3.6. Bibliografa
ARMS, W. Y. (2000). Digital libraries [en lnea]. Cambridge, MASS: MIT Press.
[Consulta: 21 de marzo de 2007]. Disponible en:
<http://www.cs.cornell.edu/wya/DigLib/>. ISBN 0262018808.
BACA, Murtha (1999). Introduccin a los metadatos: vas a la informacin digital.
Los ngeles: J. Paul Getty Trust. ISBN ISBN 0892365358.
BARRUECO, J.M.; SUBIRATS, I. (2003). OAI-PMH: Protocolo para la transmisin de
contenidos en Internet [en lnea]. Disponible en:
<http://www.uv.es/=barrueco/cardedeu.doc>.
BORGMAN, C.L. (2000). From Gutenberg to the Global Information Infrastructure:
Access to information in the networked world. Cambridge, USA: MIT Press. ISBN
026202473X.
Institute of Electrical and Electronics Engineers (1990). IEEE Standard Computer
Dictionary: A Compilation of IEEE Standard Computer Glossaries. New York: IEEE.
Disponible en: http://www.sei.cmu.edu/str/indexes/glossary/interoperability.html.
WOODLEY, M.S. (2003). Glosario DCMI. [en lnea].
Disponible en: <http://www.sedic.es/glosario_DCMI.pdf>.






Pgina 30

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Bibliografa bsica en castellano
ABSYSNET.COM (2003) ZING Z39.50 International: Next Generation [en lnea].
Disponible en: <http://www.absysnet.com/tema/tema25.html>.
ABSYSNET.COM (2001) Z39.50 [en lnea]. Disponible en:
<http://www.absysnet.com/tema/tema0.html>.






Pgina 31

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Mdulo 4. Estndar Dublin Core (ISO 15836:2003)
4.1. Caractersticas del esquema DC
En este apartado est dividido en cuatro subapartados:
Breve historia de la Dublin Core Metadata Initiative (DCMI).
Organizacin de la DCMI.
DC en Espaa.
Caractersticas del estndar.
4.1.1. Breve histria de la Dublin Core Matadata Initiative
(DCMI)
A mediados de los aos 90, se empez a apreciar que la creciente cantidad de
documentos electrnicos disponibles en la red imposibilitaba su tratamiento
profesional. Por ello, un grupo de expertos procedentes de diversos mbitos de
trabajo, aunque principalmente de las Ciencias Documentales, decidi que deban
pensar en un modo de facilitar que los propios autores dieran un tratamiento
documental bsico (de ah el trmino Core) a los contenidos que publicaban en la
web y dotar a stos de unas mnimas garantas de poder ser recuperados a
posteriori mediante los motores de bsqueda. As, en 1995 se celebr en Dublin
(Ohio, Estados Unidos, ciudad de la que toma su nombre) la primera reunin de la
iniciativa, promovida por la OCLC (Online Computer Library Center) y el NCSA
(National Center for Supercomputing Applications), que en adelante se denominara
DC1 (las distintas reuniones de la iniciativa fueron numeradas con objeto de
facilitar la ubicacin cronolgica de las distintas decisiones adoptadas). En esta
primera reunin se realiz una primera aproximacin al objeto de descripcin, el
DLO (Document Like Object) y al modelo descriptivo, el Dublin Core Metadata
Element Set (DCMES). El concepto de DLO hace referencia a la unidad documental
mnima tratable, que si bien en origen puede referirse a elementos tanto digitales
como no digitales, en la prctica se identifica con cualquier documento digital al que
se pueden incorporar metadatos con objeto de facilitar su recuperacin. En los
ltimos aos, el trmino predominante ha sido, no obstante, el de recursos
digitales (digital resources) o simplemente recursos. Por su parte, el conjunto
de elementos Dublin Core ha ido evolucionando a lo largo de las diferentes
reuniones que se han ido celebrando, tanto en forma de workshops o talleres
peridicos como de congresos que anualmente se han celebrado en distintas
ciudades del mundo (http://dublincore.org/workshops/), desde Tokyo (2001) a
Singapur (2007), pasando por Madrid (2005). Fruto del trabajo desarrollado y del
grado de consenso alcanzado con el mismo, el DCMES se convirti en norma
estadounidense ANSI/NISO Z39.85 en el ao 2001






Pgina 32

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
(http://www.niso.org/standards/resources/Z39-85.pdf), aprobndose en 2003
como norma internacional ISO 15836:2003
(http://www.niso.org/international/SC4/n515.pdf).
4.1.2. Organizacin de la DCMI
El trabajo de la iniciativa est liderado por un equipo directivo (conformado en la
actualidad por Max Dekkers y Thomas Baker) que se encarga de marcar las lneas
de actuacin as como de supervisar las distintas actividades desarrolladas. Cuenta
con un equipo asesor denominado Board of Trustees (compuesto actualmente por
nueve miembros de distintas nacionalidades) que supervisa el conjunto de la
iniciativa, busca financiacin y promociona la adopcin del DCMES. Por otra parte,
el Usage board se encarga de controlar el desarrollo de los distintos elementos
que conforman el esquema a partir del modelo conceptual base, el DCMI Abstract
Model (http://dublincore.org/documents/abstract-model/), as como las distintas
experiencias y necesidades de las comunidades en se que va aplicando el esquema,
que se canalizan a travs de los distintos grupos de trabajo de la iniciativa (como la
DCMI Libraries Community dedicado a las bibliotecas o la DCMI Education
Community dedicado a la comunidad educativa).
4.1.3. DC en Espaa
En Espaa existe un grupo de trabajo asociado a la iniciativa, el Grupo de Trabajo
sobre Normalizacin para la Recuperacin de informacin en Internet
(NORMAWEB), que desarrolla sus actividades desde la SEDIC (Asociacin Espaola
de Documentacin e Informacin). Dicho grupo mantiene un mirror espaol de la
web de la DCMI (http://es.dublincore.org/) as como una lista de distribucin en
RedIris, DCMI-ES, abierta a la comunidad hispanohablante
(http://www.rediris.es/list/info/dcmi-es.es.html).
4.1.4. Caractersticas del estndar
El estndar Dublin Core es hoy da uno de los esquemas de mayor difusin en el
mundo, tanto por su simplicidad como por su flexibilidad, demostrada en su
aplicacin a mltiples disciplinas y comunidades de inters. Se compone de tan slo
15 elementos, que comparten las siguientes caractersticas:
Todos estn al mismo nivel jerrquico.
Todos ellos son opcionales y repetibles tantas veces como sea preciso.
El orden en que se presenten es indiferente.
El desarrollo de este esquema de metadatos sigue cuatro principios (Hillman,
2003):






Pgina 33

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
5. Su simplicidad de creacin y mantenimiento. El esquema ha de ser tan
simple como sea posible tanto en su forma, contando con el mnimo nmero
de elementos que permitan realizar una descripcin adecuada, como en su
construccin y mantenimiento.
6. Uso de semntica convenida. Los elementos del esquema representan
caractersticas (semntica) que se pueden encontrar en recursos generados
por distintas disciplinas y que por tanto son de comn aplicacin.
7. Alcance internacional. El esquema pretende poder ser aplicado
internacionalmente, a recursos de todo tipo y procedencia. Para ello, la
DMCI realiza un importante esfuerzo por aunar los intereses expresados por
los distintos agentes internacionales participantes, realizando versiones en
varias lenguas.
8. Extensibilidad. La DCMI ha previsto la posibilidad de que el esquema sea
adaptado en funcin de las necesidades particulares de cada comunidad de
uso mediante los denominados perfiles de aplicacin, que posibilitan el uso
del esquema DC junto con elementos procedentes de otros esquemas u
otros de creacin local (denominadas extensiones).
A la hora de aplicar el esquema, la DCMI recomienda tener en cuenta los siguientes
principios (bidem):
1. El principio uno-a-uno (One-to-one principle). Segn este principio,
cada versin de un recurso (tanto por alteracin de su contenido, formato,
etc.) ha de tener una descripcin propia, independiente. La relacin natural
entre el recurso y sus distintas versiones ha de ser, eso s, preservada en la
descripcin.
2. El principio de simplificacin (Dumb-down principle). Segn este
principio, cualquier aplicacin podra emplear los valores asignados al
cualificador de un elemento aunque dicha aplicacin no est preparada para
entender cualificadores. Esto quiere decir que si, por ejemplo, un centro
importara un registro de metadatos codificado segn DC cualificado y dicho
centro no empleara ms que DC simple, los valores includos en los
cualificadores del registro importado se tomaran en el centro de destino
como valores de elementos DC simple, sin alterar por ello la naturaleza ni
efectividad de los mismos.
3. Adecuacin de los valores. Este principio establece que en la eleccin de
los valores asignados a los distintos elementos y calificadores ha de primar
su inters para la recuperacin.
4.2. DC simple y cualificado
DC posibilita dos niveles de descripcin: DC simple y DC cualificado (qDC o






Pgina 34

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
qualified Dublin Core). DC simple comprende el conjunto de 15 elementos
recogidos en el estndar, y representa un conjunto de elementos que sirven para
describir un recurso informativo de manera genrica. Sin embargo, en
determinados contextos de aplicacin, de mbito ms especfico, se precisar un
mayor nivel de detalle en la descripcin de los recursos para que stos sean
identificados de manera adecuada. Por ello, la DCMI propuso lo que se denomina
DC cualificado, que incorpora siete elementos adicionales as como un conjunto
de subelementos (33 en total) desarrollado para algunos de los elementos
principales que se denominan cualificadores (qualifiers) o refinamientos
(refinements), que matizan, especifican o precisan (no extienden) el alcance de
los primeros. Cuando se hace uso de estos subelementos, se dice que se est
utilizando DC cualificado. En trminos lingsticos, los elementos seran los
nombres y los cualificadores los adjetivos. La DCMI mantiene un registro
(http://dublincore.org/dcregistry/) en el que se recogen los distintos elementos,
calificadores y vocabularios asociados al esquema.
Antes de presentar los distintos elementos del esquema, debemos sealar que
despus del ao 2000, en sintona con los desarrollos de lenguajes de codificacin
para la web, la DCMI decici que los nombres de elementos y calificadores se
escribieran en minsculas, salvo en el caso de nombres compuestos, en los que se
introducen maysculas para una mayor claridad en su lectura
(http://dublincore.org/documents/naming-policy/).
4.2.1. DC Simple
Los elementos de DC simple son:
title [Ttulo]
Nombre por el que formalmente se conoce el recurso.
creator [Creador]
Persona o entidad responsable de la creacin del recurso o la versin del mismo de
que se trata.
subj ect [Materia]
Tema de que trata el recurso.
description [Descripcin]
Descripcin, a texto libre, del contenido del recurso.






Pgina 35

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
publisher [Editor]
Entidad responsable de la publicacin del recurso.
contributor [Colaborador]
Persona o entidad con responsabilidad parcial en la creacin del recurso.
date [Fecha]
Fecha de creacin o publicacin del recurso u otras fechas asociadas a su ciclo de
vida.
type [Tipo de recurso]
Naturaleza del recurso, en funcin de su contenido.
format [Formato]
Naturaleza del recurso, en funcin de sus caractersticas tcnicas.
identifier [Identificador]
Referencia para la identificacin inequvoca del recurso (URI, URL, DOI, etc,)
source [Fuente]
Referencia al identifier del recurso del que se deriva el recurso descrito.
language [Idioma]
Idioma o idiomas empleados en el recurso.
relation [Relacin]
Referencia al identifier del recurso o recursos con los que est relacionado el
recurso descrito.






Pgina 36

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
coverage [Cobertura]
Alcance espacial, temporal o jurisdiccional asociado al contenido del recurso.
rights [Derechos]
Datos relativos al rgimen de proteccin de derechos de autor que afecta al uso del
recurso descrito.
4.2.2. DC Cualificado
En cuanto a los cualificadores recomendados por la DCMI, stos son:
Elementos.
Refinamientos (Element Refinements).
4.2.2.1. Elementos
accrualMethod [Mtodo de incorporacin]
Modo en que el recurso se incorpora a la coleccin.
accrualPeriodicity [Periodicidad de incorporacin]
Frecuencia con la que un recurso se incorpora a una coleccin.
accrualPolicy [Poltica de incorporacin]
Poltica de incorporacin de recursos a la coleccin.
audience [Usuario]
Tipo de usuario para al que se dirige el recurso o para el que puede ser de utilidad.
instructionalMethod [Mtodo instructivo]
De especial utilidad en la descripcin de recursos educativos, especifica el mtodo






Pgina 37

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
instructivo empleado en el recurso.
provenance [Procedencia]
Identificacin de los sucesivos cambios en la propiedad y custodia del recurso desde
su creacin relevantes para su autenticidad, integridad e interpretacin.
rightsHolder [Propietario de derechos]
Persona o entidad a la que pertenecen los derechos de autor asociados al uso del
recurso.
4.2.2.2. Refinamientos (Elements Refinements)
E: description; ER: abstract [Resumen]
Resumen del contenido del recurso.
E: rights; ER: accessRights [Derechos de acceso]
Informacin sobre las restricciones de acceso al recurso.
E: title; ER: alternative [Ttulo alternativo]
Cualquier forma del ttulo de un recurso que se emplee como sustituto o alternativo
al principal.
E: date; ER: available [Disponible]
Fecha o fechas en la que un recurso estar disponible en red.
E: identifier; ER: bibliographicCitation [Cita bibliogrfica]
Referencia bibliogrfica del recurso.
E: relation; ER: conformsTo [Conforme a]
Referencia a la norma o normas que el recurso cumple.






Pgina 38

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
E: date; ER: created [Fecha de creacin]
Fecha de creacin del recurso.
E: date; ER: dateAccepted [Fecha de aceptacin]
Fecha en la que se acept el recurso (tesis, artculo cientfico, etc.).
E: date; ER: copyright [Fecha de copyright]
Fecha del copyright asociado al recurso.
E: date; ER: dateSubmitted [Fecha de remisin]
Fecha de remisin del recurso (tesis, artculo cientfico, etc.).
E: audience; ER: educationLevel [Nivel educativo]
Identifica el nivel educativo del usuario al que se dirige el recurso o para el que
puede ser de mayor utilidad.
E: format; ER: extent [Extensin]
Tamao o duracin del recurso.
E: relation; ER: hasFormat [Tiene formato en]
Identifica posteriores versiones (en cuanto a formato) del recurso descrito.
E: relation; ER: hasPart [Tiene parte en]
El recurso descrito est compuesto de una o varias partes, entre las que se
encuentra/n la/s referenciada/s.
E: relation; ER: hasVersion [Tiene versin en]
Referencia a la/s versin/es (en cuanto a contenido) del recurso descrito.






Pgina 39

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
E: relation; ER: isFormatOf [Es formato de]
Establece la relacin inversa al cualificador hasFormat.
E: relation; ER: isPartOf [Es parte de]
Establece la relacin inversa al cualificador hasPart.
E: relation; ER: isReferencedBy [Es referenciado por]
El recurso descrito es referenciado o citado por el recurso referenciado.
E: relation; ER: isReplacedBy [Es reemplazado por]
El recurso descrito ha quedado obsoleto y ha sido reemplazado por el recurso
referenciado.
E: relation; ER: isRequiredBy [Es requerido por]
El recurso descrito es requerido por el recurso referenciado ya sea de manera fsica
o lgica.
E: relation; ER: isVersionOf [Es versin de]
Establece la relacin inversa al cualificador hasVersion.
E: date; ER: issued [Edicin]
Fecha de edicin formal del recurso (publicacin).
E: rights; ER: license [Licencia]
Disponibilidad de documento legal en que se de permiso de manera oficial para
hacer uso del recurso.
E: audience; ER: mediator [Mediador]
Identifica el tipo de usuario que puede mediar en el acceso a un recurso educativo






Pgina 40

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
(docente o administrador).
E: format; ER: medium [Medio]
Material o medio fsico del recurso descrito.
E: date; ER: modified [Modificado]
Fecha en la que el recurso fue modificado.
E: relation; ER: references [Referencia a]
Establece la relacin inversa al cualificador isReferencedBy.
E: relation; ER: replaces [Reemplaza a]
Establece la relacin inversa al cualificador isReplacedBy.
E: relation; ER: requires [Requiere]
Establece la relacin inversa al cualificador isRequiredBy.
E: coverage; ER: spatial [Espacial]
Identifica la cobertura espacial del recurso (lugar/es).
E: description; ER: tableOfContents [ndice]
Lista de las secciones del recurso descrito.
E: coverage; ER: temporal [Temporal]
Identifica la cobertura temporal del recurso (tiempo o poca).
E: date; ER: valid [Vlido]
Identifica la fecha o rango de fechas en que el recurso es vlido.






Pgina 41

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
4.3. Vocabularios
Como se ha dicho anteriormente, los esquemas de metadatos determinan tanto la
sintaxis como la semntica. En cuanto a esta ltima, determina los posibles valores
que pueden adoptar los elementos. En funcin del elemento de que se trate, DC
permite nutrirlo de distintas maneras: cdigos alfanumricos, texto libre o
vocabularios. DCMI diferencia dos tipos de vocabularios: listas de trminos y
vocabularios controlados. En los siguientes cuadros-resumen se presentan datos
relativos a los vocabularios recomendados, los elementos a los que estn asociados
y la localizacin del texto de referencia correspondiente a cada uno de ellos:
Vocabulario:
dcmi- box
Elemento:
spatial [coverage]
Descripcin:
Identifica una regin espacial a partir de sus lmites geogrficos.
Localizacin:
http://dublincore.org/documents/dcmi-box/

Vocabulario:
dcmi- type
Elemento:
type
Descripcin:
Lista de valores empleados para categorizar la naturaleza o
gnero del contenido del recurso descrito.
Localizacin:
http://dublincore.org/documents/dcmi-type-vocabulary/

Vocabulario
:
DDC
Elemento:
subject
Descripcin
:
Valores recogidos en la Dewey Decimal Classification (DDC).
Localizacin
http://www.oclc.org/dewey/






Pgina 42

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
:
http://www.oclc.org/dewey/resources/summaries/deweysummari
es.pdf

Vocabulario
:
I SO3166
Elemento:
spatial [coverage]
Descripcin
:
Cdigos estndar para la representacin de nombres de pases.
Localizacin
:
http://www.iso.org/iso/country_codes/iso_3166_code_lists/englis
h_country_names_and_code_elements.htm

Vocabulario:
I SO639- 2
Elemento:
language
Descripcin:
Cdigos normalizados para la representacin de nombres de
idiomas.
Localizacin:
http://www.loc.gov/standards/iso639-2/langhome.html

Vocabulario:
LCC
Elemento:
subject
Descripcin:
Valores recogidos en la Library of Congress Classification (LCC).
Localizacin:
http://www.loc.gov/catdir/cpso/lcco/







Pgina 43

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Vocabulario:
LCSH
Elemento:
subject
Descripcin:
Valores recogidos en la Library of Congress Subject Headings
(LCSH).
Localizacin:
http://www.loc.gov/cds/lcsh.html#lcsh20

Vocabulario:
MESH
Elemento:
subject
Descripcin:
Valores recogidos en la Medical Subject Headings (MESH).
Localizacin:
http://www.nlm.nih.gov/mesh/meshhome.html

Vocabulario:
dcmi- period
Elemento:
date; temporal [coverage]
Descripcin:
Especifica los lmites de un intervalo de tiempo.
Localizacin:
http://dublincore.org/documents/dcmi-period/

Vocabulario:
dcmi- point
Elemento:
spatial [coverage]
Descripcin:
Identifica un punto en el espacio a travs de sus coordenadas
geogrficas.






Pgina 44

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Localizacin:
http://dublincore.org/documents/dcmi-point/

Vocabulario:
RFC1766
Elemento:
language
Descripcin:
Cdigos normalizados para la representacin de nombres de
idiomas.
Localizacin:
http://www.ietf.org/rfc/rfc1766.txt

Vocabulario:
RFC1766
Elemento:
language
Descripcin:
Cdigos normalizados para la representacin de nombres de
idiomas.
Localizacin:
http://www.ietf.org/rfc/rfc3066.txt

Vocabulario:
TNG
Elemento:
spatial [coverage]
Descripcin:
Valores recogidos en el Getty Thesaurus of Geographic Names.
Localizacin
:
http://www.getty.edu/research/conducting_research/vocabularie
s/ tgn/index.html







Pgina 45

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Vocabulario:
UDC
Elemento:
subject
Descripcin:
Valores recogidos en la Universal Decimal Classification (UDC,
CDU en castellano).
Localizacin:
http://www.udcc.org/outline/outline.htm

Vocabulario:
URI
Elemento:
identifier; source; relation
Descripcin:
La forma ms conocida de Universal Resource Identifier (URI) es
la URL (Universal Resource Locator).
Localizacin:
http://www.ietf.org/rfc/rfc2396.txt

Vocabulario:
W3CDTF
Elemento:
date; temporal [coverage]
Descripcin:
Basada en ISO8601, permite codificar fechas y horas.
Localizacin:
http://www.w3.org/TR/NOTE-datetime
Adems de estos vocabularios, la DCMI fomenta el que las distintas comunidades
de aplicacin del esquema utilicen otros vocabularios, tanto estndares como
desarrollados localmente, en los distintos centros de aplicacin. Se recomienda, en
todo caso, utilizar los vocabularios recomendados en la medida de lo posible con el
fin de tratar de asegurar el mayor grado de interoperabilidad con otros sistemas de
informacin usuarios de DC.






Pgina 46

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
4.3.1. Cuadro-resumen del esquema DC completo
El siguiente cuadro nos ser de utilidad como referencia a la hora de realizar
registros siguiendo el esquema DC:

Tipo Vocabulario/s
accrualMethod Cualificador (Elemento)
accrualPeriodicity Cualificador (Elemento)
accrualPolicy Cualificador (Elemento)
audience Cualificador (Elemento)
+ educationLevel Cualificador
+ mediator Cualificador
contributor Elemento
coverage Elemento
+ spatial Cualificador
dcmi-box / ISO3166 /
point / TGN
+ temporal Cualificador period / W3CDTF
creator Elemento no especificado
date Elemento period / W3CDTF
+ available Cualificador
+ created Cualificador
+ date accepted Cualificador






Pgina 47

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
+ dateCopyrighted Cualificador
+ dateSubmitted Cualificador
+ issued Cualificador
+ modified Cualificador
+ valid Cualificador
description Elemento
+ abstract Cualificador
+ table of contents Cualificador
format Elemento IMT
+ extent Cualificador
+ medium Cualificador
identifier Elemento URI
+ bibliographicCitation Cualificador
instructionalMethod Cualificador (Elemento)
language Elemento
ISO639-2 / RFC1766 /
RFC3066
provenance Cualificador (Elemento)
publisher Elemento
relation Elemento URI
+ conformsTo Cualificador URI






Pgina 48

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
+ hasFormat Cualificador URI
+ hasPart Cualificador URI
+ hasVersion Cualificador URI
+ isFormatOf Cualificador URI
+ isPartOf Cualificador URI
+ isReferencedBy Cualificador URI
+ isReplacedBy Cualificador URI
+ isRequiredBy Cualificador URI
+ isVersionOf Cualificador URI
+ references Cualificador URI
+ replaces Cualificador URI
+ requires Cualificador URI
rights Elemento
+ accessRights Cualificador
+ license Cualificador
rightsHolder Cualificador (Elemento)
source Elemento URI
subject Elemento
DDC / LCC / LCSH / MESH
/ NLM / UDC
title Elemento






Pgina 49

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
+ alternative Cualificador
type Elemento dcmi-type
En los casos en que no se especifica un vocabulario determinado o bien no hay
necesidad de usar ninguno dada la naturaleza de los datos a consignar (caso de
title, creator, etc.), o bien no se recomienda ninguno en particular pero s se
recomienda utilizar o desarrollar vocabularios especficos (caso de accrualMethod,
accrualPeriodicity, etc.). Recordemos que la utilizacin de una lista de valores o de
un vocabulario controlado est motivada por la necesidad de desambiguacin que
en determinados casos pueden darse con objeto de incrementar las posibilidades de
recuperacin.
4.4. Codificacin de DC en HTML, XHTML, RDF y XML
Una de las caractersticas de DC es que se trata de un esquema que acta a nivel
semntico, siendo verstil a la hora de adaptarse a distintos sistemas de
codificacin. La DCMI ha publicado varias guas en las que se recogen
recomendaciones para la codificacin de su esquema, disponibles en
http://dublincore.org/resources/expressions/.






Pgina 50

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

4.4.1. Codificacin de DC en HTML/XHTML
Como ya se ha mencionado, las metaetiquetas (metadatos) se han de consignar en
la parte inicial del cdigo fuente del documento, denominada cabecera (seccin
<head>), que se sita entre la declaracin y el cuerpo (<body>). Una forma tpica
sera la siguiente:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<link rel="schema.DC href="http://purl.org/dc/elements/1.0/">
<link rel="schema.DCTERMS href="http://purl.org/dc/terms/">
<meta name="DC.title content="La aventura de Don Quijote de la Mancha"/>
<meta name="DCTERMS.audience" content="learners"/>
</head>
<body>






Pgina 51

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
</body>
</html>
Las lneas en que se consignan los elementos <link> son necesarias para indicar
que los elementos DC (tanto simple, en el caso de la primera, como cualificado, en
el caso de la segunda) que se van a emplear en la descripcin estn registrados y
definidos en las URL referenciadas. En el ejemplo presentado, se han incluido un
elemento (title) y un cualificador (audience). El primero hace referencia al esquema
simple (est precedido por la abreviatura del esquema, DC, especificada en el
primer elemento <link>), mientras que el segundo hace referencia al esquema
cualificado (precedido de la abreviatura del esquema cualificado, DCTERMS,
especificada en el segundo elemento <link>). Como se puede observar, cada
etiqueta tiene dos partes, meta name o nombre del elemento y content, que
especifica el valor asignado al elemento.
Para indicar los vocabularios de los que se han tomado los valores que se han
asignado a los elementos, habr que incorporar una nueva lnea, en la que, esta
vez, el nombre del elemento ir relacionado con dicho vocabulario. Un ejemplo de
esto sera:
<meta name="DC.type" scheme="DCTERMS.DCMIType" content="Text"/>
Para los casos de elementos cuyos valores son enlaces (URIs) a otros recursos, la
DCMI recomienda emplear el elemento XHTML <link> de la manera que se muestra
en los siguientes ejemplos:
<link rel="DC.relation" href="http://www.example.org/"/>
<link rel="DCTERMS.references"
href="http://www.example.org/publications/2002/176459.pdf"/>
En cuanto al idioma de los valores de los elementos, la DCMI recomienda utilizar
los atributos lang (HTML) xml:lang (XHTML, idioma del valor) o hreflang
(idioma del contenido de recursos enlazados, si se trata de un elemento que
contiene este tipo de valor), segn se muestra en los siguientes ejemplos:
<meta name="DC.title" lang="en" content="Expressing Dublin Core
in HTML/XHTML meta and link elements" />

<meta name="DC.subject" xml:lang="en-GB" content="seafood"/>
<meta name="DC.subject" xml:lang="es" content="marisco"/>







Pgina 52

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
<link rel="DC.relation" hreflang="fr" href="http://www.example.org/fr/"/>
<link rel="DC.relation" hreflang="de" href="http://www.example.org/de/"/>
4.4.2. Codificacin de DC en XML
En la gua para la implementacin de DC en XML ms reciente, disponible en
http://dublincore.org/documents/2003/04/02/dc-xml-guidelines/, se realizan dos
recomendaciones generales: en primer lugar, que en las distintas aplicaciones se
empleen schemas en lugar de DTDs y, en segundo lugar, que se utilicen los
namespaces o espacios de nombres para identificar los elementos, cualificadores y
vocabularios DC, segn se recoge en
http://dublincore.org/documents/2007/07/02/dcmi-namespace/.
En dicha gua se ofrece un registro XML que ejemplifica la forma que stos suelen
adoptar:
<?xml version="1.0"?>
<metadata
xmlns="http://example.org/myapp/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://example.org/myapp/
http://example.org/myapp/schema.xsd"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<dc:title>UKOLN</dc:title>
<dc:description>UKOLN is a national focus of expertise in digital information
management. It provides policy, research and awareness services to the UK library,
information and cultural heritage communities.UKOLN is based at the University of
Bath.</dc:description>
<dc:publisher>UKOLN, University of Bath</dc:publisher>
<dc:identifier>http://www.ukoln.ac.uk/</dc:identifier>
</metadata>
Como podemos observar, el elemento contenedor de los metadatos DC en este
registro XML nos encontramos con <metadata>, si bien podemos encontrarnos
otros, como <record> o <dc>, ya que la DCMI no establece una recomendacin
clara al respecto.
Tampoco se establece de manera clara una manera de indicar que una descripcin
est asociada a un recurso en particular si no es mediante el elemento <identifier>,
cuyo valor es el URI del recurso correspondiente.
Cada elemento DC ser considerado en XML un elemento XML, y su valor ser el
contenido del elemento XML. As, por ejemplo, encontraremos lo siguiente:






Pgina 53

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
<dc:title>Don Quijote de la Mancha</dc:title>
En los casos en que a un mismo elemento le correspondan varios valores, stos se
repetirn de la siguiente manera:
<dc:subject>Aventuras</dc:subject>
<dc:subject>Espaa</dc:subject>
Los cualificadores se tratan en XML de la misma manera que los elementos de DC
simple. As, encontraremos, por ejemplo:
<dcterms:available>2007-06</dcterms:available>
En cuanto a la especificacin de los vocabularios de los que se han tomado los
valores que se han asignado a los elementos y cualificadores, sta se har
mediante el atributo xsi:type, tal y como se ilustra en el siguiente ejemplo:
<dc:identifier xsi:type="dcterms:URI">http://www.uc3m.es/</dc:identifier>
Para la codificacin del idioma de los valores de los elementos, la DCMI
recomienda utilizar el atributo xml:lang, como se muestra en el siguiente
ejemplo:
<dc:subject xml:lang="en">seafood</dc:subject>
<dc:subject xml:lang="es">marisco</dc:subject>
En determinados sistemas de informacin, el esquema DC puede no ser suficiente
para satisfacer sus necesidades descriptivas, por lo que habr emplear elementos
procedentes de otros esquemas. XML permite combinar elementos procedentes de
diferentes espacios de nombres, lo que permitir solventar estas carencias. En el
ejemplo siguiente (tomado de la gua mencionada de la DCMI), observamos cmo
se ha aadido a DC el elemento typicalLearningTime del esquema IMS
(equivalente a IEEE LOM):
<?xml version="1.0"?>
<record
xmlns="http://example.org/learningapp/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://example.org/learningapp/
http://example.org/learningapp/schema.xsd"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:ims="http://www.imsglobal.org/xsd/imsmd_v1p2">






Pgina 54

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
<dc:title>Frog maths</dc:title>
<dc:identifier>http://somewhere.com/frogmaths/</dc:identifier>
<dc:description>Simple maths games for 5-7 year olds</dc:description>
<ims:typicallearningtime>
<ims:datetime>
0000-00-00T00:15
</ims:datetime>
</ims:typicallearningtime>
</record>
4.4.3. Codificacin de DC en XML/RDF
La DCMI ha publicado dos recomendaciones, una para DC simple y otra para qDC
(pendiente de aprobacin). En ellas, la DCMI detalla cmo realizar la codificacin
del esquema. El resultado del proceso lleva a la realizacin de registros como el que
presenta:
<?xml version="1.0"?>
<!DOCTYPE rdf:RDF PUBLIC "-//DUBLIN CORE//DCMES DTD 2002/07/31//EN"
"http://dublincore.org/documents/2002/07/31/dcmes-xml/dcmes-xml-dtd.dtd">
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://www.ilrt.bristol.ac.uk/people/cmdjb/">
<dc:title>Dave Beckett's Home Page</dc:title>
<dc:creator>Dave Beckett</dc:creator>
<dc:publisher>ILRT, University of Bristol</dc:publisher>
<dc:date>2002-07-31</dc:date>
</rdf:Description>
</rdf:RDF>
En este registro, se aprecian dos diferencias principales con respecto a un registro
XML: la declaracin del uso de RDF (cuarta lnea) y la identificacin de los
elementos DC como descripcin de un recurso concreto (lneas 6 a 11).
Al igual que con XML simple, con RDF es posible combinar elementos de distintos
esquemas mediante la especificacin de los distintos espacios de nombres
implicados. En la siguiente figura, por ejemplo, se ha combinado el elemento
DC.title de Dublin Core con el elemento intendedEndUserRole del esquema IEEE
LOM.
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:lom-edu=" http://ltsc.ieee.org/xsd/LOMv1p0">
<rdf:Description rdf:about=" http://www.lib.csusb.edu/TIJ ">






Pgina 55

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
<dc:title>The Information Jungle: Learn to use the Internet for academic
research </dc:title>
</rdf:Description>
<rdf:Description rdf:about=" http://www.lib.csusb.edu/TIJ">
<lom-edu:intendedEndUserRole>Learner</lom-edu: intendedEndUserRole>
</rdf:Description>
</rdf:RDF>
4.5. Bibliografa
HILLMAN, D. (2003). Gua de uso del Dublin Core [en lnea]. Disponible en:
<http://dublincore.org/documents/usageguide/>.
Bibliografa bsica en castellano
Conjunto de elementos Dublin Core, versin 1.1: Descripcin de referencia [en
lnea]. Disponible en: <http://www.sedic.es/DCES.pdf>.
WOODLEY, M.S. (2003). Glosario DCMI. [en lnea]. Disponible en:
<http://www.sedic.es/glosario_DCMI.pdf>.






Pgina 56

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Mdulo 5. Herramientas para la creacin y/o edicin
de metadatos
5.1. Tipologa
Como hemos visto anteriormente, las descripciones realizadas mediante metadatos
se pueden incorporar a los documentos digitales a los que se refieren bien de forma
interna o de forma externa. Dado que los creadores de metadatos no tienen por
qu saber redactar cdigo, se han desarrollado diversas herramientas para facilitar
su creacin, actuando como intermediarias entre las personas y las mquinas, a la
manera de traductores. En la prctica, los distintos tipos de herramientas suelen
combinarse para facilitar las distintas fases del proceso de creacin. Se podran
distinguir las siguientes:
Tipo de metadatos Herramientas para su creacin
Metadatos internos
Formularios
De marcado
De extraccin
De conversin
Metadatos externos Formularios
Fig.1. Tipos de herramientas para la creacin de metadatos.
5.1.1. Metadatos externos
En el caso de los metadatos externos, el caso ms frecuente es el que encontramos
en repositorios y bibliotecas digitales, en los que se facilitan a sus colaboradores
una serie de formularios en los que debern consignar los datos correspondientes a
los documentos cuya incorporacin proponen. As, por ejemplo, para agregar un
documento al repositorio educativo MERLOT
(http://www.merlot.org/merlot/index.htm), se habr de cumplimentar el formulario
que se muestra en la siguiente figura:






Pgina 57

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Fig. 2. Formulario para la descripcin de contenidos educativos en MERLOT.
Otras herramientas de este tipo son el editor de ADLib (Athabasca Digital Library in
a Box) de la Universidad de Athabasca (Canad), que permite crear y editar en
lnea los metadatos de los objetos de aprendizaje incorporados al repositorio
mediante un formulario que sigue el esquema IEEE LOM, la herramienta eRIB
(EduSource Repository in a Box) perteneciente a la iniciativa EduSource (Canad),
que utiliza el mismo modelo y puede ser descargada como base de
datos/repositorio independiente (eXist) o ser utilizada a travs de COL-LOR
(Commonwealth of Learning-Learning Object Repository).






Pgina 58

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus







Pgina 59

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Fig. 3. Formularios para la descripcin de objetos de aprendizaje en ADLib y COL-LOR
5.1.2. Metadatos internos
En el caso de los metadatos de carcter interno, encontramos que se suelen utilizar
varios tipos de herramientas (NISO, 2004: 10):
Herramientas de extraccin automtica de metadatos. A travs del
anlisis del cdigo fuente de un recurso cuya URL haya sido introducida,
este tipo de herramientas generan de forma automtica una descripcin
conforme a un modelo de metadatos y una sintaxis especificados. El
resultado no suele ser de buena calidad, por lo que generalmente debe ser
editado y validado manualmente.
Formularios ( templates) . Se utilizan bien para la incorporacin de
registros a una base de datos (como hemos visto para el caso de los
metadatos externos en repositorios y bibliotecas digitales), bien para la
generacin de descripciones en el momento de la creacin de los
documentos (caso de las herramientas de autor y plantillas de
metaetiquetas tipo MetaTagBuilder, disponible en
http://www.localsubmit.com/metatags.asp) o bien para la edicin de las
descripciones generadas automticamente por las herramientas de






Pgina 60

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
extraccin automtica de metadatos.
Herramientas de marcado. La funcin de estas herramientas es la de
facilitar el proceso de creacin y edicin de cdigo fuente de diversas
maneras: mediante la utilizacin de etiquetas autorellenables, colores para
los distintos elementos la sintaxis, presentacin arbrea de los distintos
niveles jerrquicos de las estructuras, y sobre todo mediante la
identificacin automtica de errores. Herramientas como XMLSpy o
Notepad++ permiten crear y editar cdigo HTML, XML o JavaScript, entre
otros.
Herramientas de conversin. Su misin es traducir esquemas de
metadatos, trasladando los datos de un modelo a otro. Parece evidente que
el xito de la traduccin depender del grado de compatibilidad entre los
elementos de origen y los de destino, y que se pueden producir prdidas de
informacin.
5.2. Descripcin funcional de herramientas aplicables
La utilidad de las herramientas de creacin y/o edicin de metadatos reside en
facilitar la creacin de metadatos de calidad a los autores de contenidos, bien para
potenciar su recuperacin en web o bien para ser importados y extrados
posteriormente por sistemas concretos de gestin de contenidos (Greenberg et al.,
2003). Por lo general, estas herramientas permiten extraer automticamente los
metadatos contenidos en los recursos, con posibilidad de editarlos, o bien generar
nuevos metadatos. Entre las herramientas ms representativas (un registro de las
cuales se puede encontrar en http://dublincore.org/tools/) destaca DC-dot por ser
una de las ms completas de que se dispone en este momento. Se trata de una
aplicacin Java (utilizable en lnea o descargable para uso local) desarrollada y
mantenida por Andy Powell, de la Universidad de Bath (Reino Unido), en la que se
han integrado varias de las funcionalidades que acabamos de ver en el apartado
anterior. A partir de una URL, esta herramienta es capaz de extraer los metadatos
de un recurso y devolver un registro Dublin Core en XHTML, que es editable a
travs de un formulario. Posteriormente, dicha descripcin puede ser convertida a
otros lenguajes de marcado y esquemas.
Al acceder a DC-dot (http://www.ukoln.ac.uk/metadata/dcdot/), encontramos la
casilla en la que se nos ofrece la posibilidad de introducir la URL as como solicitar
que el resultado se muestre no en XHTML sino en RDF.






Pgina 61

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Fig. 4. Pgina de inicio de DC-dot
Una vez introducida la URL deseada (en este caso, por ejemplo, www.uc3m.es), el
botn Submit (enviar) nos lleva a una nueva pantalla en la que podemos
visualizar el registro resultante de la extraccin automtica de metadatos as como
un formulario en el que podemos modificar el contenido de dicho registro:






Pgina 62

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Fig. 5. Registro resultante y formulario de edicin
Una vez editado y actualizado (re-submit) el registro (en caso de que haya sido
necesario hacerlo), ste se puede visualizar en formato XML, HTML o RDF (recuadro
1). Otros formatos disponibles son (botn other formats, recuadro 2) IEEE LOM,
IMS, USMARC, SOIF, TEI, IAFA/ROADS, GILS y OLSTF. Dependiendo del formato
elegido, el archivo de salida tendr una extensin diferente (en funcin de la
aplicacin de destino). As, por ejemplo, si seleccionamos la salida RDF
obtendremos el archivo xml correspondiente (salida 1), mientras que si
seleccionamos la salida SOIF (Summary Object Interchange Format, ver
http://harvest.sourceforge.net/harvest/doc/index.html) obtendremos el archivo
.soif correspondiente (salida 2).

Fig. 6. Salida 1: RDF.






Pgina 63

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Fig. 7. Salida 2: SOIF
La principal ventaja de esta herramienta es que cada uno de los resultados
obtenidos se podr copiar y pegar directamente en el cdigo fuente del documento
de destino, en la correspondiente seccin de cabecera.
El principal inconveniente que presenta radica en que dado que la plantilla base es
DC simple, la conversin a otros esquemas es limitada. As, por ejemplo,
encontraremos que aunque esta herramienta nos permite convertir un registro a un
formato de la complejidad y riqueza semntica de IEEE LOM, no podremos
aprovechar todo el potencial descriptivo de ste, ya que slo se utilizarn los
elementos de LOM con correspondencia en DC.
Herramientas similares a sta de carcter no comercial son MetaMaker,
desarrollada por la FAO (Food and Agriculture Organization, Naciones Unidas) o
Reggie (Distributed Systems Technology Center DSTC, Australia).
5.3. Bibliografa
GREENBERG, J.; et al. (2003). Iterative design of metadata creation tools for
resource authors [en lnea]. International Conference on Dublin Core and Metadata
Applications: Supporting Communities of Discourse and Practice. 28 septiembre-2
octubre. Disponible en:
<http://www.siderean.com/dc2003/202_Paper82-color-NEW.pdf>.
NISO (2004). Understanding metadata [en lnea]. Disponible en:
<http://www.niso.org/standards/resources/Understanding Metadata.pdf>.






Pgina 64

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Mdulo 6. Aplicaciones en la Web
6.1. Ventajas y desventajas del uso de metainformacin
en la Web
Hace unos aos, Abadall pona de manifiesto que una de las preocupaciones ms
importantes para los promotores de la interconectividad y de las autopistas de la
informacin es, precisamente, llenarlas de contenidos (Abadall Falgueras, 2001).
Ms adelante, aade el problema reside ahora en disear sistemas que permitan
organizar este cosmos y establecer procedimientos destinados a favorecer el acceso
a las personas que lo deseen (bidem). En efecto, tan importante como
proporcionar contenidos de calidad a la red es dotarla de medios adecuados para su
recuperacin, y no cabe duda que los metadatos constituyen uno de los medios
ms adecuados para ello.
En la Web, la recuperacin de la informacin se hace, principalmente, a travs de la
interrogacin a las grandes bases de datos que conforman los buscadores. La
interrogacin se puede definir, en este contexto, como el proceso mediante el
cual un sistema es capaz de hacer coincidir las estrategias de bsqueda
introducidas por un usuario con las representaciones (trminos seleccionados) de
los documentos que la base contiene.
Entra en escena en este momento un concepto de extremada importancia en
recuperacin de informacin (Information Retrieval o IR): la precisin o
relevancia. sta se podra definir de manera genrica como el grado de
adecuacin de una respuesta documental a una necesidad de informacin concreta.
El objetivo de las herramientas de bsqueda es precisamente ofrecer respuestas lo
ms relevantes posible, evitando tanto el silencio (no recuperacin de documentos
relevantes) como el ruido documental (recuperacin de documentos no
relevantes).
Algunas de las principales ventajas del uso de metadatos en la recuperacin de
informacin en la Web son:
1. Su capacidad para representar el contenido de los documentos textuales
mejor que los propios documentos y que las representaciones automticas
que de ellos efectan los buscadores.
2. La mejora de la precisin de los sistemas de recuperacin, posibilitando la
prestacin de servicios inteligentes.
3. La posibilidad de representar el contenido de documentos no textuales, tales
como imgenes, sonidos o vdeos, que no se prestan fcilmente a tcnicas
de indizacin automtica.






Pgina 65

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Entre sus principales inconvenientes podemos sealar los siguientes:
1. Su creacin, eminentemente manual, frente al V3 (Volumen, Variedad y
Volatilidad) que caracteriza la Web, hace que su coste sea elevado.
2. Su aplicacin no resulta especialmente eficaz si no es en entornos
delimitados, finitos de la Web.
3. Puede ser objeto de usos malintencionados. Durante un tiempo, el uso de
metaetiquetas estuvo muy difundido en Internet ya que los buscadores
basaban en gran medida su recuperacin en ellas y se consideraba una
forma eso s, ilcita, que se denomin spamming- de promocionar sitios
web dado que el lugar ocupado por una pgina en el ranking de resultados
dependa de la frecuencia (estadstica) de aparicin de trminos en ella. Con
el tiempo, y dado que estas metaetiquetas no hacan sino afectar
negativamente al resultado de los buscadores, se empez a penalizar el uso
de las mismas, llegando al punto de que hoy muchos buscadores no
consideran en absoluto la etiqueta <keywords> y tratan con precaucin la
etiqueta <description>.
6.2. Aplicaciones, experiencias y perspectivas:
multimedia, Web semntica y Web 2.0
El aumento de la capacidad de almacenamiento y procesamiento de datos de las
mquinas as como la cada vez mayor capacidad de transmisin de las redes de
comunicacin han propiciado la incorporacin de nuevos tipos de contenidos y
servicios en la Web. Analizaremos en esta seccin tres de los principales fenmenos
que marcan la agenda de desarrollo de la red: los materiales multimedia, la Web
semntica o la Web 2.0.
6.2.1. Aplicacin de metadatos a contenidos multimedia
Los materiales multimedia predominan hoy en la red, ofreciendo un espacio virtual
cada vez ms atractivo a sus usuarios. Sin embargo, el tratamiento documental de
estos contenidos presenta especiales dificultades, y se ha desarrollado una gran
variedad de esquemas descriptivos, los denominados metadatos para material
multimedia (Sheth, Klas, 1998).
Su desarrollo ha estado liderado por dos grupos:
a) Moving Picture Experts Group (MPEG). Este grupo de trabajo de ISO/IEC, ha
desarrollado distintos estndares para la compresin, decompresin y codificacin
digital de vdeo y audio (vase http://www.chiariglione.org/mpeg/). Entre ellos,
destacaremos uno, por ser el principal estndar de descripcin de contenidos
multimedia: el MPEG-7: Multimedia Content Description Interface
(http://www.chiariglione.org/mpeg/standards/mpeg-7/mpeg-7.htm). Aprobado en






Pgina 66

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
2001 por ISO como ISO/IEC 15398, se trata en realidad de un conjunto de
herramientas que determinan tanto la forma de generar descripciones de recursos
como la forma de gestionar tales descripciones en su transporte y almacenamiento.
El estndar se basa en la accin de cuatro elementos:
1. Esquemas de descripcin: equivalentes a esquemas de metadatos.
2. Descriptores: equivalentes a valores de elementos.
3. Un lenguaje de definicin de descripcin (DDL): modelo que posibilita la
creacin de nuevos esquemas y/o la extensin y modificacin de los
existentes.
4. Herramientas de sistema: herramientas que soporten el envo simultneo de
descripciones, la sincronizacin de descripciones con el contenido,
mecanismos de distribucin y codificacin de representaciones (tanto en
formato textual orientado a la manipulacin humana como en formato
binario) para la transmisin y almacenamiento eficientes as como la gestin
y proteccin de derechos de autor
El estndar establece que las descripciones se han de generar en forma de
paquetes o wrappers (tcnica que, como ya sabemos, est orientada a la
interoperabilidad) siguiendo los Esquemas de Descripcin de Multimedia
(Multimedia Description Schemes o DSs). En lugar de utilizar un solo esquema,
este estndar emplea mltiples esquemas (en realidad, ms de 100). Estos
esquemas de metadatos determinan, segn el estndar una forma de describir en
XML importantes conceptos relacionados con la descripcin y gestin de contenido
audiovisual con el fin de facilitar su bsqueda, indizacin, filtrado y acceso. MPEG-
7 permite desarrollar dos tipos de descripciones vlidas: unidades de descripcin
(description units) y descripciones completas (complete descriptions). El elemento
raz de cualquier descripcin ser <mpeg7>, que incluye un encabezamiento
<descriptionMetadata>, en el que se recoge informacin sobre el propio registro de
metadatos. Un ejemplo de descripcin en MPEG-7 sera el siguiente:
<Mpeg7 xmlns="http://www.mpeg7.org/2001/MPEG-7_Schema" xml:lang="en"
type="complete">
<ContentDescription xsi:type="ContentEntityType">
<MultimediaContent xsi:type="ImageType">
<Image>
<MediaLocator>
<MediaUri>
http://www.tilab.org/mpeg/mpeg_logo-anim_l.gif
</MediaUri>
</MediaLocator>
<CreationInformation">
<Creation>
<Title xml:lang="en">The animated MPEG Logo</Title>
<Creator>






Pgina 67

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
<Role href="urn:mpeg:mpeg7:cs:RoleCS:AUTHOR">
<Name xml:lang="en">Author</Name>
</Role>
<Agent xsi:type="OrganizationType">
<Name>MPEG</Name>
</Agent>
</Creator>
</Creation>
<RelatedMaterial>
<MediaLocator>
<MediaUri>http://www.tilab.com/mpeg/</MediaUri>
</MediaLocator>
</RelatedMaterial>
</CreationInformation>
</Image>
</MultimediaContent>
</ContentDescription>
</Mpeg7>
Este registro, correspondiente al logo del grupo MPEG, presenta la descripcin de la
imagen (dentro de <contentDescription>), identificado el tipo de contenido
multimedia (<image>), su ubicacin (<mediaLocator>) e informacin sobre las
caractersticas del objeto tales como su ttulo (<title>), autor (<creator>) y
contexto de uso (<relatedMaterial>).
b) Joint Photographic Experts Group (JPEG). Se suele conocer bajo tal
denominacin al comit ISO SC29/WG1, que ha desarrollado el estndar JPEG2000
(ISO/IEC 15444-1:2000, Image Coding System), un formato de compresin de
imgenes que incluye un registro de metadatos principalmente descriptivos.
6.2.2. Metadatos y Web semntica
Aunque la idea no era original, teniendo a Paul Otlet (Rayward, 1994) y Vannevar
Bush (1999) como sus ms conocidos precursores, fue Berners-Lee, actual director
del Consorcio Web (W3C), quien materializ la Web y su ms ambiciosa dimensin,
la Web semntica, a finales de la dcada de 1990 (Berners-Lee, 1999). ste la ha
definido como una extensin de la web actual, en la que se otorga a la informacin
significado bien definido, mejorando las posibilidades de que los ordenadores y las
personas trabajen de forma cooperativa (Berners-Lee, 2001).
Tal visin se apoya en tres pilares: XML, RDF y agentes basados en ontologas. El
propsito de estas herramientas, cuyo desarrollo est siendo impulsado por el
Consorcio Web, es precisamente dotar a los recursos web de anotaciones
semnticas comprensibles para las mquinas (esto es, metadatos) con objeto de
desarrollar servicios sofisticados basados en tcnicas automticas de recuperacin
de informacin.






Pgina 68

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Mientras XML facilita la interoperabilidad sintctica de los recursos, los vocabularios
(codificados en RDF u otros lenguajes de representacin formal como OWL o SKOS)
estn orientados a proporcionar interoperabilidad semntica. En este caso, cuando
hablamos de vocabularios nos estamos refiriendo tanto a esquemas de metadatos
(schemas) como a vocabularios (schemes), incluyendo entre estos ltimos a
vocabularios controlados, taxonomas y ontologas.
Para el desarrollo de la Web semntica, es importante el nivel de formalizacin de
los vocabularios, ya que las mquinas precisan de informacin suficientemente
tratada como para que los agentes (robots) puedan aplicar sobre ella reglas lgicas
y de inferencia para la resolucin de tareas. Las ontologas pueden ser consideradas
los vocabularios con un mayor grado de formalizacin, y, por tanto, los
instrumentos ms adecuados para la representacin semntica en la web. Sin
embargo, su desarrollo es complejo y costoso, por lo que an no gozan de gran
difusin. Se considera, no obstante, que los lenguajes documentales pueden, en
muchos casos, constituir una buena base, una base de calidad, en la construccin
de ontologas tiles para la Web semntica.
6.2.3. Metadatos y Web 2.0
El concepto de Web 2.0 hace referencia a una nueva aplicacin de la red en la que
el soporte tecnolgico tiende a hacerse invisible, facilitando la publicacin de
contenidos y la comunicacin entre los usuarios. El usuario pasa a ocupar un primer
plano, en el que desempea un papel activo: sus experiencias vitales o ideas
(expresadas en blogs), sus opiniones sobre productos (reflejadas en ebay, amazon,
etc.), sus conocimientos (recogidos por ejemplo, en wikipedia), sus contenidos
favoritos (que referencia o alberga en delicious, flickr, youtube, etc.), en definitiva,
todas sus experiencias y creaciones pasan a formar parte de los contenidos de la
web en aras al bien comn pero, sobre todo, al comn inters.
Las distintas aplicaciones que se han desarrollado en el contexto de esta Web 2.0,
han propiciado la aparicin de una forma econmica de asignacin de metadatos a
los contenidos. Sin embargo, la mayora de los metadatos asignados son de
carcter informal, no profesional. En este contexto, predominan los vocabularios
informales, en ocasiones denominados folksonomies, social tagging, etc. Estos
vocabularios estn constituidos por trminos (palabras clave) sobre los que no se
ejerce ningn tipo de control terminolgico. Responden a una finalidad prctica:
disponer de una forma rpida de representar el contenido informativo de los
recursos para su recuperacin. La eficacia de tal representacin se enfrenta
claramente a la economa y la capacidad de los usuarios para realizar cualquier otro
tipo de representacin. Por ello, en numerosos casos la precisin de la respuesta de
los sistemas ante estrategias de bsqueda concretas ser muy baja. Un ejemplo de
ello son las etiquetas temticas o categoras asignadas en estas aplicaciones, que
en la mayora de los casos producirn un sustancial ruido.
En Youtube, se definen las etiquetas como elementos heursticos asociativos que
facilitan la localizacin de elementos de inters (Glosario Youtube, disponible en:
http://www.google.com/support/youtube/bin/answer.py?answer=70181). De






Pgina 69

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
manera ms prgmtica, en Flickr se definen como palabras clave o categoras que
agregas a una foto para que sea ms fcil encontrarla luego (Ayuda de Flickr,
disponible en: http://www.flickr.com/help/tags/#37).
Flickr permite asignar hasta 75 etiquetas a cada imagen que se suba. La
representacin visual (tag cloud o nube de etiquetas) que se presenta a
continuacin recoge la frecuencia de aparicin de las etiquetas asignadas ms
frecuentemente en la aplicacin:

Fig. 1: Tag cloud de etiquetas ms frecuentes en Flickr
En esta representacin observamos que las etiquetas que aparecen en un tipo de
letra mayor son las ms frecuentes. Inferimos que la mayor parte de las imgenes
que los usuarios de Flickr han subido son fotos correspondientes a eventos
familiares (bodas, cumpleaos, etc.), lugares, viajes, familia, etc.
La asignacin de etiquetas semnticas a los contenidos facilita, adems, su
presentacin categorizada (fig.2). Esto hace posible el browsing o navegacin por la






Pgina 70

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
estructura de contenidos que propicie una bsqueda por navegacin o serendipitous
browsing, especialmente til cuando la necesidad de informacin del usuario es de
carcter genrico o no ha sido concretada.

Fig. 2: Categoras temticas de Youtube basadas en etiquetado semntico
Otra posibilidad basada en etiquetas semnticas es la que ofrece Flickr, que permite
visualizar sus contenidos (en este caso, imgenes) en funcin del lugar geogrfico
que representan (a lo que denomina geoetiquetas).






Pgina 71

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Fig. 3: Visualizacin geogrfica de imgenes en Flickr basada en geoetiquetas
En su bsqueda de nuevas y cada vez ms atractivas formas de acceso a los
contenidos, observamos en estas aplicaciones un inters por explotar el potencial
de los metadatos para la prestacin de servicios de informacin. No obstante, no
podemos obviar las dificultades a las que se enfrentan al basarse en una asignacin
de etiquetas semnticas a la que no se aplica filtro alguno orientado a asegurar su
pertinencia, consistencia y calidad.
6.3. Bibliografa
ABADALL FALGUERAS, E. (2001). Sistemas y servicios de informacin digital. Gijn:
Trea.
BUSH, V. (1999). As we may think. Library Computing, vol. 18, n. 3, p. 180-188.
BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. (2001). The semantic web. Scientific
American, May issue.






Pgina 72

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
BERNERS-LEE, T. (1999). Weaving the web: the original design and ultimate
destiny of the World Wide Web by its inventor. New York: Harper. ISBN
0062515861
RAYWARD, W. B. (1994). Visions of Xanadu: Paul Otlet (1868-1944) and hypertext.
Journal of the American Society for Information Science, vol. 45, n. 4, p. 235-250.
SHETH, A.; KLAS, W. (1998). Multimedia Metadata Management handbook:
integrating and applying digital data. New York: McGraw-Hill. ISBN 0070577358.
Bibliografa
MARGAIX ARNAL, D. (2007). Conceptos de web 2.0 y biblioteca 2.0: origen,
definiciones y retos para las bibliotecas actuales. El profesional de la informacin,
vol. 16, n. 2, p. 95-106.
SNCHEZ FERNNDEZ, L.; FERNNDEZ GARCA, N. (2005). La Web Semntica:
fundamentos y breve "estado del arte" [en lnea]. PC World, n. 178, p. 6-11.
Disponible en: <http://www.ati.es/novatica/2005/178/178-6.pdf>.






Pgina 73

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Mdulo 7. Aplicaciones en bibliotecas y archivos
7.1. Aplicaciones, experiencias y perspectivas en
bibliotecas
En la primera leccin hemos partido de una idea intuitiva de biblioteca para
presentar el concepto de biblioteca digital. Pero, qu es una biblioteca? Una
biblioteca es una unidad (sistema) de informacin (UI) que presta servicios de
mediacin de acceso a la informacin y los documentos. La diferencia con respecto
a otras unidades de informacin como centros de documentacin y archivos es la
naturaleza de sus fondos y sus servicios, que en el caso de la biblioteca se orienta
por lo general a fines culturales. As, distinguimos bibliotecas pblicas, bibliotecas
universitarias o bibliotecas escolares, entre otras.
Los fondos de las bibliotecas han estado tradicionalmente constituidos por
materiales con soportes fsicos. Sin embargo, en su adaptacin al contexto
tecnolgico actual para la satisfaccin de las necesidades informativas de sus
usuarios, la biblioteca ha empezado a llamarse a s misma hbrida en cuanto
combina ya los soportes tradicionales con los nuevos soportes de informacin
digitales (y no slo de contenido textual, sino tambin cada vez ms imgenes,
sonidos, videos, etc.).
Por otra parte, la coleccin de una biblioteca est hoy constituida no slo por
aquellos recursos que posee dicha biblioteca, sino tambin por todos aquellos
recursos a los que puede acceso gracias a acuerdos de cooperacin bibliotecaria
(desarrollo de catlogos colectivos, licencias compartidas de acceso a bases de
datos, etc.).
Por todo ello, la biblioteca ha ido avanzando en el desarrollo de distintos estndares
(algunos de los cuales hemos visto en lecciones anteriores) que posibiliten una
adecuada gestin de recursos de informacin para la prestacin de dichos servicios.
En este sentido, dos de los proyectos ms destacados en la actualidad estn siendo
desarrollados por la Biblioteca del Congreso de los Estados Unidos (LOC): MODS y
METS (http://www.loc.gov/standards/).
7.1.1. MODS (Metadata Object Description Schema)
Se trata de un esquema XML para la descripcin de recursos que se sita a medio
camino entre el formato bibiotecario para la descripcin bibliogrfica automatizada
denominado MARC 21 (Machine-Readable Cataloging,
http://www.loc.gov/marc/umbspa/) y el estndar Dublin Core. Son tres las
caractersticas de este esquema que lo hacen especialmente til:
Es ms sofisticado, ms completo que DC.






Pgina 74

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Al mismo tiempo, no es tan complejo como el formato MARC.
Presenta un mayor grado de compatibilidad con MARC que cualquier otro
esquema, por lo que la prdida de datos entre conversiones es menor.
Es ms amigable que MARCXML (esquema desarrollado en 2002 por la LOC
que recoge la forma de conversin de MARC a XML).
Se emplea:
Como extensin de METS (que veremos a continuacin): la exhaustividad de
las descripciones MODS encajan bien con la jerarqua de los objetos METS.
Para generar descripciones de recursos que posibiliten su recoleccin (OAI-
PMH).
Como formato admitido por el protocolo SRU (Search/Retrieval via URL,
http://www.loc.gov/standards/sru/resources/schemas.html) para la
interoperabilidad de datos de registros y su recuperacin en sistemas
distribuidos.
Como elemento de convergencia entre descripciones MARC y otras
descripciones en lenguaje XML.
Para la descripcin de recursos en XML de manera ms sencilla que con
MARC.
Para generar registros de metadatos que deban ser empaquetados junto a
recursos electrnicos.
Es conveniente observar la conversin de registros de metadatos de MARC a MODS
no se hace de forma directa, sino que se ha de realizar previamente una conversin
de MARC a MARCXML y de ah a MODS.
La ltima versin del esquema, la 3.3, ha sido publicada en agosto de 2007. Los
elementos de nivel superior que en l se recogen y su equivalencia respecto a los
elementos del DCMES (http://www.loc.gov/standards/mods/dcsimple-mods.html)
son los siguientes:
Elemento MODS
Elemento
DC
Descripcin
titleInfo title Ttulo del recurso.
name creator
Encabezamiento o autoridad (persona,
entidad, etc.).






Pgina 75

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
typeOfResource type Tipo de recurso.
genre type Gnero de la obra.
originInfo
publisher,
date
Datos de publicacin del recurso.
language language Idioma del recurso.
physicalDescription format Descripcin fsica del recurso.
abstract description Resumen del contenido del recurso.
tableOfContents description Sumario o ndice del recurso.
targetAudience audience
Tipo de usuario al que se dirige el
recurso.
note description Notas.
subject subject Tema o materia del recurso.
classification subject
Cdigo de clasificacin, segn
vocabulario controlado.
relatedItem relation Recursos relacionados con el descrito.
identifier identifier ID o identificador del recurso.
location identifier Ubicacin del recurso.
accessCondition rights Condiciones de acceso al recurso.
recordInfo
Datos administrativos del recurso: fecha
de creacin, modificacin, etc.
Se puede consultar una versin ampliada de este esquema en:
http://www.loc.gov/standards/mods/v3/mods-3-3-outline-review-new.html.






Pgina 76

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Para ver un ejemplo de registro MODS, acudimos a una de las colecciones digitales
de la Biblioteca del Congreso estadounidense (fig. 1) y realizamos una bsqueda. El
registro que se nos presenta es el siguiente:

Fig. 1: Registro correspondiente a una videograbacin en la Biblioteca del Congreso
(http://lcweb2.loc.gov/diglib/ihas/loc.natlib.ihas.200035762/default.html)
El registro se puede visualizar en formato MODS y METS. El correspondiente a su
codificacin en MODS sera el siguiente (slo se presenta la parte principal del
registro, destacando en negrita los elementos principales):
<mods:mods ID="MODS" version="3.0">
<mods:titleInfo>
<mods:title>
Library of Congress Song of American Tour with Thomas Hampson, January
17, 2006, Saint Paul, MN
</mods:title>
</mods:titleInfo>
<mods:name type="personal">
<mods:namePart>Hampson, Thomas</mods:namePart>
<mods:role>
<mods:roleTerm authority="marcrelator"
type="text">Performer</mods:roleTerm>
</mods:role>
</mods:name>
<mods:name type="personal">






Pgina 77

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
<mods:namePart>Rieger, Wolfram</mods:namePart>
<mods:role>
<mods:roleTerm authority="marcrelator"
type="text">Performer</mods:roleTerm>
</mods:role>
</mods:name>
<mods:typeOfResource>moving image</mods:typeOfResource>
<mods:originInfo>
<mods:dateIssued>2006</mods:dateIssued>
<mods:issuance>monographic</mods:issuance>
</mods:originInfo>
<mods:physicalDescription>
<mods:form authority="ihas">videorecording</mods:form>
<mods:reformattingQuality>access</mods:reformattingQuality>
<mods:digitalOrigin>reformatted digital</mods:digitalOrigin>
</mods:physicalDescription>
<mods:targetAudience authority="marctarget">adult</mods:targetAudience>
<mods:note type="General">
Presented by the Schubert Club International Artist Series.
</mods:note>
<mods:note type="General">
Performed at the Ordway Center for the Performing Arts, Saint Paul,
Minnesota.
</mods:note>
<mods:note type="General">Thomas Hampson, baritone; Wolfram Rieger,
piano.</mods:note>
<mods:note type="Copyright Notice">Courtesy of The Schubert
Club.</mods:note>
<mods:identifier displayLabel="IHASDigitalID"
type="local">200035762</mods:identifier>
<mods:identifier displayLabel="IHASMODSID"
type="local">24344</mods:identifier>
<mods:location>
<mods:physicalLocation authority="marcorg">DLC</mods:physicalLocation>
</mods:location>
<mods:recordInfo>
<mods:recordContentSource>IHAS</mods:recordContentSource>
<mods:recordChangeDate
encoding="marc">060824</mods:recordChangeDate>
<mods:recordIdentifier
source="IHAS">loc.natlib.ihas.200035762</mods:recordIdentifier>
</mods:recordInfo>
Para complementar las capacidades de MODS, la Biblioteca del Congreso ha
desarrollado una especificacin para la codificacin en XML de registros de
autoridad (nombres de persona, entidades, ttulos, materias, gneros y nombres
geogrficos) denominada MADS (Metadata Authority Description Schema,
disponible en: http://www.loc.gov/standards/mads/). El registro de autoridad para






Pgina 78

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
un nombre de persona, por ejemplo, que recoge la forma autorizada para el mismo
as como sus variantes, adopta la siguiente forma (ejemplo tomado de
http://www.loc.gov/standards/mads/mads-name.xml):
<mads xsi:schemaLocation="http://www.loc.gov/mads/ mads.xsd">
<authority>
<name>
<namePart>Smith,John</namePart>
<namePart type="date">1995-</namePart>
</name>
</authority>
<variant type="other">
<name>
<namePart>Smith, J</namePart>
</name>
</variant>
<variant type="other">
<name>
<namePart>Smith, John J</namePart>
</name>
</variant>
<note type="history">Biographical note about John Smith.</note>
<affiliation>
<organization>Lawrence Livermore Laboratory</organization>
<dateValid>1987</dateValid>
</affiliation>
</mads>
7.1.2. METS (Metadata Encoding and Transmission
Standard)
Desarrollado en 2001 a partir del proyecto MOA2 (Making of America II) de la
Digital Library Federation (http://www.diglib.org/) y la LOC, METS es una
especificacin para la descripcin, gestin e intercambio de todo tipo de recursos
que puedan ser albergados en repositorios y bibliotecas digitales.
Un registro codificado en METS (a lo que se denomina documento METS) puede
llegar a contar con los siguientes componentes:
Encabezamiento (metsHdr). El denominado METS header contiene
informacin relativa a la creacin del documento METS: nombre del archivo,
fecha de creacin y modificacin del mismo, nombre del responsable de su
creacin, etc.
Metadatos descriptivos (dmdSec). El registro METS puede contener una
referencia de metadatos (Metadata Reference) o un paquete de metadatos
(Metadata Wrapper). El primero consiste en una referencia (mediante un






Pgina 79

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
enlace) a un registro de metadatos externo, mientras que el segundo est
conformado por un paquete de metadatos codificados bien en cdigo binario
(Base64) o en XML. METS ofrece un alto grado de flexibilidad en el sentido
de que, aunque suele relacionarse con MODS o Dublin Core, no utiliza ningn
esquema de metadatos en particular para la descripcin de los recursos, sino
que permite usar aquel que sea oportuno en cada contexto de aplicacin.
Metadatos administrativos (amdSec). Dispone de cuatro
subcomponentes: metadatos tcnicos, derechos de acceso y uso (rights
metadata), origen (source metadata), y metadatos de conservacin
(preservation metadata). Al igual que el componente de metadatos
descriptivos, puede hacer referencia a un registro externo o bien conformar
un paquete de metadatos.
Directorio de archivos (fileSec). El file inventory permite contar con una
lista de los archivos asociados a un documento y sus relaciones. Los archivos
que comprende pueden ser enlazados o pueden estar contenidos en el
regostro como cdigo binario.
El mapa estructural (structMap). Describe la estructura de un recurso,
presentando en una organizacin jerrquica los registros de metadatos y los
archivos de contenido a los que stos se refieren. Este mapa fomenta el
desarrollo de instrumentos que faciliten la navegacin de los usuarios en
vastas colecciones de documentos.
Enlaces estructurales (structLink). Especialmente til para describir
sitios web, trata de recoger los hiperenlaces referidos en las divisiones
indicadas en el mapa estructural.
Comportamiento (behaviorSec). Asocia comportamientos de ejecucin al
contenido del documento METS, de tal manera que, por ejemplo, sea posible
especificar el tipo de aplicacin necesario para utilizar el recurso o para
indicar que el recurso requiere una determinada hoja de estilo para ser
mostrado correctamente.
De estos componentes slo el directorio de archivos y el mapa estructural son de
uso obligatorio en METS. Ejemplos de documentos METS se pueden consultar en:
http://www.loc.gov/standards/mets/mets-examples.html.
Al igual que en el caso de otros esquemas, se han desarrollado diversos perfiles de
aplicacin de METS. Estos perfiles adaptan las mltiples posibilidades que ofrece el
esquema a las necesidades de contextos de aplicacin particulares. Un perfil de
aplicacin METS ha de contener los siguientes elementos (Cundiff, 2004):
URI asignado al perfil de aplicacin.
Breve ttulo para la clase de documentos que tratar el perfil.
Resumen.






Pgina 80

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Fecha de creacin del perfil.
Informacin de contacto.
Fecha de registro del perfil en la Biblioteca del Congreso estadounidense.
Indicacin de otros perfiles que puedan estar relacionados.
Enumeracin de extensiones.
Enumeracin de reglas de descripcin as como detalles de aplicacin.
Enumeracin de vocabularios controlados aplicables.
Descripcin de requisitos estructurales relacionados con la construccin del
propio objeto METS.
Descripcin detallada de las caractersticas tcnicas o comportamientos de
ejecucin de los archivos de contenido que se puedan permitir.
Descripcin de herramientas afiliadas, compatibles con el perfil.
Entre las instituciones que han desarrollado perfiles de aplicacin de METS se
encuentran la OCLC, la California Digital Library, la Oxford Digital Library, la Library
of Congress o la Universidad de Graz. Se puede consultar una lista completa de
perfiles METS registrados en:
http://cassatt.cdlib.org/%7Etingle/mets/mets-registered-profiles.html.
7.2. Aplicaciones, experiencias y perspectivas en archivos
Los archivos, como unidades de informacin, nacen para recoger todos aquellos
documentos generados o recibidos por una entidad en el desarrollo de su actividad.
La base de la teoria archivistica reside en el denominado principio de procedencia,
segn el cual los archivos se organizan atendiendo al origen orgnico de sus
documentos, que queda reflejado en el cuadro de clasificacin. Es precisamente la
informacin relativa al contexto y evolucin de los documentos uno de los
elementos principales en la descripcin archivstica, como seala Gilliland-Swetland
(2000): Determinar y registrar el contexto es lo que ayuda a identificar y
preservar el valor probatorio de los documentos de archivo y de los objetos a lo
largo del tiempo, al tiempo que facilita la determinacin de su autenticidad y ayuda
a los investigadores en su anlisis e interpretacin.
En los ltimos aos se han desarrollado distintos esquemas para la descripcin de
documentos de archivo, entre ellos el formato MARC Archival and Manuscript
Control (AMC) desarrollado en 1984 por la Biblioteca del Congreso y que
posteriormente se integrara en el propio formato MARC, la norma ISAD (G) o
General International Standard for Archival Description desarrollada por el Consejo
Internacional de Archivos en 1994, o el Encoded Archival Description (EAD).






Pgina 81

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Esta ltima, la EAD (http://www.loc.gov/ead/), es sin duda la aplicacin ms
importante en el campo de los archivos. Se trata de una norma que describe un
formato para la creacin, codificacin e intercambio de instrumentos de descripcin
(registros) en formato electrnico (SGML y XML) con objeto de facilitar el desarrollo
de aplicaciones que posibiliten su recuperacin en red.
EAD en consta de tres elementos:
Una DTD vlida para SGML y XML.
Un repertorio de etiquetas EAD (EAD Tag Library) en el que se describen los
elementos definidos en la DTD.
Unas directrices de aplicacin, en las que se ofrecen recomendaciones sobre
la manera de aplicar EAD a la descripcin archivstica.
Aunque se trata de una norma desarrollada en Estados Unidos, en su elaboracin
se tomaron en cuenta distintos modelos internacionales como ISAD(G), RAD, APPM,
etc. Por ello, EAD se fundamenta en principios bsicos de la descripcin archivstica
expuestos en tales estndares, como son la descripcin multinivel.
La descripcin multinivel consiste en describir un fondo de archivo con sus distintas
partes componentes (secciones, series, expedientes, documentos, etc.) de manera
que las distintas descripciones queden relacionadas, adoptando una forma
jerrquica.
Por lo general, en un registro EAD se pueden diferenciar tres partes o segmentos:
eadheader: Informacin relativa al registro EAD en s mismo.
frontmatter: Informacin relevante para la publicacin formal del registro.
findaid: Descripcin del material archivstico propiamente dicho, junto con
la informacin contextual y administrativa asociada.






Pgina 82

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
El siguiente esquema presenta una visin general de los elementos EAD:

Fig.2: Representacin arbrea de los elementos EAD (Peis y Ruiz-Rodrguez, 2004)
Como se puede observar en la fig. 2, el elemento raz de un documento EAD es el
elemento <ead>, que contiene tres elementos: <eadheader>, <frontmatter> y
<findaid>.
7.2.1. Descripcin de materiales archivsticos
Centraremos nuestra atencin en los elementos empleados para la descripcin de
los materiales archivsticos propiamente dichos, esto es, aquellos que componen el
segmento findaid:
archdesc
Puede ser considerado el elemento principal de un documento EAD. Debe ir






Pgina 83

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
acompaado siempre por un atributo level que indica el nivel de la descripcin:
fondo, seccin, subseccin, serie, expediente o unidad documental. ste se
codificar mediante las palabras reservadas collection, file, fonds, series, etc.
El elemento <archdesc> cuenta con los siguientes atributos adicionales:
audience: cumple la misma funcin que en el elemento <ead>. Si toma el
valor internal, el contenido del elemento <archdesc> no se mostrar a los
usuarios. Si toma el valor external, s ser visible.
relatedencoding: se puede utilizar en este elemento para indicar
equivalencias entre EAD y un sistema de codificacin alternativo.
langmaterial: recoger el idioma de la documentacin que se describe,
mediante su cdigo ISO 639-2 (Codes for the Representation of Names of
languages)
legalstatus: situacin jurdica del documento.
type: indica si el instrumento de descripcin es de tipo inventario o
registro.
did
Elemento de identificacin descriptiva, constituye el bloque principal de cualquiera
de los niveles de descripcin del documento EAD. Incluye los siguientes elementos
hijos:
<head>: permite asignar un ttulo al elemento <did> para su impresin o
visualizacin en pantalla.
<repository>: nombre del organismo encargado de dar acceso al
documento, que es normalmente su custodio.
<origination>: nombre del responsable de la creacin o reunin del
material que se describe.
<unittitle>: ttulo de la unidad de descripcin.
<unitdate>: fecha o fechas de la unidad de descripcin.
<physdesc>: descripcin fsica, extensin y formato de la unidad de
descripcin.
<unitid>: identificador nico de la unidad de descripcin.
<physloc>: ubicacin fsica de la unidad de descripcin.
<abstract>: resumen del contenido de la unidad documental.






Pgina 84

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
admininfo
Recoge una serie de elementos que recogen informacin sobre la custodia,
adquisicin, proceso y organizacin de la unidad de descripcin, as como
condiciones de acceso y reproduccin de los documentos y la existencia de otras
versiones en distintos formatos. Estos elementos son:
<acqinfo>: recoge informacin sobre el tipo de adquisicin del material
(compra, donacin, transferencia o depsito).
<custodhist>: recoge informacin sobre cambios en la custodia de la
unidad de descripcin que hayan podido influir en su control, integridad o
interpretacin.
<accessrestrict>: recoge informacin sobre las condiciones de acceso al
material descrito.
<userestrict>: recoge informacin sobre las condiciones de uso del
material descrito.
<altformavail>: indica la existencia de copias del material descrito en
otros formatos distintos.
<prefercite>: recoge la forma recomendada de referenciar el material
descrito.
<appraisal>: recoge informacin sobre la valoracin de la unidad de
descripcin, procesos de seleccin y expurgos realizados.
<accruals>: recoge informacin sobre adquisiciones, envos o
transferencias previstas relacionadas con el material descrito.
<processinfo>: recoge informacin sobre cualquier tipo de procesamiento
que no haya dado lugar a formato diferente del original.
bioghist
Este elemento recoge datos biogrficos del autor de la unidad que se describe.
controlaccess
En este elemento se recoge una serie de descriptores (nombres propios, de
entidades, geogrficos, de materias, etc.) que sirven de punto de acceso al
contenido de la unidad descrita para facilitar la recuperacin. Por regla general, los
valores asignados se tomarn de vocabularios controlados.
note
Informacin dirigida al usuario. Puede ser utilizado para indicar que la unidad






Pgina 85

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
descrita pertenece a una unidad de descripcin ms amplia que ha sido descrita en
otros documentos EAD.
odd
Elemento multiuso, que recoge otros datos descriptivos, informacin que no ha
podido consignarse en ningn otro elemento EAD.
scopecontent
Recoge informacin relativa al mbito y cobertura temtica del material descrito,
citando a los principales individuos, organizaciones, hechos, lugares y temas que en
ella se representan.
add
Recoge datos descriptivos complementarios, comprende instrumentos
complementarios de acceso como bibliografas, ndices, unidades de descripcin
relacionadas, etc. Puede incluir los siguientes elementos:
<head>: informacin relativa a la presentacin de los elementos.
<bibliography>: recoge referencias bibliogrficas relacionadas con el
material descrito.
<fileplan>: permite recoger el cuadro de clasificacin del archivo.
<index>: facilita un ndice en que se recogen los nombres de personas,
instituciones, lugares, etc. que se citan en el material descrito.
<otherfindaid>: indica la existencia de guas complementarias para la
unidad de descripcin.
<relatedmaterial>: indica la existencia de materiales complementarios no
relacionados directamente con el material descrito que pueden ser de inters
para el usuario.
<separatedmaterial>: indica la existencia de materiales directamente
relacionados con el material descrito, pero que se hallan separados de ste
fsicamente.
7.3. Bibliografa
CUNDIFF, M. V. (2004). An introduction to the Metadata Encoding and Transmission
Standard (METS). Library Hi Tech, vol. 22, n. 1, p. 52-64.
GILLILAND-SWETLAND, A. J. (2000). Introduction to Metadata: Setting the Stage
[en lnea]. En: BACA, M. (ed.). Introduction to metadata: pathways to digital






Pgina 86

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
information. Los Angeles: Getty Information Institute, p. 1-8. Disponible en:
<http://www.getty.edu/research/conducting_research/standards/intrometadata/set
ting.pdf>.
PEIS, E.; RUIZ-RODRGUEZ, A.A. (2004). EAD (Encoded Archival Description):
Desarrollo, estructura, uso y aplicaciones [en lnea]. Hypertext.net, n. 2.
Disponible en: <http://www.hipertext.net/web/pag223.htm>.
Bibliografa
DIGITAL LIBRARY FEDERATION (DLF) (2007). METS: Metadata encoding and
transmission standard: primer and reference manual [en lnea]. Disponible en:
<http://www.loc.gov/standards/mets/METS%20Documentation%20final%2007093
0%20msw.pdf>.
DIGITAL LIBRARY FEDERATION (DLF) (2006). Implementation guidelines for
shareable MODS records [en lnea]. Disponible en:
<http://www.diglib.org/aquifer/dlfmodsimplementationguidelines_finalnov2006.pdf
>.






Pgina 87

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Mdulo 8. Metadatos educativos: un caso de
aplicacin especfica
8.1. Estndares y perfiles de aplicacin para contenidos
educativos
Entendemos por metadatos educativos los metadatos aplicados a la descripcin de
cualquier recurso educativo o de utilidad educativa (textos, imgenes, multimedia,
etc.). Mediante los metadatos, los recursos educativos a los que se encuentran
asociados quedan identificados y preparados para su recuperacin en distintos
contextos (web, repositorios y bibliotecas digitales educativas, etc.) con vistas a su
posterior uso y reutilizacin en diferentes entornos educativos.
8.1.1. Metadatos educativos y objetos de aprendizaje
El inters que en los ltimos aos ha suscitado el tema de los metadatos educativos
viene dado por la relevancia que la descripcin de contenidos ha cobrado en los
entornos de educacin a distancia a travs de redes de comunicacin (e-learning).
La perentoria necesidad de reutilizacin de contenidos en las instituciones
educativas (principalmente universitarias) ha propiciado la investigacin en torno a
una realidad acuada en el mbito informtico: los objetos de aprendizaje o
learning objects (LO).
A pesar del gran nmero de trabajos que han abordado el tema desde que en 1994
W. Hodgins empezara a hablar de ellos, an no se ha logrado alcanzar una
definicin de consenso de LO. El trmino, que procede obviamente de la
programacin orientada a objetos (OOP), hace referencia a un tipo concreto de
documentos digitales, de naturaleza educativa, autnomos o con cierto grado de
autonoma y cuyo objetivo prioritario es estar preparados para poder ser
reutilizados posteriormente.
8.1.2. Estndares
Vamos a estudiar dos estndares:
IEEE Standard for Learning Object Metadata (LOM).
DC-Ed AP (DCMI).
8.1.2.1. IEEE Standard for Learning Object Metadata
(LOM)
LOM es un estndar elaborado por el Comit para la Normalizacin de Tecnologas






Pgina 88

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Educativas del Instituto de Ingenieros en Electricidad y Electrnica (IEEE LTSC) a
partir de trabajos previos del IMS y el proyecto europeo ARIADNE. La versin 1.0
fue aprobada en 2002, y desde entonces ha alcanzado una gran difusin,
habindose realizado incluso una traduccin al castellano, el Estndar para
metadatos de Objetos Educativos (IEEE, 2002). El propsito de este estndar es
facilitar, mediante una adecuada descripcin, la creacin, intercambio y uso de los
en l denominados objetos educativos, entendidos como cualquier entidad,
digital o no digital, que pueda ser usada, reutilizada o referenciada durante
cualquier actividad de aprendizaje basada en la tecnologa. La actual versin del
estndar presenta 77 elementos de descripcin, todos opcionales y repetibles que,
organizados jerrquicamente, se agrupan en torno a nueve categoras:
1. General. Recoge algunos de los principales elementos de identificacin del
documento descrito: cdigo de identificacin, ttulo del recurso, idioma,
breve descripcin de su contenido, palabras clave, cobertura temporal o
geogrfica, estructura e informacin sobre su granularidad o nivel de
agregacin.
2. Ciclo de vida. Recoge informacin relativa a la autora, fecha de creacin,
versin y estado del recurso descrito.
3. Meta-metadatos. Proporciona informacin sobre el esquema de metadatos
empleado en la descripcin del recurso, fecha, nombre del creador e idioma
del registro.
4. Tcnica. Recoge informacin relativa al formato, tamao, URI, duracin y
requisitos tcnicos para la utilizacin del recurso.
5. Uso educativo. Describe el uso educativo del recurso (ver tabla I): tipo de
recurso de que se trata, tipo y nivel del usuario al que se dirige, contexto de
utilizacin, tipo y nivel de interactividad que presenta, densidad semntica,
dificultad, idioma y descripcin de su uso.
6. Derechos. Recoge aspectos relativos a las restricciones de uso asociadas al
recurso: coste, proteccin de los derechos de autor y otras restricciones de
uso.
7. Relacin. Proporciona informacin sobre las relaciones, en caso de que las
haya, establecidas entre el recurso descrito y otros recursos.
8. Anotacin. Recoge los comentarios del catalogador sobre el uso pedaggico
del recurso.
9. Clasificacin. Descripcin del contenido del recurso a partir de uno o varios
sistemas de clasificacin, vocabularios y palabras clave.
La organizacin de los elementos en estas categoras es la que se presenta en el
siguiente grfico:






Pgina 89

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Fig. 1: Distribucin de elementos en el estndar LOM
En cuanto a los elementos de descripcin de caractersticas propiamente educativas
de los recursos, stos son:
Elemento Descripcin y uso
5.1 Tipo de
interactividad
Tipo de aprendizaje predominante soportado por este objeto
de aprendizaje: activo (que inducen a la participacin directa
por parte de los aprendices), expositivo (aquel en el que la
tarea principal del aprendiz consiste en asimilar los conceptos
que le son expuestos) y combinado (mezcla del activo y
expositivo)
5.2 Tipo de
recurso
educativo
Tipo de recurso, segn lista de valores: ejercicio, simulacin,
cuestionario, diagrama, figura, grfico, ndice, diapositiva,
tabla texto narrativo, examen, experimento, planteamiento de
problema y autoevaluacin.
5.3 Nivel de
interactividad
Grado de interactividad que caracteriza al objeto educativo (la
interactividad es referida al grado en que el aprendiz puede
influir en el aspecto o comportamiento del objeto educativo).






Pgina 90

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
5.4 Densidad
semntica
Grado de concisin de un objeto educativo. Puede ser
estimada en funcin de su tamao, mbito y duracin. Es
independiente de su dificultad.
5.5 Destinatario
Usuario principal para el que ha sido diseado el objeto
educativo: profesor, autor, aprendiz, administrador.
5.6 Contexto
Entorno principal en el que se utilizar el objeto educativo
segn los valores: Escuela, Educacin Secundaria,
Entretenimiento, otros.
5.7 Rango tpico
de edad
Edad del destinatario tpico.
5.8 Dificultad
Grado de dificultad que presenta para los destinatarios tpicos,
trabajar con y utilizar este objeto educativo
5.9 Tiempo
tpico de
aprendizaj e
Tiempo aproximado o tpico que necesitan para asimilar el
objeto educativo los destinatarios tpicos (expresado en
segundos).
5.10 Descripcin Comentarios sobre cmo debe utilizarse este objeto educativo.
5.11 I dioma Idioma utilizado en el objeto educativo.
8.1.2.2. DC-Ed AP (DCMI)
Dentro de la Dublin Core Metadata Initiative (DCMI) se constituy en 1998 un
grupo especfico, el Dublin Core Education Group, con objeto de desarrollar una
propuesta de aplicacin del estndar a la representacin de propiedades o
caractersticas propias de recursos de utilidad en entornos educativos, esto es, a la
descripcin de recursos educativos. Resultado del trabajo de este grupo,
actualmente dirigido por Sarah Currier y Diane Hillman, es el Dublin Core Education
Application Profile (v.0.2), que especifica la aplicacin de los elementos Dublin Core
al rea educativa e incluye dos nuevos elementos. El primero es Audience, que ha
sido el primer elemento de un dominio especfico en ser incorporado al esquema
general DC, e identifica el tipo de usuario al que se dirige el recurso educativo o
para el que pueda ser de utilidad. Presenta dos calificadores: EducationLevel, que
describe el nivel educativo al que se dirige, y Mediator, que hace referencia a la
persona o entidad que media en el acceso al recurso. El segundo es el elemento
InstructionalMethod, que hace referencia al mtodo instructivo que emplea el
recurso. Audience y Audience-EducationLevel describen caractersticas que pueden






Pgina 91

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
ser de utilidad tanto para docentes como discentes, mientras que Audience-
Mediator e InstructionalMethod estn ms orientados al trabajo docente. Se trata,
no obstante, de un trabajo todava en curso, y actualmente se trata de desarrollar
como mdulo independiente (un application profile module) que pueda ser
aplicado junto al esquema bsico de DC para la descripcin de recursos educativos.
8.1.3. Especificaciones
Veremos estas dos especificaciones:
IMS (IMS Learning Resource Metadata).
SCORM (Sharable Content Object Reference Model).
8.1.3.1. IMS (IMS Learning Resource Metadata)
Como ya se ha mencionado, el IMS Global Learning Consortium se ha visto
activamente involucrado en el desarrollo del estndar LOM del IEEE. Su
especificacin se tom como base para los primeros borradores del estndar, y ms
tarde, con su maduracin, fue aqulla la que se adapt a l. La ltima versin del
IMS LRM se considera equivalente a LOM, facilitando una gua para su
implementacin.
En la actualidad, IMS lidera un consorcio de instituciones educativas y empresas de
contenidos educativos que est desarrollando un estndar de empaquetado de
contenidos, el Common Cartridge (Cc). Los estndares de empaquetado permiten
preparar (envolver) los objetos de aprendizaje de forma que puedan ser
intercambiados (importados, exportados, agregados y desagregados) entre
sistemas y plataformas educativas (en archivos formato .zip). Common Cartridge
aglutina y reinterpreta estndares preexistentes, como IMS Content Packaging,
IEEE Learning Object Metadata y SCORM.
8.1.3.2. SCORM (Sharable Content Object Reference
Model)
Producido por la iniciativa ADL (Advanced Distributed Learning) del Departamento
de Defensa estadounidense, se trata de un conjunto de estndares y
especificaciones especialmente orientado a la gestin de contenidos educativos
dentro de plataformas de e-learning o LCMS (Learning Content Management
Systems). En el grupo relativo a la gestin del contenido educativo, el Content
Aggregation Model, observamos que SCORM utiliza el estndar LOM de forma
directa, si bien complementado con otras especificaciones que afectan a la
estructura, el empaquetado o la secuenciacin de tales contenidos.






Pgina 92

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Un paquete SCORM contiene:
Un ndice o manifest. Define, mediante un archivo XML, la forma en que se
han de importar los contenidos, as como la forma en que se han de
presentar, tal y como lo concibi en origen su creador. Incluye:
o Metadatos. Descripcin del recurso.
o Estructura. Define la estructura del objeto de aprendizaje.
o Recursos. Identifica los archivos de que se compone el objeto de
aprendizaj
Subndice o sub-manifest (no siempre).
Un ejemplo de paquete SCORM y su integracin en una plataforma educativa (en
este caso, Moodle) sera el siguiente:

En primer lugar, se descarga un paquete de contenidos del repositorio TILE (The
Inclusive Learning Exchange, disponible en
http://www.barrierfree.ca/tile/index.htm), observando que el archivo zip se






Pgina 93

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
encuentra el ndice y los archivos que componen el recurso:







Pgina 94

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
A continuacin, se aade el paquete SCORM a la plataforma:







Pgina 95

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Finalmente, se comprueba que el contenido se reproduce en ella de forma correcta:

8.1.4. Implementaciones de estndares
AICC (Aviation Industry CBT Committee)
Formado en 1988, este grupo fue el primero en desarrollar especificaciones
relacionadas con las tecnologas educativas, en su caso aplicadas a la
formacin de los profesionales de la aviacin. Participa activamente en las
actividades del IEEE LTSC. La ltima versin de su esquema de metadatos,
la 1.7 (AICC, 2006), se presenta como un perfil de aplicacin de LOM,
aunque, a diferencia de ste, ofrece una recomendacin sobre el carcter
obligatorio u opcional que han de tener sus elementos. Su mayor aportacin
se sita en la categora educativa, en la que prescinde de los elementos
referidos a la densidad semntica y el rango tpico de edades e incorpora 12
nuevos subelementos, relativos a aspectos pedaggicos -mtodos, tcnicas
y recursos didcticos- orientados al trabajo docente (Instructional Domain,
Instructional Context, Instructional Events, Instructional Strategy, Learning
Outcome Type, Objective y Required Training Resources), a la evaluacin
que efecta el recurso (Assessment Type, Instructional Feedback Level y






Pgina 96

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Training Event Reporting), a los conocimientos previos necesarios
(Competency Level) o la capacidad del contenido para adaptarse al
estudiante o la plataforma virtual de enseanza (Adaptability).
CEMARC (Curriculum Enhanced MARC)
La denominacin de Curriculum-Enhanced MARC se refiere a la utilizacin de
varios campos del formato MARC21 en la consignacin de informacin de
inters para la recuperacin de recursos educativos. As, el campo 520
(Summary, etc.) se puede utilizar para incorporar un comentario valorativo
del recurso, el 521 (Target Audience Note) para el tipo de usuario ms
apropiado para el recurso (curso, edad, etc.), el 526 (Study Program
Information Note) para el ttulo del programa docente del que pueda formar
parte el recurso y el 658 (Index Term-Curriculum Objective) para el tipo de
objetivos curriculares estatales o nacionales que persigue el recurso
(especialmente vlido para el mbito anglosajn). IBERMARC, por su parte,
ofrece correspondencia con CEMARC en los campos 520 (Nota de sumario,
resumen etc.), 521 (Nota de nivel del destinatario) y 526 (Nota de
informacin sobre el programa de estudio), si bien estos dos ltimos no son
de uso comn.
8.1.5. Perfiles de aplicacin empleados en repositorios y
bibliotecas digitales educativas
Entre el conjunto de iniciativas actualmente en marcha, destacan las siguientes:
ARIADNE.
EdNA Online.
EduSource.
GEM.
MERLOT.
The Learning Federation.
8.1.5.1. ARIADNE
Es el resultado de un proyecto europeo realizado entre los aos 1996 y 2000.
Actualmente, la Fundacin ARIADNE se encarga de mantener en funcionamiento el
SILO (Search & Index Learning Objects), repositorio accesible en doce lenguas que
alberga objetos de aprendizaje aportados por sus miembros y potencialmente tiles
para instituciones acadmicas y empresas. Su esquema de descripcin, de tipo
modular, y que sirvi de base a los trabajos del IEEE, como ya hemos comentado
anteriormente, se considera en su estado actual un perfil de aplicacin de LOM.






Pgina 97

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus







Pgina 98

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Elementos de su esquema:
Elemento Descripcin y uso
1 General Caractersticas generales del recurso
1.1 Title Ttulo del documento.
1.2 Language Idioma del recurso.
1.3 Date Fecha de publicacin del recurso.
1.4 Usage rights Derechos de propiedad intelectual.
1.5. Usage remarks Notas sobre las condiciones de uso.
1.6 Restrictions Restricciones de uso.






Pgina 99

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
1.7 Version information
(Based on)
Identificacin de versiones anteriores del recurso.
1.8 Authors Nombre del autor o entidad responsable del recurso.
1.9 Source Origen del recurso.
1.10 Description Descripcin general del recurso.
2 Semantics Clasificacin del recurso
2.1 Science type
Categora clasificatoria ms genrica, segn lista de
valores: Exact, Natural and Engineering Sciences y
Human and Social Sciences.
2.2 Main discipline
Especificacin de la disciplina principal de la que trata
el recurso, segn lista de valores.
2.3 Sub-discipline
Especificacin de la subdisciplina de la que trata el
recurso, segn lista de valores.
2.4 Main concept
Concepto principal sobre el que trata el recurso, a
texto libre.
2.5 Concept synonyms
Sinnimos del concepto principal sobre el que trata el
recurso, a texto libre.
2.6 Other important
concepts
Conceptos alternativos sobre los que trate el recurso, a
texto libre.
3 Pedagogical Caractersticas didcticas del recurso
3.1 User type
Tipo de usuario a que se dirige el recurso, segn lista
de valores: Learner, Teacher, Author, Manager.
Equivalente a LOM 5.5
Educational.IntendedEndUserRole
3.2 Document type
Tipo de recurso, segn lista de valores: Active y
Expositive. Equivalente a LOM 5.1
Educational.InteractivityType.






Pgina 100

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
3.3 Document format
Formato del recurso, en funcin del tipo de recurso y
segn lista de valores: para Active: Ariadne course,
Experiment, Exercise, Problem statement,
Questionnaire, Self-assessment, Simulation; para
Expositive: Diagram, Graph, Index, Table, Narrative
text, Hypertext, Slides, Figure, Photograph, Video,
Sound y Voice. Equivalente a LOM 5.2
Educational.LearningResourceType
3.4 Interactivity level
Grado de interactividad que presenta el recurso.
Equivalente a LOM 5.3 Educational.InteractivityLevel.
3.5 Semantic density
Densidad semntica. Equivalente a LOM 5.4
Educational.SemanticDensity.
3.6 Pedagogical duration
Tiempo estimado aproximado, expresado en minutos
(en LOM es en segundos), necesario para la utilizacin
del recurso. Equivalente a LOM 5.9
Educational.TypicalLearningTime.
3.7 Difficulty level
Nivel de dificultad que presenta el recurso. Equivalente
a LOM 5.8 Educational.Difficulty.
3.8 Didactical context
Contexto educativo de utiilizacin del recurso.
Equivalente a LOM 9.2.2.2 Classification.TaxonPath en
combinacin con 9.1
Classification.Purpose=educational level y 9.2.1
Classification.TaxonPath.Source=ARIADNE..
3.9 Granularity
Nivel de modularidad o detalle del recurso. Equivalente
a LOM 1.8 General.AggregationLevel.
4 Technical data Caractersticas tcnicas del recurso
4.1 Main file name Nombre del archivo principal del recurso.
4.2 Media type
Designacin del tipo de medio, siguiendo la lista de
valores del estndar MIME.
4.3 Operating system Tipo de sistema operativo mnimo requerido.






Pgina 101

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
4.4 File size Tamao del archivo, expresado en kB.
4.5 OS Version Versin del sistema operativo.
4.6 Installation notes Comentarios de instalacin.
4.7 Other constraints Requisitos tcnicos adicionales.
5 I ndexation data Datos de indizacin para el recurso
5.1 Header creation date Fecha de creacin de la autoridad.
5.2 Header author
Consignacin del autor o entidad responsable del
recurso.
5.3 Validation date
Fecha de validacin del registro, incorporacin del
recurso.
5.4 Validator Persona o entidad que valida el registro.
5.5 Identifier Identificador del recurso.
5.6 Last modified date Fecha de ltima modificacin del registro.
5.7 Language Idioma del registro.
6 Annotations Notas
6.1 Creation date Fecha de creacin de la nota.
6.2 Language Idioma de la nota.
6.3 Annotation Nota.
6.4 Annotator Persona o entidad que realiza la nota.







Pgina 102

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
8.1.5.2. EdNA Online
Es un servicio de informacin respaldado por el gobierno australiano que pone a
disposicin de toda su comunidad educativa un vasto repositorio de recursos
didcticos (alrededor de 20.000) organizado por sectores educativos. El esquema
desarrollado para la descripcin de sus contenidos, el EdNA Metadata Standard
v.1.1 (EdNA, 2002), es un perfil de aplicacin de Dublin Core que incorpora como
extensin local entre sus elementos de descripcin educativa el correspondiente a
la valoracin del recurso (EdNA.Review y EdNA.Reviewer), elemento de utilidad en
la discriminacin de contenidos por la recomendacin de anteriores usuarios del
recurso.







Pgina 103

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Elementos de su esquema:
Puesto que la descripcin y uso de los elementos tomados de Dublin Core son los
que figuran en la especificacin (y que se pueden revisar en la figura 4,
anteriormente presentada), slo nos detendremos en aquellos aspectos particulares
de EdNA.
Elemento Descripcin y uso
DC Elementos tomados de Dublin Core
DC.Identifier DC, URL.
DC.Title DC
DC.Description DC
DC.Subject
Vocabularios: APSDEP (Asian and Pacific Skills Development
Programme Thesaurus), DDC (Dewey Decimal Classification),






Pgina 104

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
edna-kla (Schools Key Learning Areas), LCC (Library of
Congress Classification), LCSH (Library of Congress Subject
Headings), MeSH (Medical Subject Headings), SCIS (Schools
Catalogue Information Service-Subject Headings), UDC
(Universal Decimal Classification).
DC.Publisher DC
DC.Creator DC
DC.Date DC
DC.Type Listas de valores DCMI y EdNA.
DC.Format DC
DC.Language DC
DC.Coverage DC
DC.Rights DC
DC.Relation DC
DC.Contributor DC
DC.Source DC
EDNA Extensiones
EDNA.Audience
Listas de valores propias: edna-audience (Administrator,
Community member, Parent/carer, Student,
Teacher/lecturer), edna-sector (Adult and Community
Education, Higher Education, Preschool, School, Vocational
education and training) y edna-userlevel (de 0 a 13, segn
los Australian Qualification Levels, AQF).
EDNA.Approver
Identifica a la persona o entidad que aprueba la
incorporacin del recurso al respositorio.






Pgina 105

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
EDNA.CategoryCode
Cdigo de control de las categoras temticas. Se utiliza en la
presentacin de la bsqueda por categoras.
EDNA.Entered
Fecha de entrada del registro en el repositorio, de asignacin
automtica.
EDNA.Indexing
Define el nivel de profundidad en la indizacin automatizada
de pginas web.
EDNA.Review Comentario de evaluacin del recurso.
EDNA.Reviewer Persona o entidad que realiza la revisin del recurso.
EDNA.Version
Versin del esquema EdNa utilizado en la descripcin del
recurso.
8.1.5.3. EduSource
Es un proyecto financiado por CANARIE (entidad sin nimo de lucro apoyada por el
gobierno canadiense), en un esfuerzo por aunar las mltiples iniciativas de
repositorios de recursos educativos que se han venido desarrollando en Canad,
entre los cuales destaca el Alexandria Digital Content Repository y su motor de
bsqueda CAREO (Campus Alberta Repository of Educational Objects) y su software
de catalogacin ALOHA (Advanced Learning Object Hub Application) desarrollados
en el marco del proyecto BELLE (Broadband Enabled Lifelong Learnig Environment).
Desde EduSource, estudiantes y profesores pueden realizar bsquedas federadas a
los distintos repositorios que recoge, algunos de ellos estadounidenses o
australianos: Eureka, RDN, EDNA, POND, ADLIB, SAVOIRNET, UQTR, INNOVA,
eRIB, CAREO, testHB, eklexis, SMETE. El esquema de metadatos que utiliza es un
perfil de aplicacin denominado CanCore, basado en el estndar IEEE LOM y la
especificacin IMS Learning Resource Metadata.






Pgina 106

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus







Pgina 107

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

CanCore v.2.0 pretende ser una simplificacin de LOM, tomando 61 de sus 77
elementos (todos ellos igualmente opcionales), as como una gua de aplicacin y
buenas prcticas para todos aquellos que deseen implementar dicho estndar. En
cuanto a los elementos educativos incluidos en el perfil, es destacable el hecho de
que CanCore no recomiende el uso de los elementos LOM 5.1.TipoDeInteractividad,
5.3.NivelDeInteractividad, 5.4.DensidadSemntica, 5.8.Dificultad y
5.10.Descripcin, bien por considerar que la informacin que ofrecen es redundante
(todos menos 5.8) o porque son de difcil interpretacin (caso de 5.4), de escasa
utilidad (caso de 5.4 y 5.8) o de coste elevado (caso de 5.10).
8.1.5.4. GEM
Es un proyecto del Departamento de Educacin estadounidense y ERIC (Education
Resources Information Center) que pretende dar acceso desde una plataforma
nica a la vasta coleccin de recursos albergados en sus distintas instituciones
educativas. Su esquema descriptivo, perfil de aplicacin de Dublin Core, tiene tres
versiones: Gateway Lite, que representa el nivel mnimo de descripcin con un
nmero de elementos obligatorios, Gateway Full, que ofrece un nivel de descripcin
intermedio con los elementos obligatorios del anterior y algunos opcionales y GEM,
que es el nivel de descripcin ms completo, siendo todos sus elementos opcionales
y repetibles.






Pgina 108

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus







Pgina 109

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Sealamos a continuacin las extensiones propuestas por GEM:
Elemento Descripcin y uso
Audience Tipo de usuarios potenciales del recurso
Age Edad de los potenciales usuarios del recurso.
Beneficiary
Tipo de usuarios potenciales del recurso, segn lista de
valores propia: Administrators, Students, Teachers,
Librarians, Vision-impaired students, etc.
EducationLevel
Nivel educativo de los usuarios potenciales del recurso,
segn lista de valores propia: Grade (Kindergarten-12) y
Educational Level (All, Unspecified, Adult/continuing
education, Community College, Higher education,
Preschool education, Vocational education).






Pgina 110

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Mediator
Persona o entidad que media en el acceso al recurso,
segn lista de valores propia: Administrators,
College/University instructors, Curriculum Supervisors,
etc.
Prerequisites
Conocimientos previos de que ha de disponer el usuario
potencial del recurso para la su correcta utilizacin.
Cataloging Datos de catalogacin
CatalogingOrganization Entidad que realiza la catalogacin.
CatalogingTool
Herramienta de catalogacin empleada: esquema
empleado.
IndividualCataloger Nombre del catalogador.
Duration Tiempo tpico de utilizacin del recurso
Essential resources
Recursos tcnicos requeridos para la utilizacin del
recurso
I nstructional method Mtodo instructivo
Assessment
Tipo de evaluacin desarrollada en el recurso, segn lista
de valores propia: Alternative assessment, Authentic
assessment, Curriculum based assessment, Informal
assessment, Observation, Peer evaluation, Portfolio
assessment, Self evaluation, Standardized testing,
Testing.
Grouping
Tipo de agrupacin de estudiantes necesario para la
utilizacin del recurso, segn lista de valores propia:
Cross age teaching, Heterogeneous grouping,
Homogeneous grouping, Individualized instruction, Large
group instruction, Non-graded instructional grouping,
Small group instruction.
Teaching methods
Descripcin del mtodo instructivo empleado en el
recurso, segn lista de valores propia: Brainstorming,
Computer simulations, Demonstrations, Discovery
learning, Experiential learning, Project-based learning,






Pgina 111

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
etc.
8.1.5.5. MERLOT
Es un repositorio desarrollado por un consorcio de cuatro instituciones
universitarias estadounidenses que recoge recursos web aportados por sus
usuarios de naturaleza y temtica diversa de utilidad para profesores y estudiantes
universitarios. Su esquema descriptivo toma como referencia el estndar LOM,
incorporando entre sus extensiones locales el elemento Average Ratings, en el que
se recoge la evaluacin de los recursos incorporados realizada por un grupo de
docentes en funcin de la calidad de su contenido, su potencial efectividad como
herramienta didctica y su facilidad de uso.







Pgina 112

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Elemento Descripcin y uso
Average Ratings
Valoracin, del 1 al 5, de tres aspectos: calidad de su
contenido, su potencial efectividad como herramienta
didctica y su facilidad de uso.
Type
Tipo de recurso, segn lista de valores: simulacin,
animacin, tutorial, ejercicios y prcticas, tests,
presentaciones y materiales de clase, estudios de
caso, colecciones y materiales de referencia.
Title or name Ttulo o nombre del recurso.
Location Ubicacin del recurso (generalmente URL).
Mirror Site Ubicacin alternativa del recurso.
Primary Subj ect Categora/s temtica/s del recurso, segn clasificacin






Pgina 113

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Category propia cuyas grandes categoras son: Arte, Negocios,
Educacin, Humanidades, Matemticas, Ciencia y
tecnologa y Ciencias sociales, teniendo adems una
categora especfica para Documentacin dentro de
Educacin.
Author Autor o entidad responsable del recurso.
Description Descripcin del recurso.
Submitted by
Responsable de la incorporacin del recurso al
repositorio.
Primary Audience
Principales usuarios a los que se dirige el recurso,
segn lista de valores: Grade School, Middle School,
High School, College, Graduate School, Professional.
Technical Format
Formato del recurso, segn lista de valores: Java
applet, Shockwave, Flash, Director file, Authorware
file, HTML/txt, Video, Audio, Image, VRML, Javascript,
ActiveX, CD-ROM, PDF, Executable program.
Language( s) Idioma del recurso, segn ISO 639-1.
Section 508 Compliant
Adecuacin del recurso a la seccin 508 de la
Rehabilitation Act del gobierno estadounidense, que
regula la accesibilidad de los recursos Web para
personas con algn tipo de discapacidad.
Cost I nvolved with Use Coste de uso.
Copyright and/ or Other
Restrictions
Restricciones de uso.
Source Code Available Disponibilidad de acceso al cdigo fuente del recurso.
8.1.5.6. The Learning Federation
Es un proyecto que forma parte de la Schools Online Curriculum Content Initiative
(SOCCI), iniciativa de los gobiernos australiano y neozelands con la que se
pretende potenciar el uso de contenidos digitales de calidad en sus escuelas
mediante su colaboracin, en un periodo de cinco aos que concluy en 2005, en la






Pgina 114

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
produccin de objetos de aprendizaje y de plataformas para la gestin e
intercambio de los mismos. Su esquema descriptivo, el Learning Federation
Metadata Application Profile (v.2.0), es un perfil de aplicacin de LOM, y uno de los
ms ricos en extensiones locales, considerando entre ellas elementos relacionados
con el contexto de aplicacin de los recursos descritos (Curriculum, Learning area,
Strand, Sector) o su posible utilidad didctica (Educational value).

Observa la utilizacin obligatoria de los siguientes elementos:
Clave: 1=Objetos de aprendizaje, 2=Recursos digitales, x=obligatorio
Elemento 1 2 Descripcin y uso
1 General Caractersticas generales del recurso
Subelementos LOM considerados obligatorios tanto para 1 como para 2: 1.1.1.1
Catalogue, 1.1.1.2 Entry, 1.1.2 Description, 1.1.3 Keyword, 1.1.7 Aggregation
Level, 1.2.1 Version, 1.2.2.1 Status, 1.2.2.2 Date, 1.2.2.2 Remark, 1.2.3.1 Role,
1.2.3.2 Entity, 1.3.2 Language.






Pgina 115

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
2 Educational Caractersticas didcticas del recurso
2.1 Subject
2.1.1 Topic x
Equivalente a Subject del Dublin Core Metadata
Element Set, describe el contenido del recurso a
partir del School Online Subject Thesaurus (ScOT)
2.1.2 Curriculum x
Extensin local (TLF), describe la parte del curriculo
en que se inscribe temticamente.
2.1.2.1 Learning area x
Extensin local (TLF), describe las reas de estudio
a las que se adscribe el contenido del recurso,
segn el vocabulario Edna KLA (Key Learning
Areas): English, Mathematics, Science, Studies of
Society and Environment, Health and Physical
Education, Arts, Languages Other Than English
(LOTE), Technology.
2.1.2.2 Strand x
Extensin local (TLF), describe las secciones de las
reas de estudio a partir de una lista de valores
propia. Para English, por ejemplo, los valores
asignados son: Listening and Speaking, Reading
and writing y Viewing.
2.1.2.3
Content/concept
x
Extensin local (TLF), describe el tipo de resultado
didctico que persigue el contenido del recurso (por
lo general, actitudinal o competencial), segn lista
de valores propia. Algunos de los valores asignados
a English, por ejemplo, son: Argumentation,
Challenging ideas, Critical literacy, Reading, etc.
2.1.2.4 Skills/process x
Extensin local (TLF), describe las habilidades y
procesos cuyo aprendizaje persigue el contenido
del recurso, segn una lista de valores tomados de
la taxonoma de Bloom: Knowledge,
Comprehension, Application, Analysis, Synthesis y
Evaluation.
2.2 Resource type
Equivalente a Type del Dublin Core Metadata
Element Set, describe la tipologa del recurso.






Pgina 116

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
2.2.1 Student activity x
Extensin local (TLF), describe el tipo de actividad
que presenta el recurso, segn lista de valores
propia: Comprehension activity, Concept map,
Experiment, Practical activity, etc.
2.2.2 Learning design x
Extensin local (TLF), describe los mtodos y
formas de presentacin de los materiales, segn
una lista de valores propia: Auditory learning,
Collaborative learning, Demonstrations,
Experiential learning, Independent learning, Inquiry
learning, Mentoring, Peer tutoring, Problem solving,
Resource based learning, Tactile/kinaesthetic
learning, Visual learning, Team teaching, Testing.
2.3 Audience
Equivalente a Audience del Dublin Core Metadata
Element Set, describe las caracteristicas del
potencial usuario del recurso.
2.3.1 Type x
Equivalente a Audience del EDNA Metadata
Standard, identifica el colectivo escolar a que se
dirige el recurso, segn su lista de valores:
Student, Teacher/lecturer, Parent/carer,
Administrator, Community member.
2.3.2 Sector x
Equivalente a Sector del EDNA Metadata Standard,
identifica el nivel educativo al que se dirige el
recuro, segn una lista de valores tomados del
vocabulario EDNA: Preschool, School, Vocational
education and training.
2.3.3 User level x
Equivalente a Userlevel del EDNA Metadata
Standard, indica el ao escolar al que se dirige el
recurso (de 0 a 13, segn los Australian
Qualification Levels, AQF).
2.5 Key learning
objective
x
Extensin local (TLF), describe los objetivos
didcticos del recurso. Se consigna a texto libre.
2.6 Educational value x
Extensin local (TLF), trata de describir la posible
utilidad didctica del recurso.
3 Technical Caractersticas tcnicas del recurso.






Pgina 117

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
3.1 Format x LOM
3.2 Size x LOM
3.3.1 Type x LOM
3.3.2 Name x LOM
3.3.3 Minimum
version
x LOM
4 Rights
Management
Restricciones de uso del recurso.
4.1 Rights x LOM
5 Accesibility Caractersticas de accesibilidad del recurso.
5.2 Access profile x x
Extensin local (TLF), describe las caractersticas
de accesibilidad del recurso, segn una lista de
valores propia: Visual independence, Colour
independence, Hearing independence, Physical
independence, Device independence, Cognitive
support.
8.2. Incorporacin de metadatos a recursos educativos:
herramientas y procedimientos
En esta seccin nos acercamos a las herramientas de edicin y creacin de
paquetes de contenidos educativos mediante el anlisis de dos de las ms
destacadas: CourseGenie y Reload. Ambas permiten generar objetos de aprendizaje
a partir de la integracin de distintos tipos de recursos as como paquetes de
contenidos SCORM convenientemente descritos.
8.2.1. CourseGenie
CourseGenie es una aplicacin comercial desarrollada por Wimba (se puede
descargar una versin de prueba desde la pgina del producto
http://www.wimba.com/products/coursegenie/) que funciona como plugin de
Microsoft Word y que permite generar objetos de aprendizaje en HMTL y paquetes
SCORM e IMS a partir de textos (que la aplicacin traduce antes a XML, como






Pgina 118

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
codificacin intermedia).
El procedimiento general y ms sencillo para editar objetos de aprendizaje y
generar paquetes de contenido con CourseGenie ser el siguiente:
1. En primer lugar, instalaremos el software siguiendo para ello las
instrucciones del fabricante.
2. Una vez instalada, arrancamos la aplicacin una vez abierto el texto a tratar
(en el ejemplo, una prctica de Anlisis de Contenido. El documento puede
contener imgenes.

3. En primer lugar, describimos el documento agregando los metadatos
pertinentes. Para ello, abrimos en el men CourseGenie la opcin
Metadata. En la ventana Course Genie Metadata que se nos ofrece,
iremos rellenando las distintas solapas con la informacin correspondiente.
Observe que los datos estn tomados del esquema general LOM que, como
ya comentamos anteriormente, es el empleado por SCORM e IMS.






Pgina 119

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

La aplicacin generar una tabla al comienzo del documento que contendr
los valores asignados a los distintos elementos:







Pgina 120

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
4. A continuacin, procedemos a segmentar el texto base, identificando cada
una de las partes que lo estructuran mediante las etiquetas facilitadas por la
herramienta a tal efecto. En primer lugar, seleccionamos el ttulo del
documento y le aplicamos el estilo cgPageTitle, disponible en la lista
desplegable.

5. Seguidamente, hacemos lo mismo para cada seccin del documento, esta
vez aplicando el estilo cgSectionTitle:






Pgina 121

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

6. Finalmente, generamos el paquete de contenido. Para ello:
a. En el men CourseGenie seleccionamos Generate Course (generar
curso).
b. Seleccionamos una ubicacin para la carpeta de contenido:






Pgina 122

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

Aparecer una ventana que nos informar sobre el progreso y resultado de
la accin.







Pgina 123

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
c. Visualizamos el contenido HTML generado:

Si queremos generar un paquete SCORM, seleccionaremos esta opcin en el men
Settings de CourseGenie (solapa Content) antes de generar el contenido
(Generate Course).







Pgina 124

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Observaremos que el paquete zip contiene el ndice o manifiesto del que ya hemos
hablado:

El contenido est en este momento preparado para ser captado por distintas
plataformas educativas, descrito y sin perder su estructura original.
8.2.2. Reload
Reload (Reusable Learning Object Authoring and Delivery) es una aplicacin
opensource para la creacin de paquetes de contenido desarrollada gracias a la
financiacin de la entidad britnica JISC (Joint Information Systems Committee,
http://www.jisc.ac.uk/). Se puede descargar gratuitamente en
http://www.reload.ac.uk/, y dispone de versiones en varios idiomas, entre ellos el
espaol.
El procedimiento general y ms sencillo para generar paquetes de contenido con
Reload ser el siguiente:
1. Una vez instalado el programa, crearemos en primer lugar una carpeta en la
ubicacin que se desee, en la que guardamos los distintos archivos que
compondrn el paquete. Por ejemplo, una carpeta denominada SCORM.
2. Creamos un nuevo paquete SCORM (Archivo > Nuevo > Paquete SCORM).






Pgina 125

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

3. Seleccionamos la carpeta creada en el punto 1. Se nos presentarn los
distintos contenidos que contiene. En este momento, la aplicacin crea el
ndice o manifiesto del paquete.







Pgina 126

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
4. A continuacin, identificamos el esquema de metadatos que utilizaremos
para describir el contenido del paquete. Para ello, pinchamos el manifiesto
con el botn derecho del ratn y seleccionamos Aadir metadatos.
Pinchamos con el botn derecho del ratn sobre metadatos y
seleccionaremos aadir esquema, seleccionando el esquema adecuado.
Describimos el contenido complentando el formulario (botn derecho sobre
Metadatos > Editar metadatos).

5. Seguidamente, disearemos una estructura para los contenidos
(Organizations). Para ello, generamos una organizacin que renombramos
como main, que ser la raiz o nivel superior de la jerarqua en la que se
organizarn los contenidos.






Pgina 127

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

6. A esta organizacin principal vamos incorporando los archivos que
conforman el objeto de aprendizaje, simplemente seleccionndolos de la
lista de recursos de la carpeta SCORM, arrastrndolos y dejndolos sobre la
organizacin main. En ocasiones, deberemos renombrar los items.






Pgina 128

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus

7. Previsualizamos el paquete de contenidos, comprobando que el proceso se
ha realizado correctamente (Ver > Previsualizar paquete de contenidos).







Pgina 129

Centro Internacional de Tecnologas Avanzadas. FGSR
www.fundaciongsr.es/cita/campus
8. Finalmente, guardamos el paquete de contenidos (Archivo > Comprimir
paquete de contenidos). El paquete est ya listo para ser incorporado a
distintas plataformas de e-learning.
8.3. Bibliografa
IEEE LTSC (2002). Estndar para metadatos de objetos educativos [en lnea]. IEEE
P1484.12.1-2002. Disponible en:
<www.cenorm.be/cenorm/businessdomains/businessdomains/isss/activity/lomspan
ish1.doc>.



Centro Internacional de Tecnologas avanzadas. FGSR
www.fundaciongsr.es/cita/campus
Mdulo 9. OAI-PMH: Protocolo para la transmisin de
contenidos en Internet


9.1. Biblioteca escolar digital
La Fundacin Germn Snchez Ruiprez, a travs del Centro Internacional de Tecnologas
Avanzadas, ha generado una nueva herramienta para la Educacin. La Biblioteca Escolar Digital
nace con el objetivo de ser la puerta de acceso a los mejores enlaces y recursos educativos a lo
que aade una seccin de actualidad con las ltimas noticias para profesionales, educadores,
alumnos y padres. Una herramienta primordial de un nuevo modelo educativo, que brinda
oportunidades equitativas de acceso a la informacin y la enseanza.
Mediante los metadatos, los Objetos de Aprendizaje de la Biblioteca Escolar Digital
(http://www.bibliotecaescolardigital.es/) a los que se encuentran asociados quedan identificados y
preparados para su recuperacin en distintos contextos (web, repositorios y bibliotecas digitales
educativas, etc.) con vistas a su posterior uso y reutilizacin en diferentes entornos educativos.
9.2. Bibliotecas digitales e interoperabilidad
El uso de recursos digitales reutilizables, as como tambin el uso de estndares para su gestin,
constituye una de los principales retos para las Bibliotecas Digitales.
Para facilitar el intercambio y acceso a los registros de los metadatos que describen a los
documentos almacenados en el servidor, la Biblioteca Escolar Digital del Centro Internacional de
Tecnologas Avanzadas, a travs de una interfaz diseada especialmente para tal efecto, pone a
disposicin de los usuarios sus metadatos aplicando el estndar de interoperabilidad Iniciativa de
Archivos Abiertos (OAI, por sus siglas en ingls).
Puedes tener acceso a todos los registros de metadatos de nuestros recursos catalogados en la
Biblioteca Escolar Digital accediendo a http://www.bibliotecaescolardigital.es/oai
Los usuarios solamente buscan en los registros de los metadatos que describen a los documentos.
Esta diferencia significa que el recurso obtenido a travs de los servicios de bsqueda de
recoleccin de metadatos es significativamente menos granular que en los servicios de texto
completo.
El OAI-PMH difiere de la bsqueda convencional en el uso de un entorno de trabajo formalizado,
enfocado a la interoperabilidad y que depende exclusivamente de los metadatos.
En la web www.oaister.org (contenedor global de repositorios OAI) la BED ya figura como asociada
o, como ellos denominan, 'Data Contributors'. Esta web a nivel mundial recopila informacin de
todas aquellas aplicaciones basadas en el estndar OAI que, de forma voluntaria, y tras pasar una
dura evaluacin tcnica y comprobacin de estndares, quieren mostrar su informacin.
Principalmente se compone de webs de Bibliotecas digitales, redes educativas y/o de recursos de
distintos pases. Se va actualizando semanalmente con las nuevas incorporaciones de los
proveedores. Con lo cual, nuestra biblioteca, que diariamente se actualiza, tambin incluir nuevas
aportaciones.
Contiene un apartado de bsqueda global 'Search', que muestra en un listado registros con las
ocurrencias encontradas, todo en formato Dublin Core indicando tambin el proveedor. Adems de
un listado total de registros que tiene cada proveedor para esa bsqueda, as como un listado de
todas las colecciones digitales ordenadas por orden alfabtico (View Data Contributors).



Centro Internacional de Tecnologas avanzadas. FGSR
www.fundaciongsr.es/cita/campus



9.3. Un poco de historia, de la Convencin de Santa Fe a la OAI
Algunas disciplinas comenzaron, a principios de la dcada de los 90, a crear archivos o repositorios
de documentos electrnicos (eprints) para conseguir una rpida comunicacin de sus
publicaciones. De esta forma los resultados de investigaciones en estas reas eran conocidos ms
rpidamente que hasta entonces.
Sin duda el ms conocido de estos archivos es arXiv.org, creado por Paul Ginsparg en Los lamos
(USA) para el rea de la Fsica. Entre otros tambin podemos mencionar CogPrints en el rea de la
Psicologa, NCSTRL en el campo de la Informtica o REPEC en el campo de la Economa.
En Octubre de 1999 se organiz una reunin, en Santa Fe (Nuevo Mxico, USA), con la idea de
que la interoperabilidad de estos archivos de eprints era clave para aumentar su impacto entre la
comunidad acadmica. Con ella se podran federar varios archivos, intercambiar registros o
realizar bsquedas en disciplinas relacionadas al mismo tiempo.
Los participantes establecieron que era imprescindible alcanzar una amplia adopcin entre la
comunidad de proveedores de eprints. La solucin adoptada fue la recoleccin de metadatos
(metadata harvesting). Esta solucin permite a los proveedores de eprints exponer sus metadatos
a travs de una interfaz, con el objeto de que la misma pueda ser utilizada como la base para el
desarrollo de servicios de valor aadido.
El resultado de la reunin fue un conjunto de acuerdos tcnicos y organizativos conocidos como la
Convencin de Santa Fe.
Tras hacer pblicos los resultados de la reunin, en Febrero de 2000, qued claro que haba un
inters en esta iniciativa ms all de las comunidades de eprints. En principio bibliotecarios y
muselogos se mostraron interesados en descubrir formas de hacer visibles a los motores de
bsqueda en internet partes de las colecciones de bibliotecas y museos. Estas necesidades se
expresaron en una serie de reuniones celebradas en el contexto de las principales jornadas sobre
bibliotecas digitales celebradas tanto en USA como en Europa. Respondiendo a este amplio inters
se procedi a la reconsideracin de las decisiones tomadas en Santa Fe. As se decidi ampliar el
objeto de trabajo ms all de los eprints para incluir disciplinas que no tuvieran este tipo de
documentacin.
As, en Agosto de 2000, la Digital Library Federation y la Coalition of Networked Information de los
USA anunciaron que ofreceran el soporte de su organizacin a la iniciativa. A partir de este
momento comenzaron a funcionar dos comits: uno de gestin y otro tcnico, que se encargarn
de la coordinacin de la iniciativa.
Las especificaciones revisadas fueron hechas pblicas en Enero de 2001 con la publicacin del
Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) versin 1.0. La intencin
era que este protocolo, con mnimas modificaciones, permaneciera estable al menos durante un
ao, mientras las distintas comunidades lo probaban y experimentaban con l.
Desde ese momento la implementacin del protocolo comenz, y aparecieron las primeras
instituciones que lo utilizaron para poner en Internet sus metadatos. En su implementacin, el
OAI-PMH es una tecnologa que sigue lo que Sapiro y Varian (Sapiro, 1999) denominan efectos de
red, la adopcin inicial es lenta y progresiva pero la respuesta positiva a la misma aumenta de
forma dramtica la tasa de adopcin. Esto se ha cumplido en los dos aos que lleva funcionado el
protocolo. Ya son ms de 100 las instituciones que han creado archivos abiertos, el nmero de
servicios basados en la utilizacin de la informacin almacenada en los anteriores no ha parado de
crecer tanto en nmero como en calidad de los valores aadidos que ofrecen. En estos momentos
hay registrados en el servidor de OAI unos 12 servicios. Igualmente han aparecido toda una serie



Centro Internacional de Tecnologas avanzadas. FGSR
www.fundaciongsr.es/cita/campus
de herramientas de software destinadas a facilitar la creacin y mantenimiento de archivos. Han
sido muchos los proyectos de investigacin que se han concedido durante el pasado ao para
estudiar la aplicacin del protocolo y temas relacionados. As en USA est por ejemplo la Metadata
Harvesting Initiative de la Fundacin Mellon en el seno de la que se han financiado cuatro
proyectos por valor de 1.5 millones de $ con objeto de crear servicios basados en OAI-PMH. La
National Science Digital Library, un proyecto de la National Science Foudation tiene como objeto la
creacin de lo que ser la mayor biblioteca digital hasta el momento. Ha adoptado el protocolo
como base para la comunicacin de metadatos entre los participantes. En Europa se han
financiado proyectos por parte de la UE como por ejemplo el Open Archives Forum cuyo objeto es
la creacin de una comunidad de inters en OAI en Europa por medio de la organizacin de
jornadas y actividades de soporte a la implementacin de archivos y servicios.
9.4. El protocolo OAI-PMH (Open Archives Iniciative Protocol for Metadata
Harvesting)
Facilita la publicidad de recursos digitales etiquetados que se encuentran disponibles en
repositorios digitales. Un requisito para poder recolectar los metadatos, es que estn descritos
usando al menos Dublin Core. Permite que los recursos de un repositorio dado (repositorio
harvesteado) puedan formar parte de los resultados de bsquedas realizadas desde otros
repositorios (repositorios que hacen harvesting), o desde buscadores como Google. En este
sentido el sistema devuelve una lista de metadatos en formato Dublin Core, tras haber realizado la
transformacin desde LOM-ES. El protocolo soporta los formatos Dublin Core (DC) y Learning
Object Metatada (LOM).
9.4.1. Especificacin del OAI-PMH
El protocolo se compone de seis tipos de peticiones o verbos. Estas peticiones se realizan
utilizando los mtodos GET o POST del protocolo HTTP y constan de una lista de opciones con la
forma de pares del tipo: clave: valor. Mediante estas peticiones el proveedor de servicios pide al
proveedor de datos sus metadatos. Se puede realizar esta recoleccin de metadatos de forma
selectiva, en base a rangos de fechas (para recolectar solamente los registros modificados en un
rango de fechas) y en base a sets (los metadatos pueden estar clasificados en grupos). Como
respuesta, el proveedor de datos devuelve un conjunto de registros en formato XML.
Los seis tipos de peticiones que un proveedor de servicios puede realizar a un proveedor de datos
son las siguientes:
Idenfity: Se utiliza para obtener informacin sobre el repositorio: nombre, versin del
protocolo que utiliza, contacto con el administrador, No tiene ningn argumento
adicional.
ListMetadataFormats: Devuelve la lista de formatos de metadatos que utiliza el
servidor.
ListSets: Devuelve la estructura de un repositorio, es decir, los grupos en que se
subdivide.
ListIdentifiers: Recupera slamente los encabezados de los registros. Es obligatorio
aadir el argumento metadataPrefix para indicar en qu formato queremos que nos
devuelva los encabezados. Permite, opcionalmente, los argumentos from y until para
indicar un rango de fechas (no hay por qu usar los dos a la vez) y el argumento set para
indicar los registros de qu conjunto queremos obtener.
ListRecords Recupera registros de un repositorio: Los parmetros posibles son los
mismos que para el verbo ListIdentifiers.
GetRecord: Devuelve un registro de un repositorio. Tiene dos parmetros que son
obligatorios: metadataPrefix e identifier (el identificador nico del registro a recuperar).





Centro Internacional de Tecnologas avanzadas. FGSR
www.fundaciongsr.es/cita/campus

9.4.2. Peticiones OAI
A continuacin vamos a detenernos en una descripcin ms tcnica del protocolo.
URL base. El host y puerto del servidor que acta como repositorio de datos. En el caso de
la Biblioteca Escolar Digital es http://www.bibliotecaescolardigital.es/oaiBidig2/oai2.php.
Argumentos. Son una lista de pares clave-valor. Como mnimo, cada peticin OAI tiene un
par clave-valor que especifica el tipo de peticin que se quiere realizar.
Un ejemplo realizando una peticin de tipo GetRecord para recuperar el registro en LOM cuyo
identificador es BED43_58 sera:
http://www.bibliotecaescolardigital.es/oaiBidig2/oai2.php?verb=GetRecord&identifier=oai:www.bi
bliotecaescolardigital.es:BED43_58&metadataPrefix=lom
Si queremos recuperar un registro concreto en formato DC, en el parmetro metadataPrefix
deberamos especificar el valor oai_dc.
Puedes tener acceso a todos los registros de metadatos de nuestros recursos catalogados en la
Biblioteca Escolar Digital accediendo a http://www.bibliotecaescolardigital.es/oai
9.5. Recolectores y directores de recursos digitales
Los recolectores y directores de recursos digitales ms destacados:
HISPANA
OAISTER
9.5.1.HISPANA
El Ministerio de Cultura pone a disposicin de los usuarios este recurso avanzado de
acceso a la informacin digital producida por todo tipo de instituciones espaolas que se
constituye en la red mediante la interconexin de sus bases de datos. Por un lado,
proporciona informacin bsica sobre los proyectos e iniciativas de digitalizacin
existentes en Espaa y por otro, los recursos digitales, reunidos a partir de esas bases de
datos, a los que se puede acceder de forma conjunta, utilizando tcnicas de recoleccin de
metadatos.
Puedes acceder al directorio en la direccin http://roai.mcu.es/es/inicio/inicio.cmd
Nos ofrece dos opciones de bsqueda, una sencilla basada en Ttulo, Autor, Tema,
Descripcin y Ao de Publicacin, as como en la seleccin del proyecto de digitalizacin;
la bsqueda Avanzada busca uno o varios trminos en uno o varios campos enlazados por
diferentes operadores.
Adems, nos facilita un enlace a todo el listado de las diferentes Coleccin Digitales de las
diferentes instituciones; por ejemplo, podemos encontrar informacin y acceso a la
Biblioteca Escolar Digital del Centro Internacional de Tecnologas Avanzadas de la
Fundacin Germn Snchez Ruiprez.
http://roai.mcu.es/es/comunidades/registros.cmd?posicion=101&forma=





Centro Internacional de Tecnologas avanzadas. FGSR
www.fundaciongsr.es/cita/campus

9.5.2. OAIster
Producido y mantenido por la Biblioteca de la Universidad de Michigan, OAIster es definido
como un catlogo colectivo de recursos web que da acceso a ms de 13.600.000 registros
que definen homogneamente otros tantos documentos digitales pertenecientes a las
colecciones de 890 instituciones de todo el mundo.
Entre las instituciones espaolas que contribuyen total o parcialmente con sus repositorios
de documentos digitales estn los de la Universidad Politcnica de Catalua, TDX (Tesis
Doctorales en Red), RECERCAT , Archivo Digital de la UPM ,
EPrints Complutense , la recientemente creada Biblioteca Virtual del Patrimonio
Bibliogrfico , Dialnet OAI Artculos y Tesis, etc.
Como ejemplos de grandes repositorios extranjeros: California Digital Library , CERN
Document Server , SciELO , Directory of Open Access Journals (DOAJ) y DSpace del MIT
(Massachusetts Institute of Technology).
La bsqueda en OAIster puede realizarse por Autor, Ttulo, Tema, Palabra clave e Idioma
y, si se desea, limitar los resultados a documentos textuales, imgenes, audio y vdeo;
pueden ordenarse por relevancia, fecha, etc. Los resultados se presentan de forma
uniforme , con datos que describen el documento original: autor, ttulo, fuente, resumen
del documento y enlace al texto completo del mismo dentro del repositorio donde se
localiza; aparecen distribuidos tambin claramente por repositorios.
El catlogo se actualiza semanalmente.
Como ya se apunt en el bloque 9.2, en su apartado View Data Contributors podis ver la
informacin que actualmente muestran sobre nuestra biblioteca:
Biblioteca Escolar Digital (BED) (1826 records)
http://www.bibliotecaescolardigital.es/
Biblioteca Escolar Digital (BED) of the Fundacin Germn Snchez Ruprez (Spain) shows
a pedagogical model of knowledge representation that allows the teacher to design
program sequences correspondent to the curriculum through different learning objects.
Then, as the result of the integration of a thesaurus and concept maps, the learning
objects can be used in different contexts. This repository should be helpful for the entire
community of educators.
9.6. Bibliografa
Canabal M, Sarasa A, Agrega- Plataforma de Objetos Digitales Educativos, Spedece 2007,
Bilbao. Available: http://ftp.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-318/
Barrueco, Jos Manuel. OAI-PMH: Protocolo para la transmisin de contenidos en Internet.
Barcelona, 2002. 25 p.
DELi. OAC: OAI-PMH. Estado del arte.
http://www.deli.deusto.es/Resources/Documents/OAI-PMH_estado_del_arte.pdf
Martnez Usero, Jos ngel; Lara Navarra, Pablo (2007). La interoperabilidad de los
contenidos en las plataformas de e-learning: normalizacin, bibliotecas digitales y gestin
del conocimiento. RUSC, Revista Universidad y Sociedad del Conocimiento, vol. 4, n 1,
enero de 2007. http://www.uoc.edu/rusc/3/2/dt/esp/martinez_lara.html
Van de Sompel, Herbert; Lagoze, Carl (ed.) The Open Archives Initiative Protocol for
Metadata Harvesting. http://www.openarchives.org/OAI/2.0/openarchivesprotocol.htm
Van de Sompel, Herbert ; Lagoze, Carl. Notes from the Interoperability Front: A Progress
Report on the Open Archives Initiative. En: ECDL, 2002.
http://www.openarchives.org/documents/ecdl-oai.pdf

También podría gustarte