Está en la página 1de 42

Los metadatos

GESTIÓN DE BIBLIOTECAS Y DOCUMENTOS DIGITALES,


MODULO 3
UNLA, 2008
Prof. Ana Sanllorenti
Objetos digitales

¿Qué constituye un objeto digital?

CONTENIDO
+
METADATOS
Registro y procesamiento de los
objetos digitales

• Identificación

• Descripción

• Almacenamiento

• Distribución
Metadatos
 Meta:
prefijo de origen griego: “junto a”, después de”,
“entre”, “con”
 Matadatos:
Datos /junto a, después de /entre/con/datos

datos sobre datos


informaciones sobre
informaciones

 Para la identificación y descripción de objetos


Metadatos
 Atributos de descripción de los objetos digitales

 Permiten saber qué es un objeto digital sin


necesidad de accederlo (abrirlo, leerlo,
ejecutarlo, visualizarlo, etc.)

 Representan al objeto digital

 Siempre se encuentran en entorno digital


Metadatos

¿Datos bibliográficos?

¿Metadatos?
Metadatos: Funciones

 Identificar y describir

 Recuperar y manipular
Metadatos: ¿dónde están?

 En los mismos objetos, por


ejemplo en los
encabezamientos

 En archivos separados, por


ejemplo en bases de datos
Registro y procesamiento de los objetos digitales

Descripción: Los metadatos


Descriptivos:
(“Bibliográficos”, temáticos, de
evaluación)
Administrativos:
(fuente original, fecha de creación y
versión, condiciones de uso, formato de
archivo, transacciones, relaciones
con otros objetos)
Estructurales:
(para identificar y recuperar secciones de
un objeto)
Los lenguajes de marcado

Textos digitales

 Estructura
 Forma de presentación

 Formatos propietarios
 Impiden la visualización y acceso desde otras
aplicaciones

 Codificación abierta independiente de las


aplicaciones

 LENGUAJES DE MARCADO
Los lenguajes de marcado

“ESTIMADO JUAN:
Te escribo esta carta de forma muy urgente
ya que no me has enviado…”

Ponga estilo de carta. ponga comillas, ponga mayúsculas,


Estimado Juan, ponga dos puntos, aparte, sangría, ponga
primera letra mayúscula, te escribo esta carta, ponga
negrillas, de forma muy urgente, cierre negrilla, ya que
no me has enviado...

http://es.wikipedia.org/wiki/Lenguaje de marcado
<p><b>Viedma</b> es una ciudad <a href="/wiki/Argentina" title="Argentina">argentina</a>,
capital de la <a href="/wiki/Provincia_de_R%C3%ADo_Negro" title="Provincia de Río
Negro">provincia de Río Negro</a> y cabecera del <a href="/wiki/Departamento_Adolfo_Alsina"
title="Departamento Adolfo Alsina">departamento Adolfo Alsina</a>. Se encuentra ubicada al
este de la provincia, en la margen derecha del <a
href="/wiki/R%C3%ADo_Negro_%28Argentina%29" title="Río Negro (Argentina)">río
Negro</a>, frente a la ciudad <a href="/wiki/Provincia_de_Buenos_Aires" title="Provincia de
Buenos Aires">bonaerense</a> de <a href="/wiki/Carmen_de_Patagones" title="Carmen de
Patagones">Carmen de Patagones</a> con la cual está conurbada, y dentro de la zona productiva
conocida como <a
href="/w/index.php?title=Valle_Inferior_del_R%C3%ADo_Negro&amp;action=edit" class="new"
title="Valle Inferior del Río Negro">Valle Inferior del Río Negro</a>.</p>
<p>El presidente <a href="/wiki/Ra%C3%BAl_Alfons%C3%ADn" title="Raúl Alfonsín">Raúl
Alfonsín</a> propuso el traslado a la <a href="/wiki/Conurbaci%C3%B3n"
title="Conurbación">conurbación</a> <a href="/wiki/Viedma_-_Carmen_de_Patagones"
title="Viedma - Carmen de Patagones">Viedma - Carmen de Patagones</a>, de la <a
href="/wiki/Capital_Federal" title="Capital Federal">Capital Federal</a> del país, pero no llegó a
concretar su proyecto al finalizar su mandato.</p>
<meta http-equiv="Content-Type" content="text/html;
charset=utf-8" />
<meta name="keywords"
content="Viedma,1779,1878,1882,1987,1991,2001,22 de
abril,27 de mayo,Aglomerado urbano,Altitud" />
<link rel="shortcut icon" href="/favicon.ico" />
<link rel="search"
type="application/opensearchdescription+xml"
href="/w/opensearch_desc.php" title="Wikipedia
(Español)" />
<link rel="copyright"
href="http://www.gnu.org/copyleft/fdl.html" />
<title>Viedma - Wikipedia, la enciclopedia libre</title>
Los lenguajes de marcado

■ Formas de codificar documentos para indicar,


junto con el texto / contenido, información
adicional acerca de la estructura o su
presentación

■ Emplea etiquetas (metaetiquetas) no visibles


pero reconocidas por distintas aplicaciones de
software
Los lenguajes de marcado

Origen: la edición
digital

 SGML 1986
 HTML 1990, Web, Tim Berners Lee
 XML 1998, W3C
Los lenguajes de marcado: XML

Estándar para el intercambio de información


estructurada entre diferentes plataformas
(Internet, bases de datos, editores de texto,
hojas de cálculo, etc.)

 Texto plano, basado en ASCII


 Abierto, no sujeto a patentes
 Extensible
 Portable, legible por cualquier plataforma
 Traducible fácilmente a otras estructuras
Los lenguajes de marcado: XML
 Utiliza marcas encerradas entre < >

 A cada marca de inicio de un contenido, le corresponde una


marca de fin: <autor> Roberto Fontanarrosa </autor>

 Estructura jerárquica con un único elemento raíz del que todos


los demás son parte

 Los diferentes elementos deben estar correctamente anidados

 Puede asociarse con recursos que definen las estructuras de los


documentos (DTD y XML Schemas) y con hojas de estilo
Los lenguajes de marcado:
Un ejemplo en XML

<?xml version="1.0" encoding="ISO-8859-1" ?>


<Mensaje>
<Remitente>
<Nombre> Ana Sanllorenti </Nombre>
<Mail> ana@bl.fcen.uba.ar </Mail>
</Remitente>
<Destinatario>
<Nombre>Graciela López</Nombre>
<Mail> graci@gmail.com </Mail>
</Destinatario>
<Texto>
<Parrafo>
Envío los materiales para el curso sobre bibliotecas digitales.
</Parrafo>
<Parrafo>
Cordiales saludos
</Parrafo>
<Parrafo>
Cordiales saludos
</Parrafo>
</Texto>
</Mensaje>
Metadatos: Algo de historia

 Páginas Web del mundo académico en cuyos


encabezamientos se indicaban datos descriptivos:
autor, fecha, palabras clave
 Muchos de esos datos eran comunes
 No estaba normalizada la forma de expresarlos
 En 1995, Grupo de trabajo liderado por la OCLC, en
Dublin, Ohio (USA), establece un conjunto mínimo
de elementos para describir los objetos digitales ->
DUBLIN CORE
 2003: ISO 15836
 Mantenido por la Dublin Core Metadata Initiative
Metadatos: Tendencias

 Formato simple, sin normalizar, a partir de


la indexación del texto completo. Ejemplo:
buscadores
 Formato estructurado, normalización
sencilla. Ejemplo: Dublin Core
 Formato complejos, normalización con
sistemas de etiquetas muy elaboradas:
MARC, EAD
Metadatos: Dublin Core

Dublin Core Metadata Initiative


(Iniciativa de Metadatos Nucleares de
Dublin)

Dublin Core Metadata Element Set


(Conjunto de Elementos Metadatos
Nucleares de Dublin)

http://dublincore.org/
Metadatos: Dublin Core

Su amplia difusión se debe a:

 Simplicidad: solamente 15 elementos


 Puede ser ampliado a través de calificadores y
esquemas
 Otros esquemas lo contienen y amplían, lo que
permite tener un núcleo común para el intercambio
y mantener elementos específicos
 Cada elemento es opcional, repetible y modificable
por los calificadores
Metadatos: Dublin Core

Los 15 elementos se agrupan en:

Contenido: características intelectuales del


OD
Propiedad intelectual: características de
autoría y posesión de derechos de autor
Instanciación: características de realización
u ocurrencia física
Metadatos: Dublin Core,
Elementos de contenido

Título Texto libre tal como lo indicó el autor o


editor
Materia Palabras clave o frases. Puede utilizarse un
vocabulario controlado
Descripci Texto que representa el contenido del
recurso. Resumen
ón Referencia a otro recurso del que deriva el
Fuente
que está siendo descrito
Lengua Se recomienda la Tabla ISO 639

Relación Relación con otro recurso. Imágenes con


texto, traducciones, versiones diferentes,
etc.
Características espacio temporales del
Cobertura
recurso
Metadatos: Dublin Core,
Elementos de propiedad
intelectual

Autor Persona u organización responsable del


contenido
Editor Persona u organización responsable de
hacer disponible el recurso
Colaborad Persona u organización que ha hecho
contribuciones significativas pero
or secundarias al contenido. Compilador,
traductor, ilustrador, etc.
Derechos Persona u organización responsable de
los derechos autorales y de propiedad
de autor intelectual del recurso. Suministra
información sobre la forma legal de
acceder el recurso
Metadatos: Dublin Core,
Elementos de instanciación

Fecha Fecha asociada a los contenidos:


creación, publicación. Se recomienda ISO
8601
Categoría del contenido en cuanto a su
Tipo de
naturaleza intelectual: monografía, tesis,
recurso artículo, informe, etc.
Formato Categoría del contenido en cuanto a su
naturaleza física digital para el
reconocimiento del software o hardware
requerido para acceder. Se recomienda
Mime Type: texto, imagen, sonido,
multimedia, etc.
Cadena de símbolos para identificar
Identificado
unívocamente el recurso: URL, DOI,
r ISBN, etc.
Metadatos: Dublin Core,
Calificadores

Permiten aumentar la cantidad de información y facilitan la


interoperabilidad entre bibliotecas digitales, publicados
en 2000
Son opcionales

 Refinamiento de elementos: dan


información más precisa sobre cada elemento

 Esquemas de codificación: indican


esquemas externos para ser utilizados con
fines de normalización
Metadatos: Dublin Core,
Calificadores
Elemento Refinamiento Esquema de
codificación

Título Título alternativo No se aplica

Autor No se aplica No se aplica

Materia No se aplica LCSH, LCC, CDD,


CDU, MESH
Descripción Tabla de No se aplica
contenido;
Resumen
Metadatos: Dublin Core,
Calificadores

Elemento Refinamien Esquema de


codificación
to
creación, validez, period. Especificación de
Fecha los límites de un intervalo
disponibilidad, de tiempo. http://
publicación, dublincore.org/documents/
dcmi-period/.
modificación, W3CDTF. Reglas de
aceptación del codificación de la w3c
recurso, para fechas y horas,
basado en ISO 8601. http
declaración de ://www.w3.org/TR/NOTE-
copyright, datetime.
solicitud de
revisión
Tipo de recurso No se aplica DCMI Type Vocabulary
http://dublincore.org/document
s/dcmi-type-vocabulary
Metadatos: Dublin Core,
Calificadores

Elemento Refinamien Esquema


to
Tamaño / IMT . Internet Media Type.
Formato www.isi.edu/in-notes/iana/
extensión assignments/media-types
/media-types.
Soporte MIME . http://dublincore.org/
usage/terms/references/#MIME
.
URI . Uniform Resource
Identificador No se aplica Identifier. www.ietf.org/rfc
/rfc2396.txt.

URI . Uniform Resource


Fuente No se aplica Identifier. www.ietf.org/rfc
/rfc2396.txt.
Metadatos: Dublin Core,
Calificadores

Elemento Refinamient Esquema


o
ISO639-2 . Códigos de
Lengua No se aplica representación de nombres de
idiomas. www.lcweb.loc.gov/
standards/iso639-2/langhome.html
.
RFC1766 . Internet RFC 1766
“etiquetas para la identificación de
idiomas”, especifica un código de
2 letras tomado del iso 639,
seguido opcionalmente de 2 letras
del país tomadas del código iso
3166. www.ietf.org/rfc/rfcl766.txt.
RFC3066 . Internet RFC 3066
“etiquetas para la identificación de
idiomas”. Especifica código de dos
letras para la parte 1 o un código
tres letras para la parte 2,
tomados del ISO 639. Este RFC
reemplaza al RFC1766.
Metadatos: Dublin Core,
Calificadores

Elemento Refinamiento Esquema

Es versión de / Tiene URI . Uniform Resource


Relación versión
Identifier.
www.ietf.org/rfc/rfc2396.txt.
Es reemplazado por /
Reemplaza a
Es requerido por /
Requiere a
Es parte de / Tiene parte
Está referenciado por /
Referencia a
Es formato (diferente)
del mismo contenido /
Tiene otro formato
Metadatos: Dublin Core,
Calificadores
Elemento Refinamiento Esquema
•Point . Identifica un punto en el
Cobertura Espacial espacio utilizando sus coordenadas
geográficas. c.
•ISO3166 . Código para representar
los nombres de países. http://
www.din.de/gremien/nas/nabd
/iso3166ma/codlstp1/index.html
•Box . Identifica una región del
espacio utilizando sus limites
geográficos.
http://dublincore.org./documents/dcmi-box
.
•TGN . The Getty Thesaurus of
Geographic Names. http://
www.getty.edu/research/tools/
vocabulary/tgn/index.html

period. Especificación de los límites


Temporal de un intervalo de tiempo. http://
dublincore.org/documents/dcmi-
period/.
W3CDTF. Reglas de codificación de
la w3c para fechas y horas, basado
en ISO 8601. http://www.w3.org
/TR/NOTE-datetime
Metadatos: Dublin Core,
Calificadores
Elemento Refinamiento Esquema
Derechos de No se aplica No se aplica
autor
Metadatos: Dublin Core en HTML

<META NAME=“DC.Title” CONTENT=“La Biblioteca Digital”/>


<META NAME=“DC.Creator” CONTENT="García Camarero, Ernesto; García Melero, Luis
Angel”/>
<META NAME=“DC.Subject” CONTENT=“bibliotecas digitales”/>
<META NAME=“DC.Description” CONTENT=“Evolución en las técnicas para registrar,
difundir y guardar el conocimiento hasta la era digital. Las redes informáticas. La
edición electrónica. La propiedad intelectual. Metadatos. El sistema bibliotecario
digital. Repositorios de publicaciones digitales”/>
<META NAME=“DC.Publisher” CONTENT=“Arco/Libros”/>
<META NAME=“DC.Date” CONTENT=“2001”/>
<META NAME=“DC.Identifier” CONTENT=" ISBN 84-7635-486-X”/>
<META NAME=“DC.Language” CONTENT=“es”/>
<META NAME=“DC. Type” CONTENT=“libro”/>
<META NAME=“DC.Rights” CONTENT= =“Arco/Libros”/>

García Camarero, Ernesto; García Melero, Luis Angel (2001). La biblioteca Digital.- Madrid : Arco/Libros.
381 p
DC sin calificadores DC con calificadores
<META NAME= DC.Creator CONTENT= “Rebeca <META NAME= DC.Creator CONTENT= “Rebeca
Bradshaw/> Bradshaw/>
<META NAME= DC.Creator.Email CONTENT=
“rebeca@adam.ac.uk/>
<META NAME=DC.Title CONTENT= “ADAM: Art, <META NAME=DC.Title LANG= “en”
Design, Architecture and Media Information CONTENT= “ADAM: Art, Design, Architecture
Gateway”/> and Media Information Gateway”/>
<META NAME=DC.Publisher CONTENT= <META NAME=DC.Publisher LANG= “en”
“University of Northumbria at Newcastle on CONTENT= “University of Northumbria at
behalf of the ADAM Cosnortium”/> Newcastle on behalf of the ADAM
Cosnortium”/>
<META NAME=DC.Subject CONTENT= “ADAM, <META NAME=DC.Subject LANG= “en”
art, architecture, media, eLib, JISC”/> CONTENT=” ADAM, art, architecture, media,
eLib, JISC”/>
<META NAME=DC.Description CONTENT= META NAME=DC. Description LANG= “en”
“ADAM: an information gateway to quality CONTENT= “ADAM: an information gateway to
assured resources on the Internet in art, quality assured resources on the Internet in art,
design, architecture and media. An Access to design, architecture and media. An Access to
Network Resources project funded as part of Network Resources project funded as part of
JISC´s Electronic Libraries Programme”/> JISC´s Electronic Libraries Programme” />
<META NAME=DC.Date CONTENT= “1997-05- <META NAME=DC.Date.LastModified
22”/> SCHEME=”ISO 31-1” CONTENT= “1997-05-
22”/>
<META NAME=DC.Identifier <META NAME=DC.Identifier
CONTENT=http://adam.ac.uk//> CONTENT=http://adam.ac.uk//>
<META NAME=DC.Language CONTENT=”en”/> <META NAME=DC.Language SCHEME=”iso
639” CONTENT=”en”/>
<META NAME=DC.Format CONTENT= <META NAME=DC.Format SCHEME= “IMT”
“text/html”/> CONTENT=”text/html”/>
<META NAME=DC.Rights CONTENT= <META NAME=DC.Rights CONTENT=
“http://adam.ac.uk/adam/rights.html”/> “http://adam.ac.uk/adam/rights.html/”>

Fuente: Méndez, Eva. Metadatos y recuperación de información: estándares, problemas y


aplicabilidad en bibliotecas digitales.- Madrid : Ediciones Trea, 2002.
Metadatos: Otros esquemas
 MODS (Metadata Objetc Desription Standard)
Esquema de descripción en XML, desarrollado por la Library of
Congress. Basado en MARC 21, aunque no es totalmente
compatible. Orientado a descripciones bibliográficas de
bibliotecas, más que DC.

Para aplicaciones específicas:

 LOM; Learning Object Metadata


 ETDs, Electronic Theses and Dissertations
 EAD, Encoded Archival Description
 CSDGM, Content Standard for Digital Geospatial Metadata
 TEI; Text Encoding Initiative (modelo, basado en SGML,
orientado a la expresión digital de trabajos académicos con
fines de intercambio y reutilización)
RDF: Modelo para crear
esquemas de metadatos

Resource Description Framewok - W3C

➧ Modelo de datos: Recurso, tipo de propiedad, valor

➧ Sintaxis: XML

➧ Esquema

Proyección para la Web semántica


RDF: Ejemplo
RDF: Ejemplo
Harvesting: “Colecta de
metadatos”

OAI-PMH: Open Archive Iniciative Protocol


of Metadata Harvesting

Bibliotecas, editoriales digitales, repositorios, periódicos


digitales, museos -> compartir metadatos.

Hace posible colectar de forma automática los


metadatos de documentos, que luego pueden ser
reutilizados. Se basa en Dublin Core

Expresado en XML sobre HTTP