Documentos de Académico
Documentos de Profesional
Documentos de Cultura
JCYLRecomendaciones Digitalizacion Archivos2011 PDF
JCYLRecomendaciones Digitalizacion Archivos2011 PDF
pa ra l a
digitalizacin de
documentos en los
A rc hi v os
2011
Versin: 4
Fecha: octubre 2010
Fecha: noviembre
2010
Localizacin
Archivo General de Castilla y Len
Archivo General de Castilla y Len
Archivo Histrico Provincial de Palencia
Archivo Histrico Provincial de Palencia
Archivo Histrico Provincial de Soria
Archivo Histrico Provincial de Soria
Archivo Histrico Provincial de vila
Archivo Histrico Provincial de Salamanca
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
Versin: 4
Fecha: octubre 2010
Versin: 4
Fecha: octubre 2010
Consideracin de la descripcin
Preparacin de los originales
Condiciones de visualizacin y calibracin del monitor
Obtencin de las imgenes
Control de la calidad de la imagen
Tratamiento de las imgenes
Creacin de los ficheros de consulta y ficheros de divulgacin
Marca de agua
b) Optimizacin de ficheros grficos y restauracin digital
5. EL MARCO LEGAL: DERECHOS DE AUTOR
a) La aplicacin de los derechos de autor sobre obras digitales
b) Licencias para contenidos libres
c) Gestin de obras ajenas
GLOSARIO
ANEXO I
ANEXO II
BIBLIOGRAFA
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
Versin: 4
Fecha: octubre 2010
INTRODUCCIN
A modo de introduccin y antes de entrar en materia sera conveniente justificar la
necesidad de la digitalizacin en los archivos. Aunque ms adelante se especificarn
las distintas finalidades de la digitalizacin, resulta evidente que la primera de ellas
responde a la necesidad de realizar copias de los fondos que se conservan en un
archivo. Las fotocopias en papel y en microfilm han dado paso al formato digital que, si
bien an tiene como asignatura pendiente demostrar su perdurabilidad en el tiempo (a
largo plazo), por el contrario presenta ventajas lo suficientemente significativas como
para que tanto las administraciones como el sector privado hayan depositado en el
entorno digital todas sus expectativas. Como primera de las ventajas de este formato
se puede sealar una mayor rapidez en la recuperacin de la copia digital deseada,
recuperacin que depender en todo momento de los metadatos que se asocien a
dicha imagen. Existen, adems, sistemas de Reconocimiento ptico de Caracteres
(OCR) mediante los que se pueden extraer caracteres de la imagen digital y, sobre
ellos, realizar bsquedas a texto completo. No obstante estos sistemas no son vlidos
para gran parte de la documentacin histrica, que se conserva en otros tipos de
escritura anteriores a la humanstica actual.
Por otro lado, la importancia que el entorno digital ha adquirido en los ltimos aos,
impulsado por la legislacin desarrollada en torno a l (Ley 11/2007, de 22 de junio, de
acceso electrnico de los ciudadanos a los Servicios Pblicos; Ley 2/2010, de 11 de
marzo, de Derechos de los Ciudadanos en sus relaciones con la Administracin de la
Comunidad de Castilla y Len y de Gestin Pblica), proporciona a los documentos
digitales unas garantas bsicas de supervivencia, mantenimiento tecnolgico e
innovacin.
Otra de las ventajas que ofrecen estos formatos es la posibilidad de que la copia digital
sea firmada electrnicamente, originndose as la autenticacin de dicha copia y
siendo susceptible, en tal caso, de entrar a formar parte de la produccin documental
derivada de la administracin electrnica.
Finalmente, la necesaria migracin a otros soportes o cambios de formato es mucho
ms sencilla y rpida cuando nos movemos en el entorno digital que con el antiguo
microfilm.
En definitiva, el salto al futuro y la incorporacin de las Tecnologas de la Informacin y
la Comunicacin en los archivos del Sistema puede aportar mejoras importantes para
ellos, abriendo un amplio abanico de oportunidades y propiciando adems una mayor
visibilidad de nuestros centros en la sociedad.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
Versin: 4
Fecha: octubre 2010
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
Versin: 4
Fecha: octubre 2010
Versin: 4
Fecha: octubre 2010
2. CONCEPTOS BSICOS
a) Imagen digital
La diferencia entre una reproduccin fotogrfica ordinaria (analgica) y una
reproduccin fotogrfica digital estriba en que la primera obtiene la imagen sobre una
emulsin qumica fotosensible (pelcula fotogrfica), mientras que la reproduccin
digital captura una imagen de formato electrnico por medio de un sensor y construye
su representacin mediante una cadena de bits. Esta cadena de bits, interpretada por
un ordenador, presenta una reproduccin de la imagen en pantalla.
Las imgenes digitales se pueden obtener de varias formas:
Por medio de dispositivos de conversin analgica-digital, como son los
escneres y las cmaras digitales.
Directamente mediante programas informticos.
La imagen digital, obtenida por escaneo, es dividida en una matriz de puntos a modo
de cuadrcula, tantos como fotodiodos2 tenga el sensor. Cada uno de estos puntos
recibe el nombre de pxel3, que toma el valor binario 1 0 dependiendo de la
luminosidad y el tono lumnico ledo por el escner.
Esta cadena de cdigo binario es enviada al ordenador, donde la imagen queda
almacenada en formato digital.
A cada pxel se le asigna un valor tonal (negro, blanco, gris, color) que est
representado por un cdigo binario (ceros y unos). Estos dgitos binarios (bits) para
cada pxel son almacenados en una secuencia y con frecuencia reducidos a una
representacin matemtica (compresin).
b) Resolucin digital
La resolucin de la imagen viene dada por el nmero de pixeles (n de filas x n de
columnas) que tiene la imagen. Cuanto mayor sea este nmero mayor ser la
resolucin. La medida de la resolucin se determina por el nmero de pxeles ledos
en una distancia lineal de una pulgada (2,54 cm) en el documento digitalizado. Las
unidades ms utilizadas son puntos por pulgada o dots per inch (dpi), y los pxeles
por pulgada o pixels per inch (ppi). Conviene no confundir dpi (dots per inch o puntos
por pulgada) con ppi (pixels per inch o pxeles por pulgada). Los pxeles por pulgada
hacen referencia a la resolucin a la que ponemos nuestras imgenes para impresin.
La imagen se puede imprimir con ms o menos calidad de impresin, es decir, con
ms o menos cantidad de puntos de tinta de la impresora. Los puntos por pulgada
determinan la matriz de resolucin con que imprimir la impresora.
Fotodiodo es un dispositivo electrnico que cuando recibe luz genera una corriente elctrica
de una magnitud acorde a la cantidad de luz recibida.
3
Trmino formado de la mezcla de los trminos ingleses picture+element. Es el elemento ms
pequeo de que se compone una imagen digital.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
Versin: 4
Fecha: octubre 2010
e) Compresin
La compresin se utiliza para reducir el tamao del fichero de imagen para su
almacenamiento, su procesamiento y transmisin. El tamao del fichero para las
imgenes digitales puede ser muy grande, lo que requiere mayores recursos
informticos para su almacenamiento, procesamiento y transmisin.
4
Ms adelante se detallarn las distintas resoluciones a las que se debe escanear cada tipo de
material.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
Versin: 4
Fecha: octubre 2010
f) Formatos de ficheros
Existen diferentes formatos de ficheros de imgenes en el mercado. Cada uno con sus
caractersticas especficas, sus ventajas e inconvenientes en relacin a su capacidad
para soportar distintas profundidades de bits, de colores, metadatos, de aceptar o no
distintas tcnicas de compresin, etc.
Sealaremos los siguientes:
10
Versin: 4
Fecha: octubre 2010
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
11
Versin: 4
Fecha: octubre 2010
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
12
Versin: 4
Fecha: octubre 2010
3. PLAN DE DIGITALIZACIN
a) Finalidad de la digitalizacin en los archivos.
Como seala Carmen Crespo, la multiplicacin del original5 (ya sea mediante
fotocopia, microfilmacin o digitalizacin) propicia:
1. El servicio inmediato y directo de consulta.
2. Completar fondos documentales, originaria o temticamente afines, repartidos
entre varias instituciones archivsticas, facilitando con ello su conocimiento y
uso.
3. Potenciar la accesibilidad y difusin de series documentales.
4. Preservar de su deterioro las piezas ms frgiles y/o valiosas, al evitar de esta
forma su consulta directa.
5. Asegurar la pervivencia del contenido de un fondo frente a posibles
destrucciones o perdidas materiales.
6. Sustituir legal y definitivamente al original (en papel) en el supuesto de
eliminacin autorizada.
Pero, en esencia, dos son las finalidades bsicas de la reproduccin de documentos
en los archivos: la conservacin y la difusin. Ambas finalidades deben ir de la mano
del Plan de Digitalizacin del archivo y del establecimiento de unos criterios de
seleccin documental previos que veremos ms adelante.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
13
Versin: 4
Fecha: octubre 2010
Todo archivo que acometa un Plan de digitalizacin debe tener en cuenta los
siguientes aspectos:
1.
2.
3.
4.
b.
c.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
14
Versin: 4
Fecha: octubre 2010
permita mantener unos criterios bsicos para todos los archivos de gestin
autonmica.
d.
Finalmente, debemos puntualizar que, para que el Plan de digitalizacin cumpla estos
objetivos y sea, adems, duradero en el tiempo (es decir, un Plan cuyos resultados
deben poder seguir observndose a medio-largo plazo), es necesario que cumpla los
siguientes requisitos:
Que sea lo suficientemente claro como para que pueda ser comprendido
por la diversidad de usuarios a los que va dirigido.
Que sea flexible, puesto que debe poder adaptarse a las condiciones de
cada momento.
Establecimiento de prioridades
Los objetivos de cualquier proyecto de digitalizacin en los archivos son la
conservacin, la difusin y la investigacin de la documentacin en ellos conservada.
Todas las actividades que se emprendan en el Plan de Digitalizacin debern
someterse a estos principios.
Dentro de este mbito, las prioridades en la digitalizacin de documentos vendrn
dadas por las necesidades de los usuarios y los recursos disponibles en cada
momento: estas condiciones permiten establecer los criterios mnimos, que sirven para
establecer las lneas bsicas en la poltica de digitalizacin de los archivos. Las
prioridades as determinadas permitirn establecer una clasificacin general de
documentos para digitalizar. Se aplican a fondos documentales y colecciones
conservadas en los archivos y estn establecidas a partir de los siguientes aspectos:
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
15
Versin: 4
Fecha: octubre 2010
ESTABLECIMIENTO DE PRIORIDADES6
o Derechos de propiedad.
Condiciones del
o Restricciones legales.
documento
o Existencia o no de versiones digitales de
calidad.
o Calidad.
o Estado de conservacin.
Caractersticas
o Dimensiones.
intrnsecas
o Pluralidad de formatos.
o Relevancia del fondo.
o Pertinencia.
Caractersticas
o Coherencia con el resto de los fondos y
extrnsecas
las funciones del centro.
o Demanda de consulta del fondo.
o Actualidad.
o Oportunidad.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
16
Versin: 4
Fecha: octubre 2010
1 2 3 4 5
Tomado del Plan de Digitalizacin de la Filmoteca Nacional (se puede consultar en:
http://www.mcu.es/cine/docs/MC/FE/PlanDigitalizacion.pdf.ltima consulta del 27/03/2011).
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
17
Versin: 4
Fecha: octubre 2010
Usos
El material se solicita habitualmente para su consulta?
Se prev un aumento en la frecuencia de uso?
Existe una demanda suficiente de los documentos?
Mejorar el acceso como consecuencia de la digitalizacin?
Puede la digitalizacin soportar variedad de usos?
(impresin, navegacin mediante intranet o internet)
Existen condiciones (normativa) que regulen el acceso y
uso de esos archivos?
El material ser fcilmente manejable por los usuarios?
Los usuarios poseen recursos apropiados para utilizar el
material digitalizado?
Duplicacin del esfuerzo
El material ha sido digitalizado anteriormente por otra fuente
confiable?
Los archivos digitales son de calidad suficiente para servir a
sus fines?
Capacidad institucional
Se posee la infraestructura necesaria para la gestin de los
materiales digitales?
Existe la oportunidad de obtener una cooperacin multiinstitucional?
Recursos financieros
Se puede determinar el coste total de la digitalizacin?
Este coste se encuentra justificado?
Existen fondos para respaldar este esfuerzo?
Existe un compromiso institucional para gestionar y
preservar estos archivos?
c) Recomendaciones previas
Configuracin del hardware
No se pretende descender a recomendar una configuracin de hardware mnima, ms
an cuando en la mayora de las ocasiones sta viene impuesta por los estndares de
puesto de usuario definidos por el Servicio de Infraestructuras Informticas y Servicios
Corporativos, o est condicionado a la disponibilidad presupuestaria. No obstante,
podemos decir que lo ideal sera disponer de un sistema que pueda satisfacer las
necesidades de velocidad, memoria, almacenamiento y calidad de presentacin de las
imgenes. Para ello habr que tener en cuenta las siguientes cuestiones:
Qu clase de imgenes se estn creando? Textuales / fotogrficas / otras?
Qu cantidad?
Con qu fines? Servicio al usuario / difusin / conservacin?
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
18
Versin: 4
Fecha: octubre 2010
Los escneres planos son adecuados para escanear documentos e imgenes grficas en
papel. Algunos estn preparados para poder escanear pelcula, pero su rendimiento ptico en
el escaneo de negativos puede llegar ser decepcionante.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
19
Versin: 4
Fecha: octubre 2010
Del mismo modo podemos mencionar, como mtodo alternativo para la digitalizacin
de documentos, un sencillo sistema de sujecin de los documentos mediante un atril
(en posicin vertical), y un trpode para fijar la cmara digital. Sin embargo, este
sistema puede resultar menos preciso si no se realiza correctamente, puesto que la
imagen resultante puede sufrir deformaciones en caso de que la documentacin no
se encuentre en el ngulo adecuado para su reproduccin.
Software de visualizacin y tratamiento de imgenes
Es conveniente utilizar un software de recuperacin y visualizacin apropiado para las
imgenes. Se pueden utilizar programas de visualizacin gratuitos (freeware) y
compartidos (shareware) disponibles en la Web que soportan el espacio de formato y
de color, como puede ser el programa IrfanView. Existen, en el mbito de los
softwares propietarios, visores con los que se pueden gestionar archivos de imagen y
editar metadatos.
Para el tratamiento de las imgenes se recomienda que todos los centros de archivo
en los que se lleven a cabo planes de digitalizacin sistemticos cuenten con algn
tipo de visor (ya sea libre o propietario), en una versin adecuada a las necesidades
del servicio. Con el objeto de favorecer el correcto manejo de este programa se
recomienda su uso exclusivo por parte de tcnicos especializados y personal con la
formacin necesaria en la herramienta.
Del mismo modo, para facilitar la conversin de ficheros a formatos pdf y tiff, es
conveniente que aquellos centros que realicen digitalizaciones sistemticas cuenten
con programas especficos.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
20
Versin: 4
Fecha: octubre 2010
21
Versin: 4
Fecha: octubre 2010
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
22
Versin: 4
Fecha: octubre 2010
g) Metadatos
Los metadatos no son ms que datos estructurados sobre la informacin, es decir,
datos sobre los datos. Se trata de informacin extra que se incorpora a un archivo de
datos. Las etiquetas y metadatos se utilizan para almacenar una informacin de
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
23
Versin: 4
Fecha: octubre 2010
inters sobre una imagen ya sea dentro del mismo archivo grfico o bien asociada al
mismo de alguna otra manera. Esta informacin nos servir para su posterior
identificacin y recuperacin.
El concepto de metadatados -datos sobre datos- se puede entender en un sentido
amplio o en un sentido ms estricto. En un sentido amplio, si entendemos que
metadatos es un trmino que se utiliza para describir datos que ofrecen el tipo y la
clase de la informacin, esto es, son datos acerca de datos, podemos considerar que
el catlogo de una biblioteca, un repertorio bibliogrfico, o una descripcin archivstica
ISAD(G) son tipos de metadatos. Estos tipos de metadatos emplean,
fundamentalmente, reglas de catalogacin, normas de descripcin archivstica y
formatos para transmitir la informacin, como los formatos MARC en el caso de las
bibliotecas. As considerados, cada ficha catalogrfica o cada ficha descriptiva es un
conjunto de metadatos de un libro, de un documento/expediente/fondo, etc., y los
metadatos proporcionan una informacin bsica sobre ese libro o ese
documento/expediente, etc., relacionndolo adems cuando es posible establecer
esas relaciones- con otros. De la misma forma, los registros de una base de datos
llevada a cabo para indizar o hacer un resumen documental, podran tambin
considerarse como metadatos.
Sin embargo, si acotamos la definicin de metadatos dndole un sentido ms estricto,
los metadatos slo seran posibles en un contexto digital y en red ya que slo dentro
de este contexto se pueden utilizar los metadatos con la funcin que les caracteriza,
que es la de la localizacin, identificacin y descripcin de recursos, legibles e
interpretables por mquina.
Se pueden mencionar tres tipos de metadatos, aunque no se trata de una clasificacin
fija (en ocasiones se mezcla la informacin de uno y otro tipo):
Descriptivos: Contienen informacin que describe, clasifica o cataloga la
imagen correspondiente, bien de una forma libre por el usuario, bien conforme
a algunos campos predefinidos por un formato o aplicacin, o bien conforme a
unas normas estndar y reguladas (como pueden ser las normas propuestas
por el Dublin Core, los METS, los EAD o las del formato Marc entre otras).
Estructurales: Contienen informacin codificada en un lenguaje de marcado
que se refiere a relaciones entre objetos de acuerdo a algn tipo de estructura
concreta, es decir, qu lugar ocupa esa imagen dentro de un documento, qu
relaciones tiene con otros ficheros, etc. Las ms utilizadas son las etiquetas
tipo XML.
Administrativos (o tcnicos): Su funcin es gestionar y administrar los
recursos digitales. Ofrecen informacin bsica sobre las caractersticas y
propiedades de la imagen (tipo de fichero, tamao, resolucin, color, peso,
localizacin, institucin o autor que genera, alberga y mantiene los recursos,
fecha de creacin y actualizacin, seguimiento y control de versiones, etc.).
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
24
Versin: 4
Fecha: octubre 2010
Hay que puntualizar que no todos los formatos grficos soportan todo tipo de
metadatos e incluso algunos no soportan ninguno. Otros muchos, en cambio, s que
soportan estructuras de metadatos, e incluso han sido diseados para ello, como es el
caso del TIFF.
Conviene tener especial cuidado cuando se procede a convertir un formato en otro
(por ejemplo un archivo TIFF a PNG), porque ello puede suponer la prdida total de
los metadatos del documento.
El uso de los metadatos es un tema an complejo y en vas de implantacin. No
obstante, resulta imprescindible en el entorno web de cara a la recuperacin de la
informacin.
Partiendo de que los metadatos estructurales y administrativos vienen dados por los
propios formatos, nos vamos a detener nicamente en los descriptivos. A este
respecto, conviene recordar lo mencionado en el segundo prrafo de este epgrafe:
() cada ficha catalogrfica o cada ficha descriptiva es un conjunto de
metadatos de un libro, de un documento/expediente/fondo, etc., y los
metadatos proporcionan una informacin bsica sobre ese libro o ese
documento/expediente, etc., relacionndolo adems cuando es posible
establecer esas relaciones- con otros.
Es por este motivo que, en el caso de los documentos de archivo digitalizados (ya
sean imgenes o textos), la base para determinar cules son los metadatos de los
mismos la encontramos en los propios elementos de la norma ISAD (G) y, para
aquellos materiales sobre los que se haya desarrollado alguna convencin, los
elementos de sta. Lgicamente, no sern necesarios ni obligatorios todos esos
elementos y, por el contrario, se debern aadir otros relativos al control del fichero
digital.
Conviene sealar que ese fichero digital puede contener una o varias imgenes,
dependiendo de si se trata de una unidad documental simple o de una unidad
documental compuesta. En caso de que se trate de una unidad documental
compuesta (por ejemplo, un expediente), el fichero digital (pdf pdf/a) contendr
mltiples imgenes. El control secuencial de dichas imgenes (nmero de imgenes
del fichero y orden de las mismas) ser recogido por defecto por el propio programa en
los metadatos estructurales del fichero.
El Esquema Nacional de Interoperabilidad (Real Decreto 4/2010, de 8 de enero, por el
que se regula el Esquema Nacional de Interoperabilidad en el mbito de la
Administracin Electrnica) alude al Esquema de Metadatos mnimos obligatorios que
deben acompaar a todo documento electrnico y se remite a la Norma Tcnica
correspondiente que desarrollar esos metadatos mnimos que deben estar asociados
a cualquier documento electrnico. En el momento de redaccin del presente
documento an no se cuenta con un texto definitivo de esa Norma Tcnica.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
25
Versin: 4
Fecha: octubre 2010
Carcter
Descripcin
Archivo
Obligatorio
Cdigo de referencia
Obligatorio
Recomendado
Serie documental
Obligatorio
Nivel de descripcin
Obligatorio
Ttulo
Obligatorio
Nmero de expediente
Obligatorio
Obligatorio
Obligatorio
Unidad productora
Recomendado
Descripcin
Recomendado
Descriptores
Recomendado
Vocabulario
de
los
descriptores existentes.
distintos
26
Versin: 4
Fecha: octubre 2010
Identificacin
relacionados.
Recomendado
Obligatorio
Tipo de documento
Recomendado
Documentacin
relacionada
Recomendado
Tipo de relacin
Recomendado
Clasificacin, seguridad
y acceso
Recomendado
LOPD (sensibilidad de
datos)
Responsable de la
digitalizacin
Fecha de la digitalizacin
Obligatorio
de
los
expedientes
Observacin: los metadatos referidos tanto a la resolucin como al tamao del fichero
vienen dados por los propios dispositivos de captura de la imagen.
SUGERENCIA:
Fondo
0001_CGCYL
Unidad de descripcin
digitalizada
0001_CGCYL_250-2.pdf
Nombre del
Fondo
Signatura
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
27
Versin: 4
Fecha: octubre 2010
Esta forma de denominar a los ficheros digitales (por fondos y por signaturas)
facilitar el archivado de los mismos en una estructura jerrquica de carpetas
que refleje el esquema de organizacin de los fondos dentro del centro de
Archivo.
El problema que se plantea es cmo insertar o anexar estos metadatos al fichero
digital. A este respecto cabe sealar que los propios programas de digitalizacin
permiten la insercin de metadatos descriptivos que quedan anexados o incrustados a
la propia imagen, de modo que siempre van con ella. Igualmente, la mayora de los
programas de tratamiento de imgenes permiten la insercin de metadatos. Para que
esos metadatos puedan ser visualizados siempre que se recupere la imagen (con
cualquier visor), aqullos deben haberse grabado en formato Exif information. La
ventaja que ofrecen los programas de metadatos en formato Exif, es la de asegurar la
perdurabilidad de los mismos y su recuperacin en todo momento (al registrarse
aqullos en lenguaje html).
Por otro lado, adems de los programas propietarios, existen otros gratuitos
disponibles en la red, como es el caso de XnView o la herramienta Metadatador
(desarrollada por el Servicio de Archivos de la Junta de Andaluca) que permite la
introduccin de metadatos en los ficheros digitales.
Se debern insertar, como mnimo, aquellos metadatos que se han definido con
carcter obligatorio.
Por su parte, las aplicaciones de gestin documental (por ejemplo, Albal) tambin
ejercen como generadora de metadatos, en tanto que los elementos de la descripcin
son considerados como tales. En ese caso, habra que asegurar el modo de conservar
un enlace o vnculo permanente del fichero digital con su descripcin correspondiente.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
28
Versin: 4
Fecha: octubre 2010
29
Versin: 4
Fecha: octubre 2010
3. Fechas y lugares
4. Nivel de la descripcin
5. Volumen y soporte
6. Nombre/s del/los productor/es
30
Versin: 4
Fecha: octubre 2010
Por otro lado, es necesario tener en cuenta que las imgenes (contraste, color, brillo,
etc.) pueden aparecer de manera diferente en los distintos monitores, por lo que se
hace necesaria la calibracin del monitor. La calibracin no es ms que el proceso de
ajuste de la configuracin del color del monitor a un nivel estndar, de manera que la
imagen se presente de igual manera en diferentes monitores.
Ejemplo:
31
Versin: 4
Fecha: octubre 2010
Textuales
Tipo
Grficos
Planos, mapas,
pergaminos
Fotografas
(negativos)
Caractersticas
materiales de los
originales
Resolucin de
captura/tipos de
archivo a obtener
Volumen
Archivo
(peso)
Modos de
color
Texto impreso A2
(42x59,4 cm) B/N
14,7 MB
Escala de
grises, a 8
bits
Texto impreso A3
( 29,7x42 cm) B/N
7,4 MB
Escala de
grises, a 8
bits
Texto impreso A4
(21X29,7 cm) B/N
8,3 MB
Escala de
grises, a 8
bits
Texto manuscrito A2
(42x59,4 cm) Color
(mapas, planos,
pergaminos)
44 MB
Color, a 24
bits
Texto manuscrito A3
( 29,7x42 cm) Color
(mapas, planos,
pergaminos)
22 MB
Color, a 24
bits
Texto manuscrito A4
(21X29,7 cm) Color
(Protocolos
Notariales)
24,9 MB
Color, a 24
bits
Negativos vidrio o
celuloide 4,5x6cm,
6x6cm,
70 MB
Color, a 24
bits
Negativos vidrio o
celuloide 6,5x9cm
102 MB
Color, a 24
bits
Negativos vidrio o
celuloide 9x12cm,
10x15cm
68 MB
Color, a 24
bits
Negativos vidrio o
celuloide 13x18cm
103 MB
Color, a 24
bits
Negativos vidrio o
celuloide 15x20 cm
84 MB
Color, a 24
bits
81 MB
94 MB
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
32
Versin: 4
Fecha: octubre 2010
Negativos vidrio o
celuloide 18x24cm,
20x25cm, 24x30cm
70 MB
80 MB
Color, a 24
bits
114 MB
Fotografas
(positivos)
Negativos y
diapositivas de 35mm y
16 mm
103 MB
Color, a 24
bits
Papel 9x12cm,10x15
cm
68 MB
Color, a 24
bits
103 MB
Color, a 24
bits
Papel 18x24cm,
20x25cm, 24x30cm
70 MB
Color, a 24
bits
94 MB
80 MB
114 MB
Ejemplo 1:
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
33
Versin: 4
Fecha: octubre 2010
Informacin completa
Realizado con escner de planos SMARTLF CI40 e impresora de planos CANON IPF 810
Ejemplo 2:
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
34
Versin: 4
Fecha: octubre 2010
Escaneado en color, 75 ppp, a 1:1, tamao original 6x 4,5 cm, peso 49 KB. Al intentar ampliar
la foto se pixela.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
35
Versin: 4
Fecha: octubre 2010
Escaneado en color, 1600ppp, a 1:1, tamao original 6x 4,5 cm, peso 70 MB. Nos permite
poder hacer buenas copias a ms tamao que el del original.
Realizado con el escner de sobremesa EPSON EXPRESSION 10000XL.
La razn por la cual se ha escogido un valor que sobrepasa las expectativas de los
dispositivos de salida existentes hoy en da radica en prever la disponibilidad y las
necesidades del archivo de cara al futuro, as como en permitir grandes ampliaciones
de las fotografas sin necesidad de recurrir a los originales.
Se incluye en el Anexo I una tabla que puede servir de ayuda para la digitalizacin de
materiales fotogrficos fijados en soportes rgidos del siglo XIX, as como otra tabla
comparativa de formatos de imgenes.
Control de la calidad de la imagen
Para el control tonal y de color se recomienda incluir en los ficheros maestros escalas
o cartas de colores.
Una carta de color es una herramienta que permite el control preciso de un proceso
fotogrfico o de un dispositivo de captura o de salida digital (como pueden ser una
cmara o un monitor, respectivamente). Las ms conocidas son las que estn
construidas sobre algn tipo de cartn como soporte, con parches de color impresos
encima. Existen cartas de colores que nicamente contienen grises (en este caso se
trata de cartas o de cuas de grises). Pero, para generalizar, ambos tipos se pueden
denominar cartas de control tonal.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
36
Versin: 4
Fecha: octubre 2010
Las cartas de color sirven para conseguir un mayor control sobre los resultados de un
proceso fotogrfico, tanto si es de toma, como si es de tratamiento de la imagen o de
impresin final.
Para hacer uso de ellas, normalmente se incluyen dentro de la propia imagen que se
va a reproducir, junto a ella, tal y como se muestra en la fotografa inserta bajo estas
lneas. As se consigue una referencia bien clara del aspecto real del original.
Para el control de la resolucin y estar dentro de las normas del ndice de calidad (QI),
se emplea la carta MIRA TEST ISO CHART N2, utilizada en la microfilmacin. Dicha
carta se recomienda digitalizar al principio de cada escaneado y esta sirve para decidir
que resolucin es la ms adecuada para posibilitar la lectura de la letra ms pequea
del documento, ya sea manuscrito o impreso.
Para facilitar el trabajo existe "La calculadora de calidad de la imagen" (Anexo III) que
es una aplicacin fcil de usar y se puede encontrar en la web de la Universidad de
Illionois (http://images.library.uiuc.edu/calculator/index.htm).
En el caso de usar cmaras digitales tenemos que saber cul es la resolucin ptica
de partida que ofrece el sensor de nuestra cmara. Para ello deberamos conocer los
pxeles que ofrece nuestra cmara (informacin que suele especificar el fabricante en
la web). As tendremos, por ejemplo, la CANON EOS MARK II, que ofrece una
resolucin de 3744x5616. Sabiendo esto slo nos falta medir nuestro original y
trasladar esa medida a pulgadas. Si tenemos un DINA3 es 11,69"x16,54" ya tenemos
los datos necesarios. Ahora dividimos 3744/11,69"= 320,27 es decir, nuestra cmara
nos dar para un documento DINA3 capturado a sangre, una resolucin ptica
mxima de 320,27. En el Anexo IV incluimos una tabla orientativa de varios modelos
de cmaras digitales.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
37
Versin: 4
Fecha: octubre 2010
Esta informacin ha sido facilitada por Luis Torres Freixinet, del Ayuntamiento de
Zaragoza.
Tratamiento de las imgenes
Tras el escaneo de los documentos, se deber verificar que:
a.
b.
c.
d.
e.
10
38
Versin: 4
Fecha: octubre 2010
expediente. Para ello deber utilizarse una aplicacin que permita la generacin de
ficheros PDF v. 1.4 superior.
Para los documentos sueltos, el fichero de consulta se conservar en formato JPG
PNG.
Cabe puntualizar que por fichero de consulta se entiende aqul que se genera para la
consulta de usuarios en el propio centro. Por el contrario, se habla de fichero de
divulgacin cuando se trata de aquel generado para el propio usuario. En este caso, el
peso del fichero depender de las necesidades del interesado (publicaciones,
exposiciones, uso particular, etc.) y se entregar generalmente en un CD o DVD.
Cuando los ficheros de consulta sean para uso particular y el interesado no haya
especificado un peso concreto, se recomienda entregarle una copia (en CD CVD) de
entre 12 y 20 MB, que es el peso que da cualquier cmara compacta hoy en da. En el
caso de que se trata de un fichero de consulta para su divulgacin va web, stos
tendrn un peso mximo de 1MB aproximadamente.
Marca de agua
En los ficheros de consulta PDF/PNG/JPG se podr insertar una marca de agua
transparente de tamao reducido en cualquiera de los ngulos de la imagen digital
(siempre y cuando no obstaculice la visibilidad de la misma) a efectos de difusin e
identificacin de su procedencia. Los ficheros maestros (TIFF/PDF) no llevarn inserta
en ningn caso marca de agua.
La marca de agua consistir en el logo de Archivos de Castilla y Len, al que se
podr aadir en su parte inferior el nombre del archivo que custodia el documento.
Ejemplo:
39
Versin: 4
Fecha: octubre 2010
Cabe recordar que la marca de agua es un elemento inserto en la imagen que puede
ser fcilmente eliminado si se dispone de los medios necesarios (un programa de
tratamiento de imgenes como puede ser Adobe PhotoShop). Por tanto, la eficacia de
la marca de agua en este sentido se pone en entredicho (si bien se puede mantener
meramente a efectos de difusin). Ms confiable resulta, por el contrario, la
informacin registrada en el metadato responsable de la digitalizacin ya que en
dicho elemento se consignar la persona e institucin responsables de dicha
digitalizacin.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
40
Versin: 4
Fecha: octubre 2010
12
En algunos pases, como los EE.UU., algunas obras creadas por la administracin pblica no
quedan protegidas por los derechos de autor sino que, una vez divulgadas, estn disponibles
para ser usadas libremente sin necesidad de autorizacin previa.
13
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
41
Versin: 4
Fecha: octubre 2010
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
42
Versin: 4
Fecha: octubre 2010
y autorizacin. En ese proceso de bsqueda del titular de los derechos, puede darse la
situacin de que nos resulte imposible localizar al autor o titular. Es el caso de las
llamadas obras hurfanas, cuya reutilizacin puede conllevar problemas, ya que,
aunque no se pueda localizar al autor o titular de los derechos, estos pueden estar
vigentes y pueden aparecer herederos o titulares de esas obras. Conviene recordar, a
este respecto, que los derechos de autor tienen una validez temporal de hasta 70 aos
despus de la muerte del autor. Transcurrido dicho plazo, la obra pasa a ser de
dominio pblico y, por tanto, no ser necesario solicitar permiso alguno.
As pues, una buena fuente para encontrar recursos libres de derechos es el dominio
pblico, aunque no existe un registro oficial ni un depsito de obras en el que se
recojan estos materiales15.
Si debemos gestionar la solicitud de un permiso para la utilizacin de una obra ajena,
deber tenerse en cuenta el uso que se le va a dar a la obra en cuestin, ya que es
probable que no slo queramos reproducirla sino, adems, distribuirla y comunicarla.
De tal manera, el permiso tendr que establecer en qu manera se realizarn estas
acciones.
Se puede llegar a pactar con el autor o titular una difusin libre de materiales, pero en
todo caso esa voluntad deber quedar reflejada en el correspondiente acuerdo,
siempre teniendo en cuenta, eso s, la revocabilidad de este tipo de licencias. Es decir,
en cualquier momento el autor o titular puede modificar la licencia o volver al todos los
derechos reservados. Pese a ello, la vigencia de la primera licencia con la que se ha
divulgado la obra se mantendr para aquellos que hayan accedido a ella antes de
operarse cualquier cambio.
15
Existen proyectos para la creacin de una base de datos local e internacional en la que se
recojan las obras que se encuentran en domino pblico para facilitar las consultas.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
43
Versin: 4
Fecha: octubre 2010
GLOSARIO
Compresin (de datos): consiste en la reduccin del volumen de informacin tratable
(procesar, transmitir o grabar). En principio, con la compresin se pretende transportar
la misma informacin, pero empleando una menor cantidad de espacio. El objetivo de
la codificacin es siempre reducir el tamao de la informacin, intentando que esta
reduccin de tamao no afecte al contenido. No obstante, la reduccin de datos puede
afectar o no a la calidad de la informacin. Se habla de compresin sin prdida
cuando los datos antes y despus de comprimirlos son exactos. Por el contrario, la
compresin con prdida supone que el algoritmo de compresin elimina determinados
datos para reducir an ms el tamao, con lo que se suele producir tambin una
prdida de calidad.
Copia manipulada u optimizada: fichero digital generado a partir del fichero maestro
o master que ha sido sometido a algn proceso de manipulacin de la imagen,
siempre con la finalidad de mejorar la visibilidad de la misma.
Derecho de autor: conjunto de normas y principios que regulan los derechos morales
y patrimoniales que la ley concede a los autores, por el solo hecho de la creacin de
una obra literaria, artstica, cientfica o didctica, est publicada o indita. Una obra
pasa al dominio pblico cuando los derechos patrimoniales han expirado.
Digitalizacin: Accin de convertir en digital (aportando valores en bits 0 y 1)
cualquier tipo de informacin, ya sea grfica, de audio, vdeo, etc.
Dominio pblico: en el mbito de los derechos de autor, se entiende por dominio
pblico la situacin en que quedan las obras literarias, artsticas o cientficas al expirar
el plazo de proteccin de los derechos patrimoniales exclusivos que las leyes de
derecho de autor reconocen en favor del derecho habiente y que implica que pueden
ser explotadas por cualquier persona o corporacin, pero siempre respetando los
derechos morales (bsicamente la paternidad de la obra). Esto sucede habitualmente
trascurrido un trmino contado desde la muerte del autor.
Exif (formato Exif information): Exif es la abreviatura de Exchangeable Image File
(archivo de imagen intercambiable). Originalmente, el formato Exif es una
especificacin para formatos de archivos de imagen usado por las cmaras digitales.
La informacin Exif son metadatos encapsulados en el archivo de imagen en el
momento de la exposicin (aunque pueden ser modificados a posteriori mediante
aplicaciones como Adobe PhotoShop). Esta informacin puede contener: marca y
modelo de la cmara, dimensiones de la imagen, fecha y hora de la exposicin,
informacin tcnica de la exposicin, etc. Pero, adems, las etiquetas de metadatos
definidas en el estndar Exif cubren un amplio espectro, que puede incluir otros
metadatos descriptivos de la imagen, por lo que llegado el caso- pueden ser
adaptados para cubrir las necesidades de la descripcin archivstica de cada unidad
de descripcin.
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
44
Versin: 4
Fecha: octubre 2010
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
45
Versin: 4
Fecha: octubre 2010
ANEXO I
Resolucin de captura/tipos
de archivo
Volumen
Archivo
Modos
de color
RGB
103 Mb
Color, a 24
bits
106 Mb
Color, a 24
bits
96 Mb
Color, a 24
bits
100 Mb
Color, a 24
bits
100 Mb
Color, a 24
bits
100 Mb
Color, a 24
bits
97 Mb
Color, a 24
bits
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
46
Versin: 4
Fecha: octubre 2010
Formato original
Resolucin
escala de
grises a 8 bits
DIN A4 (21X20,7
cm)
100
944 Kb
DIN A4
200
DIN A4
color 24
bits
JPG
comprimido
PNG
comprimido
color 24 bits
color 24 bits
2,7 Mb
327 Kb
693 Kb
3,7 Mb
11 Mb
614 Kb
2,3 Mb
300
8,3 Mb
24,9 Mb
1,6 Mb
4,2 Mb
DIN A4
400
14,7 Mb
44,25 Mb
2,6 Mb
6,4 Mb
DIN A4
600
33 Mb
99 Mb
5,3 Mb
11,4 Mb
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
47
Versin: 4
Fecha: octubre 2010
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
48
Versin: 4
Fecha: octubre 2010
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
49
Versin: 4
Fecha: octubre 2010
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
50
Versin: 4
Fecha: octubre 2010
BIBLIOGRAFA
AA.VV. Vives, Josep (Coord.). Digitalizacin del patrimonio: archivos, bibliotecas y
museos en la red. Barcelona, 2009.
SIGIA. Normas Tcnicas n 1.Digitalizacin de documentos. Versin 1.0. Sistema de
Gestin e Informacin de Archivo. Gobierno del Principado de Asturias. Consejera de
Economa y Administracin Pblica. 2007.
Tocco, Maximiliano. Manual conceptual operativo de digitalizacin.
Crespo, Carmen. La reprografa en los Archivos. Boletn ANABAD. Tomo 36, n 1-2,
1986, pp. 45-62.
Bermdez Muoz, Mara Teresa. Gua para digitalizar documentos
http://www.archivonacional.go.cr/pdf/guia_digitalizar_documentos.pdf)
(en
Nacional
Riecks,
David.
IPTC
Core
Schema
for
XMP.
Version
1.0
http://www.iptc.org/std/Iptc4xmpCore/1.0/documentation/Iptc4xmpCore_1.0-docCpanelsUserGuide_13.pdf )
(En
(En
Palacio Licenciado Butrn. Plaza Santa Brgida, s/n 47003 Valladolid. Telfono: 983 41 29 18 Fax: 983 41 29 19
51