Documentos de Académico
Documentos de Profesional
Documentos de Cultura
JULIO 2015
‐ El acceso a largo plazo de la información digitalizada
‐ La calidad de las imágenes digitalizadas
‐ La seguridad y la confidencialidad de la información
‐ La funcionalidad continua del repositorio
LOS ESTÁNDARES TECNOLÓGICOS
El uso de un conjunto de estándares tecnológicos,
definitivamente contribuye a lograr los objetivos
propuestos. El Archivo Nacional de Québec recomienda
tener en cuenta los siguientes estándares:
‐ La Norma ISO 9660 para el registro y lectura de los
datos en discos ópticos con el fin de asegurar su
migración a diferentes ambientes tecnológicos.
‐ El formato TIFF para la toma de imágenes.
‐ La Norma ISO 19005‐1:2008, que define el uso del
formato PDF, como un estándar para el archivo y
conservación de documento a largo plazo.
EL ACCESO A LAS IMÁGENES
El acceso a la información conservada en discos
ópticos supone que esa información permanecerá
legible, inteligible y recuperable.
La legibilidad significa la posibilidad de acceder en
todo momento, presente o futuro a la información
digitalizada sin ninguna pérdida de datos.
Generalmente, la imposibilidad de acceso a la
información proviene de la obsolescencia del
material.
La recuperación de la información implica la
posibilidad de encontrar la información
almacenada en los discos ópticos y acceder
fácilmente.
Para garantizar el acceso a la información, se
deben respetar las siguientes reglas:
• Establecer una estrategia de migración que
permita la evolución del equipo, los programas
informáticos y los soportes de almacenamiento
de los datos al ritmo de los cambios
tecnológicos.
• Flacso Andes tiene un plan de respaldo de
todos los contenidos digita
LA CALIDAD DE LAS IMÁGENES
1. La verificación de la calidad de las imágenes se
hace mediante tres operaciones:
• La toma de las imágenes
• Su mejoramiento
• La compresión y descompresión de los datos
digitalizados.
Para obtener una buena calidad de la imagen se
deben respetar cuatro reglas:
1. El equipo (unidad de disco óptico y escáner)
debe ser calibrado correctamente de acuerdo con
las instrucciones del productor y ajustado de
acuerdo con las necesidades del usuario.
Efectuar una prueba con un muestreo de
documentos antes de iniciar la digitalización de
todo un fondo documental.
2. La densidad de la digitalización se da en función de la
calidad de la imagen y de la capacidad de almacenamiento
que se desean. Se debe tener en cuenta la capacidad de
memoria de los discos ópticos.
3. Para mejorar una imagen digitalizada se puede hacer una
edición para limpiar la imagen, suprimiendo los datos de
una forma selectiva o automática. En algunos casos, esto
puede provocar una pérdida significativa de detalles, es por
esto que, cuando se utiliza este procedimiento, se debe
conservar un respaldo de la imagen original no mejorada
Para los documentos que tienen valor de prueba o valor
científico‐cultural, se debe conservar siempre una imagen
no retocada.
4. La compresión y la descompresión de los datos. La
compresión reduce enormemente el volumen de las
imágenes digitalizadas por medio de fórmulas
matemáticas. Estas fórmulas pueden ser comerciales
o estándar.
Si se utiliza este procedimiento de compresión y
descompresión, se debe procurar realizarlo sin
pérdida de datos.
LA FUNCIONALIDAD DEL SISTEMA DE DIGITALIZACIÓN
La funcionalidad de un sistema de digitalización
depende principalmente del uso de una
arquitectura abierta y que sea compatible.
Una arquitectura abierta permite:
• Mejorar los componentes del sistema sin
degradar sus funciones y sin perder información
• Importar y exportar los datos
PROTECCIÓN DE LA INFORMACIÓN DIGITALIZADA
Para proteger los documentos digitalizados de una
forma adecuada, es necesario:
• La adquisición de soportes y tecnología de registro y
almacenamiento de alta calidad
• El control de la cantidad de los datos almacenados
en el soporte
• Generar respaldos de la información documental de
forma periódica, utilizando formatos homogéneos
en los datos y la documentación, procurando
establecer un solo medio de respaldo electrónico,
por ejemplo, los discos compactos no regrabables.
EVOLUCIÓN DE LAS TECNOLOGÍAS DE
INFORMACIÓN
Este aspecto exige una constante actualización
tecnológica con el fin de conocer los nuevos
equipos y programas que aparecen en el mercado
para asegurar la migración de la información
digitalizada
FORMATOS DE ARCHIVOS DIGITALES ‐ FLACSO
Andes
1. Identificación.
2. Clasificación.
3. Transporte y Recepción del material.
4. Preparación
5. Digitalización o captura.
6. Reconocimiento del texto.
7. Indexación.
1. IDENTIFICACIÓN.
Tarea que le corresponde al personal técnico de la
Biblioteca Nacional, luego de realizar una
selección exahustiva del material bibliográfico que
contiene el FER I, determinan que material va a
ser enviado a Flacso Andes para ser digitalizado
2. CLASIFICACIÓN.
Lo realiza el personal técnico de la Biblioteca
Nacional y consiste en: el ordenamiento del
material bibliográfico, preparación del listado de
los libros que serán enviados a digitalizarse y el
correcto embalaje del material, para luego ser
transportado a Flacso Andes.
3. TRANSPORTE Y RECEPCIÓN DEL
MATERIAL.
La Biblioteca Nacional ha asumido el compromiso
de transportar el material bibliográfico que va a
ser digitalizado, hasta las instalaciones de Flacso
Andes.
4. PREPARACIÓN DE LOS DOCUMENTOS HA
SER DIGITALIZADOS.
En esta fase se prepara la documentación a
capturar, revisando uno a uno los documentos,
deshaciéndose de cualquier elemento que impida
la ágil captura de las mismas o que puedan
entorpecer o imposibilitar el proceso de
digitalización.
Las tareas más significativas a realizar en la
fase de Preparación son:
• Quitar clips, en el caso que se
encontraren.
• Separar documentos con varias páginas
unidas.
• Revisión de los documentos en su
integralidad.
5. DIGITALIZACIÓN
Los documentos del FER I, se digitalizan en el
escáner ATIZ BOOKDRIVE PRO, que es un escáner
especializado para la digitalización de
documentación histórica, cuya principal
característica es que el documento no tiene que
ser desencuadernado para ser escaneado.
Esta fase tiene una índole técnica muy
importante, por lo que es necesario realizar
durante la misma las siguientes tareas:
• Definir el formato del fichero que contiene la
imagen digitalizada del documento original
en papel.
• Establecer los parámetros de digitalización
(resolución, profundidad de bits, etc.).
• Garantizar el equilibrio entre una calidad
visual aceptable para el usuario y el tamaño
del fichero.
• Decidir si se va a crear un único fichero (con
una o varias páginas) por cada documento
original o varios ficheros (una por cada
página). Para la carga de un documento en el
Repositorio Digital es recomendable que el
formato final del mismo sea un PDF (multi
páginas).
ESCANER ATIZ BOOKDRIVE PRO
La captura de las imágenes en el escáner ATIZ se la
realiza en el formato RAW, dicho formato (a ser
entendido como "formato de imagen sin
modificaciones"), es un formato de archivo digital
de imágenes que contiene la totalidad de los datos
de la imagen tal y como ha sido captada por el
sensor digital de la cámara fotográfica.
Son archivos que tienen un peso considerable,
pero es porque almacenan mucha más
información de: luz, detalle y color de la imagen
que cualquier otro formato.
6. RECONOCIMIENTO DEL TEXTO
La fase de reconocimiento del texto está
indiscutiblemente relacionada con la de
digitalización y en muchos casos se realiza
simultáneamente en el tiempo.
El reconocimiento automático de datos que
realizamos con los archivos digitales en Flacso
Andes, es el OCR (optical character recognition).
En este tipo de reconocimiento se harán uso de
técnicas para la extracción automatizada de los
datos significativos del documento. La utilización
de OCR, proporciona la habilidad de convertir
imágenes de caracteres en letra de máquina, en
caracteres capaces de ser interpretados o
reconocidos por un ordenador.
7. INDEXACIÓN
En esta fase de Indexación se reúne toda la
información identificatoria de los documentos junto
con la información necesaria para su incorporación al
Repositorio Digital, es decir, en esta etapa se debe
obtener toda la información necesaria para la carga
de la documentación en el repositorio.
PROCESO DE CATALOGACIÓN Y CARGA DE
ARCHIVOS DIGITALES
Para la descripción de metadatos utilizamos el
formato “DUBLIN CORE” (DC), constituido por
quince metadatos básicos, los cuales se dividen en
tres apartados: Contenido (Título, Tema,
Descripción, Fuente, Lengua, Relación, Cobertura);
Propiedad Intelectual (Autor, Editor, Colaborador,
Derechos); y Creación e identidad (Fecha, Tipo,
Formato, Identificador).
DUBLIN CORE es un modelo de metadatos
elaborado y auspiciado por la DCMI (Dublin
Core Metadata Initiative), una organización
dedicada a fomentar la adopción extensa de
estándares interoperables de metadatos.
VENTAJAS DEL USO DE DUBLIN CORE
• La simplicidad
• La flexibilidad
• La interoperabilidad semántica
• Alto nivel de normalización formal
• Crecimiento y evolución del estándar a
través de una institución formal consorciada:
la DCMI.
• Es un formato de uso por consenso
internacional.
REPOSITORIO FLACSO ANDES
www.repositorio.flacsoandes.edu.ec
Descripción del Fondo Ecuatoriano Republicano I
GRACIAS