Está en la página 1de 37

BIBLIOTECA NACIONAL “EUGENIO ESPEJO” –

CASA DE LA CULTURA ECUATORIANA

DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO I

JULIO 2015

Ana Lucía Delgado Delgado


En un proyecto que involucre la digitalización de documentos, se
debe tomar en cuenta los siguientes aspectos:

• Los objetivos del proyecto


• Los estándares tecnológicos
• El acceso a las imágenes y a los índices de datos
• La calidad de las imágenes
• La funcionalidad del sistema
• La protección de la información digitalizada
• La evolución de las tecnologías de la información
LOS OBJETIVOS DEL PROYECTO 
En el marco del proyecto de digitalización del Fondo 
Ecuatoriano Republicano I (FER I), hemos priorizado los 
siguientes objetivos:

‐ El acceso a largo plazo de la información digitalizada 
‐ La calidad de las imágenes digitalizadas
‐ La seguridad y la confidencialidad de la información 
‐ La funcionalidad continua del repositorio
LOS ESTÁNDARES TECNOLÓGICOS
El uso de un conjunto de estándares tecnológicos, 
definitivamente contribuye  a lograr los objetivos 
propuestos.  El Archivo Nacional de Québec recomienda 
tener en cuenta los siguientes estándares: 

‐ La Norma ISO 9660 para el registro y lectura de los 
datos en discos ópticos con el fin de asegurar su 
migración a diferentes ambientes tecnológicos. 
‐ El formato TIFF para la toma de imágenes. 
‐ La Norma ISO 19005‐1:2008, que define el uso del 
formato PDF, como un estándar para el archivo y 
conservación de documento a largo plazo.
EL ACCESO A LAS IMÁGENES 
El acceso a la información conservada en discos 
ópticos supone que esa información permanecerá 
legible, inteligible y recuperable. 

La legibilidad significa la posibilidad de acceder en 
todo momento, presente o futuro a la información 
digitalizada sin ninguna pérdida de datos. 
Generalmente, la imposibilidad de acceso a la 
información proviene de la obsolescencia del 
material.  

La recuperación de la información implica la 
posibilidad de encontrar la información 
almacenada en los discos ópticos y acceder 
fácilmente. 
Para garantizar el acceso a la información, se 
deben respetar las  siguientes reglas:

• Establecer una estrategia de migración que 
permita la evolución del equipo, los programas 
informáticos y los soportes de almacenamiento 
de los datos al ritmo de los cambios 
tecnológicos. 
• Flacso Andes tiene un plan de respaldo de 
todos los contenidos digita
LA CALIDAD DE LAS IMÁGENES 
1. La verificación de la calidad de las imágenes se 
hace mediante tres operaciones: 

• La toma de las imágenes 
• Su mejoramiento 
• La compresión y descompresión de los datos 
digitalizados. 
Para obtener una buena calidad de la imagen se 
deben respetar cuatro reglas: 

1. El equipo (unidad de disco óptico y escáner) 
debe ser calibrado correctamente de acuerdo con 
las instrucciones del productor y ajustado de 
acuerdo con las necesidades del usuario. 

Efectuar una prueba con un muestreo de 
documentos antes de iniciar la digitalización de 
todo un fondo documental.
2. La densidad de la digitalización se da en función de la 
calidad de la imagen y de la capacidad de almacenamiento 
que se desean. Se debe tener en cuenta la capacidad de 
memoria de los discos ópticos. 

3. Para mejorar una imagen digitalizada se puede hacer una 
edición para limpiar la imagen, suprimiendo los datos de 
una forma selectiva o automática. En algunos casos, esto 
puede provocar una pérdida significativa de detalles, es por 
esto que, cuando se utiliza este procedimiento, se debe 
conservar un respaldo de la imagen original no mejorada 

Para los documentos que tienen valor de prueba o valor 
científico‐cultural, se debe conservar siempre una imagen 
no retocada. 
4. La compresión y la descompresión de los datos. La 
compresión reduce enormemente el volumen de las 
imágenes digitalizadas por medio de fórmulas 
matemáticas. Estas fórmulas pueden ser comerciales 
o estándar. 

Si se utiliza este procedimiento de compresión y 
descompresión, se debe procurar realizarlo sin 
pérdida de datos. 
LA FUNCIONALIDAD DEL SISTEMA DE DIGITALIZACIÓN 

La funcionalidad de un sistema de digitalización 
depende principalmente del uso de una 
arquitectura abierta y que sea compatible. 

Una arquitectura abierta permite:

• Mejorar los componentes del sistema sin 
degradar sus funciones y sin perder información 
• Importar y exportar los datos 
PROTECCIÓN DE LA INFORMACIÓN DIGITALIZADA 
Para proteger los documentos digitalizados de una 
forma adecuada, es necesario: 
• La adquisición de soportes y tecnología de registro y 
almacenamiento de alta calidad 
• El control de la cantidad de los datos almacenados 
en el soporte 
• Generar respaldos de la información documental de 
forma periódica, utilizando formatos homogéneos 
en los datos y la documentación, procurando 
establecer un solo medio de respaldo electrónico, 
por ejemplo, los discos compactos no  regrabables. 
EVOLUCIÓN DE LAS TECNOLOGÍAS DE 
INFORMACIÓN 

Este aspecto exige una constante actualización 
tecnológica con el fin de conocer los nuevos 
equipos y programas que aparecen en el  mercado 
para asegurar la migración de la información 
digitalizada
FORMATOS DE ARCHIVOS DIGITALES ‐ FLACSO 
Andes

TIFF (Tagged Image File Format) – (formato de 


archivo de imagen etiquetado)
Es un formato de fichero digital que acepta a 
compresión sin  pérdidas,  por  lo  que  se conserva  
la  información  original completa. Se trata de un 
formato estándar y de uso libre, y es el más 
utilizado con  fines  de  conservación.  
JPEG  (Joint Photographic Experts Group):  
Se  trata  de  un  formato  de  gran calidad   para   
imágenes   en   color   (24   bits) que ofrece  un   
alto   grado   de compresión, aunque ésta 
siempre es con pérdidas. Es un formato 
estándar muy usado. 
PDF  (Portable  Document Format):  
Es  un  formato  de  almacenamiento  de documentos  
compuesto  (imagen  vectorial,  mapa  de  bits  y  texto).  
Es  un  estándar  muy  extendido  y mantiene  una  
calidad  muy  buena.  El  PDF es  idóneo  para  imprimir  
y  crear documentos  secuenciales  con  páginas  
múltiples.
El  PDF/A,  basado  en  un  subconjunto  del  formato  
PDF,  es  el estándar  ISO  (ISO  19005‐1:2005)  para  la  
preservación  de  los  documentos electrónicos a largo 
plazo.
FASES DEL PROCESO DE DIGITALIZACION DE 
DOCUMENTOS

1. Identificación. 
2. Clasificación. 
3. Transporte y Recepción del material. 
4. Preparación 
5. Digitalización o captura. 
6. Reconocimiento del texto. 
7. Indexación. 
1. IDENTIFICACIÓN. 

Tarea que le corresponde al personal técnico de la 
Biblioteca Nacional, luego de realizar una 
selección exahustiva del material bibliográfico que 
contiene el FER I, determinan que material va a 
ser enviado a Flacso Andes para ser digitalizado
2. CLASIFICACIÓN. 

Lo realiza el personal técnico de la Biblioteca 
Nacional y consiste en: el ordenamiento del 
material bibliográfico, preparación del listado de 
los libros que serán enviados a digitalizarse y el 
correcto embalaje del material, para luego ser 
transportado a Flacso Andes.
3. TRANSPORTE Y RECEPCIÓN DEL 
MATERIAL.

La Biblioteca Nacional ha asumido el compromiso 
de transportar el material bibliográfico que va a 
ser digitalizado, hasta las instalaciones de Flacso
Andes.
4. PREPARACIÓN DE LOS DOCUMENTOS HA 
SER DIGITALIZADOS.

En esta fase se prepara la documentación a 
capturar, revisando uno a uno  los documentos, 
deshaciéndose de cualquier elemento que impida 
la ágil captura de las mismas o que puedan 
entorpecer o imposibilitar el proceso de 
digitalización.  
Las tareas más significativas a realizar en la 
fase de Preparación son: 

• Quitar clips, en el caso que se 
encontraren.  
• Separar documentos con varias páginas 
unidas. 
• Revisión de los documentos en su 
integralidad.
5. DIGITALIZACIÓN  

Los documentos del FER I, se digitalizan en el 
escáner ATIZ BOOKDRIVE PRO, que es un escáner 
especializado para la digitalización de 
documentación histórica, cuya principal 
característica es que el documento no tiene que 
ser desencuadernado para ser escaneado.
Esta fase tiene una índole técnica muy 
importante, por lo que es necesario realizar 
durante la misma las siguientes tareas:

• Definir el formato del fichero que contiene la 
imagen digitalizada del documento original 
en papel. 
• Establecer los parámetros de digitalización 
(resolución, profundidad de bits, etc.).
• Garantizar el equilibrio entre una calidad 
visual aceptable para el usuario y el tamaño 
del fichero. 
• Decidir si se va a crear un único fichero (con 
una o varias páginas) por cada documento 
original o varios ficheros (una por cada 
página). Para la carga de un documento en el 
Repositorio Digital es recomendable que el 
formato final del mismo sea un PDF (multi
páginas).
ESCANER ATIZ BOOKDRIVE PRO
La captura de las imágenes en el escáner ATIZ se la 
realiza en el formato RAW,  dicho formato (a ser 
entendido como "formato de imagen sin 
modificaciones"), es un formato de archivo digital 
de imágenes que contiene la totalidad de los datos 
de la imagen tal y como ha sido captada por el 
sensor digital de la cámara fotográfica.

Son archivos que tienen un peso considerable, 
pero es porque almacenan mucha más 
información de: luz, detalle y color de la imagen 
que cualquier otro formato.
6. RECONOCIMIENTO DEL TEXTO  

La fase de reconocimiento del texto está 
indiscutiblemente relacionada con la de 
digitalización y en muchos casos se realiza 
simultáneamente en el tiempo. 
El reconocimiento automático de datos que 
realizamos con los archivos digitales en Flacso
Andes, es el OCR (optical character recognition). 
En este tipo de reconocimiento se harán uso de 
técnicas para la extracción automatizada de los 
datos significativos del documento. La utilización 
de OCR, proporciona la habilidad de convertir 
imágenes de caracteres en letra de máquina, en 
caracteres capaces de ser interpretados o 
reconocidos por un ordenador. 
7. INDEXACIÓN 

En esta fase de Indexación se reúne toda la 
información identificatoria de los documentos junto 
con la información necesaria para su incorporación al 
Repositorio Digital, es decir, en esta etapa se debe 
obtener toda la información necesaria para la carga 
de la documentación en el repositorio. 
PROCESO DE CATALOGACIÓN Y CARGA DE 
ARCHIVOS DIGITALES

Para la descripción de metadatos utilizamos el 
formato “DUBLIN CORE” (DC), constituido por 
quince metadatos básicos, los cuales se dividen en 
tres apartados: Contenido (Título, Tema, 
Descripción, Fuente, Lengua, Relación, Cobertura); 
Propiedad Intelectual (Autor, Editor, Colaborador, 
Derechos); y Creación e identidad (Fecha, Tipo, 
Formato, Identificador).
DUBLIN CORE es un modelo de metadatos 
elaborado y auspiciado por la DCMI (Dublin 
Core Metadata Initiative), una organización 
dedicada a fomentar la adopción extensa de 
estándares interoperables de metadatos.
VENTAJAS DEL USO DE DUBLIN CORE

• La simplicidad
• La flexibilidad
• La interoperabilidad semántica
• Alto nivel de normalización formal
• Crecimiento y evolución del estándar a 
través de una institución formal consorciada: 
la DCMI.
• Es un formato de uso por consenso 
internacional.
REPOSITORIO FLACSO ANDES
www.repositorio.flacsoandes.edu.ec
Descripción del Fondo Ecuatoriano Republicano I
GRACIAS

También podría gustarte