Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Recomendaciones para Proyectos de Digitalizacion de Documentos PDF
Recomendaciones para Proyectos de Digitalizacion de Documentos PDF
http://creativecommons.org/licenses/by-nc-sa/4.0/
Atribución— Debe reconocer la autoría de la obra en los términos especificados por el propio
autor o licenciante.
Licenciamiento recíproco- Si altera, transforma o crea una obra a partir del material,
sólo podrá distribuir la obra resultante bajo una licencia igual a esta.
3
Archivo General de la Nación
Mercedes de Vega
Directora General
1. INTRODUCCIÓN 6
1.1 Alcance 6
2. GESTIÓN DOCUMENTAL 8
2.1 Administración documental 8
2.1.1 Digitalización para trámites y servicios 12
2.1.2 Digitalización para consulta, difusión y conservación 13
2.1.2.1 Consulta de documentación semiactiva 13
2.1.2.2 Digitalización para consulta, difusión y
conservación de documentos históricos 14
2.1.3 Digitalización con fines de contingencia y continuidad
de la operación 15
3. SELECCIÓN DE DOCUMENTOS 16
3.1 Principales razones para digitalizar 16
3.1.1 Mejorar la disponibilidad de los documentos 17
3.1.2 Preservar los documentos 18
3.2 Criterios de selección 20
3.2.1 Por el contenido de los materiales 21
3.2.2 Por la demanda de los materiales 21
3.2.3 Por el estado de conservación de los materiales 22
4. IMPLEMENTACIÓN DEL PROYECTO 23
4.1 Estructura de trabajo para la gestión de imágenes 24
5. REQUERIMIENTOS TÉCNICOS Y DE IMPLEMENTACIÓN 29
5.1 Formatos 29
5.2 Conversión 33
5.3 Control de calidad 35
5.4 Marcas de agua 37
5.5 Metadatos 38
5.5.1 Descriptivos 39
5.5.2 Técnicos 40
5.5.3 Estructurales 40
5.5.4 Administrativos 40
5.5.5 Para preservación 40
5.5.6 Derechos de autor 41
5.6 Equipo de digitalización 41
6. PRESERVACIÓN DIGITAL 45
6.1 Estrategia de preservación digital 45
6.2 Políticas de preservación digital 46
Glosario de términos 50
Bibliografía 58
1. INTRODUCCIÓN
1.1 Alcance
El presente documento contempla las líneas a seguir para desarrollar proyectos
de digitalización de colecciones que originalmente se encuentran en diferentes
soportes: papel, manuscritos, libros impresos, fotografías, entre otros; sin embargo,
Los documentos que se encuentran concluidos pasan a la tercera fase de su ciclo vital:
la inactividad. En ella los documentos pueden formar parte del Archivo Histórico o
ser eliminados, según sea el resultado de su valoración previa. A continuación, en la
Tabla 2, se muestra la vigencia que tienen distintos tipos de documentos:
Archivo contable
Acuerdo presidencial, DOF,
Documentos justificatorios 5 años
25/08/1998
y comprobatorios
Expedientes en proceso
de financiamiento de Acuerdo presidencial, DOF,
12 años
responsabilidades o 25/08/1998
procesos judiciales
Ley de Adquisiciones,
Expedientes de Arrendamientos y Servicios
3 años
adquisiciones del Sector Público, DOF,
16/01/2012
Lineamientos Generales
para la Organización
Expedientes clasificados Se adiciona un periodo igual de los Archivos de las
como reservados al de reserva Dependencias y Entidades
de la Administración Pública
Federal, DOF, 20/02/2004
Lineamientos Generales
para la Organización
Documentos que hayan sido Dos años adicionales a la
de los Archivos de las
objeto de solicitudes de conclusión de su vigencia
Dependencias y Entidades
acceso a la información documental
de la Administración Pública
Federal, DOF, 20/02/2004
La Tabla 3 muestra, de forma general, las fases que contemplan el ciclo vital de los
documentos.
PRIMARIO:
Institucional,
• Administrativo Institución Archivo de
Activa de consulta
• Fiscal o contable productora trámite
frecuente
• Legal o jurídico
PRIMARIO: Institucional,
• Administrativo de consulta Institución Archivo de
Semiactiva
• Fiscal o contable ocasional productora concentración
• Legal o jurídico (esporádica)
SECUNDARIO: Investigador
Difusión e Archivo
Inactiva • Evidencial Público en
investigación histórico
• Testimonial general
El contenido puede ser obtenido, en forma expedita, desde cualquier lugar del
mundo y a cualquier hora, sin necesidad de emplear personal.
Al tener organizada la información, los interesados pueden buscar documen-
tos, hacer referencias cruzadas sobre éstos, definir filtros, etcétera, con el fin
de obtener sólo los materiales que necesiten, en muy poco tiempo.
Si se cuenta con una colección notable, única o muy difícil de encontrar, ha-
cerla disponible digitalmente al público mejora, de manera considerable, el
prestigio de la institución y promueve líneas de investigación que, con anterio-
ridad, se encontraban limitadas a un número reducido de personas.
La accesibilidad a los documentos genera un incremento del número de usua-
rios potenciales.
Es congruente con otras iniciativas de digitalización nacionales o gremiales.
Documentos raros, únicos o frágiles; archivos y otros objetos con alto valor de
construcción que deben ser resguardados en su forma original. La conversión
digital puede generar sustitutos de alta calidad, los cuales permiten un acceso
amplio que, en la mayoría de los casos, va a prevenir la manipulación del
material. Estos documentos no siempre podrán digitalizarse en su estado
actual, por lo tanto pueden requerir una estabilización previa.
Con los objetivos del proyecto de digitalización y la selección del material, se estable-
cerá el alcance del mismo. Las especificaciones y costos del proyecto se definirán
con precisión, incluyendo cada una de las etapas del proceso. Es preciso prevenir la
adición de tareas extras o materiales no presupuestados en un inicio.
La planificación detallada para la viabilidad de un proyecto de digitalización debe
estar precedida por un riguroso análisis tanto legal, de costo-beneficio y de tiempo.
En éste se deben indicar claramente los beneficios esperados frente al costo de la
inversión a realizar; se indicarán, también, los recursos de presupuesto necesarios
para adelantar los proyectos correspondientes, tanto en materia de organización de
los documentos como en los procesos tecnológicos inherentes a la captura de las
imágenes, construcción de los índices y control técnico de calidad, actividades que
pueden demandar buena parte del presupuesto asignado al proceso de digitalización.
Además, se debe tomar en cuenta el proceso de captura de metadatos.
Algunas tareas involucradas en un proyecto de digitalización pueden no ser
obvias o ser específicas de una institución, y por lo tanto deben identificarse y
agregarse al plan del proyecto; de otra forma, causarán problemas de presupuesto
y fechas de entrega. Algunas de estas tareas pueden incluir:
Duración del proyecto: inicio, ejecución y fin del proyecto. Éste debe ser muy
claro y contener cualquier relación que se tenga con otros proyectos.
Tiempos: planear los tiempos de forma realista para cada una de las activida-
des a realizar; es importante asignar tiempo extra para posibles problemas,
definidos en el análisis de riesgos.
Análisis de tareas: identificar las tareas que no son obvias y tener claro que
pueden surgir más a lo largo de la ejecución, por lo tanto, hay que buscar la
forma de acomodarlas dentro del plan.
Personal: asegurar que el equipo de trabajo está capacitado para efectuar
las tareas asignadas, así como cumplir los tiempos asignados al proyecto; es
posible que se deba asignar tiempo extra para capacitación y tomar en cuenta
la curva de aprendizaje.
Control de calidad: las imágenes digitales cumplirán con ciertos estándares;
dentro del plan se debe asignar tiempo para actividades de control de calidad,
las cuales incluyan no sólo la revisión de las imágenes, sino también de los me-
tadatos que las acompañan.
Análisis de riesgos: generar un análisis de riesgos en el cual se especifiquen
tanto los posibles problemas que puedan surgir durante la ejecución del
proyecto, como las estrategias a seguir para solventarlos.
Las decisiones de calidad y resolución de las imágenes deben estar basadas en las
necesidades de los usuarios, en el uso que se les va a dar a éstas y en la naturaleza
de los materiales que se van a digitalizar (dimensiones, color, rango tonal, formato,
tipo de material, etcétera). La calidad y condición del documento original van
a determinar directamente la resolución en la cual se va a digitalizar, así como la
calidad de la imagen digital.
En este sentido, lo primero que debemos preguntarnos es “¿qué nos interesa?”;
dependiendo de la respuesta se pueden dar los siguientes casos:
Para cualquiera de las tres opciones se deberán generar metadatos que acompañen
a la digitalización. Este tema se desarrolla más adelante en el punto 5.5. “Metadatos”.
5.1 Formatos
El formato del archivo es el factor principal al crear o almacenar contenidos digitales
a futuro; por ello se deben utilizar formatos estándares, que sean ampliamente
utilizados y no tengan mucha probabilidad de ser descontinuados.
Sin propietarios.
De estándar abierto documentado ( , , ).
Utilizados comúnmente por la comunidad de investigadores.
Sin cifrado.
Sin compresión.
PDF/A
El (Portable Document Format) es uno de los mejores formatos para preservar
documentos electrónicos y asegurar su supervivencia en el futuro. Se sugiere
utilizar / (Archival) —Norma 19005— para archivar documentos con fines
de preservación, pues contiene todos los elementos necesarios para reproducir el
contenido tal como se generó, independientemente de las herramientas y sistemas
utilizados para su producción, almacenamiento y reproducción.
Se recomienda utilizar el formato / cuando se quiere digitalizar textos o
una mezcla de textos e imágenes. Es importante pasar la imagen por un proceso
, el cual extrae el texto y lo pone detrás de la imagen, permitiendo indexar el
documento y hacer búsquedas sobre éste. El formato o / permite también
la construcción de objetos complejos de múltiples páginas, como libros, periódicos
o diarios.
TIFF
El (Tagged Image File Format) es un formato de imágenes flexible, altamente
portátil, ampliamente aceptado, de estándar abierto y considerado el estándar
profesional de imágenes, los archivos pueden utilizar compresión sin pérdidas,
pero esto resulta en imágenes que utilizan mucho espacio de almacenamiento.
El formato generalmente se utiliza para la creación de archivos maestros
de imagen, ya que está conformado por múltiples páginas para tener una secuen-
cia de imágenes de alta calidad. Su amplio uso a lo largo de los años supone que va a
seguir estando soportado por mucho tiempo; sin embargo, en diversos aspectos se ha
quedado rezagado, debido a que no se ha seguido desarrollando. Este formato tiene
variantes que difieren principalmente en los métodos de compresión.
Tradicionalmente algunas instituciones han optado por almacenar sus imágenes
utilizando archivos sin compresión y sin pérdidas, ya que se considera como
la mejor manera de preservar las características esenciales de un documento al
ser digitalizado; con todo, para proyectos grandes de digitalización, utilizar un
JPEG-2000
2000 es un estándar de compresión y codificación digital de imágenes de
propósito general. Fue creado por el Joint Photographic Experts Group (Grupo
Conjunto de Expertos en Fotografía o ) en 2000, con la intención de sustituir el
formato original creado en 1992.
Al utilizar compresión, una imagen digitalizada y almacenada en este formato
ocupa mucho menos espacio sin sacrificar calidad. Entre sus características
principales se encuentran las siguientes:
Diversas instituciones en todo el mundo han optado por almacenar sus archivos
maestros utilizando la compresión 2000, sobre todo cuando se trata de coleccio-
nes grandes y se quiere utilizar el mismo archivo tanto para preservación como para
acceso, aplicando el principio de “digitalizar una vez, utilizar para muchos propósitos”.
Algunas organizaciones utilizan la compresión 2000 sin pérdidas, pero
cada vez es más frecuente utilizar 2000 con pérdidas, buscando que la imagen
se considere “visualmente sin pérdidas”. En general, 2000 se elige buscando
maximizar los costos de almacenamiento sin sacrificar prácticamente la calidad.
5.2 Conversión
Se le llama conversión al proceso por el cual pasan los archivos físicos originales
al ser digitalizados, es decir, convertidos a formato digital utilizando un dispositivo
— escáner o cámara digital—, cuyo resultado es un archivo digital de imagen maestra.
Ésta debe ser una representación visual del objeto original lo más exacta posible que
sirva para las necesidades de la institución; en este sentido, se debe entender que la
solución no es capturar una imagen con la más alta calidad posible, sino evaluar
el contenido del documento original y decidir la calidad de la imagen a utilizar al
realizar la digitalización.
Como un primer paso en este proceso, se analizan los atributos de los documentos
originales; éstos pueden diferir en cuanto a dimensiones, rango de colores o la forma
en la que fueron producidos: a mano, con una imprenta, por medio de una cámara
fotográfica, medios electrónicos, etcétera.
El estado de conservación de los documentos puede afectar el proceso de
conversión, por eso es importante identificar si existe la necesidad de realizar una
5.5 Metadatos
El término “metadato” se utiliza para incluir los principios descriptivos de
catalogación en archivos digitales, así como información necesaria para obtención,
acceso y gestión de esos archivos. Crear metadatos de calidad es componente clave
para la gestión responsable y la preservación a largo plazo de los archivos digitales
que genere el proyecto.
Una imagen digitalizada no se puede considerar de alta calidad a menos de que
se le asocien metadatos al archivo digital. Éstos hacen posible la ejecución de fun-
ciones clave, por lo cual están asociados, directamente, con la mayoría de los pasos
que sigue un flujo de trabajo en un proyecto de digitalización: nombramiento de
archivos, captura, procesamiento, control de calidad, rastreo de producción, diseño
de búsquedas y obtención de archivos, almacenamiento y gestión a largo plazo;
es decir, diferentes tipos de metadatos deben ser agregados por distintas personas
en las etapas del ciclo de vida de la imagen digital. A pesar de que su producción
puede ser costosa en tiempo y recursos, los metadatos son indispensables para los
5.5.1 Descriptivos
Se refieren a la información que identifica un recurso, describe su contenido y su
relación con otros recursos dentro de una jerarquía. Sirven para ayudar a encontrar
y obtener documentos, distinguir entre unos y otros, así como para descubrir su
tema o contenido. Además de información bibliográfica, también puede describir
atributos físicos del documento, como tipo, dimensión, condición, etcétera; esta
información generalmente es almacenada fuera del archivo de imagen dentro de una
base de datos. Ejemplos: título, fecha del documento, descripción.
5.5.3 Estructurales
Contemplan las relaciones entre múltiples archivos digitales, permitiendo a los
usuarios recorrer objetos complejos como pueden ser las páginas y capítulos de un
libro. Una de sus funciones principales es permitir el despliegue y la navegación,
usualmente por medio de una aplicación con cambio de páginas, indicando la
secuencia de imágenes. Ejemplos: tabla de contenidos, página, capítulo, volumen.
5.5.4 Administrativos
Se utilizan generalmente para la gestión interna de recursos digitales y pueden
incluir información de derechos o de reproducción, otros requerimientos de acceso,
criterios de selección o políticas para archivar el contenido digital, rastros de
auditorías, identificadores, metodología o documentación del proceso de captura,
información acerca de los documentos fuente, etcétera. En general, contemplan las
necesidades locales administrativas de un proyecto o institución. Ejemplos: fecha de
captura, proveniencia (historia), revisiones de integridad del archivo.
Equipos de escaneo
Escáner de cama plana: este equipo es uno de los más populares, y es utilizado
ampliamente en bibliotecas, archivos y museos. Dependiendo de la condición
y el formato del material seleccionado, un escáner de cama plana puede ser
empleado para digitalizar material bidimensional, como documentos en papel,
fotografías, material impreso, entre otros. Este dispositivo no es recomendable
para obras de arte originales, incluyendo impresos de arte. Con este tipo de
equipo, es importante considerar el área de escaneo, debido a la diversidad en
las dimensiones de los materiales que se requiere digitalizar, pues en algunos
casos será necesario contar con un área de escaneo más grande que en otros.
Algunos modelos cuentan con accesorios disponibles, como adaptadores
para transparencias o alimentadores automáticos de documentos. Utilizar
un escáner de cama plana para digitalizar cintas de película puede causar
Las políticas también van a servir como documento de autoridad para quienes harán
la labor de preservación digital, en términos de:
La infraestructura técnica.
Los formatos digitales de las colecciones, medios de almacenamiento,
metadatos, origen y condición de los originales.
Necesidades
Identificar las necesidades de preservación digital, basadas en la evaluación de
riesgos de la institución.
Metas y objetivos
Desarrollar metas y objetivos basados en las declaraciones de misión o propósito de
la organización.
Compromisos financieros
Listar los recursos financieros que van a ser necesarios para lograr las metas y
realizar los proyectos.
Personal
Hacer una lista del personal clave involucrado y los roles a desempeñar.
Metadatos de preservación
Crear una frase que muestre la creación y el uso de metadatos de preservación.
Funciones y responsabilidades
Definir las funciones y responsabilidades de los participantes en la preservación
digital a largo plazo.
Capacitación
Describir los compromisos de la institución y los planes de capacitación y
entrenamiento del personal que trabaja en la preservación digital.
Evaluación y actualización
Describir el tiempo en el que se hará una revisión del plan de preservación digital.
Foliación. Es la numeración de todas y cada una de las fojas que integran el expediente.
Se hará al término de la organización, es decir, una vez que la clasificación y la
ordenación sean definitivas, iniciando en cada expediente con el uno en la primera
foja y hasta el número que se llegue dentro de ese expediente.
Validez. Atributo de documento electrónico que posee los mismos efectos jurídicos
que el documento escrito y firmado ológrafamente en soporte papel.
Valor fiscal. Utilidad o aptitud que tienen los documentos para la Hacienda Pública.
Valor jurídico o legal. Valor del que se derivan derechos y obligaciones legales,
regulados por el derecho común y que sirven de testimonio ante la ley.
Kenney, Anne R., Rieger, Oya Y. y Entlich, Richard. “Moving Theory into Practice. Digital
Imaging Tutorial”. Ithaca, N.Y.: Cornell University Library, Research Department,
2003. Disponible en: http://www.library.cornell.edu/preservation/tutorial/
[Consultado 29 de junio de 2014].
Library of Congress. “Metadata Encoding & Transmission Standard. Mets Tools &
Utilities”. Disponible en: http://www.loc.gov/standards/mets/mets-tools.html
[Consultado 29 de junio de 2014].
The National Archives. Digital Preservation Policies: Guidance for Archives. United
Kingdom: The National Archives, 2011. Disponible en: http://www.nationalarchives.
gov.uk/documents/information-management/digital-preservation-policies-
guidance-draft-v4.2.pdf [Consultado 1 de julio de 2014].
Karla Youngs, Managing the Digitisation of Library, Archive and Museum Materials,
United Kingdom: National Preservation Office, 2011. p. 24.
Schreibman, Susan (ed.). “Best Practice Guidelines for Digital Collections at University
of Maryland Libraries”. 2ª ed., Office of Digital Collections and Research, University of
Maryland, College Park, Maryland, 2007. Disponible en:
http://ourdigitalworld.org/wp-content/uploads/2012/04/
DigitizationBestPractices_Schreibman.pdf [Consultado 29 de junio de 2014].
U.C. Berkeley Library. Library Systems Office: Imaging Best Practices. Disponible en:
http://www.lib.berkeley.edu/digicoll/bestpractices/image_bp.html [Consultado 29
de junio de 2014].
Elaboración de textos
Sebastián Alcérreca Alcocer y Erick Cardoso Espinoza,
con la colaboración de Claudia López Iglesias y Alexandra Trejo Galindo
Diseño y formación
Elisa Cruz Cabello
Corrección de estilo
Roberto Del Vecchyo Calcáneo
María del Carmen Gutiérrez Haces
Francisco Javier González Ruiz
El libro Recomendaciones para proyectos de digitalización de documentos,
versión electrónica, fue editado en julio de 2015.