Está en la página 1de 56

GUA DE PROCEDIMIENTOS

DIGITALIZACIN EN ARCHIVOS
UNA APROXIMACIN AL TEMA

GUA DE PROCEDIMIENTOS

DIGITALIZACIN EN ARCHIVOS
UNA APROXIMACIN AL TEMA

LEONARDO GUZMN

SAMIUEL MORENO ROJAS


Alcalde Mayor de Bogot, D.C

YURI CHILLN REYES


Secretario General

LUIS MIGUEL DOMNGUEZ GARCA


Subsecretario General

GERMN RODRIGO MEJA PAVONY


Director Archivo de Bogot
AUTOR Leonardo Guzmn EDICIN Y COORDINACIN EDITORIAL Bernardo Vasco Fabio Lpez LECTORES: Germn Rodrigo Meja Pavony Gloria Rendn Cuartas Margoth Guerrero FORMATOS Sistema de Informacin de Archivos del Archivo de Bogot DIAGRAMACIN Y ARMADA ELECTRNICA Bernardo Gonzlez Gonzlez DISEO DE CARTULA Gyzela Giraldo Fernndez Sandra Barbn FOTOGRAFA Fabio Lpez Surez SUBDIRECCIN IMPRENTA DISTRITAL - D.D.D.I. Impresin ISBN: 978-958-98352-0-3 Primera edicin 250 ejemplares 2008 Alcalda Mayor de Bogot Impreso en Colombia

* La presente gua tuvo como base los siguientes documentos: Gua prctica para la organizacin de los fondos documentales acumulados de las entidades del Distrito Capital, escrita por los asesores archivistas Julio A. Parra, Elizabeth Corts, Cecilia Chvez, Heisy Surez y Richard Lpez en el ao 2001. Y el documento Fondos documentales acumulados. Documento de trabajo, escrito por la coordinadora de investigaciones Bertha Duque Gmez en el ao 2002.

CONTENIDO

PREFACIO INTRODUCCIN LA SELECCIN DE DOCUMENTOS COMO CRITERIO No todo lo anlogo tiene que ser convertido a digital! METADATOS: LA DESCRIPCIN DOCUMENTAL CONCEPTOS DE INTERS Base de datos descriptiva ndices frente a descripcin archivstica Unidad bsica de informacin Unidad de servicio Banco de imgenes visuales Campos de enlace POLTICA DE DIGITALIZACIN Caractersticas de los documentos Clases de equipos Escner de cama plana Escner de alimentacin automtica Escner de tambor Cmara digital Escner de planos Escner de transparencias y diapositivas Escner de microfilmes Sistemas hbridos digital-microfilm Eleccin de un escner Tipo

9 11 15 15 19 23 23 23 24 25 25 26 27 27 28 28 29 30 30 31 31 32 32 33 34
7

| GUA PARA LA ORGANIZACIN|

Capacidad de formatos / soportes Velocidad Mtodos de captura Productividad diaria Tipo de interfaz (driver) Ergonoma Software de captura

34 35 35 36 36 37 37

CARACTERSTICAS TCNICAS DE LAS IMGENES Concepto Modalidad Pxel Resolucin Dimensiones de pxel Profundidad de bit Compresin Calidad Formato de archivo AUTOMATIZACIN Estructura de almacenamiento Ruta Nomenclatura de ficheros y carpetas Almacenamiento fsico Caractersticas tcnicas Acceso COMPONENTES DE LA IMAGEN DIGITAL Infraestructura tecnolgica Migracin Administracin Uso y explotacin Presentacin de las imgenes Calibracin de monitores Integracin y puesta en marcha LA PRESERVACIN DIGITAL BIBLIOGRAFA
8

39 39 39 40 40 40 40 41 41 42 43 43 44 44 44 45 45 47 47 47 48 48 48 49 49 51 57

PREFACIO

Gracias a la ingente cantidad de fuentes de que dispone la sociedad, especialmente la red de redes, existe sin duda la posibilidad de encontrar muchos textos e informacin orientada a la digitalizacin. Sin embargo, la intencin general y los apartados suscritos en este documento tienen un fin particular que se orienta al establecimiento de la digitalizacin de imgenes para convertir y hacer accesibles los materiales del patrimonio cultural, naturales en los repositorios documentales de archivo. No obstante las posibilidades tcnicas que permiten la conversin de casi cualquier documento a formato digital, es importante rescatar que el enfoque aqu presentado hace nfasis en la migracin del soporte papel, sin que signifique necesariamente que los dems medios que contienen informacin archivstica se encuentran excluidos. Se enfatizan las caractersticas de este soporte por ser el ms ampliamente utilizado en los repositorios documentales y por convertirse, finalmente, en el de mayor volumen, que demanda atencin inmediata y sobre el cual se estn aplicando la mayor cantidad de acciones de conversin digital. Ningn archivo puede ser ajeno a la necesidad de un acercamiento integrado a los programas de digitalizacin de imgenes, vistos desde la seleccin y acceso, pasando por la gestin y trmite, para finalmente observar la conservacin y la disponibilidad del documento en el futuro lejano. Los archivos custodian generalmente documentos de carcter nico y el volumen de estos materiales es, y crece, de manera significativa da a da. Las instituciones encargadas de custodiar la memoria colectiva tienen la responsabilidad no solo de difundir este patrimonio para los usuarios actuales, sino de preservarlo para las generaciones futuras, hacindolos accesibles y con posibilidad de uso, siendo consecuentes con la interpretacin de esas nuevas formas y estndares en que se manifiestan los documentos en la era de la informacin.
9

| GUA DE PROCEDIMIENTOS |

Cualquier iniciativa digital emprendida por un archivo, debe estar enmarcada en un patrn de referencia. Comnmente tendrn que crear las poltica de digitalizacin, entendidas como los parmetros institucionales en donde se establecen principios, caractersticas tcnicas, justificaciones y orientacin general del proyecto digital, a fin de garantizar no solo la continuidad desligada de los protagonistas (recurso humano, software y/o hardware), sino la facilitacin de reingeniera de procesos, propios del entorno tecnolgico de la sociedad moderna. Este documento, por tanto, no es otra cosa que una primera aproximacin al tema, visto no con los ojos de la tecnologa informtica que se involucra, sino con una percepcin de las necesidades primarias de los archivos y los archivistas, como responsables de la custodia, el acceso y la preservacin de las colecciones. Si bien es cierto que se incorporan textos con enunciados tcnicos en relacin con las imgenes digitales, el objetivo est lejos de convertirse en una herramienta especializada para determinar alcances de un desarrollo informtico que identifique condiciones, caractersticas, principios y funcionalidades de las imgenes digitales. No es, tampoco, un documento conceptual que describa procedimientos archivsticos de manera profunda. Se trata, eso s, de un esfuerzo que plantea la necesidad de involucrar en un contexto integrado, los elementos de forma y fondo, que permitan adelantar procesos de digitalizacin de documentos de archivo, promoviendo el respeto por los principios y fundamentos de esta disciplina documental y planteando cmo las imgenes digitales pueden ser convertidas en un valor agregado de la tecnologa y no en un fin ltimo de la automatizacin de archivos.

10

INTRODUCCIN

Las grandes ventajas que ofrece la tecnologa digital para hacer frente a los retos impuestos a la archivstica moderna, se ven como obvias. La imagen digital es hoy una herramienta alternativa para difundir el contenido informativo de los archivos, permitiendo que las colecciones documentales estn fuera del alcance fsico de las nocivas manipulaciones de que son objeto, por su razn de ser. Si bien es cierto cualquier esfuerzo por transformar la realidad que han vivido los archivos descuido, desatencin, imposibilidad de uso, falta de mecanismos de preservacin es importante, tambin lo es el hecho de que una tecnologa digital implementada por fuera del marco de referencia archivstico, puede ser ms perjudicial que beneficiosa para los documentos. Establecer procedimientos digitales a partir de una poltica de organizacin documental previa, parece ser el nico esquema funcional viable de aplicacin en los archivos, salvo contadas excepciones que deben ser analizadas en entornos particulares. La importancia que cobra la organizacin archivstica en su conjunto, cuando se pretende realizar implantaciones tecnolgicas de imagen digital, es vital para la garanta de xito de un proyecto de esta naturaleza. Desde el punto de vista metodolgico, todo archivo que pretenda vincular a su operacin imgenes digitales, debe garantizar documentos preparados previa y suficientemente, con el fin de encontrar en la tecnologa una representacin de dicha organizacin y no por el contrario, el substituto tecnolgico de una administracin documental deficiente y carente de servicio. No es prudente, por tanto, promover la informatizacin de acervos desorganizados y carentes de acceso, sin posibilidad de uso de la informacin. La presente Gua se relaciona con el acercamiento a los aspectos tcnicos de la digitalizacin de imgenes, pero resulta necesaria la reiteracin marcada sobre entender la digitalizacin como un complemento facilitativo al cumplimiento de los
11

| GUA DE PROCEDIMIENTOS |

objetivos misionales de los archivos y no como un fin ltimo de los mismos. Ha de persistir la necesidad de que los archivos y sus polticas apliquen procesos y actividades a sus documentos, para convertirlos como reto, en los nuevos centros de informacin, alejados de la condicin peyorativa que los identifica como depsitos de papel. Si un archivo no est en capacidad de dar acceso y controlar la documentacin que custodia, es efectivamente un simple repositorio. El desafo consiste precisamente en convertir los depsitos de papel en centros de informacin, haciendo acopio e integracin de la disciplina archivstica de la mano de la tecnologa digital. Negar las bondades que la tecnologa aporta en cualquier campo de la accin humana es absurdo; los archivos como disciplina social requieren que esas aportaciones sean estructuradas de manera engranada, como parte de un programa metodolgico de organizacin fsica e intelectual de los documentos. Este es el principal aporte que pretende rescatar el trabajo que aqu se presenta. En el primer captulo se identifican algunos elementos que debern ser tenidos en cuenta para priorizar qu, de todo lo anlogo, debe convertirse a digital. Los programas de reproduccin documental son costosos en implementacin, operacin y sostenibilidad; un archivo que planee su proyecto de digitalizacin reducir no solo la inversin econmica, sino que podr brindar en el corto tiempo un servicio de consulta optimizado, identificando con criterios de seleccin los documentos que en prioridad ingresarn al sistema. En el captulo siguiente, Metadatos: la descripcin documental, aparecen recapituladas las tendencias normativas de carcter internacional ante las cuales ningn archivo puede ser ajeno. Hablar de la descripcin parece no tener relacin con nuestro tema digital, sin embargo, es la descripcin documental la que se beneficia de la tecnologa digital de imagen; es la descripcin documental la que se enriquece con el valor agregado de las imgenes y no, por el contrario, la imagen la que se ve beneficiada al contar con unos mecanismos de acceso. Aparece luego el captulo denominado Conceptos de inters que enfoca su desarrollo en la interaccin entre bases de datos descriptivas y algunas de las interpretaciones sobre conceptos archivsticos, que trata de canalizar la forma correcta como se relacionan con proyectos de imagen digital. La Poltica de digitalizacin centra gran parte de atencin de la cartilla y conforma el captulo siguiente. Un sistema de referencia general conceptual y tcnica, pare-

12

| DIGITALIZACIN EN ARCHIVOS |

ce ser un vaco institucional que requiere ser evaluado porque muchos proyectos digitales estn siendo dirigidos ms por un afn desmedido en el uso de la tecnologa, acompaado lgicamente de un proveedor de soluciones, que por una necesidad archivstica de acceso, difusin y preservacin de informacin. Los anlisis documentales que se plantean en este captulo no son los nicos y muchos menos los suficientes; son tan solo los primeros referentes, los de mayor incidencia en el proyecto y, desafortunadamente, los que con frecuencia son ignorados, o por lo menos no evaluados, al momento de planear iniciativas digitales. Algunas de las ms importantes caractersticas tcnicas de las imgenes son tratadas en el captulo siguiente. Parece oportuno y necesario que a travs de un lenguaje sencillo haya comunicacin y entendimiento entre tcnicos y archivistas que sin invadir competencias, puedan generar conjuntamente espacios de reflexin que satisfagan intereses y conveniencias mutuas. Este captulo, que comienza con una definicin bsica de qu son las imgenes digitales, introduce los aspectos esenciales para la conformacin de los apartados tcnicos de las polticas de digitalizacin, permitiendo, dimensionar los requerimientos infraestructurales y de almacenamiento, propios de los proyectos de imagen digital. La automatizacin, en el captulo 6, plantea algunas necesidades de software para masificar los proyectos de digitalizacin. Porque no hay archivo pequeo, es importante lograr una certeza de produccin, basada en las capacidades fsicas, lgicas y operacionales del proyecto de digitalizacin. La interconexin de equipos y la interoperabilidad de redes, son elementos que nos indican las acciones preliminares para conocer cmo automatizar. Los estudios alusivos al tema siempre manifiestan qu se debe hacer para automatizar archivos, pero en contadas excepciones nos indican cmo, y particularmente los elementos bsicos para hacerlo. El captulo 7 establece de manera resumida y mnima, las bases integrales de los Componentes de un proyecto de imagen digital. Finalmente una reflexin que preocupa a la comunidad mundial: La preservacin digital. Este captulo introduce temas de vital importancia para la funcin archivstica, especficamente lo relacionado con la conservacin de informacin en soportes informticos. Hace alusin a las iniciativas emprendidas por la Unesco, a travs del programa Memoria del Mundo, que demuestra la desatencin global que existe sobre este reto archivstico y plantea algunas acciones preliminares a travs de las Directrices de Preservacin Digital.

13

LA SELECCIN DE DOCUMENTOS COMO CRITERIO

NO TODO LO ANLOGO TIENE QUE SER CONVERTIDO A DIGITAL!


La disciplina archivstica dej de atrs una definicin que estableci durante mucho tiempo, la limitada condicin de guardar. A pesar de la sinonimia existente entre archivar y guardar, el segundo concepto es ampliado por la teora que indica la necesidad de guardar para el cumplimiento de propsitos especficos: difundir y conservar. Un archivo que no sirva para mostrar el contenido de sus fondos, que est sin posibilidad de difundir su acervo, sin capacidad de conservar la riqueza informativa para generaciones futuras, merece el apelativo de dposito de papel. La digitalizacin como herramienta de reprografa busca, precisamente, ayudar a que el valor informativo de los materiales pueda darse al servicio, velando simultneamente porque los documentos originales estn lo ms alejados posibles de la nociva manipulacin causada por la consulta. Hace un par de dcadas el concepto de archivo fue redefinido y ampliado, convirtiendo la disciplina en una actividad dinmica, relacionada como un sistema, con esquemas funcionales asociadas a procesos institucionales, particularmente caracterizada por un ciclo de vida. Los documentos fueron vistos desde entonces, como una representacin de las actividades creadas por entes jurdicos o personales, en virtud de unas funciones o actividades interconectadas en etapas que fluan naturalmente a travs de una cadena de procesos, en permanente dependencia con la identificacin de los valores que posean. El ciclo vital de los documentos, como parte de la interpretacin moderna del concepto de archivo, permitir finalmente, que cualquier proyecto de digitalizacin tenga caractersticas especficas dependiendo de la etapa en que sea aplicado. No se tendrn las mismas consideraciones para digitalizar un documento perteneciente a la fase de gestin, que con un material de valor adicional, constitutivo de la fase histrica.
15

| GUA DE PROCEDIMIENTOS |

Si bien los proyectos digitales en archivos deben propender porque la aplicacin tecnolgica involucre las tres etapas de ciclo vital del documento, no es frecuente que las posibilidades econmicas y tecnolgicas siempre permitan hacerlo. Muchas instituciones tienen que iniciar con proyectos de cubrimiento especfico y delimitado. Esta intervencin parcializada, que es una realidad en nuestro medio, debe estar provista de una aplicacin estricta de los instrumentos archivsticos y caractersticas tcnicas de las imgenes, relacionadas con las expectativas de vida, la frecuencia de consulta, las condiciones fsicas del soporte, etc., entre otras muchas variables, asociadas particularmente a la etapa del ciclo vital del documento que se quiere afectar. Conceptos como el de Archivo Total y programa de Gestin Documental, parecen hoy ms que nunca tomar equivalencias aproximadas. El archivo total puede ser entendido como la acumulacin de documentos que fluyen a travs del ciclo de vida, con control y seguimiento en trmite, desde el momento de su produccin, hasta la eliminacin o conservacin permanente. La Unesco plantea el Programa de Gestin Documental, dndole a este trmino una definicin muy sencilla que aclara el alcance en la prctica profesional: Esfera de la gestin administrativa encaminada a conseguir la economa y la eficacia de las operaciones con vista a la creacin, mantenimiento, utilizacin y por ltimo a la eliminacin de los documentos o a su conservacin definitiva durante su ciclo vital1. Dentro de las nuevas apreciaciones del concepto de archivo, una accin tecnolgica que involucra la conversin de imgenes, debe ser delineada con caractersticas que satisfagan las necesidades documentales de acceso y conservacin, por y para materiales archivsticos en una determinada fase del ciclo vital de los documentos, siendo de aplicacin general algunos criterios que se mencionan en este apartado. En el campo de los archivos ha de diferenciarse con la fundamentacin suficiente, la seleccin del material que entrar a formar parte del sistema de objetos digitales que prestarn servicio documental, particularmente a travs de las imgenes escaneadas. Anteponer al acceso a la preservacin es un error. Los materiales de archivo, por percepcin de carcter general, han sido identificados como objetos de poca importancia y sin mayor representacin de inters, lo que regularmente ocasion descuido y desatencin. Materiales afectados fsicamente, en riesgo de desaparecer, tienen que ser intervenidos de manera previa a la puesta en servicio. Todo el material archivstico que se encuentre en condiciones fsicas que impidan su manipulacin y uso, son candidatos a ingresar al sistema digital, como substitutos informativos del contenido de los documentos.
1

Gestin Documental: Bases para la elaboracin de un programa / Grupo de Archivo y Correspondencia. Bogot, Archivo General de la Nacin. 1996.

16

| DIGITALIZACIN EN ARCHIVOS |

La riqueza2 documental del acervo es un criterio de seleccin que se conjuga con el movimiento de fondos y la consulta de materiales, para determinar la prioridad de ingreso de las imgenes al sistema de informacin. Digitalicemos poco, cubriendo los ms amplios espectros de demanda en consulta. De conformidad con las estadsticas de uso, este criterio de seleccin permitir identificar que con tan solo algunos cientos de miles de imgenes puedan ser satisfechas un alto porcentaje de consultas de informacin. En los archivos, como en cualquier mbito documental, el acceso a los materiales se lleva a cabo a partir de consultas de referencia basados en sistema de descripcin. Es importante la existencia de obras de referencia anexas a sistemas de organizacin fsica e intelectual de los documentos, antes de proceder operativamente con la digitalizacin de imgenes. Estas actividades de carcter archivstico son los instrumentos que dan sustento y conforman el rbol de digitalizacin de imgenes, reflejando la estructura organizacional del fondo documental que se digitaliza y permitiendo la posterior navegacin a travs de los cuadros de clasificacin documental. Se trata de procesar documentos de archivo con una poltica que represente las unidades de servicio y grupos y niveles de descripcin establecidos por criterios institucionales. La gua, el inventario general, el inventario esquemtico, los catlogos e ndices, son las hojas de ruta para obtener una representacin digital de un fondo documental organizado. Por otra parte se debe insistir en el criterio estadstico de consulta y movimiento de fondos, as como en el anlisis sobre las tendencias investigativas, que sern fundamentales a la hora de decidir el orden con que debe procesarse digitalmente la documentacin del archivo. Los procesos de migracin digital son costosos en trminos econmicos, operacionales y cronolgicos. Un archivo que establece elementos que le permitan decidir qu debe entrar al sistema digital de imgenes, cuando debe hacerlo, cual es la prioridad, qu ganancia investigativa se obtiene, etc., es un archivo que planea exitosamente su proyecto digital. Estos cuatro criterios estado fsico de la documentacin, riqueza histrica e investigativa, existencia de instrumentos de recuperacin y estadsticas de consulta aunque no son las nicas, si constituyen los primeros elementos que se deben tener en cuenta de cara a la implementacin de sistemas de imagen digital para documentos de archivo, implementados con polticas de austeridad y servicio efectivo.
2

El trmino se utiliza en un contexto general, conociendo la subjetividad que conlleva, pero queriendo indicar que el material es representativo en cualquiera de las expresiones en que sea consultado y por tanto lo reviste de especial importancia para ser difundido y conservado.

17

METADATOS: LA DESCRIPCIN DOCUMENTAL

Identificar y explicar el contexto y contenido de los documentos de archivo con el objetivo de hacerlos accesibles, es la finalidad de la descripcin archivstica. Para poder hacer consultable un documento, es necesario elaborar unas representaciones precisas y adecuadas que identifiquen elementos especficos de informacin, preferiblemente de acuerdo con modelos predeterminados de uso general. La comunidad archivstica desde hace un par de dcadas se ha preocupado por estandarizar los procesos descriptivos, persiguiendo la realizacin universal de descripciones coherentes, pertinentes y explcitas; normas que apuntan con una intencin clara de facilitar la recuperacin y el intercambio de informacin sobre documentos de archivo; instrumentos que permiten compartir datos de autoridad; en fin, procedimientos que hacen posible la integracin de descripciones procedentes de distintos lugares en un sistema unificado de informacin. Una realidad que aplica en la actualidad est relacionada con las polticas de descripcin documental, en donde la comunidad internacional muestra los beneficios de haber producido estndares de descripcin archivstica que hoy ms que nunca son de amplia aceptacin. Una descripcin de documentos de archivo, soportada en el concepto Multinivel, facilita las acciones sobre el Fondo documental de cualquier institucin, estableciendo esquemas operacionales apropiados a sus necesidades particulares, a sus alcances econmicos o bien a la disponibilidad de talento humano asociado al proceso. Un archivo puede, con el uso de estos estndares, crear instrumentos de recuperacin de carcter general como las guas de archivo, los inventarios en cualquier modalidad; o bien obras especficas como los catlogos y los ndices. Cualquier nivel de descripcin utilizado por un archivo est asociado a las imgenes digitales que enriquecern el servicio documental de la institucin, convirtiendo la descripcin en el instrumento que marca la ruta para la creacin, mantenimiento y navegacin del rbol de digitalizacin de imgenes.
19

| GUA DE PROCEDIMIENTOS |

Esta informacin estructurada, que muchos denominan metadatos descriptivos, ha focalizado la atencin archivstica y gran parte de los esfuerzos de normalizacin se crean para este entorno. La Norma Internacional General de Descripcin Archivstica, conocida como ISAD(G), y su complemento ISAAR(CPF) Norma Internacional sobre Encabezamientos Archivsticos Autorizados para Entidades, Personas o Familias, son el resultado tangible de la disciplina para la normalizacin de sus actividades de descripcin. En trminos operacionales y con la visin archivstica de servicio, la imagen digital no es accesible si no cuenta con metadatos descriptivos. Pero no se trata de cualquier metadato asociado a un software de recuperacin. Es precisamente importante el manejo de metadatos descriptivos para archivos, lo que garantizar que la institucin pueda vincular sus documentos y sus imgenes a entornos internacionales y compartir sus descripciones con archivos de todo el mundo. En relacin con la imagen digital, la creacin de elementos de datos que ayudan a describir, rastrear, organizar y/o mantener una imagen, tambin se denominan comnmente metadatos, de manera ms precisa, metadatos estructurales. Mientras que los datos descriptivos se fundamentan en identificar recursos de informacin, es decir, facilitan la bsqueda y recuperacin de documentos de archivo y su contexto de creacin; los metadatos estructurales se orientan con fines de navegacin, presentacin, gestin y procesamiento tcnico. Registran rtulos de estructuracin y datos asociados a las imgenes de documentos de archivo, como el tipo y modelo de escner utilizado, resolucin con la que se ha capturado la imagen, profundidad de bit para la digitalizacin, espacio de color, formato de archivo, compresin, fuente de luz, propietario, actividades de preservacin, ciclos de actualizacin, migracin, etc. La lnea de accin en normalizacin est activa con metadatos descriptivos. Es hora de incorporar informacin estructurada para dar cubrimiento a los datos estructurales y tcnicos con fines de gestin, administracin y preservacin de los objetos digitales. No obstante la importancia de la descripcin archivstica, es importante recalcar sobre la existencia de este tipo de metadatos, no tan comunes, pero tambin necesarios para gestionar datos en un entorno informtico, como el que plantea la existencia de imgenes y digitalizacin de documentos de archivo. Como informacin de referencia se mencionan proyectos de inters para el campo de metadatos de preservacin, particularmente tiles por ser los de menor aplicacin en el entorno archivstico nacional:

20

| DIGITALIZACIN EN ARCHIVOS |

Preservation Metadata for Digital Collection Biblioteca Nacional de Australia Exemplars in Digital Archives Red Europea de Depsito Bibliogrfico Preservation Metadata: Implementation Strategies Grupo Premis Metadata Preservation Biblioteca Nacional de Nueva Zelanda

21

CONCEPTOS DE INTERS

BASE DE DATOS DESCRIPTIVA


Disponer de imgenes digitalizadas asociadas a un sistema de informacin descriptivo para archivos, es el valor agregado de la tecnologa. Hoy por hoy, la mayora de las herramientas de software que vienen integradas al hardware de digitalizacin de imgenes, estn dotadas de generadores de ndices y puntos de acceso, almacenados en un sistema de base de datos. Toda vez que los sistemas de descripcin documental estructuran la informacin de manera particular para los archivos, importante resulta que las bases de datos que asocien imgenes digitalizadas, sean diseadas de conformidad con la norma de descripcin archivstica ISAD(G), mientras que los productores del documento y, por qu no, los puntos de acceso controlados en contenido, de acuerdo con el estndar ISAAR(CPF). Parte de la misin de los archivos se concentra en disponer y hacer accesible la documentacin que conservan. Disponer de herramientas descriptivas de carcter internacional facilita el intercambio de datos y permite compartir registros de autoridad para conocer el contexto de creacin de los documentos. Ahora bien, si adicionalmente estas descripciones cuentan con la integracin de imgenes, el beneficio ser doblemente satisfactorio, ya por la inmediatez de acceso a la informacin por parte del usuario, ya por los enormes beneficios de preservacin que trae para el archivo el sacar de circulacin, sin negar la posibilidad de uso, los materiales originales.

NDICES FRENTE A DESCRIPCIN ARCHIVSTICA


Es necesario identificar la diferencia existente entre imgenes indexadas y sistemas de informacin descriptivos, con imgenes asociadas.
23

| GUA DE PROCEDIMIENTOS |

Los ndices son elementos de datos que permiten una recuperacin de objetos: descripciones, imgenes, sonidos, videos, en fin, documentos. Los ndices son puntos de acceso que se generan a partir de los elementos de la descripcin, es decir, forman parte de la descripcin archivstica que prev campos especialmente diseados para estos efectos, previstos en la normativa relacionada. Es por esto, debido a la importancia que tienen los puntos de acceso en la recuperacin, que el CIA Consejo Internacional de Archivos ha elaborado la Norma Internacional sobre Encabezamientos Archivsticos Autorizados para Entidades, Personas y Familias, y ha proporcionado reglas generales para el establecimiento de los encabezamientos autorizados que generen uniformemente mecanismos de recuperacin de informacin, entendibles y familiares para todos. Tcnicamente los sistemas de digitalizacin y tratamiento de imgenes estn provistos de herramientas de software capaces de generar puntos de acceso en los documentos que procesan, con relacin a elementos de datos no estructurados. Se encuentran entonces facilidades tcnicas de lectura zonal, reconocimiento de caracteres, indexacin, marcacin de imgenes, correccin tonal, especificaciones de umbral, contraste, etc., todos ellos procesos automatizados. No obstante estos representativos desempeos orientados a la recuperacin de la imagen, los sistemas de indexacin no pueden sustituir, sino apenas complementar, las actividades archivsticas de la descripcin documental, en donde la generacin de elementos de acceso estructurados y conceptualmente construidos es un componente de la descripcin documental en su conjunto.

UNIDAD BSICA DE INFORMACIN


El concepto archivstico descripcin multinivel cobra especial importancia de cara a la estructuracin y almacenamiento de imgenes en los sistemas de informacin digital.
Si se describe el fondo como un todo, ste debe representarse en una descripcin. Si es necesario describir las partes que integran el fondo, estas pueden describirse por separado. La suma total de todas estas descripciones, jerrquicamente unidas entre s, representa el fondo y las partes descritas. Esta tcnica de descripcin se denomina descripcin multinivel.3

Si bien es cierto que el proceso de digitalizacin se adelanta operativamente unidad por unidad, imagen por imagen, los proyectos de esta iniciativa deben tener clara la necesidad de asociar las imgenes en un bloque de informacin coherentemente
3

ISAD(G) Norma Internacional General de Descripcin Archivstica. Madrid, 2000.

24

| DIGITALIZACIN EN ARCHIVOS |

ligado a la unidad bsica de informacin, es decir, al nivel de descripcin utilizado por la institucin archivstica. Esta identificacin permitir agrupar y servir, a travs de un visor, las imgenes integradas a una descripcin documental en particular.

UNIDAD DE SERVICIO
Tal y como se da un apareamiento lgico entre una descripcin archivstica y las imgenes asociadas a esta, existen niveles de descripcin superiores que no resulta conveniente ni prctico servir como imgenes en bloque. Los diferentes niveles de descripcin aplicados a las unidades documentales de un fondo, deben permitir navegar por el cuadro de clasificacin de la institucin y poner en servicio nicamente aquellas imgenes pertenecientes o asociadas a los niveles inferiores, es decir, unidad documental compuesta o unidad documental simple. La anterior explicacin se fundamente en la necesidad de incorporar en el sistema de informacin digital, la identificacin de la unidad de servicio de imagen que presta una institucin archivstica. Esto significa que dependiendo de la decisin, muy seguramente un usuario podr conocer en trminos descriptivos una serie o subserie documental, pero esta no ser servida integralmente en imgenes digitales. Para ver las imgenes asociadas a este nivel, deber desplegar los componentes del nivel de descripcin inferior y solicitar de cada uno de ellos las imgenes asociadas.

BANCO DE IMGENES VISUALES


Tal y como se ha manifestado anteriormente, la integracin del sistema descriptivo y el sistema digital es el fundamento de una posibilidad de servicio amplio en los archivos. El banco de imgenes visuales se relaciona con ese componente especfico en donde se encuentran las imgenes de los documentos referenciados con asientos descriptivos. Es el repositorio estructurado en donde se almacenan las fotos digitales de los documentos, que por lo general no son una parte embebida de cdigo, sino una referencia a objetos dada a partir de un campo de enlace presente tanto en el mdulo de descripcin como en el mdulo digital. En otras palabras, debe existir un directorio, carpeta o unidad de destino organizado, en donde las imgenes se estructuran y almacenan de una manera particularmente til, para que puedan ser coherentemente asociadas a las unidades de descripcin.
25

| GUA DE PROCEDIMIENTOS |

CAMPOS DE ENLACE
Cuando se habla de integracin entre subsistemas, como es el caso de la digitalizacin y la descripcin, es necesario que exista una posibilidad unvoca de comunicar el uno con el otro. La condicin nica de enlace permitir que un registro descriptivo siempre tenga asociado un conjunto de imgenes digitales coherentemente, si existe un campo de enlace nico. Muchos sistemas de informacin pueden disearse con este cruce de referencias, siendo comnmente establecido el campo de signatura como el elemento de enlace entre los susbsistemas digital y descriptivo. Es necesario aclarar que el concepto de signatura topogrfica tiene un significado de cdigo nico para la identificacin de documentos en un fondo, lo que permite garantizar que dos documentos distintos tendrn dos signaturas distintas y por tanto podr enlazarse una signatura descriptiva con una signatura igual del subsistema digital.

26

POLTICA DE DIGITALIZACIN

Para los intereses de este documento bastar interpretar la totalidad de la cartilla como el llamado de atencin sobre los requerimientos de una poltica de digitalizacin. Se trata particularmente de que las intenciones de proyectos digitales sean explcitas en la obtencin de respuestas a muchas inquietudes, entre las que encontramos frecuentemente las siguientes:

CARACTERSTICAS DE LOS DOCUMENTOS


La identificacin de tipos de documentos y sus caractersticas impresas pueden aportar una visin particular sobre las especificaciones tcnicas de la digitalizacin: texto impreso, manuscritos, media tinta, tonos continuos o combinados, requerimientos de color, etc. Las condiciones fsicas de la documentacin, el estado de los soportes que la contienen, la necesidad de intervencin previa, las caractersticas de tintas, la presencia de efectos visuales (transparencia, manchas, etc.), son elementos para tener en cuenta de cara a las especificaciones tcnicas de la captura y el procesamiento de imgenes, con el fin de obtener resultados aceptables en cuanto a presentacin a los usuarios finales. Un programa de digitalizacin es calificado como satisfactorio, cuando es posible retirar de circulacin el material original, toda vez que la imagen digital se convierte en un sustituto equivalente de los documentos, para casi todos sus efectos de uso. Un archivo se caracteriza por la variedad no solo de las condiciones del soporte documental sino de clases de medios que soportan informacin: papel, videos, discos, casetes. Cada clase de soporte debe ser identificada en sus condiciones fsicas para, concordantemente, disponer de un equipo que permita realizar la digitalizacin de informacin analgica, sin afectar o agredir las condiciones actuales del soporte.
27

| GUA DE PROCEDIMIENTOS |

En el caso del papel, debern identificarse variables relativas al formato, por ejemplo, caben los documentos en el cristal de digitalizacin del escner? Las condiciones fsicas del material soportan sin riesgo la traccin del alimentador? El grosor de los documentos permite la alimentacin automtica? Los documentos estn libres de elementos extraos (clips, grapas, ganchos, etc.) y preparados fsicamente (sueltos y sin dobleces) para un trabajo automatizado de carcter masivo? Las caractersticas de los documentos prevn la disponibilidad de un equipo de digitalizacin con alcances y desempeo especficos, siendo comn que la adquisicin no siempre cubra las necesidades de los documentos que queremos digitalizar.

CLASES DE EQUIPOS
Un escner es un perifrico que permite digitalizar documentos, incluyendo en la definicin las cmaras digitales y cualquier dispositivo capaz de crear una representacin informtica de soportes analgicos. Existe una amplia variedad de equipos destinados a la digitalizacin, algunos con posibilidades mltiples de procesar todo tipo de documentos, mientras otros estn diseados a formatos especficos, desde los ms normales hasta los ms inusuales. Sin duda existe en el mercado un equipo de digitalizacin apropiado para una documentacin que posee un archivo en particular y lo primero que resulta importante es identificar esa relacin directa entre el equipo de digitalizacin y los documentos que se vayan a digitalizar. Los escneres funcionan utilizando el principio bsico de la transparencia de la luz. Se coloca la imagen, enfrentada al bloque lector y al cabezal lector compuesto por el CCD (Charge Couple Device), el sistema de iluminacin y un conjunto de lentes se desplazan barriendo la imagen. La luz reflejada se convierte en energa elctrica y la velocidad del movimiento del cabezal determina la resolucin. Cuanto menor sea la velocidad del lector, ms informacin se extraer de la imagen.

Escner de cama plana


El escner de cama plana es un dispositivo de captura diseado para documentacin que no puede ser procesada masivamente a travs de alimentadores automticos debido particularmente a las condiciones fsicas del soporte. A pesar de que se trata de uno de los procesos ms lentos de captura documental, la mayor bondad que representa est enfocada en una agresin mnima del documento original, bsicamente la causada por la intensidad de luz, ya que es una lmpara la que se desplaza y realiza el escaneo del documento.
28

| DIGITALIZACIN EN ARCHIVOS |

Dada la intencin particular de este documento para manejar el soporte papel, las condiciones constitutivas del material son importantes. Si la pretensin es almacenar digitalmente documentos de texto o grficos tanto en color como en blanco y negro y estos no son aptos para una traccin automtica, cualquier escner plano de una resolucin ptica de 600 puntos por pulgada o inferior ser suficiente. Esta resolucin se adapta perfectamente a la representacin en pantalla y a eventuales impresiones.

Escner de alimentacin automtica


Es mi escner un equipo para procesamiento de alto volumen? Los archivos tienen como caracterstica homognea una ingente cantidad de masa documental y, como mnimo, un proyecto serio de digitalizacin debe partir de la disponibilidad de un escner de produccin equivalente. La mayora de los escneres dispuestos en el mercado fueron diseados para produccin en serie de documentacin con caractersticas particulares, generalmente orientados en reas de negocio especficas. Por fortuna, esta tendencia se ampla y comienzan a aparecer lneas de produccin tecnolgica que se ajustan a las necesidades de los archivos. La adopcin de un escner a las necesidades particulares de los archivos debe comenzar por identificar si el equipo es compatible con los documentos y en el caso de los escneres de alimentacin automtica, si la documentacin est preparada fsicamente para soportar una traccin automtica. Esto significa que la documentacin en muy buen estado o con muy buena preparacin podr ser digitalizada a partir de alimentadores automticos, mientras que otra requerir del trabajo mecnico con la cama plana del dispositivo. Una doble lectura puede resultar conveniente para documentos con informacin por ambas caras de la hoja, lo que requerir entonces de un sistema duplex de captura, a partir de alimentacin automtica, bondad que se ver ampliada si el alimentador soporta diferentes tamaos y pesos; combina alimentacin justificada en varios sentidos (derecha, centro, izquierda); si la bandeja de elevacin acepta gran cantidad de hojas y provee literalmente un funcionamiento sin atascos de papel. Indudablemente tamaos que acepta, medios que soporta (transparencias, negativos, diapositivas, entre otros), condiciones fsicas como encuadernaciones, tamaos, papeles, formatos, etc., se convierten en elementos de criterio til para decidir cual dispositivo debe adquirir el archivo. Si fsicamente aporta solucin,
29

| GUA DE PROCEDIMIENTOS |

preguntemos por la calidad: es la esperada? El volumen de produccin es el adecuado? Finalmente la representacin tcnica soporta mi lnea de produccin a costos razonables? En relacin directa se encuentran los documentos y los equipos de procesamiento digital. Dependiendo de los alcances y caractersticas poltica de digitalizacinque institucionalmente se establezcan, la entidad optar por un equipo de alcances funcionales (cama plana, alimentador automtico, tambor, cmara digital, escner de microfilm, etc.) que satisfaga las necesidades de difusin y preservacin de los documentos.

Escner de tambor
Este es el sistema que ms fielmente reproduce el documento original. Este tipo de escner es una difcil eleccin de para el usuario aficionado, debido a su elevado precio, por lo que est reservado a trabajos profesionales de artes grficas (laboratorios, imprentas, etc.). El sistema consiste en un tambor de cristal de gran pureza al cual se le pega el documento. Este tambor gira a alta velocidad y un sensor va recogiendo fragmentos del documento. Los primeros de estos dispositivos de exploracin de imgenes separaban las exploraciones en datos CYMK, registrndolas directamente sobre pelculas colocadas en un segundo tambor giratorio.

Cmara digital
Una cmara digital es aquella cuyo principal objetivo es captar fotografas en formato digital. Todas las cmaras utilizan un dispositivo CCD o un sensor CMOS, para transformar las imgenes o el video en datos electrnicos. Los dispositivos CCD transportan la carga a travs del chip hasta un convertidor analgico-digital que convierte el valor de cada pxel en un valor digital, midiendo la carga que llega. Dependiendo del nmero de bits del conversor, obtendremos un mayor o menor nmeros de gamas de color. Las cmaras digitales son similares en clasificacin a las tradicionales de pelcula; las estndar y las reflex, diferenciadas bsicamente porque estas ltimas posibilitan el uso de objetivos que exponen la luz sobre un sensor de imagen. Se caracte30

| DIGITALIZACIN EN ARCHIVOS |

rizan porque incluyen un sensor de mayor tamao que las cmaras compactas lo que permite capturar distancias focales mayores y con ello obtener un mayor control sobre la profundidad de campo. Por su parte las cmara estndar renen la mayor parte de las cmaras del mercado, a pesar de que la tendencia se inclina a hacerlas cada vez ms potentes y funcionales en trminos de capacidad y funcin de la calidad de fotografas que se obtienen.

Escner de planos
El escner de planos tambin conocido como escner de gran formato, es uno de los dispositivos ms adecuados para la digitalizacin de material planimtrico y cartogrfico. Si bien algunas especificaciones de carcter profesional pueden ser suplidas a partir de cmaras digitales para capturar grandes formatos, la relacin 1:1 existente en una digitalizacin de planos con este tipo de escner, supera ampliamente las capturas digitales a partir de cmara. Se trata de dispositivos especialmente diseados para digitalizar documentos que en los otros escneres, se haran seccionadamente. Hacer una toma digital nica facilita no solo el servicio de consulta e impresin, sino que evita la fotocomposicin de partes, una tarea tediosa para el usuario y costosa debido al tiempo invertido. Toda vez que se trata de alimentaciones mecnicas que generan traccin sobre los documentos originales, la gran mayora de estos dispositivos han sido dotados de sbanas de recubrimiento para los documentos que fsicamente puedan ser agredidos, especialmente diseadas para que no afecten tcnicamente la generacin de imgenes y protejan a la vez la integridad de estas valiosas fuentes de informacin. La tecnologa ha aportado grandes avances frente a estos dispositivos de captura permitiendo velocidades aceptables, modalidades monocromticas y de color, alta resolucin de escaneo, control de ajuste automtico de color, tecnologa avanzada de CCD de hasta 48 bits y sistemas de traccin total que protegen y cuidan los documentos originales.

Escner de transparencias y diapositivas


El funcionamiento de este tipo de escneres es similar al escner plano de sobremesa, salvo que en lugar de escanear documentos opacos, lo hace con transparencias (negativos y diapositivas).
31

| GUA DE PROCEDIMIENTOS |

La calidad es superior al escner plano, si bien el mayor problema suele estar en la cantidad de ruido que muestra, particularmente lo relacionado con motas de polvo e impurezas del negativo.

Escner de microfilmes
La micrografa consiste en la reproduccin fotogrfica de documentacin a tamao muy reducido, precisando de un lector para su posterior consulta. Los formatos tradicionales han sido la pelcula de carrete de 35 y 16 milmetros y la microficha, normalmente de 15 X 10,5 cms. Esta tcnica ha representado un sistema de duplicacin documental cuya mayor importancia radica en la conformacin de archivos de seguridad con finalidades de consulta, economa de espacio y reduccin del deterioro de documentos. Actualmente los avances en velocidades de procesamiento informtico y capacidad de almacenamiento de soportes electrnicos dejan en desventaja la tcnica analgica de microfilmacin, no obstante las bondades de preservacin a largo plazo que representan. Los escneres de microfilm son en esencia de transparencias en donde la fuente de alimentacin es un documento soportado en pelcula de microfilm. Combinan en un nico sistema la posibilidad de visualizar microfilmes con la impresin de documentos en papel y en archivo electrnico. Esto permite imprimir o escanear al mismo tiempo. En trminos generales del uso cotidiano que se ha establecido para estos dispositivos se relaciona con una digitalizacin no masiva, discrecional por parte de los usuarios, en donde a partir de una consulta se determina si se requiere digitalizar el documentos (folio) microfilmado, la que hace a partir de lectores/impresores. Sin embargo, para efectos de proceso masivo, el mercado cuenta con dispositivos de digitalizacin de microfilmes, dotados de caractersticas de nivel profesional, disponiendo en estos dispositivos de poderosas densidades pticas y alta resolucin lo que garantiza un escaneo escalable.

Sistemas hbridos digital-microfilm


Tambin denominado microfilmador electrnico, es uno de los dispositivos que mayor nivel de aplicacin representa para garantizar que los documentos digitalizados puedan estar disponibles en el futuro lejano.
32

| DIGITALIZACIN EN ARCHIVOS |

El proceso consiste en la captura de imgenes a partir de las bondades y facilitacin que proporcionan los escneres de alta velocidad. La tecnologa digital procesa las imgenes para lograr la mayor calidad posible. Para un acceso a largo plazo, las imgenes estn respaldadas en un microfilm a prueba de obsolescencia y para acceso inmediato estn disponibles en un sistema de imgenes. La digitalizacin de documentos es un proceso rpido y sencillo. Una alimentacin flexible y sistemas confiables de transporte reducen la necesidad de preparar documentos y prcticamente eliminar la interrupcin. La operacin permite trabajar productivamente y el procesamiento automtico, generar imgenes de excelente calidad, incluso de documentos que tienen una gama de fondos y densidades de texto. Una pelcula de caractersticas perfectas es posible de obtener a travs de los microfilmadores electrnicos con imgenes derechas y perfiladas de acuerdo con las imgenes digitalizadas. Se pueden escribir imgenes a la pelcula en una amplia variedad de relaciones de reduccin y formatos de indexacin, lo que significa que comparado con un proceso convencional el microfilmador electrnico proporciona mejoras significativas: imgenes alineadas, los bordes han sido cortados, espaciado uniforme de imgenes lo que puede optimizar el uso de la pelcula, La calidad de la imagen duplica muy de cerca la imagen digital y por tanto pueden ser impresas fcilmente. El escritor de microfilm ayuda a mejorar la velocidad y precisin de produccin mientras reduce el tiempo y la mano de obra requerida para obtener alta calidad. Es realmente un sistema que integra hardware, software y componentes de medios probados, haciendo escalable el sistema a necesidades y volmenes de documentos acorde a las necesidades de archivos particulares. Finalmente, las pelculas de microfilm, como bien se conoce en el mbito archivstico, suelen permanecer como sistema de acceso libres de la obsolescencia tecnolgica, por unos periodos de tiempo mucho ms amplios que los que puede ofrecer cualquier medio informtico del momento.

ELECCIN DE UN ESCNER
Dada la amplia variedad de posibilidades que el mercado de tecnologa ofrece, se intenta delimitar la seleccin de un equipo de digitalizacin a partir de las condiciones naturales de volumen documental de un repositorio de archivo y de las condiciones y caractersticas fsicas en que se encuentran estos materiales. Todos
33

| GUA DE PROCEDIMIENTOS |

los archivos se caracterizan por grandes volmenes, siendo consecuentemente lgico, que para su digitalizacin se requiera de un escner de gama alta, especialmente en lo relacionado con la versatilidad y la productividad. Un escner de gama alta es un dispositivo especialmente fabricado para aplicaciones de gran volumen en donde existen enormes cargas de trabajo, con tiempos de inactividad mnimos.

Tipo
Existe una amplia oferta del mercado dividida en tres tipos de escneres: de mano, de sobremesa y de rodillo. El escner de mano es, como mucho, la alternativa ms econmica, puesto que elimina gran parte de los mecanismos que encarecen a los dispositivos de sobremesa; concretamente el de traccin, ya que es el usuario quien mueve el escner sobre al imagen o documento. La ventaja econmica y de ahorro de espacio tiene su contrapartida en la poca fiabilidad del proceso ya que depende de la habilidad y pulso del usuario y mover el escner en forma demasiado lenta o rpida, puede afectar al resultado final. Frente a estos modelos, los de sobremesa representan la alternativa ms profesional y de calidad aunque tambin es la ms costosa. A modo de pequeas fotocopiadoras la imagen se coloca sobre un cristal bajo el cual la lente luminosa se desplaza, digitalizando el documento. La mayor complejidad de este dispositivo, as como el sistema de escaneo, permiten obtener una gran calidad y fiabilidad. Los escneres de rodillo son una interesante alternativa intermedia que refleja niveles de produccin basados en la traccin de documentos cuya calidad no es tan alta, pero incrementa y es til para actividades de digitalizacin en volumen.

Capacidad de formatos / soportes


Para el caso de soporte papel, se relaciona con las dimensiones fsicas de los materiales. En muchas ocasiones la variable no es analizada consecuentemente con la realidad y los dispositivos adquiridos no tienen fsicamente la capacidad de soportar las dimensiones de los documentos que se van a digitalizar. Documentacin de formatos oficio largo, por ejemplo, no caben en el cristal o cama plana de la mayora de los escneres domsticos. Sin embargo, en las espe34

| DIGITALIZACIN EN ARCHIVOS |

cificaciones se anotan las dimensiones del soporte y son explcitas las condiciones de formato A4, sin que exista suficiente claridad que estos escneres son capaces de trabajar con esta longitud de papel, nicamente a travs del alimentador automtico. Qu pasa entonces cuando mis documentos no son aptos para sufrir una traccin automtica? Anlisis equivalentes deben establecerse cuando se requiere digitalizacin de gran formato y no se cuenta con dispositivos de captura lo suficientemente potentes para realizar un buen trabajo. No es posible obtener copias digitales de calidad, por ejemplo de mapas, a travs de uso de cmaras digitales de formato domstico, bsicamente porque las especificaciones tcnicas no son las apropiadas ni las suficientes para poder capturar las dimensiones y los detalles de este tipo de formatos.

Velocidad
Identifica la medida y cantidad de imgenes que puede procesar un dispositivo, en una unidad de tiempo. Todos los escneres presentarn variaciones de desempeo, relacionadas con las caractersticas tcnicas de digitalizacin establecidas y por tanto, bien vale la pena contrapreguntar que si un escner es capaz de procesar lotes de hasta 150 pginas por minuto, cul ser su desempeo y velocidad, si el escaneo es a color, en modalidad de grises o bitonal. Muy seguramente estas velocidades variarn de manera drstica, dependiendo del modo como se configure la captura de la imagen. Lo importante de este apartado es explorar las necesidades tcnicas de la digitalizacin del archivo, determinar cul es la velocidad real que se podr lograr en el dispositivo, y ajustarlos a las condiciones que requiere el documento.

Mtodos de captura
Existen bsicamente tres mtodos de captura digital para documentos soportados en papel. Blanco y negro, escala de gris y color. La seleccin de un escner tiene, definitivamente, que ser coherente con las lneas de accin tcnica con los cuales se generan las imgenes. A pasar de ser una tendencia tecnolgica que est siendo revaluada, especialmente porque la mayora de dispositivos permiten captura de las tres modalidades, existen an escneres que bien tienen limitantes de captura en color o bien deben ser adaptados fsica y lgicamente, para que soporten esta modalidad. Tcnicamente existe la justificacin por que la captura de color hace ms costoso
35

| GUA DE PROCEDIMIENTOS |

el dispositivo y el procesamiento de las imgenes; por tanto, para lograr los niveles adecuados, muchos equipos prefieren especializarse en lograr alto volumen con una modalidad hasta niveles de gris.

Productividad diaria
El desempeo diario de un escner de alto volumen es un elemento crtico cuando se aplica a documentos de archivo. Es necesario identificar la produccin real de los equipos de digitalizacin, en el entendido de que un proyecto archivstico de informatizacin debe estimar medias de produccin para el procesamiento de sus imgenes, acordes a los volmenes diarios de documentos que deben ser capturados. Si la utilizacin de cabezas de alimentacin automtica es aconsejable para las condiciones fsicas del soporte de los documentos, el equipo deber responder a esas necesidades, en volumen de trabajo: 1000, 2000, 5000, 15000, o ms imgenes diarias. Esto significa que se deben conjugar las variables de velocidad y produccin ya que un equipo puede ser habilitado para que capture 50 imgenes por minuto, pero de manera continuada, el fabricante recomienda que diariamente no se supere las 1000 o 2000 imgenes, lo que se traduce en tiempo real, que el escner, a la velocidad del ejemplo, puede trabajar nicamente un par de horas, haciendo realidad un desfase cronolgico de cualquier proyecto digital de archivos.

Tipo de interfaz (driver)


Un driver es un pequeo programa que opera como controlador de un dispositivo para que se puedan comunicar un computador y un perifrico. Un driver de escner es, por ejemplo, un controlador de dispositivo que convierte los datos y los comandos de escaneo en una interpretacin entendible entre el equipo y su perifrico. Como base de los aspectos tcnicos, existen tendencias de facto que por su versatilidad se convierten en los estndares de mercado y sobre los cuales deben inclinarse los proyectos digitales. Los estndares Twain/Isis actan como intermediarios entre el escner y la aplicacin que tratar el archivo digitalizado; son controladores que pueden ser utilizados por cualquier aplicacin que cumpla con dichos estndares. En este punto es importante que el driver Twain/Isis del escner sea lo ms potente y flexible posible, no basta con que permita elegir resolucin, tamao y tipo (color, grises, etc.) de la imagen o documento, sino que tambin posea controles para ajustar los parmetros que influyen en el proceso de digitalizacin como niveles de contraste, colores, etc.
36

| DIGITALIZACIN EN ARCHIVOS |

Ergonoma
La ergonoma es el estudio de datos biolgicos y tecnolgicos que son aplicados a problemas de adaptacin entre los seres humanos y las mquinas. El objetivo es adaptar los productos, las tareas, las herramientas, los espacios y el entorno en general a la capacidad y necesidades de las personas, de manera que mejore la eficiencia, seguridad y bienestar de los consumidores, usuarios o trabajadores (Tortosa et al, 1999). Tradicionalmente la ergonoma se ocupa de la interaccin entre el trabajador y su puesto de trabajo, sin embargo el concepto abarca y est supeditado a objetivos de organizacin, produccin, rentabilidad, innovacin y calidad, etc. El servicio y los escneres de volumen utilizados para la automatizacin de archivos, no pueden estar alejados de estos objetivos.

Software de captura
La adquisicin de un escner generalmente comprende un software adicional, que suele tratarse de versiones reducidas de excelentes programas de captura, tratamiento y eventualmente, reconocimiento ptico de caracteres. Sobre las expectativas de masificacin de un proceso digital para archivos, es preciso buscar un escner que incluya un buen software de captura, en donde a travs de una programacin creada por el usuario, puedan establecerse todas las caractersticas tcnicas y de almacenamiento requeridas para que el proceso de digitalizacin no se convierta en una actividad manual, sino por el contrario, est totalmente automatizada. Como se ha mencionado en apartados anteriores, los proyectos digitales para archivos no son otra cosa que la integracin de dos sistemas independientes (base de datos textual y base de datos de imgenes), conectadas coherentemente a travs de un campo de enlace. As las cosas, el componente del subsistema digital deber orientar su automatizacin para que las actividades de enrutamiento, estructura de carpetas, nombres de fichero, signaturizacin de imgenes, modalidad, resolucin, compresin, estn parametrizadas a travs de un proceso automtico. De la versatilidad del software de captura depender en gran medida el sistema de procesamiento de imgenes, pretendiendo que cada vez ms las prestaciones que se logren incrementen de manera significativa la automatizacin del proceso. Es importante que el software de captura pueda adaptarse a las necesidades de prcticamente cualquier carga de trabajo de digitalizacin y que la productividad
37

| GUA DE PROCEDIMIENTOS |

se vea beneficiada a travs de un amplio nmero de funciones que ayudan a impulsar y sacar el mayor provecho posible de los dispositivos adquiridos. En muchas oportunidades se compran escneres de alto desempeo que vienen acompaados de software limitado y, finalmente, gran parte del trabajo de digitalizacin termina por realizarse de manera manual, generando lgicamente una insatisfaccin en desempeo y corriendo altos riesgos de integracin, ya que los errores humanos de actividades mecanizadas, pueden generar inconsistencias de enlace entre las aplicaciones de bases de datos y las imgenes asociadas a los registros. Llevar cabo una digitalizacin del flujo de trabajo con documentos de archivo puede ser mucho ms rentable si se cuenta con un programa apropiado para capturar y procesar imgenes, conjugando fiabilidad, manejo, precios, versatilidad y productividad, en un solo software.

38

CARACTERSTICAS TCNICAS DE LAS IMGENES

CONCEPTO
Las imgenes digitales son fotos electrnicas compuestas por puntos o pxeles organizados en filas y columnas, los cuales pueden contener diferente cantidad de valores de informacin, generando distintas modalidades de imgenes, lo que tcnicamente es entendido como profundidad de bits o modalidad de digitalizacin.

MODALIDAD
Cuando se captura una imagen, esta puede ser configurada en blanco y negro, escala de grises o color. La diferencia entre estos tipos de datos se basa en el nmero de bits asociados a cada punto de la imagen. Una imagen en blanco y negro, comnmente llamada bitonal, es aquella que se representa por pxeles o puntos formados por un bit que puede representar dos tonos (blanco o negro). Una imagen en escala de grises est formada por pixeles representados por varios bits de informacin tipicamente 2 a 8. Para identificar el nmero de tonos posibles en una imagen, se debe elevar 2 a la potencia del nmero de bits asociados por pxel, es decir, una imagen en grises con una profundidad de bits de 2 tiene la posibilidad de representar 4 tonos (2 elevado al cuadrado), mientras que una imagen en escala de grises con una profundidad de bits modalidad de digitalizacin podr representar 256 (2 elevado a la 8) tonos diferentes para cada pxel, lo que significa que podrn existir 254 tonos de grises entre un blanco puro y un negro puro. Una imagen en color se representa por una profundidad de bit de 8 a 24 lo que permite obtener hasta 16,7 millones de colores asociados a un pxel, resultantes de elevar 2 a la 24. La modalidad de color se especifica por canales (rojo, verde y azul) a los que se aparea una posibilidad de 8 bits por cada color.
39

| GUA DE PROCEDIMIENTOS |

PXEL
Es la abreviatura fontica del concepto ingls picture element (elemento grfico). Se trata de un punto en una rejilla rectilnea de miles de puntos tratados individualmente, para formar una imagen en una pantalla o en una impresora. Igual que un bit es la unidad de informacin ms pequea que puede procesar un computador, un pxel es el elemento ms pequeo que el hardware y el software de pantalla e impresora pueden manipular al crear grficos. Si un pxel tiene solo dos valores de color (normalmente blanco y negro), se puede codificar con un solo bit de informacin. Cuando se utilizan ms de dos bits para codificar un pxel, es posible representar un rango mayor de colores y niveles de gris. Con dos bits se representan cuatro colores o niveles de gris, con cuatro bits se representan diecisis colores, y as sucesivamente. Las imgenes digitales estn compuestas de miles o millones de estos puntos y por eso se califica que los pxeles son los elementos constitutivos de las imgenes digitales.

RESOLUCIN
Tcnicamente la resolucin identifica el nmero de puntos (pxeles) que se identifican en una unidad de medida, generalizada a pulgadas. Es la capacidad de distinguir los detalles espaciales finos. La resolucin es la medida de lo detallada y precisa que es una imagen. La escala de resolucin depende del dispositivo que se mida. Las digitalizaciones se miden en pxeles por pulgada ppi mientras que las tramas pueden medirse en lneas por pulgada (lpi), siendo claro que en todos los casos cuanto mayor sea la resolucin, ms detallada y definida ser la imagen.

DIMENSIONES DE PXEL
Son las medidas horizontales y verticales de una imagen, expresada en pxeles. Las dimensiones de pxel se pueden determinar multiplicando tanto el ancho como la altura por el nmero de puntos por pulgada a que se ha establecido la resolucin.

PROFUNDIDAD DE BIT
Este concepto es determinado por la cantidad de bits utilizados para definir un pxel. A mayor profundidad, mayor ser la cantidad de tonos (escala de gris o color) que pueden ser representados.
40

| DIGITALIZACIN EN ARCHIVOS |

La calidad de una imagen depende del nmero de puntos utilizados para formarla. La dimensin se establece a partir de la cantidad de puntos dispuestos en una unidad de medida, generalmente pulgadas. Esto significa que en una imagen de 300 puntos por pulgada (ppp) cada pxel que forma la imagen tiene un tamao de 1/300 de pulgada, Cuantos ms pxeles por unidad de medida mayor resolucin; en consecuencia, una imagen de baja resolucin tendr un aspecto menos ntido que una de alta y generar un fichero informtico de menor tamao que esta.

COMPRESIN
La compresin se utiliza para reducir el tamao del fichero de imagen para su almacenamiento, procesamiento y transmisin. El tamao del archivo para imgenes digitales puede ser muy grande, complicando las capacidades informticas y de redes de muchos sistemas. Todas las tcnicas de compresin abrevian la cadena de cdigo binario en una imagen sin comprimir, a una forma de abreviatura matemtica, basada en complejos algoritmos. Los sistemas de compresin pueden caracterizarse como sin prdida o con prdida. Los primeros abrevian el cdigo binario sin desechar informacin, por lo que, cuando se descomprime la imagen es idntica bit por bit al original. Los sistemas con prdida, como JPEG, utilizan una manera de desechar la informacin menos importante, basada en un entendimiento de la percepcin visual. Sin embargo, puede ser extremadamente difcil detectar los efectos de la compresin con prdida, y la imagen puede considerarse sin prdida visual. La compresin sin prdida se utiliza con mayor frecuencia en el escaneado bitonal de material de texto. La compresin con prdida tpicamente se utiliza con imgenes tonales, y en particular con imgenes de tono continuo en donde la simple abreviatura de informacin no tendr como resultado un ahorro de archivo apreciable4 .

CALIDAD
La calidad de la imagen conjuga un amplio nmero de variables, porque se trata no solo de las caractersticas de la captura, partiendo de las condiciones del original, sino del dispositivo de salida que se tenga previsto para la imagen. Las polticas normales han limitado el tamao de los ficheros reduciendo la resolucin, la profundidad de bits y haciendo uso de la compresin. El objetivo es aumentar la velocidad de entrega, sin comprometer demasiado la calidad de la
4

Cornell University. Tutorial de digitalizacin de imgenes. Llevando la teora a la prctica.

41

| GUA DE PROCEDIMIENTOS |

imagen. Todas las condiciones tcnicas de la captura influyen en el resultado final, siendo destacables dos aspectos fundamentales: la resolucin y la transmisin de color y tonalidad en forma efectiva. La satisfaccin del usuario con las imgenes en la pantalla depender de las posibilidades de los sistemas de visualizacin. Adems de la velocidad de entrega, los usuarios estn interesados en la calidad de la imagen (legibilidad y fidelidad de color para una tarea); la presentacin completa de las imgenes en pantalla y las representaciones exactas de las dimensiones de los documentos originales.

FORMATO DE ARCHIVO
Los formatos de archivo de imagen se relacionan ms que con los bits que forman la imagen, con la informacin del encabezamiento acerca de cmo leer e interpretar un fichero. Los formatos de archivo cambian en trminos de resolucin, profundidad de bits, capacidad de color y soporte para compresin y metadatos. Los formatos de ficheros de imagen se identifican para establecer atributos propios que soportan diferentes potencialidades de las imgenes en s mismas. Como en todo proyecto digital de volumen, los tamaos de archivo y por consiguiente los ficheros de imgenes, deben tener prevista la estructura y sistema de almacenamiento digital, para lo cual puede resultar interesante la posibilidad de dimensionar el peso de un fichero digital, el cual se establece a partir de la multiplicacin del rea de superficie (ancho por alto), por la profundidad de bits y por los puntos por pulgada (dpi por sus siglas en ingls) al cuadrado. Debido a que el archivo de imagen se presenta en bytes (formados por ocho bits) se debe dividir esta cifra por ocho. Algunos de los factores que se deben tener en cuenta al elegir un formato de archivo son los siguientes: profundidad de bits aceptadas, tcnicas de compresin aceptadas, gestin de color, soporte tcnico, capacidad de metadatos, etc. Existen muchos formatos de archivo de imagen, pero los ms usados en la actualidad son TIFF Tagged Image File Format; GIF Graphics Interchange Format; JPEG Joint Photographic Expert Group; JFIF TPEG File Interchange Format; FlashPix; PhotoCD; PNG Portable Network Graphics; PDF Portable Document Format.

42

AUTOMATIZACIN

La automatizacin del proceso de digitalizacin est relacionada con actividades que se ejecutan repetitivamente, todas las veces que se escanea un documento y que comnmente se realizan de manera manual por parte de los usuarios, ante lo cual se generan no solo errores humanos propios de la mecnica, sino niveles de produccin que hacen cuestionable la adquisicin de equipos de alta gama, con especificaciones en volumen de produccin altas.

ESTRUCTURA DE ALMACENAMIENTO
Se ha insistido a travs del texto en conceptos como las unidades de descripcin y las unidades de servicio. El proyecto informtico de archivo que integre el componente digital y la base de datos textual, debe generar un entendimiento entre estos sistemas, para establecer enlaces coherentes y asociados armnicamente. Por tratarse de aspectos de diseo, en donde la funcionalidad puede ser tan variada como la creatividad lo permita, este apartado nicamente se plantea como un referente de conocimiento general, ms no como una lnea de accin para los programas de digitalizacin. Una estructura de almacenamiento de imgenes tiene componentes tcnicos y de concepto. Por una parte, los elementos tcnicos pueden estar referidos al rbol que se generar a partir de la digitalizacin, al establecer carpetas y subcarpetas, y dentro de ellas ficheros de imagen, dependiendo de las capacidades del sistema operacional y las velocidades de acceso que deben garantizar al usuario una respuesta oportuna. Con respecto a los componentes de concepto, es viable, porqu no, que exista una integracin de imgenes, a partir de carpetas asociadas fsicamente a las unidades de descripcin, estableciendo una integracin automatizada por cada registro en base de datos, una carpeta que contenga las imgenes asociadas a este.
43

| GUA DE PROCEDIMIENTOS |

Finalmente se trata de establecer que las estructuras de almacenamiento de las imgenes obedezcan a criterios claros y precisos, tcnica y conceptualmente, porque es la nica manera de que los subsistemas de imgenes y base de datos, sean independientes y puedan coexistir y ser funcionales sin una dependencia intrnseca entre ellos. Esto significa que un sistema de base de datos no tiene por qu estar amarrado a un sistema de imgenes y, a su vez, un sistema de imgenes no tiene por qu funcionar nicamente con determinado sistema de descripcin documental.

RUTA
Se refiere a un componente especfico de la estructura de almacenamiento, en donde, como su nombre lo indica, el procesamiento de imgenes guarda los ficheros generados. La ruta, generalmente orientada a un servidor o repositorio de imgenes, con una estructura particularmente diseada, facilita la elaboracin de copias de seguridad integral de las imgenes, aportando al sistema digital los mecanismos de seguridad necesarios para desarrollar las polticas de mantenimiento establecidas.

NOMENCLATURA DE FICHEROS Y CARPETAS


La automatizacin de la digitalizacin deber, a travs del software de captura, asignar los nombres de ficheros y carpetas, de acuerdo con unas reglas establecidas y desligar al usuario de la responsabilidad de estas actividades. Estas nomenclaturas sern interpretadas desde la base de datos textual para realizar los enlaces respectivos y es por esto que se recomienda su mecanizacin a partir de las opciones disponibles en el software de interfase con que vienen acompaados los escneres.

ALMACENAMIENTO FSICO
El apartado de almacenamiento fsico se refiere al destino final de las imgenes, las cuales pueden permanecer on line en lnea, near line cercanos o, fuera de lnea. Es importante definir el sitio fsico de almacenamiento, para prever las condiciones mnimas de capacidad y garantizar un proyecto perdurable en el tiempo. Si bien los sistemas de almacenamiento han ampliado sus posibilidades de una manera casi ilimitada, el proyecto digital debe iniciar con unos estimados que se compadezcan con la realidad de la produccin de imgenes y determinar, si su disponibilidad ser
44

| DIGITALIZACIN EN ARCHIVOS |

en lnea, basado en arreglos de discos, por ejemplo; en medios externos de almacenamiento+; o en cualquier otro estndar tecnolgico que sirva como repositorio de imgenes. Se advierte, eso si, que cualquiera sea el medio de almacenamiento fsico, el sistema deber servir las imgenes de una manera oportuna y satisfactoria para los usuarios, con una velocidad de prestaciones aceptable, trtese de un mecanismo automatizado, semimanual o manual.

CARACTERSTICAS TCNICAS
Elegir entre una variedad de opciones de servicio diseadas especficamente para un modo particular de trabajo, aunado a la posibilidad de configurar servicios de procesamiento de imgenes, son, en contexto, las habilidades que deben disponerse en un software de captura. Un sistema de procesamiento de imgenes con innovadoras prestaciones ofrece la posibilidad de automatizar las caractersticas tcnicas de las imgenes generadas, por medio de aplicaciones de captura que los usuarios definen como herramientas de trabajo, permitiendo que tan solo con seleccionar la aplicacin deseada, el sistema se configure y cree imgenes con reas de escaneo establecidas, modalidades de color definidas, aplicacin de diversos formatos de grabacin, visualizacin y recuperacin de documentos, enrutamiento de los ficheros generados a carpetas especficas, generacin de estructuras de carpetas de acuerdo con pautas preconcebidas, entre otras muchas versatilidades. Todo esto se traduce y significa productividad, ganada a travs de funciones que permiten guardar configuraciones y perfiles personalizados de trabajo.

ACCESO
Entendamos por acceso la facilidad de visualizacin y despliegue de imgenes en un visor de alta velocidad, utilizando el sistema de captura automatizado. Frente a una alimentacin automtica o bien basada en cama plana, es importante que el usuario pueda tener acceso al producto de la digitalizacin, es decir al resultado final del escaneo de documentos, para validar, aprobar o rechazarlo, ejerciendo un control de calidad inmediato sobre las imgenes. El acceso al resultado de la digitalizacin permitir repetir de manera instantnea aquellas imgenes que no han cumplido satisfactoriamente las condiciones de visualizacin requeridas y manipularlas en trminos de insercin, rotacin, orientacin o mejoramiento especfico.
45

COMPONENTES DE LA IMAGEN DIGITAL

INFRAESTRUCTURA TECNOLGICA
La cadena tecnolgica necesaria para la digitalizacin de imgenes se relaciona con una serie de pasos lgicamente dispuestos, que deben ser evaluados de manera integrada. Confluyen elementos de hardware, software y redes, siendo operativos en un marco de referencia orientado a la documentacin objeto de la digitalizacin. Es decir, hay mucha variedad en las caractersticas tcnicas para digitalizar documentos, pero finalmente el objetivo y los propsitos de un repositorio en particular, sern el patrn para determinar las lneas de accin. De ah, la importancia de establecer una poltica de digitalizacin.

MIGRACIN
La creacin de imgenes soportada en la captura o conversin de documentos a formato digital es el primero de los componentes de un flujograma de proyectos digitales para el campo archivstico. Los procedimientos involucrados se relacionan con las caractersticas tcnicas de la poltica de digitalizacin y pueden variar de conformidad con las especificaciones de cada archivo y las particularidades de sus documentos. La migracin debe estar dotada no solo de los lineamientos tcnicos de la digitalizacin sino de los instrumentos operacionales adecuados para ejercerla, es decir equipos y mquinas apropiadas a las caractersticas fsicas de los documentos objeto de proceso.

47

| GUA DE PROCEDIMIENTOS |

ADMINISTRACIN
Para crear un sentido de prestacin de servicios, es importante gestionar y administrar los documentos digitalizados a travs de un sistema de informacin asociado a los metadatos extrados de cada unidad documental. Es necesario, por tanto, garantizar un mantenimiento de las imgenes y del sistema, que incluya no solo su operatividad funcional, sino que vele por los aspectos relacionados con la preservacin y acceso a largo plazo. La administracin se refiere, entonces, a la organizacin, mantenimiento de las imgenes y lgicamente a los metadatos que dan acceso a ellas.

USO Y EXPLOTACIN
Este componente se relaciona con la presentacin de las imgenes para el usuario, involucrando la infraestructura necesaria para su visualizacin, impresin y en general para su uso. Los componentes de un flujo de proceso de la imagen digital deben ser integrados para que exista una interoperacin sin dificultad. Las actividades y subprocesos se ramificarn ampliamente, y en tal sentido es necesario prever fallas, demoras y contingencias, toda vez que los componentes de la imagen digital deben ser adaptados de manera creativa en los campos de archivos y bibliotecas. No se trata simplemente de conectar y operar. Un proyecto fundamentado de digitalizacin de archivos, deber garantizar continuidad, permanencia, uso de estndares, metodologas de actualizacin y renovacin de hardware y software, as como una preparacin continua y permanente, que cuente con recursos suficientes, para migraciones peridicas.

PRESENTACIN DE LAS IMGENES


La digitalizacin deber encontrar un punto intermedio entre el servicio de imgenes digitales a travs de monitores y la copia impresa de los documentos digitalizados. Las necesidades de los usuarios podrn requerir de posibilidades de consulta en lnea, descargue de imgenes, impresin de documentos, etc., y el sistema digital de imgenes ha de prever la satisfaccin de estos requerimientos con en establecimiento de caractersticas tcnicas aplicadas al proceso. Modalidad de captura (color, escala de gris, bitonal), tamaos de ficheros, calidad de las imgenes, formatos de grabacin, escala aplicada, entre otros, son aspectos que requieren de evaluacin, aunado a las especificaciones disponibles por el usuario en relacin con alcances tcnicos del computador, la velocidad de acce48

| DIGITALIZACIN EN ARCHIVOS |

so, capacidades del navegador web y disponibilidad y caractersticas del visualizador. Resumiendo esta sincronizacin, se busca que el usuario convencional disponga de una rpida recuperacin, una calidad aceptable, una visualizacin completa de las imgenes y, opcionalmente, de la posibilidad de generar copias impresas de los documentos.

CALIBRACIN DE MONITORES
La satisfaccin del usuario con las imgenes en la pantalla depender de las posibilidades de los sistemas de visualizacin. De cara a la presentacin de las imgenes, la digitalizacin tiene que disponer de un mecanismo de representacin adecuado a las caractersticas tcnicas de la captura realizada. Un monitor que no sea apto o mejor, no este preparado (calibrado) podr generar una inadecuada apreciacin de imgenes que han sido satisfactoriamente procesadas. Cualquier usuario puede realizar una primera calibracin acorde a sus gustos y preferencias. Sin embargo, el despliegue de imgenes requiere de una calibracin adecuada porque de lo contrario se obtendrn resultados indeseados. Un monitor que se encuentre correctamente calibrado mostrar la informacin digital exactamente igual a como podremos verla en papel de imprenta (aunque no, lgicamente, mediante impresoras laser o de inyeccin, ya que estas, a su vez tambin deben calibrarse). Si bien la calibracin puede hacerse mediante hardware especial, para esta funcin tambin se puede acudir a software bsico que el usuario utilice.

INTEGRACIN Y PUESTA EN MARCHA


Todos los elementos, desde la infraestructura tecnolgica hasta la poltica de digitalizacin, deben nteroperar sin dificultad. Se deben seleccionar productos de aceptacin comercial, soportados ampliamente por el proveedor, preferiblemente estndares de facto, lo ms alejados posibles de sistemas propietarios. Muy seguramente requeriremos de adaptaciones particulares en el proceso de implementacin, ya que por ms reducido que sea el nivel de componentes, los proyectos digitales se convierten en ramificaciones complejas al momento ponerlos en marcha. La integracin funcional del sistema digital requiere de un concurso multidisciplinar para su xito. Archivistas, tcnicos, ingenieros podrn aportar visiones operativas que confluyen en un proceso continuado de conversin, gestin de imgenes, presentacin y servicio integral de acceso a documentacin archivstica.
49

LA PRESERVACIN DIGITAL
paradjicamente, en la era de la informacin, la humanidad est en riesgo de perder la memoria
Jorge Palacios Preciado. (q.e.p.d.)5

Considerando que la tecnologa generalmente nos ofrece ventajas y soluciones, el tema de la preservacin digital es uno preocupante y desalentador, en los que debe interesarse cualquier institucin dedicada a la preservacin de la memoria. Mucho se habla de la importancia de la preservacin de objetos digitales, que constituyen un alto porcentaje del patrimonio documental, y es muy limitado el esfuerzo prctico que se hace en este sentido. Tal y como se menciona por parte de los especialistas, no se puede decir que un documento digital se ha preservado, si no se tiene acceso a l. La meta de la preservacin digital es garantizar y mantener la capacidad de acceder a archivos digitales, de cara a la obsolescencia tecnolgica y a inestabilidad de los soportes informticos a largo plazo. La confianza fsica de los medios es un problema asociado, particularmente porque son de poca duracin en el tiempo, frgiles y por dems, no muestran sus posibles fallas anticipadamente. La recomendacin general de copias de respaldo, si bien resulta un tema trillado, cobra importancia por los recursos invertidos y por el tiempo demandado en el proceso. Por otra parte, promover el uso archivos digitales garantizar, de alguna forma, la permanente atencin y preocupacin por el acceso y la disponibilidad de estos acervos. Finalmente, asegurar la confiabilidad de los archivos digitales a travs de procedimientos tcnicos (criptografa y firma digital) influye en la toma de decisiones para la preservacin digital. La preservacin a largo plazo es naturalmente necesaria en los archivos calificados con valor permanente. No obstante, de acuerdo con la Ley 594 o Ley General de Archivos para Colombia, la digitalizacin de documentos patrimoniales no au5

Nota de cierre del texto expuesto por Leonardo Guzmn en el II Encuentro de Archivos de Tradicin Ibrica. Ro de Janeiro. 2002.

51

| GUA DE PROCEDIMIENTOS |

toriza la eliminacin del soporte papel y en consecuencia la preservacin digital deber estar enfocada a los documentos que nacen y cobran valor archivstico en este formato. Por otro lado, los documentos pertenecientes a las etapas administrativas del ciclo vital, tendrn necesariamente unas acciones de preservacin ms limitadas en trminos de su permanencia, de acuerdo con los tiempos de retencin establecidos en los instrumentos TRD6, sin que obste que todo el acervo digital debe ser atendido de manera pronta debido particularmente a la falta de certidumbre sobre la permanencia tanto de la informacin como del medio, en los soportes informticos. Dada esta preocupacin, nos permitimos anexar un par de textos relativos al tema, que despiertan inters desde el seno del programa General de Informacin de la Unesco.
Cada vez ms, nuestro patrimonio cultural, cientfico y de informacin reviste formas digitales y, tambin cada vez con ms frecuencia, se produce nicamente en forma digital. Las tecnologas que utilizamos para crear y aprovechar el patrimonio digital poseen numerosas ventajas que explican que hayan sido adoptadas tan rpidamente en muchas partes del mundo. No obstante, existen graves problemas para mantener utilizable y disponible nuestro emergente, aunque ya floreciente, patrimonio digital. Los medios que utilizamos para guardarlo y almacenarlo son inestables y la tecnologa necesaria para tener acceso a l es superada rpida y constantemente por otras nuevas. Cuando las tecnologas caducan, con ellas se pierde tambin el acceso al patrimonio digital que permitan. Estos problemas no son nicamente de carcter tcnico, sino que tambin tienen dimensiones sociales y de organizacin, ya que tenemos la responsabilidad de esforzarnos por conservar abiertos los medios de acceso durante largos perodos de tiempo, a menudo sin recursos suficientes y con estrategias inciertas. No debe sorprender el inters de la Unesco por esta situacin, pues su razn de ser es en parte fomentar y permitir la preservacin y el disfrute del patrimonio cultural, cientfico e informativo de los pueblos del mundo, y difcilmente poda ignorarse el crecimiento y la vulnerabilidad del patrimonio digital.

Apartado del Captulo 1. Introduccin, del documento Directrices de Preservacin del Patrimonio Digital, preparado por la Biblioteca Nacional de Australia para la Divisin de la Sociedad de la Informacin de la Unesco. Marzo de 2003
6

Tabla de Retencin Documental.

52

| DIGITALIZACIN EN ARCHIVOS |

Gran parte de la ingente cantidad de informacin que se produce en el mundo es de origen digital y existe en una gran variedad de formatos: texto, bases de datos, grabaciones sonoras, pelculas, imgenes. Para las instituciones culturales que tienen a su cargo el acopio y la preservacin del patrimonio cultural, definir qu elementos deben conservarse para las generaciones futuras y cmo proceder en su seleccin y conservacin, se est volviendo un probema apremiante. El enorme tesoro de informacin digital producida hoy en da en prcticamente todas las reas de las actividades humanas y concebida para ser consulta con computadoras, podra perderse si no se elaboran tcnicas y polticas especficas para su conservacin. La preservacin de valiosa informacin cientfica, datos de investigacin, productos de comunicacin o arte digital, para nombrar solo algunas de esas reas, plantea nuevos problemas. Si el objetivo es poder tener acceso a esos materiales en su forma original, es preciso conservar el equipo tcnico, es decir, los soportes materiales y lgicos originales o compatibles, junto con los ficheros digitales que constituyen los correspondientes datos. En muchos casos, los componentes multimedia de los sitios web, incluidos los enlaces a Internet, constituyen una dificultad adicional en lo relativo a derechos de autor y a geografa, ya que a veces resulta difcil determinar a qu pas pertenece el sitio web. La Unesco ha venido examinando estas cuestiones con objeto de definir una norma que gue los esfuerzos de preservacin de los gobiernos en la era digital. En su 31 reunin, la Conferencia General aprob la Resolucin 31 C/34, en la que llamaba la atencin acerca del patrimonio digital mundial, cuyo volumen aumenta sin cesar, y sobre la necesidad de emprender una campaa internacional para salvaguardar la memoria digital en peligro de desaparicin. Asimismo, la Conferencia General invit al Director General a preparar un documento de trabajo para la reunin del Consejo Ejecutivo, prevista para la primavera de 2001, en el que figuraran los elementos de un proyecto de carta para la preservacin de documentos de origen digital, y tambin a alentar a las organizaciones gubernamentales y no gubernamentales y a los organismos internacionales, nacionales y privados a garantizar que la preservacin del patrimonio digital fuese altamente prioritaria dentro de las polticas nacionales. Durante la reunin de mayo-junio de 2001 del Consejo Ejecutivo de la Organizacin, los Estados Miembros convinieron en que era necesario actuar con rapidez para salvar el patrimonio digital. Los debates fueron ampliamente sustentados por un documento de trabajo sobre los diversos aspectos de la preservacin digital elaborado para la Unesco por la European Comission of Preservation and Acces (ECPA), una fundacin sin fines de lucro con sede en Amsterdam.
53

| GUA DE PROCEDIMIENTOS |

Los mtodos tradicionales de preservacin, como el depsito legal, utilizado por las bibliotecas nacionales para que se conserven copias de todos los materiales impresos, no puede aplicarse tal cual al material digital por varios motivos, principalmente porque las publicaciones de la malla mundial aprovechan a menudo datos almacenados en servidores en diferentes partes del mundo. Otro problema que se plantea es el del volumen mismo de los datos, pues se estima que, en Internet, existen mil millones de pginas cuya duracin de vida media es muy corta, se calcula entre 44 das y dos aos. Considerado el medio de publicacin ms democrtico en toda la historia, hay quienes sostienen que Internet, cuyo volumen aumenta sin cesar, merece ser preservada como un todo, pues sus pginas y foros de discusin constituyen un invalorable espejo de la sociedad. Existen problemas tcnicos para que el objeto digital salvaguardado sea accesible en su forma original. Al tiempo que, de la produccin total en el mundo, la proporcin de informacin y arte en medios tradicionales, tales como pginas impresas, grabaciones o filmaciones analgicas, disminuye ao tras ao frente a los objetos digitales, los programas y equipos son reemplazados constantemente por nuevas generaciones ms potentes que acaban por resultar incompatibles con sus predecesores, lo cual har que, de aqu a pocos aos, el material, del que a menudo forman parte sonidos y grficos o imgenes dinmicos, as como enlaces con sitios web y bases de datos, se volver inaccesible. El volumen de datos que debe examinarse para seleccionar lo que merece ser preservado es pasmoso. Segn un reciente estudio de la School of Information Management and System de la Universidad de Berkeley , California, el almacenamiento de la produccin total anual de contenidos impresos,filmados, pticos o magnticos, requerir unos 1.500 millones de gigabytes de memoria, lo que equivale a 250 megabytes por cada hombre, mujer o nio del planeta. Otro aspecto complejo es el de la propiedad intelectual, comprendidos los derechos de autor de los programas necesarios para el acceso a los ficheros digitales. Por ejemplo, puede encontrarse un sorprendente conjunto de derechos asociados a los sitios web que combinan objetos digitales de diversas procedencias, y todava no se ha llegado a un acuerdo de alcance sobre el principio del derecho de copia para preservacin. Aunque en muchos pases se han emprendido valiosas iniciativas para preservar el patrimonio digital, incluidos sitios web, la ECPA seala las limitaciones de estos esfuerzos y defiende la adopcin de normas internacionales.
54

| DIGITALIZACIN EN ARCHIVOS |

La complejidad de los problemas que se plantean obliga a que en la tarea de preservacin intervengan los productores de la informacin digital, comprendidos los de programas informticos, quienes, al disear sus productos, debern tener en cuenta la conservacin. Es obvio que ya han pasado a la historia los das en que la responsabilidad de la preservacin incumba exclusivamente a las instituciones encargadas de los archivos. La cooperacin, la orientacin, la direccin y la distribucin de tareas constituyen un elemento clave de la preservacin del patrimonio digital. Las instituciones culturales necesitan la cooperacin de los creadores de informacin y los productores de programas informticos. Adems, son indispensables recursos adecuados y apoyos polticos para que las futuras generaciones sigan teniendo acceso a los abundantes recursos digitales en cuya creacin hemos invertido tanto en las ltimas dcadas. Tomando como base las reflexiones anteriores, la Unesco ha elaborado una estrategia para promover la preservacin digital, que se articula en torno a: a) un amplio proceso de consultas con los gobiernos, responsables de la formulacin de polticas, productores de informacin, instituciones y expertos encargados del patrimonio, fabricantes de programas informticos y organismos de normalizacin; b) la difusin de directrices tcnicas; c) la ejecucin de proyectos piloto, y d) la preparacin de un proyecto de carta para la preservacin del patrimonio digital, que se someter a la aprobacin de la Conferencia General en su 32 reunin. El presente documento, elaborado para la Unesco por la Biblioteca Nacional de Australia, contiene directrices generales y tcnicas para la preservacin del creciente patrimonio digital mundial y el acceso permanente al mismo. Tiene por finalidad servir de manual de referencia sobre el Proyecto de Carta para la Preservacin del Patrimonio Digital. Debemos agradecer a Colin Webb y a la Biblioteca Nacional de Australia el haber preparado las Directrices y organizado la Reunin de Consulta para Asia y el Pacfico sobre la Preservacin del Patrimonio Digital, celebrada en Canberra (Australia), del 4 al 6 de noviembre de 2002, que fue la primera de una serie de consultas regionales similares, celebradas en Managua (Nicaragua), del 18 al 20 de noviembre de 2002; Adis Abeba (Etiopa), del 9 al 11 de diciembre de 2002; Riga (Letonia), del 18 al 20 de diciembre de 2002, y Budapest (Hungra), los das 17 y 18 de marzo de 2003. En esas reuniones regionales participaron 175 expertos, procedentes de 86 pases, que representaban una gran variedad de intereses y disciplinas: bibliotecas y archivos, proveedores de servicios de Internet, organismos nacionales e normali55

| GUA DE PROCEDIMIENTOS |

zacin, fabricantes de equipos y programas informticos, periodistas, juristas, universidades e instancias gubernamentales. Todos contribuyeron con sus valiosos comentarios a la redaccin de las Directrices y del anteproyecto de carta sobre la preservacin del Patrimonio Digital. Esperamos que las presentes Directrices sean de utilidad para los especialistas de la gestin y la conservacin cuando deben tratar los complejos problemas tcnicos que plantean la preservacin del patrimonio digital mundial y el acceso permanente al mismo. Adbelaziz Abid Divisin de la Sociedad de la Informacin Unesco

56

| DIGITALIZACIN EN ARCHIVOS |

BIBLIOGRAFA

Ley 594 de 2000. Ley General de Archivos para Colombia. Llevando la teora a la prctica: Tutorial de digitalizacin de imgenes. Cornell University. 2000-2003. Biblioteca de la Universidad de Cornell / Departamento de Investigacin. http://www.library.cornell.edu/preservation/tutorial-spanish/contents.html Norma Internacional General para Descripcin Archivstica ISAD(G). Madrid, Consejo Internacional de Archivos, 2000. Norma Internacional para Registro de Autoridades Archivsticas (Entidades, Personas y Familias) ISAAR(CPF). CIA, Consejo Internacional de Archivos, 1996. http://www.fotonostra.com/glosario/driver.htm http://wwwmx.kodakprofessional.com http://webpersonal.uma.es/~MANOLI/impresion_imagenes.htm Directrices para la preservacin del patrimonio digital. Nacional Library of Australia - Unesco. 2003. Archivos Estatales en Red. Ministerio de Cultura de Espaa. http://aer.mcu.es/sgae/index_aer.jsp

57

También podría gustarte