Está en la página 1de 10

Escáneres

"hazlo

mismo":

digitalización

de

bajo

costo

para

archivos

y

bibliotecas con software libre, cámaras fotográficas y filosofía hacker 1 .

Autora: Evelin Heidel

Ciudad / País: Capital Federal, Argentina

Título: estudiante de Letras y estudiante de Bibliotecología y Cs. de la Información

Lugar de trabajo: Facultad de Filosofía y Letras, Universidad de Buenos Aires /

Fundación Vía Libre / Creative Commons Argentina

Email: eheidel@vialibre.org.ar

Resumen: En la actualidad, la mayoría de las bibliotecas y los archivos sienten una

necesidad imperiosa de digitalizar sus acervos bibliográficos. Sin embargo, esta tarea

puede ser costosa, puede requerir una gran pericia técnica, en ocasiones implica lidiar

con grandes trabas burocráticas para la adquisición o importación de los equipos, y si

estos llegaran a romperse, los costos de reparación son tan altos que los programas de

digitalización emprendidos se detienen. El modelo del escáner "Do It Yourself" (hazlo tú

mismo) es una solución fácil, sencilla y barata de implementar, realizada 100% con

hardware y software libre, y diseñada para cumplir con los estándares bibliotecarios para

la digitalización. Actualmente se implementa en la Facultad de Filosofía y Letras (UBA) y

pasará a implementarse en otras bibliotecas del país en breve.

Palabras

claves:

ESCÁNERES

SOFTWARE

LIBRE

-

HARDWARE

LIBRE

-

DIGITALIZACIÓN

-

Introducción

A finales de 2010, la Subsecretaria de Bibliotecas de la Facultad de Filosofía y

Letras de la Universidad de

Buenos Aires, comenzó a indagar

opciones

para la

digitalización de los acervos bibliográficos de la facultad. Los presupuestos para la

adquisición de un escáner profesional oscilaban entre los 10.000 a 90.000 dólares, sin

haber nunca un presupuesto intermedio. Ninguno de los escáneres cumplía además con

una serie de requisitos necesarios para la facultad, a saber:

1. que el escáner fuera sólido y robusto;

2. que fuera adaptable a más de un tipo de libro o de archivo;

3. que no dañara los libros forzándolos a abrirse más de lo necesario;

4. que fuera rápido digitalizar un libro;

5. que la digitalización cumpliera con estándares mínimos de calidad, tales

como obtener imágenes a 300 DPI.

La mayoría de los escáneres, además de quedar fuera de las posibilidades de la

facultad

en

términos

económicos,

no

cumplían

con

al

menos

una

de

las

cinco

condiciones. En ocasiones, el diseño del escáner exigía forzar la apertura del libro (como

en el caso de los escáneres planos o de los escáneres orbitales con vidrio); en otros

casos el sistema de toma de las imágenes tomaba demasiado tiempo, y finalmente, en

otros casos, los costos de reparación si algo se dañaba ascendían a sumas en dólares

que en muchos casos volverían irrecuperables las máquinas.

Además, se sumaba en este caso el problema de la cantidad de escáneres. En la

medida en que todos los escáneres necesitan ser operados por una persona, el límite

temporal de la persona para la digitalización, se impone por sobre la velocidad de la toma

de la imagen. De este modo, para iniciar un programa de digitalización, se necesita tener

más de un escáner y más de una persona para las operaciones. Al de por sí ya alto costo

unitario, se imponía un costo aún mayor si se necesitaba adquirir más de un escáner.

Fue así como, finalmente, tras haber indagado por los caminos comerciales, el blog

Derecho a Leer 2 , integrado por el diseñador gráfico Juan Pablo Suárez y por mí,

decidimos construir un escáner casero utilizando cámaras compactas o de bolsillo, como

solución alternativa al problema presentado por la Subsecretaria de Bibliotecas de la

Facultad de Filosofía y Letras.

Los escáneres DAL, que toman

su nombre del acrónimo

del

sitio

web ya

mencionado,

"Derecho

A

Leer",

son

escáneres

desarrollados

con

métodos

de

autoconstrucción diseñados por comunidades colaborativas globales de especialistas en

diversos campos, tales como fotografía, digitalización y programación, que por fuera de

canales institucionales y a través de Internet, ofrecen soluciones a bajo costo para la

digitalización de acervos bibliográficos 3 . El escáner DAL incorpora como dispositivos de

digitalización cámaras fotográficas, y las coloca sobre una estructura que garantiza la

preservación del material bibliográfico.

Al contrario de los escáneres comerciales tradicionales, las ventajas de un escáner

DAL pueden resumirse en:

1. gran capacidad de adaptación a distintos tipos de libros y archivos;

2. bajos costos de reparación de los materiales;

3. amplio rango de calidad, dado que la tecnología se encuentra mayormente

depositada en las cámaras;

4. desmontable y fácil de trasladar, por lo que puede ser llevado a otras

instituciones u institutos de investigación, sin necesidad de trasladar el

material;

5. fácil de operar;

6. veloz.

2 http://derechoaleer.org 3Do It Yourself Book Scanner (http://www.diybookscanner.org) es una comunidad global de hackers, especializados en la construcción de escáneres utilizando técnicas, materiales y herramientas de fácil acceso, cuyo principal objetivo es colaborar con organizaciones dedicadas a preservar y dar acceso a acervos bibliográficos.

Fotos de los escáneres terminados

Fotos de los escáneres terminados Ilustración 1: Uno de los escáneres actualmente en uso en la

Ilustración 1: Uno de los escáneres actualmente en uso en la Facultad de Filosofía y Letras, UBA.

actualmente en uso en la Facultad de Filosofía y Letras, UBA. Ilustración 2: El primer escáner

Ilustración 2: El primer escáner construido en 2011.

Desarrollo de los escáneres

Los componentes principales del escáner DAL son:

1. estructura de madera o metal;

2. cámaras fotográficas;

3. lámparas (iluminación).

Estructura de madera o metal

La estructura puede hacerse de múltiples materiales, aunque por razones obvias, la

madera resulta el más barato y el más práctico. Hay otros modelos de escáneres que

pueden observarse en la comunidad DIY Book Scanner, algunos de ellos hechos con

extrusiones de aluminio 80/20, entre otros materiales. Sin embargo, en líneas generales,

la madera gana por sobre el resto de los materiales por su costo y su versatilidad.

La base de la estructura posee unas guías de aluminio (vulgarmente conocidas

como correderas, que se utilizan en cajones o en los portateclados), que van adheridas a

los costados de la base. Sobre las guías se monta a su vez la base de la forma en V que

se observa en la foto.

La forma en V es donde descansa el libro durante el proceso de digitalización. Esta

apertura, calculada en un ángulo de 30 grados, le permite al libro no forzar su apertura en

exceso, y funciona con libros nuevos o de tapa blanda, e incluso con libros que están

dañados o cuyas letras están demasiado cercanas a los márgenes del nacimiento de las

hojas. La forma en V puede deslizarse hacia un costado según el tamaño del libro. De

esta forma, se garantiza que cualquier libro pueda ponerse sobre la base, sin importar si

el lomo es grande o pequeño, o la cantidad de páginas. Es conveniente colocar goma

espuma sobre la base en V, para corregir ligeras curvaturas que puedan producirse. El

libro permanece abierto

y

fijo

en

la misma posición durante todo el proceso de

digitalización, aunque lo hace en una posición que puede denominarse como natural.

Sobre

la

forma

en

V,

y

en

el

nacimiento de la parte posterior de la base, van

colocadas otras guías, también de aluminio, que sostienen dos acrílicos -también en

forma en V- y que siguen un movimiento arriba-abajo. Los acrílicos sirven para aplanar la

hoja y corregir la curvatura natural que tiene el libro cuando se encuentra abierto en una

posición no forzada. El espesor de los acrílicos permite a su vez llegar hasta los

márgenes internos cuando las letras se encuentran demasiado cercanas a ellos. A su vez,

los acrílicos en V tienen un sistema de poleas para aligerar su peso, resultando de esta

forma un dispositivo liviano para el operador, quien de lo contrario se vería afectado por el

peso total de los acrílicos, de las guías y del aglomerado al que están adheridos los

acrílicos.

Sobre los costados, van adheridos los brazos, que funcionan como sostenes de las

cámaras. Los brazos pueden ser de posición variables (movibles) o fijos, siempre y

cuando respeten una distancia predeterminada de la cámara con respecto a los acrílicos.

La estructura finaliza con un sostén para las lámparas, que son las que proveerán

de la iluminación necesaria para obtener una imagen uniforme.

Cabe destacar que este es sólo un enfoque entre las múltiples formas de

aproximación que pueden hacerse al problema de la base y de la estructura. Otros

enfoques contemplan la posibilidad de mover el libro en lugar de los acrílicos; hay

escáneres que llevan vidrio en vez de acrílico; otros ponen las luces a los costados en vez

de encima de los acrílicos; en fin, pueden explorarse diferentes ideas en la comunidad de

DIY Book Scanner. Por el momento, la decisión de elegir esta aproximación es su alto

nivel de estandarización dentro de la propia comunidad de DIY Book Scanner.

Cámaras fotográficas

En

la

actualidad,

las

cámaras

fotográficas

han

conseguido

un

desarrollo

impresionante, que ha provocado que tengan cada vez mayor calidad en menor tamaño.

Las mejoras en la tecnología CCD, además de la ampliación de la cantidad de píxeles

reales en las cámaras de buena calidad, hacen que las cámaras compactas puedan y

sean, de hecho, una buena opción para la digitalización de bajo costo.

Actualmente, el mínimo necesario de megapíxeles para la digitalización está en el

orden de los 8 MP reales, cantidad que tiene cualquier cámara de baja gama. Se puede

utilizar una sola cámara y hacer un libro en dos pasadas, o utilizar dos cámaras y hacer

un libro en una sola pasada. El inconveniente de las dos pasadas es, además del tiempo,

que debe ser cuidadosamente controlado por el operador humano para no cometer

errores.

Las cámaras deben dispararse de manera sincronizada y consecutiva (es decir, la

cantidad de imágenes pares e impares deben coincidir). Para que eso suceda pueden

usarse dos métodos de control de disparo: electrónico (vía USB y software) o bien de

manera mecánica.

En el caso de los escáneres DAL, la opción ha sido la vía electrónica. Las cámaras

van conectadas a un USB hub, un dispositivo que cuenta con cuatro entrada adicionales

para fichas USB. El dispositivo se conecta a su vez a un transformador de 5 volts que va

conectado a una zapatilla que lo provee de energía eléctrica, y a un cable con un

disparador en la punta que funciona precisamente como disparador. Los cables USB van

enchufados al USB Hub y a las cámaras.

La desventaja de esta opción es que deben utilizarse cámaras Canon. Sobre la

tarjeta de memoria se monta un firmware llamado CHDK (Canon Hackers Development

Kit), que funciona sobre la tarjeta de memoria, sin alterar el firmware original de la

cámara. Se corre un pequeño script (conjunto de instrucciones) que hace que la cámara

reconozca el impulso eléctrico de los 5 volts que se otorgan a través del disparador, como

si efectivamente se estuviera presionando el disparador original de la cámara.

Lámparas

Las lámparas son en este caso lámparas comunes, fluorescentes, de luz fría, cuyo

grado de temperatura es muy bajo y que tienen una vida útil de más de 8.000 horas, y

cuyo consumo eléctrico es menor a los 23W. Si bien las lámparas fluorescentes no tienen

un espectro tan amplio de luz como sí tienen las lámparas halógenas, se optó por utilizar

fluorescentes porque nunca llegan a alcanzar los niveles de temperatura que alcanzan las

halógenas. Además, las halógenas pueden dañar la vista del operador de la máquina y

exponerlo a quemaduras por sobreexposición al UV de la lámpara.

También podrían haberse utilizado lámparas dicroicas (de museo), pero su alto

costo, sumado a que se necesitan múltiples lámparas (alrededor de ocho lámparas en

total), con un bajo rendimiento y un alto consumo (alrededor 8 amperes), hacen que sean

fácilmente descartables para este tipo de tareas.

Proceso de digitalización

El proceso de digitalización está dividido en dos partes: una parte correspondiente

a la toma de las imágenes, y una segunda parte correspondiente al postproceso.

Brevemente, la parte correspondiente a la toma de las imágenes consiste en:

1.

Se coloca el libro sobre la base en V, ajustando las planchas en V según el

tamaño del lomo.

2.

Se mide la distancia de las cámaras entre sí y de las cámaras respecto del

acrílico. Tienen que guardar una distancia proporcional e igual.

3.

Se configuran los parámetros de la cámara para que estén iguales (asas,

exposición focal, apertura focal, zoom, entre otros).

4.

Se conectan las cámaras al USB Hub.

5.

Se activa el script.

6.

Se procede a la digitalización del libro.

El postproceso, al igual que todo el proceso de digitalización, utiliza software libre.

El desarrollo de software libre, además de ser muy conveniente en cuanto a los costos,

tiene una línea política coincidente con la misión y los valores de la universidad 4 . En este

caso, el único punto donde el software libre falla un poco respecto del software privativo

es en el OCR. Brevemente, el postproceso de las imágenes continúa de esta forma:

1. Se bajan las imágenes a la computadora con Gtkam (basado en gphoto).

2. Se rotan masivamente con Phatch.

3. Se renombran masivamente con Krename o similar.

4. Se procesan con ScanTailor.

5. Se les aplica OCR con el motor de Tesseract, aplicado en Ocropus, montado

en gscan2pdf.

El resultado es un PDF de imágenes, que pueden estar en blanco y negro, color o

combinado. Una vez terminado el proceso de digitalización, pueden subirse a la web o al

repositorio institucional de la facultad.

Por supuesto, el diseño de los pasos del postproceso no es fijo ni estanco, y podría

diseñarse de otra forma. En todo caso, lo que interesa es que todo puede realizarse con

software libre y que, aún más, el software libre resulta aquí una opción con mayor

capacidad de prestación y rendimiento que el software privativo.

Un plan de digitalización, ¿para qué?

Es importante destacar, a su vez, que el programa de digitalización en la FFyL se

ha pensado como una política integral en relación con la política general de la facultad,

por lo tanto su desarrollo es mucho más que la simple digitalización y contempla cuatro

áreas de desarrollo principales: acceso, preservación, servicios de extensión y formación.

Es una estrategia de democratización de acceso al saber y al conocimiento, a la par que

concebida con un fuerte desarrollo de la extensión, permitiendo que otras instituciones

puedan digitalizar sus acervos bibliográficos y puedan, a su vez, apropiarse de lo

realizado por la Facultad, tanto en términos de los resultados finales como de todo el

proceso de aprendizaje y experiencia que conlleva el desarrollo del programa.

En este sentido, cabe aclarar también que los escáneres DAL, si bien están

utilizándose intensivamente en Filosofía y Letras, también han sido solicitados por otras

instituciones, entre ellas el SEDICI de la Universidad Nacional de La Plata, y se está

llevando adelante un plan con la Asociación Civil Wikimedia Argentina, consistente en la

manufacturación

de

escáneres

para

su

entrega

en

commodato

en

bibliotecas

de

universidades públicas, instituciones culturales o de investigación y bibliotecas populares.

Conclusión

Todas las instituciones que resguardan acervos bibliográficos necesitan digitalizar o

contar con un escáner que les permita digitalizar material, ya sea porque el material que

tienen actualmente se encuentra deteriorado y necesitan sacarlo de circulación; porque se

cuenta con una única copia del material; porque el material es muy valioso, de dominio

público, y no se encuentra en ningún otro sitio; entre muchos otros factores. Una política

de digitalización puede, además, ser un gran instrumento para pensar en la extensión

cultural de la biblioteca.

Sin embargo, los costos actuales de los escáneres comerciales son una barrera

para masivizar una herramienta tecnológica tan importante para la vida de las bibliotecas.

Los escáneres caseros DIY o "hazlo tú mismo", pueden ser una opción que permitan

desarrollar un plan intensivo de digitalización a bajo costo y con gran calidad.

Quedará para otra discusión la situación actual de la legislación de propiedad

intelectual, que es un obstáculo enorme para el desarrollo integral de proyectos de

digitalización en las bibliotecas.