Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Automatizacion VII3 BIB
Automatizacion VII3 BIB
3 BIBLIOTECA AUTOMATIZADA
Fernando Galindo Soria*
INTRODUCCIN
Cuando se observan los trabajos desarrollados en el rea de Automatizacin de Bibliotecas, se detecta que la mayora de estos trabajos versan realmente sobre la automatizacin de un catlogo de ttulos, autores, etc., y sobre la explotacin automtica de estos catlogos y con esto el concepto de Biblioteca Automatizada se queda en el limbo, ya que lo que realmente se automatiza es la parte administrativa-operativa del manejo de informacin bibliogrfica y la biblioteca en s no es tocada. En este trabajo se presenta una propuesta de automatizacin de bibliotecas, en la cual se plantea que la biblioteca debe estar dentro de la computadora y no en estantes o libreros. Esta idea no es nueva y realmente en la Unidad Profesional Interdisciplinaria de Ingeniera y Ciencias Sociales y Administrativas (UPIICSA) del Instituto Politcnico Nacional (IPN) se han desarrollado algunos prototipos bajo este concepto, sin embargo, la mayora de las personas involucradas en automatizacin de bibliotecas no la contemplan principalmente por dos motivos: 1) Rompe completamente con el esquema tradicional de una biblioteca, donde los libros se encuentran en libreros y se tiene un sistema de alta complejidad para localizarlos y mantenerlos en su lugar (es por eso, que la mayora de aplicaciones de automatizacin de bibliotecas tienden a automatizar el proceso de catalogacin).
447
2) No es fcil conceptualizar a una biblioteca dentro de la computadora y an ms se marcan una serie de problemas para su logro. Un libro ocupa mucho espacio y no cabra en la computadora, esto ya no es un argumento si se considera que un libro tpico tiene l50 pginas, 40 renglones por pgina, 50 caracteres/rengln = 300,000 caracteres lo cual cabe sin ningn problema por ejemplo en un disco flexible. Por lo que si tomamos en cuenta que una computadora tpica actual puede tener 2 Mb en memoria principal y l000 Mb en disco, la capacidad de almacenamiento es sin problema la de una biblioteca mediana (alrededor de 3000 ttulos deferentes). Otro problema que se marca mucho es el de la captacin de la informacin, sin embargo, este problema es en s una falacia, ya que la mayora de las editoriales actuales capturan para su edicin los libros en algn sistema de computo y posteriormente lo imprimen en papel (en la actualidad sale tan caro un ciento de hojas de papel como un disco flexible) por lo que en su momento se podra almacenar directamente el libro en la computadora, por otro lado, en el rea de reconocimiento de imgenes se tienen desarrollos orientados a la captura visual de libros. Poca gente tendra acceso a este tipo bibliotecas, esta es una verdad/mentira, ya que en la actualidad poca gente tiene un acceso real a cualquier tipo, de biblioteca y los libros son cada vez ms caros por otra parte con introduccin de las computadoras en las bibliotecas pblicas (Proyecto Computacin para Todos los Nios) y en las escuelas por un lado y por el otro con el acceso casero a la computadora, en algunos lugares, cada vez ms se contar con herramientas para un acceso masivo. Sin embargo, el argumento ms fuerte en contra de este tipo de desarrollo se centra en la no disponibilidad de herramientas de programacin orientadas a manejar una biblioteca automatizada. Es precisamente el objetivo de este trabajo, mostrar que una herramienta de este tipo es relativamente fcil de construir ya que se cuenta prcticamente con todos los ingredientes del men y lo que se requiere es combinarlos en un buen platillo.
448
449
INFORMACIN Libros completos Autores Ttulos Temas Relaciones entre temas, libros y autores Etc.
Requerimientos
CONSTRUCTOR
BIBLIOTECA AUTOMATIZADA
EXPLOTADOR
Respuestas Ttulos, Autores, etc. Relacin entre libros, temas, etc. Listado de libros Prrafos
450
II RECONOCEDOR DE LENGUAJE
El reconocedor de Lenguaje Natural, es el responsable de detectar a partir de la informacin requerimientos del usuario, los entes y acciones involucradas. Por ejemplo en la oracin:
Dame todos los prrafos que tengas sobre temas relacionados con Antropologa.
1) El sistema detecta una accin: Dame 2) Detecta un cuantificador: todos 3) Detecta lo que se quiere (prrafos, libro, rea, etc.): prrafos 4) Detecta que no quiere el tema principal sino: los temas relacionados 5) Detecta el tema principal: Antropologa Este tipo de reconocedor es relativamente fcil de construir utilizando las tcnicas de Programacin Dirigida por Sintaxis.
451
clulas estudia Citologa parte de libro de Biologa Biologa Celular compuesto de tejidos estudia Histologa
relacionada con
C.U.M. Smith
autor de
el sistema puede responder: Histologa. Por otra parte si a lo anterior se le aumentan reglas de inferencia, se cuenta ya con una herramienta muy interesante. Por ejemplo, si se agrega: Si X es parte de Y, X estudia Z, entonces Y estudia Z Si X est relacionado con Y entonces Y est relacionado con X Si X estudia y entonces X est relacionado con Y Si X est compuesto de Y entonces X esta relacionado con Y Si X es parte de Y entonces X esta relacionado con Y
da como respuesta.
Histologa Tejidos
IV BASE DE DATOS
Este primer nivel de almacenamiento es extremadamente poderoso y en su momento nos permite dar respuestas a mltiples interrogantes en las que participan distintos entes involucrados. Sin embargo, y si recordamos el modelo de Chen de Base de Datos (de Entidad/Relacin), la realidad se puede conceptualizar en trminos de entidades relacionadas entre s, donde cada entidad es a su vez descrita mediante un conjunto de atributos y hasta el momento, lo nico que hemos manejado ha sido a las entidades y sus relaciones y no se ha involucrado a los atributos, por lo que oraciones como las siguientes: 1) Pedro Prez naci en la ciudad de Guadalajara 2) Pedro Prez vive en cerritos #38, col. Chapuln 3) Pedro Prez naci el 20 de enero de l950 no se han manejado. Como un primer enfoque "se siente" que se podra aumentar la Base de Conocimientos, sin embargo, desde un punto de vista prctico, tal vez no sea la mejor solucin, ya que los atributos de un ente pueden ser muchos y en su momento slo se refieren a ese ente en particular por lo que no se requiere ni la capacidad de relacionar todo contra todo, ni los mecanismos de inferencia. En particular, en este trabajo se plantea la introduccin de un segundo mecanismo de manejo de informacin fuertemente relacionado con el primero. Este mecanismo es un sistema manejador de Base de Datos de tipo Relacional.
453
Mediante este enfoque, se detectan los principales tipos de Entes involucrados en el sistema (en este caso pueden ser: autor, libro, editorial, etc.) y para cada caso, sus principales atributos, por ejemplo en el caso de autor pueden ser: nombre, fecha de nacimiento, lugar de nacimiento, estudios, etc.; y a partir de estos se puede disear la Base de Datos (figura 4), en donde a cada entidad le correspondera una parte del esquema.
AUTOR NOMBRE Juan Prez FECHA-NAC LUGAR-NAC 20-ene-50 Guadalajara LIBROS AUTOR TITULO EDICION PAGINAS
mediante este mecanismo, los atributos de Juan Prez quedan en la Base de Datos, por lo que si alguien pregunta:
Dnde naci Juan Prez?
El sistema responde: En Guadalajara Por otra parte, los dos mecanismos se encuentran fuertemente relacionados, ya que si por ejemplo se almacena:
Juan Prez escribi La Vida es Verde
En este caso el sistema primero tiene que ir a la Base de Conocimientos para enterarse que Juan Prez escribi La Vida es Verde y con esta informacin accesa la Base de Datos para saber que Juan Prez naci en Guadalajara, que es lo que responde.
V BIBLIOTECA ALMACENADA
Sin embargo, y a pesar de estos mecanismos, an no se cuenta con una Biblioteca Automatizada, ya que los libros an no estn en el sistema pero esto se puede arreglar introduciendo el tercer mecanismo, con el cual se pretende almacenar precisamente los libros. Este mecanismo es un almacn o Biblioteca Almacenada donde cada libro queda fsicamente guardado. Por lo que si alguna persona pide el contenido de un libro en particular, lo nico que se requiere es desplegarlo. Ahora bien, para lograr lo anterior, nuevamente los diferentes mecanismos deben estar fuertemente relacionados. Por ejemplo, almacenado como atributos del libro dentro de la Base de Datos los siguientes: 1) Nombre del Archivo Almacn 2) Posicin Inicial del libro en el archivo 3) Posicin Final de caracteres del libro con lo cual, si se pide un libro en particular se puede localizar. Hasta este punto se puede decir que ya se cuenta con una Biblioteca Automatizada, sin embargo, es ilgico desaprovechar tan bonita oportunidad y quedarnos slo en el umbral de lo que se puede obtener ya que, s se involucra un nuevo mecanismo, el potencial del sistema aumenta considerablemente.
455
1) Dime en que partes del libro de Biologa Molecular se estudian las clulas 2) Dame los prrafos del libro Biologa Molecular que tratan de las clulas 3) Dame todos los prrafos que tengas sobre Vicente Guerrero En principio un mecanismo de este tipo est formado por un directorio o ndice, donde para cada tema aparecen los libros donde se encuentra y se indica en que partes del libro se menciona el tema. Al integrar este mecanismo con los anteriores, el potencial crece ya que nos permite un acceso prcticamente a la informacin y realmente el concepto de libro desaparece ya que lo que se tiene es un gran almacn de informacin con mltiples mecanismos de acceso a diferentes niveles de especificidad. Uno de los problemas planteados a este ltimo mecanismo es el de la dificultad para obtener y almacenar este tipo de informacin, sin embargo, sta no es una limitante real ya que la mayora de los libros trae un ndice por captulos y muchos cuentan con ndices por temas. Por otro lado, esta es otra de las ventajas de una Biblioteca Automatizada, ya que al tener los libros en la computadora se puede desarrollar una herramienta que permita listar todas las palabras diferentes con las se cuenta y su posicin en los diferentes documentos (en su momento se le puede dar una lista de palabras relevantes para que no las almacene, y otra de palabras compuestas v.g.: Buenos Aires que es, importante manejar en forma compuesta).
456
457
MEMORIA AUTOMATIZADA