Está en la página 1de 27

Tratamiento automatizado de la información:

Bases de datos

1. Bases de datos: definición, características____________________________ 2

1.1. Definición: ______________________________________________ 2

1.2. Principales características de las bases de datos:_________________ 2

1.3 Conceptos relacionados con las bases de datos ____________________ 3

1.4 Administradores / usuarios: __________________________________ 3

2. Estructuras de datos utilizadas en dispositivos de almacenamiento / estructura


de la información digital _____________________________________________ 4

3. Clasificación de las bases de datos _________________________________ 8

4. El mercado de las bases de datos _________________________________ 10

5. Sistemas de gestión de bases de datos _____________________________ 12

6. Sistemas de gestión de bases de datos _____________________________ 15

6.1. SGBD relacional _________________________________________ 15

6.2. Sistemas de gestión documental ____________________________ 16

6.3. Sistemas de gestión electrónica de documentos ________________ 21

7. Automatización de un centro de documentación informativo_____________ 22

8. Las bases de datos en una biblioteca _______________________________ 26

1
1. Bases de datos: definición, características

1.1. Definición:

La explosión de la información ha hecho necesarios nuevos métodos de control para


no ahogarse en medio de tantos datos y poder aprovechar al máximo todo lo
publicado. La posibilidad de tener toda esta información en la memoria del
ordenador y, mediante un programa de gestión y recuperación poder recuperarla
siempre que se quiera, fue uno de los motivos primordiales de la constitución de las
bases de datos.

Entendemos como bases de datos el conjunto de textos, cifras, imágenes o la


combinación de todos ellos registrados de modo que pueden ser leídos por
ordenador y organizados por un programa que permite su localización y
recuperación.

Conjunto de datos clasificados y ordenados mediante un programa de ordenador, a


los que puede accederse de una forma rápida y automatizada. Los programas
capaces de llevar a cabo esta tarea son los programas gestores de bases de datos.

1.2. Principales características de las bases de datos:

o Están formadas por grandes depósitos de información muy diversa (textos,


cifras, imágenes) organizadas en unidades mínimas, llamadas registros.
o Los registros están grabados en un soporte (magnético u óptico) susceptible de
ser leído por ordenador.
o Constan de un programa de gestión documental que se encarga de estructurar
y controlar la información para facilitar en cualquier momento su rápida y
precisa recuperación.
o Las bases de datos se pueden distribuir en distintos soportes: bases de datos en
línea, en soporte óptico.

2
1.3 Conceptos relacionados con las bases de datos

✓ Flexibilidad: se refiere a los tiempos de respuesta que obtiene un usuario


cuando consulta una base de datos independientemente del método de acceso
utilizado. Lo idóneo es obtener una gran flexibilidad con tiempos de respuesta
pequeños.
✓ Acceso múltiple: se refiere a la capacidad de varios usuarios par acceder de
forma simultánea a la base de datos sin que ello provoque conflictos ni
versiones diferentes.
✓ Uso múltiple: capacidad de los usuarios para tener distintas visiones
particulares.
✓ Seguridad: capacidad del sistema para protegerse respecto a accesos no
autorizados, para evitar así la posible manipulación o destrucción de los datos.
✓ Integridad de los datos: se refiere a la capacidad de los sistemas para
protegerse contra posibles errores o daños que se pudieran producir en los
datos. Estos pueden venir por fallos del hardware o del software.

1.4 Administradores / usuarios:

En el uso de las bases de datos distinguimos entre el administrador y el usuario:

✓ El administrador no siempre tiene que ser una persona pues puede referirse a
una función. Se ocupa de la gestión y vigilancia de los datos en los sistemas de
información a los que acceden diversos usuarios. Para ello utiliza las funciones
de definir y modificar las estructuras de datos, autorizar el acceso de
determinados usuarios a determinados datos, la seguridad de los datos, el
almacenamiento físico de los mismos y se ocupa también de hacer copias de
seguridad y de la elaboración de estadísticas del sistema.

✓ Los usuarios son personas que acceden y usan la información. Los informáticos
suelen ser analistas, programadores. Los no informáticos utilizan la información
porque la necesitan.

3
2. Estructuras de datos utilizadas en dispositivos de almacenamiento /
estructura de la información digital

• En los ordenadores el mínimo contenido de información es el bit, al conjunto de


bits necesarios para representar un carácter se le denomina byte (actualmente
8).
• Tipos de caracteres: alfabéticos, numéricos, especiales, de control (que se
utilizan para el gobierno de las unidades a las cuales van destinados).
• Dato: conjunto de caracteres con significado propio.

• Campo: lugar físico de almacenamiento destinado a contener información


independiente. Un campo es la estructura que contiene un dato individual
acerca de la entidad de la que trate. Hay distintos tipos de campos:

• Tipos de campos: alfabéticos (texto), numéricos (susceptibles de realizar


operaciones con ellos), alfanuméricos (combina los dos anteriores),
formateados (contienen una información según un patrón determinado,
fecha, hora, moneda), lógicos (su información cumplirá determinadas
condiciones (solo admite dos posibilidades sí/no). Ejemplo de subcampo:
área de edición (lugar de edición, editorial, año de edición).

• Longitud de campo: número de posiciones que ocupa un campo en el medio


de almacenamiento en el que está inserto. Puede ser igual o superior al
número de caracteres del dato que contiene. Campos de longitud fija y
campos de longitud variable.

• Al conjunto de datos relativos a un mismo ente u objeto se le denomina


registro. Al conjunto de registros de entes homogéneos se le llama fichero.

4
Registro: conjunto de campos relacionados entre sí que contiene datos
referidos a un mismo ente u objeto. Estructuras de datos que contiene
información relativa a un mismo ente. El registro se subdivide en campos.

✓ Registros de longitud fija: todos los campos que lo forman son de longitud
fija.

✓ Registros de longitud variable: uno o varios de los campos que lo integran


tiene longitud variable, aunque tiene una dimensión máxima que no se
sobrepasará.

✓ Registros de longitud indefinida: la longitud es imposible de determinar.


Incluye marcas de final de campo y de fin de registro.

✓ Registro lógico: los registros, tal y como los vemos nosotros.

✓ Registro físico: unidad física de información que el ordenador es capaz de


leer o grabar en una operación de e/s de una sola vez.

Fichero: conjunto homogéneo y organizado de información referente a un mismo


tema, organizada de forma que permita el acceso al usuario. Se compone de
registros. Pueden ser ficheros permanentes (con información relevante para el
programa) o temporales.
Fichero de una base de datos: conjunto de registros que tienen una relación entre
sí. Cada registro contiene toda la información relativa a un elemento del fichero.

Operaciones que se pueden hacer sobre un fichero:


✓ Creación: consiste en definir su estructura (campos, longitud de los campos,
clave...).
✓ Actualización: consiste en tres operaciones:
o Inserción de registros: introducir datos.
o Borrado: suprimir uno o varios registros.
o Modificación: cambiar la información correspondiente a uno o varios
registros.
✓ Clasificación (ordenarlo conforme a algún criterio)
✓ Consulta: cualquier acceso a uno o varios registros para conocer el
contenido de uno o varios registros, conocer la información o tratarla.

5
Métodos de organización y acceso de ficheros:
Métodos de acceso a ficheros: conjunto de técnicas que tienen por objeto facilitar la
búsqueda de información dentro de la organización física de los ficheros:

Secuencial: los registros están grabados en orden y deben ser leídos en ese mismo
orden. Para leer un registro hay que pasar por los anteriores. Solo pueden añadirse
registros al final del fichero, pues no permite la inserción de registros en un punto
cualquiera.
Los registros se clasifican en orden ascendente o descendente, unos detrás de
otros, sin dejar hueco (ahorro de espacio), en función de su clave. Para recuperar,
se busca en secuencia desde el principio del fichero hasta el registro que se busca.
Si el registro está en el medio, hay que pasar por la mitad de los registros. No se
puede realizar directamente la inserción o supresión de registros porque entonces
no se mantendría la secuencia lógica del fichero.

Secuencial indexado: la grabación del registro es igual que en el anterior


(secuencialmente). La lectura, se hace a través de un índice. El índice, recoge todas
las claves de los registros, y asociados a esta clave, la dirección que tiene el
registro en el fichero. De esta forma, no hay que leer todos los registros uno por
uno hasta llegar a la información que nos interesa, sino que lee el disco por
sectores.
Los ficheros indexados o ficheros inversos son aquellos que se crean para facilitar el
acceso aleatorio mediante claves secundarias elegidas por el usuario. Cada registro
contiene:
a) el valor del campo por el cual se desea realizar la búsqueda directa y
b) un puntero, un registro de dirección que permite el acceso directo a
dicho registro.

Aleatoria o directa: este tipo de fichero solo es posible en soportes direccionables


(discos). Para poder acceder a estos ficheros, al crearlos se genera
automáticamente su dirección en el disco, accediéndose por lo tanto a través de un
índice que se genera automáticamente.
La inserción se puede realizar en cualquier parte del fichero.
Son ficheros en los que se puede acceder a una información sin necesidad de pasar
por las informaciones que le precedan. Los datos se almacenan sin tener en cuenta
la secuencia física de llegada. El acceso al registro se hace por medio de la
dirección relativa del registro. El mayor inconveniente es conocer esa dirección
relativa.

6
Fichero de datos (en secuencia por DNI)
Nº registro DNI Apellidos Nombre Nº matrícula
1 3856 Estévez López Álvaro 20
2 32856 Martín Benítez Isabel 22
3 123489 Valle garcía Ana 24
4 443892 Álvarez vega Benjamín 21
5 4834622 Cruz Aguirre José 25
6 22356420 Redondo Sanz Manuela 23

Fichero secuencial indexado

Fichero índice
Apellidos Registro de dirección
Álvarez Vega 4
Cruz Aguirre 5
Estévez López 1
Martín Benítez 2
Redondo Bermejo 6
Valle García 3

Fichero de datos (sin secuencia)


Nº registro DNI Apellidos Nombre Nº matrícula
1 123489 Valle garcía Ana 24
2 32856 Martín Benítez Isabel 22
3 3856 Estévez López Álvaro 20
4 443892 Álvarez vega Benjamín 21
5 22356420 Redondo Sanz Manuela 23
6 4834622 Cruz Aguirre José 25

7
3. Clasificación de las bases de datos

A) Las bases de datos pueden ser clasificadas según diversos criterios, como son el
área temática que cubre, el ámbito publico o privado de las empresas que las
crean, etc., pero la tipología más común es la que basa su criterio diferenciador en
el carácter primario o secundario de la información que ofrecen. Así, las bases de
datos pueden ser:

3.1. Referenciales: aquellas que no disponen de la información final, sino


que remiten al usuario a otra fuente de información que le permitirá completar su
consulta. Dentro de estas hay dos grupos:

✓ Bases de datos bibliográficas: contienen descripciones, algunas veces con


resumen, de diversos documentos. Remiten a diferentes tipos de documentos
(revistas, monografías, videos, etc.);
✓ Bases de datos directorio: las referencias que contienen remiten básicamente a
organizaciones, asociaciones, empresas o personas. Proporcionan la dirección,
el nombre completo, el teléfono y algunas también un breve historial.

3.2. Fuente: las bases de datos fuente son las que proporcionan información
final, es decir, el texto completo y no solamente la referencia y, por tanto,
responden de forma completa e inmediata a la petición del usuario, sin necesidad
de que este tenga que redirigirse a otras fuentes de información. Dentro de estas
se distinguen tres grupos:

✓ Bases de datos textuales: sus registros contienen los textos completos de los
documentos y permiten acceder inmediatamente a la fuente primaria de
información.
✓ Bases de datos numéricas: contienen básicamente cifras y valores numéricos de
diversos aspectos: estadísticas, cotizaciones de bolsa, etc. Generalmente se
presentan en forma de tablas o series.
✓ Bases de datos textual - numéricas: combinan ambas, ya que sus registros
disponen de diferentes campos de información.

8
B) En cuanto a la localización de las bases de datos, estas pueden ser locales o
remotas o distribuidas:

✓ Las locales se encuentran instaladas en equipos próximos al usuario;


✓ Las remotas se encuentran en servidores alejados y deben consultarse por
vía telemática;
✓ Se habla de bases de datos distribuidas cuando los contenidos y registros de
la base de datos se encuentran en diferentes sistemas informáticos y estos
sistemas informáticos se encuentran dispersos geográficamente, como
serian por ejemplo las Bb. de los bancos. Así se consigue que se dé una
mejor operación con la base de datos desde cualquier lugar en donde se
opere con ella, existiendo una serie de réplicas o mirrors de la misma.

9
4. El mercado de las bases de datos

Los elementos que componen el mercado de las bases de datos son:


✓ Los productores;
✓ Los distribuidores;
✓ Las redes de telecomunicaciones.

4.1. Los productores de las bases de datos son aquellas empresas,


organizaciones o instituciones destinadas a la creación de bases de datos. Su labor
consiste en analizar documentos (describirlos, analizarlos, clasificarlos o incluso
resumirlos) y convertirlos en información elaborada.
Para poner la información al alcance de los usuarios, los productores de bases de
datos pueden emplear los siguientes caminos: distribuir ellos mismos sus bases de
datos o ceder la explotación de su base de datos a los distribuidores, que es la
opción más empleada.
Ejemplo: CSIC

4.2. Distribuidores de bases de datos: también denominados hosts, son unas


organizaciones que disponen de grandes ordenadores que contienen las cintas
magnéticas con la información de diversas bases de datos, un paquete de
programas que permitirá consultar con un lenguaje único todas las bases de datos
que se distribuyan y las conexiones con las redes de telecomunicaciones que
permitirán acceder a la información almacenada al ordenador principal a cualquier
usuario que disponga de un terminal remoto.
Es decir, los distribuidores han obtenido los derechos de explotación de diversas
bases de datos y se ocupan de organizar los medios técnicos para ponerlas a
disposición de sus usuarios. El hecho de que existan los distribuidores es una
ventaja para los usuarios, puesto que con un único contrato puede acceder a
diversas bases de datos comercializadas por el distribuidor y puede interrogarlas
mediante un único lenguaje.
Distribuidores españoles serian la agencia efe, baratz, ebsco, doc6

10
Las características que diferencian a los distintos distribuidores de bases de datos
son:
✓ Las diferentes tarifas para consultar una misma base de datos según el
distribuidor;
✓ Las condiciones de la suscripción;
✓ Las características del lenguaje de recuperación;
✓ La frecuencia de actualización de las bases de datos;
✓ Los servicios que ofrece y sus características y condiciones;
✓ Las distintas bases de datos que pueden consultarse.

Servicios que ofrecen los distribuidores de bases de datos:

✓ Servicio de búsqueda bibliográfica retrospectiva: consiste en recopilar la


información existente en una o más bases de datos sobre un tema en un
periodo de tiempo previo al del momento en que se realiza la búsqueda.
✓ Servicio de difusión selectiva de la información: este servicio permite almacenar
una búsqueda en el ordenador del distribuidor de bases de datos y que esta se
ejecute automáticamente en las bases de datos que convenga cada vez que
estas se actualicen.
✓ Servicio de correo electrónico: este servicio puede ser utilizado para hacer llegar
la información obtenida fruto de una búsqueda a su usuario o para establecer
comunicación entre el distribuidor y usuario o entre distintos usuarios.
✓ Servicio de búsqueda simultanea: permite realizar una misma búsqueda en
distintas bases de datos a la vez, es decir, con una única búsqueda
interrogamos a la vez a varias bases de datos.
✓ Servicio de detección de duplicados: este servicio ha surgido a raíz de la
aplicación del anterior, es decir, consiste en extraer del resultado de una
búsqueda simultanea en varias bases de datos todos los registros repetidos que
puedan encontrarse.
✓ Servicio de obtención de copias de documentos primarios, que podría realizarse
mediante correo electrónico.

4.3. Redes de telecomunicación

La comunicación en línea y a distancia se lleva a cabo a través de las redes de


telecomunicaciones, a través de las cuales se transmite la demanda de la
información. Las redes de transmisión de datos pueden ser de titularidad publica o
privada. Dependiendo de los países predomina una u otra.

11
5. Sistemas de gestión de bases de datos

Los programas que permiten administrar y explotar bases de datos se llaman


sistemas de gestión de bases de datos (SGBD).

El sistema de gestión de bases de datos es un conjunto integrado de programas,


procedimientos y lenguajes que suministra a distintos tipos de usuarios los medios
necesarios para describir y manipular los datos almacenados en una base de datos
y garantizar su seguridad.

Es un sistema formado por un conjunto de datos interrelacionados y almacenados


en conjunto, y un paquete de software para la gestión del mismo, de tal modo que
se controla el almacenamiento de datos redundantes y los datos resultan
independientes de los programas que los usan.

Funciones y lenguajes documentales

Un lenguaje en un SGBD es el conjunto de instrucciones que, de acuerdo a una


sintaxis, ayudan a cumplir las distintas funciones que ha de cumplir un SGBD.
✓ Si atendemos al tipo de función distinguimos entre lenguajes de definición y
lenguajes de manipulación de datos.
✓ Si atendemos al tipo de usuarios: lenguajes orientados a informáticos y
lenguajes orientados a usuarios finales.

12
Las funciones esenciales de un SGBD son las de descripción, manipulación y
utilización:

✓ Función de descripción o definición. Esta función permite al administrador de la


Bb. especificar los elementos de datos que la integran, su estructura y las
relaciones que existen entre ellos, así como las características de tipo físico y las
vistas lógicas de los usuarios. Esta función se lleva a cabo por el lenguaje de
definición de datos (LDD).
Se trata, pues de un conjunto de instrucciones que operan de acuerdo a una
sintaxis y que permiten al administrador de la base definir los datos con
facilidad y precisión, especificando sus distintas estructuras:
- Lenguaje de definición de la estructura lógica: permite asignar nombre a
los campos, a los registros, estableciendo sus longitudes y
características, así como sus relaciones, restricciones, etc. Permite a
quién lo diseña especificar que datos lo van a integrar: tipo de datos,
relaciones entre ellos, características de su almacenamiento físico y su
presentación a los usuarios.
- Lenguaje para la definición de la estructura interna.
- Lenguaje de definición de estructuras externas: el SGBD debe poner a
disposición de los usuarios medios que les permitan recuperar o
actualizar los datos contenidos en la base, de acuerdo con la visión lógica
o estructura externa (vista) que precise cada aplicación.

✓ Función de manipulación. Esta función permite a los usuarios la:


- Consulta o recuperación: consiste en una serie de operaciones que
pueden afectar a la totalidad o una parte determinada de datos. Al
hacer una consulta, el sistema accede a la estructura interna, localiza los
registros, selecciona la información que cumple la condición de búsqueda
y por último los pone a disposición del usuario.
- Actualización de la base de datos: se puede realizar mediante la
inserción, el borrado o la modificación de datos.
La función de manipulación se lleva a cabo a través del lenguaje de
manipulación de datos (LMD), que facilita los instrumentos necesarios
para la realización de estas tareas. El usuario final no necesita
normalmente tanta potencia, por ello se le da un lenguaje de
manipulación con sintaxis sencilla, a veces por medio de menús. La
estructura y sintaxis de todos esos tipos de lenguajes dependen de cada

13
SGBD, pero en las SGBD relacionales SQL es un estándar muy
extendido.
Es decir, se trata de un conjunto de instrucciones que operan de acuerdo
a una sintaxis y que permiten a los usuarios la posibilidad de referirse a
determinados conjuntos de datos que cumplan ciertas condiciones
(criterio de selección), como que un atributo tenga un determinado
valor, o que un conjunto de atributos y valores satisfagan cierta
expresión lógica. Además del criterio de selección, es preciso indicar la
estructura externa que se desea actualizar o recuperar.

✓ Función de utilización. Es la función que reúne todas las interfaces que


necesitan los usuarios para comunicarse con la base y proporciona un conjunto de
procedimientos para el administrador, entre los que se encuentra el lenguaje de
control de datos (LCD), que facilita una serie de servicios, como obtener
estadísticas de utilización, así como todas aquellas relacionadas con la seguridad
física (copias de seguridad, rearranque en caso de caída del sistema, etc.) y las
autorizaciones de acceso a datos.

14
6. Sistemas de gestión de bases de datos

Existen varios tipos de programas gestores de bases de datos: unos pueden


procesar y manejar una gran cantidad de información, almacenada en una serie de
documentos mas o menos extensos denominados registros. Son las bases de datos
documentales (Knosys). Otros, por el contrario, presentan una capacidad elevada
para el procesamiento de datos de tipo numérico, pero son mas limitados para el
tratamiento de la información escrita, pudiendo presentar restricciones, por
ejemplo, en la longitud que ocupa cada entrada de datos (Access).

Los principales SGBD que se encuentran en el mercado son los siguientes:

1.- sistemas de gestión de bases de datos relacional (SGBDR)


2.- sistemas de gestión documental (SGD)
3.- sistemas de gestión electrónica de documentos (sistema GED)

6.1. SGBD relacional

Se trata de un tipo de programas de bases de datos útiles para gestionar


documentos de tipo administrativo, ya que la información que contienen esta muy
estructurada (p.ej. cada campo tendrá un numero de caracteres determinado: un
código postal 5 caracteres numéricos, una profesión, unos caracteres alfanuméricos
predecibles, etc.)

Información estructurada y no estructurada.


Información estructurada: aquellos datos que tienen una longitud y un formato fijo.
Información no estructurada: son aquellos datos que tienen una longitud y un
formato variable). Los datos se almacenan en diversas estructuras tabulares
interrelacionadas entre sí, correspondiendo las filas a los registros, y las columnas,
a los campos.

Para utilizar bases de datos relacionales, los datos deben cumplir un requisito
ineludible: estar muy estructurados. En general, datos muy definidos que son
fácilmente divisibles en campos concretos.

15
6.2. Sistemas de gestión documental

Los SGD están pensados para gestionar documentos mas que simples datos. Son
sistemas que ponen su énfasis en la recuperación de la información. Esta orientado
a la gestión de documentos de tipo científico y de prensa. Este tipo de información
se encuentra poco estructurada (un titulo puede ocupar 3 letras o 3 líneas, a veces
no hay autor, a veces hay 4, etc.).
Hemos visto que podemos utilizar bases de datos relacionales para información
muy estructurada. Sin embargo, la mayoría de la información que se utiliza
normalmente en documentación no está tan estructurada. La variedad de
información es tan grande que es imprevisible saber qué es lo que puede buscar
alguien y aunque definiésemos un campo por cada palabra, ¿cómo saber si un tema
se ha introducido en la base de datos tal y como la busca el usuario?.

Diferencias entre bases de datos relacionales y los SRI:

✓ Los registros son documentos y no filas de una tabla.


✓ Los campos tienen extensión variable.
✓ Un registro puede no tener estructura al estar formado sólo por un campo.
✓ La longitud de los campos buscables no se limita a 255 caracteres.
✓ Permiten una recuperación libre de la información, o sea, sin necesidad de
indicar el campo en el que se desea buscar.
✓ Los SRI son capaces de generar automáticamente índices en el interior de cada
campo por cada elemento (por palabra, por campo completo, por términos
encerrados entre signos, etc.).
✓ Los SRI son concebidos para almacenar y recuperar información textual. Los
SGBD están orientados hacia el procesamiento convencional de datos
(estructuras muy definidas).
✓ Los SRI poseen mayor grado de rapidez que los SGBD en la recuperación de
aquellos registros que satisfacen las condiciones de búsqueda.

16
Características de los SGD:

o Estructuralmente, los SGD basan su poder de recuperación en la creación de


unos índices (fichero inverso) a los que van a parar todos los términos incluidos
en cualquier campo indexado del registro, a excepción de aquellos que
previamente se han definido como términos sin significación (palabras vacías).
Los sistemas de recuperación de información, SRI (Bb., SGBDT, SGD) son
programas o paquetes de software que basados en el uso de ficheros inversos
disponen de todas las funciones necesarias para el almacenamiento, indexación,
consulta y modificación de información textual.
Esta técnica de indización se denomina así por contraposición al fichero directo,
que es el conjunto de todos los registros introducidos en la base de datos y que
están dispuestos de forma secuencial (siguiendo el orden cronológico de
introducción de los datos). Por su parte, el fichero inverso es el fichero de
búsqueda y consta de la relación alfabética de todos los términos contenidos en
campos indizables de los registros. Se podría comparar al índice analítico de una
publicación.
Es un índice que permite al programa recuperar los documentos por su
contenido: encuentra el documento en el que se encuentra el término, el
campo, la frase y la posición en dicha frase. El fichero inverso es el medio que
tiene el programa para localizar la información
o El uso de registros de extensión indefinida basados en el modelo de una ficha
bibliográfica, en lugar de una estructura tabular como los SGBDR.
(Almacenamiento de documentos en forma de registros de longitud variable).
Capacidad para diseñar, estructurar, modificar y utilizar cómodamente una base
de datos con información textual de gran longitud.
o Disponen de gran potencia de recuperación (tienen un lenguaje de recuperación
muy versátil y potente) y de la posibilidad de confeccionar productos impresos
de características muy diversas. Existe la posibilidad de elaborar distintos
productos impresos y generar informes. Permite acceder a los registros a partir
de cualquier palabra introducida que se encuentre en un campo indizado y que
no sea una palabra vacía
o Posibilidad de hacer búsquedas secuenciales. Realiza la búsqueda en
toda la base documento a documento. Es mucho más lenta que la
búsqueda indexada.
o El álgebra booleana para efectuar las operaciones de recuperación. Estos
operadores son siempre binarios. Deben llevar términos de búsqueda a
ambos lados.

17
o Posibilidad de combinar distintas expresiones y estrategias de búsqueda
o Administración de la base de datos: posibilidad de establecer niveles de
seguridad. Permite la definición del modelo de registro, de los campos, de los
criterios de indización y facilita el establecimiento de palabras vacías.
o Posibilidad de definir campos como indizables o no indizables. Un campo
indizable es un campo que nos permite buscar información que contiene ese
campo o cuyos términos pasan a formar parte de un fichero inverso.
o Poder definir campos de contenido obligatorio. Esto significa que el campo debe
tener datos obligatoriamente para poder guardar el documento.
o Posibilidad de definir campos con vocabulario controlado. El sistema obliga
automáticamente a que en el campo figuren términos de una lista de ellos
autorizada. Posibilidad de incorporar un tesauro.
o Existe la posibilidad de tener un editor que pueda procesar los textos que se
utilicen en la base de datos. Como mínimo, que permita operaciones con
bloques y que permita diferentes estilos de textos.

18
Los lenguajes de interrogación:

Es una herramienta que nos permite buscar y recuperar información empleando los
términos o palabras que figuran en los documentos. La recuperación de información
es esencialmente una operación de comparación.

✓ Referencias simples: búsquedas de una sola palabra.


✓ Referencias genéricas: búsquedas de palabras mediante truncamientos o
comodines. El truncado puede ser de un solo carácter o de muchos caracteres y
puede ser a la derecha, a la izquierda o en medio de las palabras.
✓ Referencias adyacentes o de proximidad: búsqueda de múltiples palabras que
forman un concepto o que mantienen una relación estrecha de cercanía. Que
estén separadas sólo por dos palabras, que estén en la misma frase o que estén
en el mismo párrafo.
✓ Referencias cualificadas: búsqueda de palabras en un campo determinado.
✓ Operadores booleanos: and, or, not. Los operadores funciones con jerarquía y
en las búsquedas complejas es necesario el uso de paréntesis.
✓ Operadores relacionales: los de comparación: >, <, =, <>, >/, </.

Modo de indización automática en los SRI

✓ El programa lee los textos desechando una serie de palabras vacías, a veces
definibles por el usuario, almacenadas en un fichero. Con cada palabra el fichero
inverso genera un registro con un puntero a cada documento y a la situación
exacta del fichero maestro que contiene esa palabra.
✓ Las consultas se realizan por defecto sobre el fichero inverso o índice y no sobre
el fichero maestro.

19
Fichero maestro:

Doc 1032:
Autor = Pérez, José
Título = los sistemas de recuperación de información: teoría y práctica

doc 2075
Autor = López, Juan
Título = los sistemas de información universitaria

Fichero inverso:

término Nº doc. Campo Nº párrafo Nº frase Nº palabra


Información 1032 Título 1 1 3
Información 2765 Título 1 1 2
José 1032 Autor 1 1 2
Juan 2765 Autor 1 1 2
López 2765 Autor 1 1 1
Pérez 1032 Autor 1 1 1
Práctica 1032 Título 2 1 2
Recuperación 1032 Título 1 1 2
Sistemas 1032 Título 1 1 1
Sistemas 2765 Título 1 1 1
Teoría 1032 Título 2 1 1
Universitaria 2765 Título 1 1 3

20
6.3. Sistemas de gestión electrónica de documentos

Son unos programas más complejos que los anteriores y permiten gestionar, no
sólo una referencia, sino también la reproducción facsímil de cada uno de los
artículos analizados. De este modo se dispone del documento original en pantalla y
no es necesario desplazarse para buscar el documento al que te remiten las
referencias. Es un tipo de sistemas muy propicio para los medios de comunicación.
La base lógica de un sistema GED esta formado por un SGBDR o un SGD que es el
encargado de gestionar las referencias de los documentos digitalizados y de las
conexiones entre estas y las imágenes digitalizadas.

21
7. Automatización de un centro de documentación informativo

Mientras que las redacciones de los medios de comunicación se han adaptado mas
rápidamente a las nuevas tecnologías de la comunicación, no ha sido así en los
centros de documentación, aunque se ha visto la necesidad de la informatización de
los mismos, ya que la gestión automatizada permite y facilita un acceso más rápido
y selectivo a la información. La creación y diseño de una base de datos permite
gestionar informáticamente los fondos del centro. Ahora bien, informatizar un
centro de documentación no supone solo la compra de unos equipos informáticos,
sino que hace necesario un proyecto de diseño de su estructura y funcionamiento
según las necesidades y forma del trabajo del propio centro: análisis del futuro
centro, diseño de una base de datos, aplicación del sistema automatizado.

7.1. Análisis de la información:

Primero habrá que ver que tipo de información y de documentos quieren


gestionarse automáticamente. En nuestro caso se trataría de la llamada
información de actualidad, que son documentos de extensión diversa, de material
tanto textual como grafico, que abarca todo tipo de temas y con un volumen y
crecimiento muy elevado.
Serra necesario establecer distintos tipos de gestión para la información textual y
para la información grafica (fotografías, mapas, etc.)
Habrá que determinar cuál va a ser la base documental: si la base de datos va a
tener solo información lo publicado en nuestro medio de comunicación o también
otras publicaciones exteriores.
Hay que tener en cuenta que, en un principio, la gestión automatizada se lleva a
cabo en los documentos a partir del momento de informatización, no con visión
retrospectiva, por lo que durante algunos años convivirán el sistema tradicional
(que será el de recortes y clasificación temática por dossieres) y el sistema
informatizado.
En esta fase de análisis inicial habrá que definir ya la organización y recursos
humanos:
- en primer lugar es necesario determinar las necesidades de los usuarios para
prever sus necesidades actuales y futuras.
- Además, el personal que vaya a gestionar la base de datos deberá contar
preferentemente con unas determinadas características: tener amplios
conocimientos sobre información de actualidad así como conocimientos de
nuevas tecnologías.

22
7.2. Diseño de la base de datos:

Refiriéndonos a los requisitos que deberá cumplir la futura base de datos. Lo


adecuado seria trabajar primero con una muestra de los documentos, hasta
comprobar la validez y el correcto funcionamiento de la Bb..

Se deben seguir una serie de pasos para diseñar una base de datos:

- Tipo de bases de datos: deberemos elegir entre distintas posibilidades como


será la creación de una base de datos referencial (referencias de diversos
artículos), opción adecuada para un medio de comunicación pequeño que no
pueda realizar una inversión muy grande, y además no tiene un exceso de
material, creación de una base de datos de texto completo, o almacenar la
imagen facsímil de los documentos (bases de datos que contienen los
documentos digitalizados en forma de imagen, explotadas por la gestión
electrónica de documentos -GED-). Esta opción y la anterior seria para
empresas grandes que puedan realizar una gran inversión en su
automatización.
- Definición del modelo de registro: una vez identificado el tipo de información,
se hace necesario identificar también cual va a ser la unidad de registro, así
como de que campos va a contar y cuales van a ser indizados, es decir, que
campos volcaran su contendido en los índices (fichero inverso) y serán
recuperables.
- Después se establecen los campos de los documentos que vamos a insertar en
la base de datos. A efectos prácticos, es conveniente distinguir tres tipos de
campos:
o Campos de descripción formal o identificación: nos dan información
sobre características externas del documento que la identifican
unívocamente dentro de una colección de documentos.
o Campos de contenido: son los que recogen cualquier faceta
importante del contenido del documento p.ej.: las materias un campo
de resumen...
o Campos de control: recogen una serie de informaciones que son
importantes para el control de la base de datos: persona que hace el
documento; fecha de la última modificación, quien la ha hecho, etc.
- Diseño: consiste en determinar de una manera detallada la estructura de la
base de datos, con las características específicas de cada campo.

23
Con ellas construimos un “diccionario de datos” que es una lista detallada de
cada uno de los campos que formarán la base de datos con información acerca
de una serie de aspectos de cada campo:
o Nombre del campo
o Dominio del campo (conjunto de valores del que puede tomar datos
el campo)
o Tipo de indización (determinar si un campo indizará o no)
o Tratamiento documental (determinar un lenguaje controlado o libre:
lenguaje controlado: es un lenguaje que permite términos de una
lista autorizada. Lenguaje libre: es un lenguaje que permite
cualquier término).
o Controles de validación (una serie de condiciones o requisitos que
debe reunir el contenido del campo).
- por otra parte, tendremos que confeccionar unos instrumentos básicos para el
análisis, serán pues imprescindibles los lenguajes documentales (como
tesauros) para clasificar e indizar bien y de forma homogénea los documentos.
- tipo de recuperación: la consulta a la base de datos tiene que tener distintos
niveles adecuados a usuarios distintos y a diferentes tipos de consulta:

o Browse (u hojeo del fichero lineal): permite avanzar y retroceder en los


registros de la base de datos, siguiendo su orden de entrada.
o Consulta a los índices (fichero inverso): facilita el movimiento dentro de los
índices para tener así una idea general del contenido temático de la base de
datos.
o Búsquedas simplificadas: se trata de interfases de consulta especialmente
útiles para aquellos usuarios no expertos en la consulta de bases de datos.
El sistema les ayuda a formalizar su consulta en el lenguaje de interrogación
del programa sin necesidad de conocerlo.
o Búsquedas utilizando el lenguaje de interrogación: lo que permite realizar
búsquedas más complejas y precisas. Normalmente, es tan solo usado por
los documentalistas, que actúan como intermediarios entre el usuario
(periodistas) y la información almacenada en la base de datos.

- Difusión: el servicio de documentación ha de decidir que tipo de productos


secundarios se elaboraran: dossieres específicos según el interés de los usuarios,
edición en papel de actualizaciones de la base de datos, accesibilidad a través de
las redes de telecomunicaciones a usuarios externos, edición en soporte óptico

24
7.3. Implantación

- Primero se elige un sistema informático (hardware y software), introducir


elementos y hacer pruebas con ellos para saber como funcionan.
- Seleccionar un personal informático con conocimientos para la gestión del
sistema.
- Redacción de unas normas de tratamiento documental
- Formación del usuario mediante cursillos o folletos informativos.
- Implantación del sistema: una vez definido el proyecto por completo, con los
equipos y los programas informáticos, es necesario instalarlos y crear la base
de datos. Antes de una implantación definitiva, seria conveniente alimentar la
base de datos con una muestra experimental de registros para comprobar el
funcionamiento del sistema y detectar posibles errores no previstos. Una vez
que la base de datos ya ha pulido y corregido los errores y dispone de un
diseño definitivo, puede empezar a ser explotada de forma continuada,
teniendo como tareas básicas: la actualización diaria de los datos, la atención
de consultas y la elaboración de productos impresos junto con un control de
calidad que implica el mantenimiento del tesauro, revisión de las operaciones
de análisis documental y supervisión de diccionarios de palabras vacías y
diccionarios, y la realización de copias de seguridad para evitar la posible
perdida o deterioro de los registros introducidos.

25
8. Las bases de datos en una biblioteca

Características de un sistema ideal de adquisiciones


o Capacidad de búsqueda, por medio de diversos puntos de acceso, en el fichero
del CD para determinar el estatus de un ejemplar determinado, (por ejemplo,
pedido y no recibido).
o Capacidad del operador autorizado para pedir ejemplares adicionales de un
documento pedido anteriormente.
o Capacidad del operador autorizado dirigir un pedido en línea directamente al
proveedor y ajustar el fichero económico en la forma apropiada.
o Envío del ejemplar pedido, si está disponible, en 24 horas y ajuste del
inventario del proveedor.
o Capacidad para proporcionar información presupuestaria detallada en distintas
formas.
o Posibilidad de recuperar títulos, útiles en teoría, de una base de datos externa
que puede utilizarse con fines de selección de la biblioteca.
o El mantenimiento de un fichero general con la información completa de todos
los ejemplares pedidos o en proceso y que avise al personal cuando los
ejemplares pedidos no llegan.
o Capacidad para manejar todas las transacciones financieras y ajustar los
ficheros de acuerdo con ellas.
o Capacidad para acomodarse a diversos tipos de material como monografías,
revistas, publicaciones oficiales, ingresos globales, donativos y canjes, material
audiovisual etc.

Características de un sistema ideal de catalogación automatizada


o Acceso en línea a la base de datos para recuperar aquellos registros
bibliográficos que se necesitan.
o Rápida disponibilidad de un alto porcentaje de registros requeridos de forma
que se minimice la catalogación individualizada.
o Alta calidad y consistencia de los registros de la base de datos y conformidad
con las últimas normas de catalogación y clasificación.
o Control de autoridades en línea.
o Posibilidad de realizar catalogación propia en línea cuando sea necesario y de
obtener mensajes de ayuda apropiados.
o Capacidad de acceso a los registros del catálogo a partir de diversos puntos y
en el formato de salida adecuado.

26
Características ideales de un sistema automatizado de control del préstamo:
o Determinar con rapidez y facilidad qué títulos existen en la biblioteca y cual es
su ubicación.
o Prestar y devolver materiales con rapidez y precisión.
o Averiguar si se debe prestar servicio a una persona que lo desea.
o Preparar avisos de reclamación.
o Permitir la reserva de ejemplares y emitir los avisos necesarios cuando el
ejemplar reservado sea devuelto.
o Alertar de que una persona intenta pedir prestados más ejemplares de los
establecidos.
o Informar al lector de los ejemplares en préstamo.
o Detectar lectores "problemáticos" a la hora del préstamo.
o Calcular cualquier multa necesaria en el momento de la devolución.
o Facilitar estadísticas sobre el sistema.
o Ser fidedigno y económico.

Características ideales de un sistema de control de publicaciones periódicas:


o La selección con vistas a comprar los títulos apropiados.
o La generación de órdenes de compra. La mayor parte de las suscripciones de
publicaciones periódicas son renovaciones de órdenes anteriores; se precisa por
tanto una indicación automática sobre la necesidad de renovación de una
suscripción.
o La organización de los asuntos financieros y la carga en las cuentas apropiadas.
o La recepción de los números y la reclamación de los números sin recibir.
o El mantenimiento preciso y actualizado de los datos de los números que posee
la biblioteca.
o El acceso a los datos del fondo.
o La circulación, o el seguimiento de ruta de los ejemplares, entre los diferentes
miembros del organismo.
o El préstamo de números o de volúmenes encuadernados.
o La organización de la encuadernación de volúmenes.
o La producción de información estadística.

27

También podría gustarte