Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bases de datos
1
1. Bases de datos: definición, características
1.1. Definición:
2
1.3 Conceptos relacionados con las bases de datos
✓ El administrador no siempre tiene que ser una persona pues puede referirse a
una función. Se ocupa de la gestión y vigilancia de los datos en los sistemas de
información a los que acceden diversos usuarios. Para ello utiliza las funciones
de definir y modificar las estructuras de datos, autorizar el acceso de
determinados usuarios a determinados datos, la seguridad de los datos, el
almacenamiento físico de los mismos y se ocupa también de hacer copias de
seguridad y de la elaboración de estadísticas del sistema.
✓ Los usuarios son personas que acceden y usan la información. Los informáticos
suelen ser analistas, programadores. Los no informáticos utilizan la información
porque la necesitan.
3
2. Estructuras de datos utilizadas en dispositivos de almacenamiento /
estructura de la información digital
4
Registro: conjunto de campos relacionados entre sí que contiene datos
referidos a un mismo ente u objeto. Estructuras de datos que contiene
información relativa a un mismo ente. El registro se subdivide en campos.
✓ Registros de longitud fija: todos los campos que lo forman son de longitud
fija.
5
Métodos de organización y acceso de ficheros:
Métodos de acceso a ficheros: conjunto de técnicas que tienen por objeto facilitar la
búsqueda de información dentro de la organización física de los ficheros:
Secuencial: los registros están grabados en orden y deben ser leídos en ese mismo
orden. Para leer un registro hay que pasar por los anteriores. Solo pueden añadirse
registros al final del fichero, pues no permite la inserción de registros en un punto
cualquiera.
Los registros se clasifican en orden ascendente o descendente, unos detrás de
otros, sin dejar hueco (ahorro de espacio), en función de su clave. Para recuperar,
se busca en secuencia desde el principio del fichero hasta el registro que se busca.
Si el registro está en el medio, hay que pasar por la mitad de los registros. No se
puede realizar directamente la inserción o supresión de registros porque entonces
no se mantendría la secuencia lógica del fichero.
6
Fichero de datos (en secuencia por DNI)
Nº registro DNI Apellidos Nombre Nº matrícula
1 3856 Estévez López Álvaro 20
2 32856 Martín Benítez Isabel 22
3 123489 Valle garcía Ana 24
4 443892 Álvarez vega Benjamín 21
5 4834622 Cruz Aguirre José 25
6 22356420 Redondo Sanz Manuela 23
Fichero índice
Apellidos Registro de dirección
Álvarez Vega 4
Cruz Aguirre 5
Estévez López 1
Martín Benítez 2
Redondo Bermejo 6
Valle García 3
7
3. Clasificación de las bases de datos
A) Las bases de datos pueden ser clasificadas según diversos criterios, como son el
área temática que cubre, el ámbito publico o privado de las empresas que las
crean, etc., pero la tipología más común es la que basa su criterio diferenciador en
el carácter primario o secundario de la información que ofrecen. Así, las bases de
datos pueden ser:
3.2. Fuente: las bases de datos fuente son las que proporcionan información
final, es decir, el texto completo y no solamente la referencia y, por tanto,
responden de forma completa e inmediata a la petición del usuario, sin necesidad
de que este tenga que redirigirse a otras fuentes de información. Dentro de estas
se distinguen tres grupos:
✓ Bases de datos textuales: sus registros contienen los textos completos de los
documentos y permiten acceder inmediatamente a la fuente primaria de
información.
✓ Bases de datos numéricas: contienen básicamente cifras y valores numéricos de
diversos aspectos: estadísticas, cotizaciones de bolsa, etc. Generalmente se
presentan en forma de tablas o series.
✓ Bases de datos textual - numéricas: combinan ambas, ya que sus registros
disponen de diferentes campos de información.
8
B) En cuanto a la localización de las bases de datos, estas pueden ser locales o
remotas o distribuidas:
9
4. El mercado de las bases de datos
10
Las características que diferencian a los distintos distribuidores de bases de datos
son:
✓ Las diferentes tarifas para consultar una misma base de datos según el
distribuidor;
✓ Las condiciones de la suscripción;
✓ Las características del lenguaje de recuperación;
✓ La frecuencia de actualización de las bases de datos;
✓ Los servicios que ofrece y sus características y condiciones;
✓ Las distintas bases de datos que pueden consultarse.
11
5. Sistemas de gestión de bases de datos
12
Las funciones esenciales de un SGBD son las de descripción, manipulación y
utilización:
13
SGBD, pero en las SGBD relacionales SQL es un estándar muy
extendido.
Es decir, se trata de un conjunto de instrucciones que operan de acuerdo
a una sintaxis y que permiten a los usuarios la posibilidad de referirse a
determinados conjuntos de datos que cumplan ciertas condiciones
(criterio de selección), como que un atributo tenga un determinado
valor, o que un conjunto de atributos y valores satisfagan cierta
expresión lógica. Además del criterio de selección, es preciso indicar la
estructura externa que se desea actualizar o recuperar.
14
6. Sistemas de gestión de bases de datos
Para utilizar bases de datos relacionales, los datos deben cumplir un requisito
ineludible: estar muy estructurados. En general, datos muy definidos que son
fácilmente divisibles en campos concretos.
15
6.2. Sistemas de gestión documental
Los SGD están pensados para gestionar documentos mas que simples datos. Son
sistemas que ponen su énfasis en la recuperación de la información. Esta orientado
a la gestión de documentos de tipo científico y de prensa. Este tipo de información
se encuentra poco estructurada (un titulo puede ocupar 3 letras o 3 líneas, a veces
no hay autor, a veces hay 4, etc.).
Hemos visto que podemos utilizar bases de datos relacionales para información
muy estructurada. Sin embargo, la mayoría de la información que se utiliza
normalmente en documentación no está tan estructurada. La variedad de
información es tan grande que es imprevisible saber qué es lo que puede buscar
alguien y aunque definiésemos un campo por cada palabra, ¿cómo saber si un tema
se ha introducido en la base de datos tal y como la busca el usuario?.
16
Características de los SGD:
17
o Posibilidad de combinar distintas expresiones y estrategias de búsqueda
o Administración de la base de datos: posibilidad de establecer niveles de
seguridad. Permite la definición del modelo de registro, de los campos, de los
criterios de indización y facilita el establecimiento de palabras vacías.
o Posibilidad de definir campos como indizables o no indizables. Un campo
indizable es un campo que nos permite buscar información que contiene ese
campo o cuyos términos pasan a formar parte de un fichero inverso.
o Poder definir campos de contenido obligatorio. Esto significa que el campo debe
tener datos obligatoriamente para poder guardar el documento.
o Posibilidad de definir campos con vocabulario controlado. El sistema obliga
automáticamente a que en el campo figuren términos de una lista de ellos
autorizada. Posibilidad de incorporar un tesauro.
o Existe la posibilidad de tener un editor que pueda procesar los textos que se
utilicen en la base de datos. Como mínimo, que permita operaciones con
bloques y que permita diferentes estilos de textos.
18
Los lenguajes de interrogación:
Es una herramienta que nos permite buscar y recuperar información empleando los
términos o palabras que figuran en los documentos. La recuperación de información
es esencialmente una operación de comparación.
✓ El programa lee los textos desechando una serie de palabras vacías, a veces
definibles por el usuario, almacenadas en un fichero. Con cada palabra el fichero
inverso genera un registro con un puntero a cada documento y a la situación
exacta del fichero maestro que contiene esa palabra.
✓ Las consultas se realizan por defecto sobre el fichero inverso o índice y no sobre
el fichero maestro.
19
Fichero maestro:
Doc 1032:
Autor = Pérez, José
Título = los sistemas de recuperación de información: teoría y práctica
doc 2075
Autor = López, Juan
Título = los sistemas de información universitaria
Fichero inverso:
20
6.3. Sistemas de gestión electrónica de documentos
Son unos programas más complejos que los anteriores y permiten gestionar, no
sólo una referencia, sino también la reproducción facsímil de cada uno de los
artículos analizados. De este modo se dispone del documento original en pantalla y
no es necesario desplazarse para buscar el documento al que te remiten las
referencias. Es un tipo de sistemas muy propicio para los medios de comunicación.
La base lógica de un sistema GED esta formado por un SGBDR o un SGD que es el
encargado de gestionar las referencias de los documentos digitalizados y de las
conexiones entre estas y las imágenes digitalizadas.
21
7. Automatización de un centro de documentación informativo
Mientras que las redacciones de los medios de comunicación se han adaptado mas
rápidamente a las nuevas tecnologías de la comunicación, no ha sido así en los
centros de documentación, aunque se ha visto la necesidad de la informatización de
los mismos, ya que la gestión automatizada permite y facilita un acceso más rápido
y selectivo a la información. La creación y diseño de una base de datos permite
gestionar informáticamente los fondos del centro. Ahora bien, informatizar un
centro de documentación no supone solo la compra de unos equipos informáticos,
sino que hace necesario un proyecto de diseño de su estructura y funcionamiento
según las necesidades y forma del trabajo del propio centro: análisis del futuro
centro, diseño de una base de datos, aplicación del sistema automatizado.
22
7.2. Diseño de la base de datos:
Se deben seguir una serie de pasos para diseñar una base de datos:
23
Con ellas construimos un “diccionario de datos” que es una lista detallada de
cada uno de los campos que formarán la base de datos con información acerca
de una serie de aspectos de cada campo:
o Nombre del campo
o Dominio del campo (conjunto de valores del que puede tomar datos
el campo)
o Tipo de indización (determinar si un campo indizará o no)
o Tratamiento documental (determinar un lenguaje controlado o libre:
lenguaje controlado: es un lenguaje que permite términos de una
lista autorizada. Lenguaje libre: es un lenguaje que permite
cualquier término).
o Controles de validación (una serie de condiciones o requisitos que
debe reunir el contenido del campo).
- por otra parte, tendremos que confeccionar unos instrumentos básicos para el
análisis, serán pues imprescindibles los lenguajes documentales (como
tesauros) para clasificar e indizar bien y de forma homogénea los documentos.
- tipo de recuperación: la consulta a la base de datos tiene que tener distintos
niveles adecuados a usuarios distintos y a diferentes tipos de consulta:
24
7.3. Implantación
25
8. Las bases de datos en una biblioteca
26
Características ideales de un sistema automatizado de control del préstamo:
o Determinar con rapidez y facilidad qué títulos existen en la biblioteca y cual es
su ubicación.
o Prestar y devolver materiales con rapidez y precisión.
o Averiguar si se debe prestar servicio a una persona que lo desea.
o Preparar avisos de reclamación.
o Permitir la reserva de ejemplares y emitir los avisos necesarios cuando el
ejemplar reservado sea devuelto.
o Alertar de que una persona intenta pedir prestados más ejemplares de los
establecidos.
o Informar al lector de los ejemplares en préstamo.
o Detectar lectores "problemáticos" a la hora del préstamo.
o Calcular cualquier multa necesaria en el momento de la devolución.
o Facilitar estadísticas sobre el sistema.
o Ser fidedigno y económico.
27