Está en la página 1de 8

Computación para Ingeniería I y Laboratorio Cap.

2 - Conceptos de Archivos y Bases de Datos

CAPITULO 2 – CPNCEPTOS DE ARCHIVOS Y BASES DE DATOS

2.1. Introducción.- El almacenamiento y manejo de grandes cantidades de datos se hace


necesario en cualquier empresa para el logro de sus objetivos. Por ejemplo, se necesitan los
datos de los empleados, de clientes, de proveedores, de los productos almacenados, etc.
Normalmente, la gestión de estos datos se ha venido realizando de forma manual. Se
organizaban en forma de fichas, informes o expedientes, colocándolos en carpetas y
almacenando éstas en un archivador (Figura 2.1). Por ejemplo, se tiene un archivo de
clientes en el que cada ficha contiene todos los datos correspondientes a un cliente. Cuando
se necesita consultar o modificar los datos de clientes concretos será preciso realizar toda la
operación manualmente.

Figura 2.1. Archivo manual.

La utilización de las computadoras en la administración de las empresas ha supuesto


una revolución respecto al almacenamiento y gestión de sus datos, dando lugar al uso de los
denominados archivos informáticos y bases de datos.
Para el almacenamiento de los datos se utilizan soportes informáticos principalmente de
tipo magnético y óptico (discos, cintas, etc.), y para el tratamiento de los datos grabados en
ellos se utilizan las computadoras (Figura 2.2).

Figura 2.2. Soportes para el almacenamiento de datos.

Las ventajas obtenidas se derivan de las características de los soportes y de las


computadoras:
- Gran capacidad de almacenamiento en un reducido espacio.
- Rapidez en el proceso de los datos.
- Precisión de los resultados obtenidos del proceso.
Los archivos antes citados se denominan archivos de datos, pero hemos de tener en
cuenta que existen otros tipos de archivos, ya que cualquier información permanente que se
almacena en una computadora de cualquier forma, se considera igualmente un archivo. Por
ejemplo, un archivo fuente contendrá un programa fuente (programa escrito en un lenguaje
de programación de alto nivel), un archivo objeto contiene un programa ya compilado, un
archivo gráfico, un dibujo, etc.
En el presente capítulo nos dedicaremos al estudio de los archivos de datos o conjuntos
de informaciones en memoria secundaria relativas a un mismo tema. También estudiaremos
las bases de datos como generalización de la estructura de archivo.

Ing. Hermas Herrera Callejas Página: 1 de 8


Computación para Ingeniería I y Laboratorio Cap. 2 - Conceptos de Archivos y Bases de Datos

2.2 Archivos y registros.- Un Archivo o Fichero es una estructura de datos que reside en
memoria secundaria, consistente en un conjunto de informaciones estructuradas en unidades
de acceso denominadas registros, todos del mismo tipo y en número indeterminado.

2.2.1 Un registro lógico.- O simplemente registro es cada uno de los componentes del
archivo, conteniendo el conjunto de informaciones que se acceden y se tratan de manera
unitaria. Está constituido por uno o más elementos denominados campos, que pueden ser
de diferentes tipos y que a su vez pueden estar compuestos por subcampos.
Un registro puede tener un campo clave, cuyo valor sirve para identificar de forma
única el registro y por tanto, dicho valor no puede aparecer repetido en otro registro diferente.
Puede suceder que un archivo no tenga campo clave en sus registros, o por el
contrario, que tenga varios, denominándose clave primaria a la principal y a las demás
secundarias.
Si un archivo contiene información de un conjunto de individuos u objetos, sus registros
contienen información de cada uno de ellos y los campos los diferentes datos que componen.
Por ejemplo, en el archivo de personal de una empresa, cada registro contiene
información de un empleado, los campos contienen su número de CI, nombre, dirección,
fecha de ingreso, etc. La calle en que vive será un sub-campo y el campo clave puede ser el
número de CI (Tabla 2.1).
NÚMERO DE CI 2198365
NOMBRE LUIS ORTIZ RUBIO
DIRECCIÓN PS. OLMOS # 16
LOCALIDAD LA PAZ
DEPARTAMENTO PRODUCCION
CATEGORIA LABORAL TÉCNICO AUXILIAR
FECHA DE INGRESO 15/09/1988
Tabla 2.1. Registro personal.

2.2.2 Un registro físico.- O bloque corresponde a la cantidad de información que se


transfiere físicamente en cada operación de acceso (lectura o escritura) del medio magnético
Se debe aclarar los conceptos de registro lógico y registro físico, diferenciándose en
que el tamaño y formato del registro lógico los define el programador, mientras que el tamaño
del registro físico viene dado por las características físicas de la computadora utilizada.
En general, un bloque tendrá capacidad para contener uno o más registros lógicos, pero
también puede ocurrir que un registro lógico ocupe más de un bloque (Figura 2.3).
En el primer caso se habla de registros bloqueados, denominándose factor de
bloque al número de registros lógicos que contiene cada registro físico, y se denominan
registros expandidos a aquellos que ocupan más de un bloque.
La lectura de un archivo con registros bloqueados transfiere a memoria varios registros
a la vez, pero para leer un registro expandido será necesario realizar más de un acceso.
Bloque (Factor de bloqueo = 3)
Registro 1 Registro 2 Registro 3

campo 1 campo 2 campo 3 subcampo1 subcampo 2

campo 3

Ing. Hermas Herrera Callejas Página: 2 de 8


Computación para Ingeniería I y Laboratorio Cap. 2 - Conceptos de Archivos y Bases de Datos

Figura 2.3. Esquema lógico de un archivo.


2.3 Clasificación de los Archivos Según su Uso.- Los archivos se clasifican según la
utilización que se hace de ellos en tres grupos:

2.3.1 Archivos Permanentes.- Contienen información que varia poco a lo largo del tiempo.
Pueden ser de. tres clases:
2.3.1.1 Archivos de Constantes.- Su información permanece prácticamente inamovible,
utilizándose principalmente como archivos de consulta. Un archivo de este tipo puede ser el
de la red del metro de una ciudad, que contiene la descripción, características, número de
estaciones, número de trenes, etc., de cada línea.
2.3.1.2 Archivos Maestros.- También denominados Archivos de Situación, contienen la
información que refleja el estado o situación de una empresa, entidad o algún aspecto de ella
en un determinado momento. Estos archivos se actualizan periódicamente para adaptarlos a
cada nueva situación. Un ejemplo es el archivo de personal con contrato temporal en una
empresa, o también el archivo de existencias en almacén.
2.3.1.3 Archivos Históricos.- Se obtienen de los anteriores cuando se dejan fuera de uso
para futuros estudios estadísticos o consultas. Será un archivo histórico el que contiene la
información de libros adquiridos por una biblioteca en la década de los ochenta.

2.3.2 Archivos de Movimientos.- En ellos se almacena la información que se utilizará para


actualizar los archivos maestros. Sus registros, denominados movimientos o transacciones,
son de tres clases: altas, bajas y modificaciones.
Una vez realizado el proceso de actualización de un archivo maestro por medio de un
archivo de movimientos, éste pierde su validez y podemos deshacernos de él.
Un archivo de este tipo para actualizar el antes mencionado de personal contratado, es
el que refleja las nuevas contrataciones, finalizaciones de contratos y modificaciones de los
mismos producidas en la empresa durante el mes actual.

2.3.3 Archivos de Trabajo.- Tienen una vida limitada, normalmente igual a la duración de la
ejecución de un programa y se utilizan como auxiliares de los anteriores (se llaman también
archivos de maniobra).
Por ejemplo, si se desea una lista alfabética de los nombres del personal contratado, se
hará por medio de un archivo de trabajo en el que se almacene esta información a partir del
archivo de personal. Este archivo desaparecerá una vez se tenga la lista impresa.

2.4 Organización de Archivos.- Al diseñar un archivo, dependiendo del uso que se va a


hacer del mismo y del soporte utilizado, se pueden elegir diferentes maneras de organizar
sus registros, siendo las principales organizaciones las siguientes:

- Secuencial
- Directa o aleatoria
- Indexada
- Archivos de texto
- Archivos binarios

2.4.1. Organización Secuencial.- Es aquélla en la cual los registros ocupan posiciones


consecutivas de almacenamiento, y solo se puede acceder a ellos de uno en uno a partir del
primero (Figura 2.4).
En un archivo secuencial no se pueden hacer operaciones de escritura cuando se está
Ing. Hermas Herrera Callejas Página: 3 de 8
Computación para Ingeniería I y Laboratorio Cap. 2 - Conceptos de Archivos y Bases de Datos

leyendo, ni operaciones de lectura cuando se está escribiendo.


Por otro lado, para actualizados es preciso crear nuevos archivos donde se copien
registros que vayan a permanecer, modificados o no, junto con los nuevos.

Acceso secuencial

Registro 1 Registro 2 Registro 3 Registro 4 Registro 5

Figura 2.4. Esquema lógico de un archivo secuencial.

2.4.2 Organización Directa o Aleatoria.- En un archivo con esta organización, también


denominada relativa las informaciones se colocan y se acceden aleatoriamente mediante su
posición, es decir, indicando el lugar relativo que ocupan dentro del conjunto de posiciones
posibles.
En esta organización se pueden leer y escribir registros, en cualquier orden y en
cualquier lugar.
Presenta el inconveniente de que es tarea del programador establecer la relación entre
la posición que ocupa un registro y su contenido, además puede desaprovecharse parte del
espacio destinado al archivo, ya que pueden quedar huecos libres entre unos registros y
otros.
Su principal ventaja es la rapidez de acceso a un registro cualquiera, ya que para ello
no es preciso pasar por los anteriores (Figura 2.5).
Acceso directo

Registro 2 Registro 3 Registro 1 Registro 4 Registro 8 Registr

Posiciones 01 02 03 04 05 06 07

Figura 2.5. Esquema lógico de un archivo directo.

2.4.3 Organización Secuencial Indexada.- Un archivo con esta organización consta de


tres áreas:

 Área de índices
 Área de datos o primaria
 Área de excedentes (Overflow)

2.4.3.1 El área de datos o primaria.- Contiene los registros de datos, clasificados en orden
ascendente por su campo de clave.

2.4.3.2 El área de índices.- Es un archivo secuencial creado por el sistema, en el que cada
registro establece una división (segmento) en el área de datos o primaria, y contiene la
dirección de comienzo del segmento y la clave más alta del mismo. De esta manera, el
sistema accede de forma directa a un segmento del área primaria a partir del área de índices,
de forma similar a la búsqueda de un capitulo de un libro a partir de su índice.

2.4.3.3 El área de excedentes.- Es un espacio reservado para añadir nuevos registros que
no pueden ser colocados en el área primaria cuando se produce una actualización del
Ing. Hermas Herrera Callejas Página: 4 de 8
Computación para Ingeniería I y Laboratorio Cap. 2 - Conceptos de Archivos y Bases de Datos

archivo (Figura 2.6).

Área de índices 01 AC 04 FA 07 GK

Área de datos AA -- AB -- AC -- BC -- CH -- FA -- GF -- GJ - GK -
01 02 03 04 05 06 07 08

Área excedentes FM -- AN -- BM -- GA

Figura 2.6. Esquema lógico de un archivo secuencial indexado.

Esta organización presenta la ventaja de un rápido acceso por medio de la clave del
registro, y además el sistema se encarga de relacionar la posición de cada registro con su
contenido por medio del área dé índices. También es trabajo del sistema, la gestión de las
áreas de índices y de excedentes.
Los inconvenientes que presenta son la necesidad de espacio adicional para el área de
índices y el desaprovechamiento de espacio que resulta de quedar huecos intermedios libres
después de sucesivas actualizaciones.

2.5 Métodos de Acceso.- Se denomina método de acceso a la forma en que el dispositivo


que maneja el soporte de información que contiene un archivo se posiciona en un
determinado lugar del mismo para realizar una operación de lectura o escritura de un
registro.
El modo de acceso lo decide el programador de la aplicación en función del soporte
utilizado y del tipo de organización del archivo.
Hay 2 métodos básicos: secuencial y directo.
El acceso secuencial a un registro supone acceder inicialmente al primer registro del
archivo y después, consecutivamente, a todos los sucesivos hasta llegar al registro deseado.
Este modo de acceso se puede utilizar con cualquier soporte y organización.
El acceso directo solamente se puede realizar en los denominados soportes
direccionables, como los discos magnéticos, y consiste en el posicionamiento sobre cualquier
registro sin necesidad de haber accedido antes a los anteriores.
En los archivos de organización directa, este acceso se consigue proporcionando al
dispositivo la posición del registro que se desea acceder. En ocasiones es conveniente
programar una función de aleatorización o hashing, la cual permita calcular la posición de
cualquier registro a partir del valor de su clave.
En los archivos indexados, el acceso directo lo realiza de forma automática el sistema a
partir del valor del campo clave; para ello utiliza, como se ha descrito en el apartado anterior,
un conjunto auxiliar de índices que relacionan las claves con las posicione de los registros.

2.6 Bases de Datos.- La gestión de archivos se ha demostrado insuficiente para cubrir las
necesidades de almacenamiento y proceso de datos en la actualidad.
Los sistemas de información de las empresas son cada vez más grandes y complejos, y
su gestión mediante el uso de archivos presenta algunos inconvenientes, como el hecho de
que los datos estén repartidos por distintos departamentos de la empresa, lo que supone
tener que desplazarse o solicitarlos cada vez que se necesitan en un lugar diferente de
donde se generan.
Además pueden estar repetidos varias veces, con el inconveniente de que su
Ing. Hermas Herrera Callejas Página: 5 de 8
Computación para Ingeniería I y Laboratorio Cap. 2 - Conceptos de Archivos y Bases de Datos

actualización dará lugar a inconsistencias si no se realiza simultáneamente en todos los


lugares en que se ubican.
Las aplicaciones que se creen deberán tener en cuenta las distintas estructuraciones de
los datos, y los cambios que se realicen tanto en hardware como en software presentarán
numerosas complicaciones.
Otro problema derivado de la dispersión de los datos radica en la dificultad para
establecer sistemas de control y seguridad en los mismos.
Los sistemas de bases de datos pretenden dar solución a los problemas expuestos
mediante la integración de los archivos de datos, de su estructura y de la aplicación que los
maneja.
Podemos definir una base de datos como un conjunto integrado de datos
interrelacionados, junto con una serie de aplicaciones para su manejo, accesibles
simultáneamente por diferentes usuarios y programas.
Sus principales características son:
 Control centralizado de los datos.
 Integridad de los datos.
 Minimización de las redundancias.
 Independencia de los datos y las aplicaciones.
 Acceso concurrente a los datos.
 Costo mínimo de almacenamiento y mantenimiento.
 Versatilidad para la representación de relaciones.
 Establecimiento de medidas de seguridad.
 Facilidad para el cambio (hardware y software).

2.6.1 Modelos de Bases de Datos.- El modelo de base de datos hace referencia a la


estructura que se utiliza para expresar las relaciones existentes entre las diferentes unidades
de datos que la constituyen. De entre las varias posibilidades útiles para ello, son tres los
modelos que se han afianzado y están actualmente en uso:
1. Modelo jerárquico.
2. Modelo en red.
3. Modelo relacional.

2.6.1.1 Modelo Jerárquico.- Utiliza la estructura de árbol para establecer relaciones del
tipo 1 : n (uno a muchos). Una base de datos de este tipo consistirá en uno o varios árboles
que expresarán las distintas agrupaciones entre los datos. Cada árbol tiene un nodo
distinguido denominado raíz y, a partir de él, se establecen relaciones de sucesión,
denominándose nodos hijos a los descendientes de otro. Mientras que un nodo padre sólo
puede tener una ocurrencia, los nodos hijos pueden tener varias (Figura 2.7).

Empleado

Estudios Experiencia Familia Logros

Figura 2.7. Modelo Jerárquico.

Ing. Hermas Herrera Callejas Página: 6 de 8


Computación para Ingeniería I y Laboratorio Cap. 2 - Conceptos de Archivos y Bases de Datos

2.6.1.2 Modelo de Red.- Utiliza la estructura de red o grafo, que permite definir entre todos
los nodos relaciones n : n (muchos a muchos). Mediante el establecimiento de apuntadores
entre nodos se puede relacionar cualquier unidad de datos con cualquiera de las otras
(Figura 2.8).

Estudios Experiencia

Empleado

Logros Familia

Figura 2.8. Modelo de Red.

2.6.1.3 Modelo Relacional.- Se basa en el Álgebra Relacional. Las relaciones entre las
unidades de datos o entidades se expresan mediante tablas de dos dimensiones. Una base
de datos de este tipo estará formada por varias de estas tablas en las que una fila (tupla)
contiene una ocurrencia de valores interrelacionados y una columna contiene los diferentes
valores posibles de cada entidad (Tabla 2.2).

AUTOCAR CONDUCTOR CIUDAD PASAJERO AGENCIA


105 JULIÁN PÉREZ LA PAZ ELÍAS PEINADO TOURISA
105 JULIÁN PÉREZ COCHABAMBA ANA MARTORELL PRISA
105 PEDRO ROSALES SANTA CRUZ MARTA SÁNCHEZ TOURISA
107 JULIÁN PÉREZ SUCRE JULIO CARRANZA TOURIZA

Tabla 2.2. Modelo relacional

2.6.2 Seguridad y Control de Datos.- La información almacenada en un archivo o base de


datos puede llegar a tener una gran importancia y su pérdida o destrucción podría suponer
un desastre para sus propietarios.
Por ello, será preciso establecer determinadas medidas de seguridad y control que
minimicen o anulen ese riesgo.
Asimismo, habrá que determinar otras protecciones que garanticen la privacidad y
confidencialidad de los datos, con el fin de que éstos no puedan ser utilizados para otros
propósitos diferentes de los usos correctos para los que se crearon.
Distinguiremos dos aspectos diferentes con respecto a la protección que se puede
establecer sobre los datos:
1. Seguridad contra fallos del sistema o del soporte. Integridad
2. Seguridad contra usos incorrectos o no autorizados. Confidencialidad

2.6.3 Seguridad Contra Fallos del Sistema o del Soporte.- Es preciso proteger no sólo
los datos, sino también las operaciones de actualización que se realizan con ellos, de tal
manera que si en un momento dado se produce una caída del sistema o la rotura del
soporte, se pueda recuperar la información según estaba antes del fallo.
Ing. Hermas Herrera Callejas Página: 7 de 8
Computación para Ingeniería I y Laboratorio Cap. 2 - Conceptos de Archivos y Bases de Datos

Para ello se emplean las siguientes técnicas:


 Realización de copias de seguridad (back-up) periódicamente, por ejemplo, una vez por
semana, guardando estas copias en un lugar seguro hasta que dejen de tener validez al
realizar nuevas copias.
 Registro de operaciones que se realicen con los datos, recopilando estos registros
periódicamente, por ejemplo, una vez por día.
 Establecimiento de procedimientos de recuperación capaces de reconstruir la información
en su estado anterior a producirse el fallo, por medio de la copia de seguridad y de los
registros de operaciones.
 RAID = Redundant Array of Inexpensive Disk.- La información de archivos o bases de
datos creados en un volumen es distribuida de modo automático en áreas especiales de
los demás volúmenes para su recuperación automática en caso de daño del volumen
físico

De esta forma, cuando se produzca un fallo o avería, una vez subsanada y realizado el
procedimiento de recuperación, se tendrá la información según estaba cuando se efectuó el
último registro de operaciones y sólo será preciso repetir las operaciones que se hicieron
sobre el archivo o base de datos desde ese momento hasta el fallo.

2.6.4 Seguridad Contra Usos Incorrectos o no Autorizados.- Una de las principales


características de los archivos y de las bases de datos es la posibilidad de acceso a sus
datos por parte de diferentes programas y usuarios. Esta característica implica la posibilidad
de que los datos puedan ser dañados por error o que puedan ser utilizados ilegítimamente
por usuarios no autorizados. Para evitarlo, habrá que establecer medidas de seguridad al
efecto.
Físicamente el acceso a un archivo se protege por medio de etiquetas, cuyas claves
están controladas por el sistema operativo. En algunos casos se puede aumentar aún más
esta protección por medio del criptografiado de los datos almacenados, consistente en el
encubrimiento de la información por algún método de cifrado. (Sin embargo hay posibilidad
de violar esa seguridad mediante pinchazos a las vías de transmisión mediante sneefers)
La protección queda establecida mediante diferentes niveles de acceso a los archivos
relativos a las operaciones permitidas o prohibidas: lectura, escritura y borrado de registros.
A cada usuario se le asigna un nivel de acceso, que es aceptado por el sistema
operativo tras el reconocimiento de su clave de usuario (password) y que le restringe el
acceso a determinados archivos y a determinadas operaciones sobre ellos. Es conveniente
que la clave de usuario se cambie con frecuencia para reforzar la seguridad.
Es imposible lograr seguridad en un 100 %, sin embargo toda medida de seguridad
implantada disminuye el riesgo contra uso no autorizado o destrucción. Habrá que buscar un
sano equilibrio entre el costo de implantar medidas de seguridad y el nivel de seguridad
alcanzado de modo que corresponda a las políticas de cada institución.

Ing. Hermas Herrera Callejas Página: 8 de 8

También podría gustarte