Está en la página 1de 11

ITSA

ORGANIZACIÓN DE DATOS
UNIDAD I

ESTRUCTURA JERÁRQUICA DE LOS DATOS

BD

ARCHIVO ARCHIVO ARCHIVO

REGISTRO REGISTRO REGISTRO

CAMPOS CAMPOS

SUBCAMPOS SUBCAMPOS

CARACTER

1.1 CONCEPTOS DE ARCHIVOS

ARCHIVO

Un fichero o archivo es una colección de datos estructurados (registros)


relacionados entre sí con aspectos en común y organizados por un propósito
específico.

Se dice que un archivo:

 Es Independiente, respecto a la información que maneja y los programas que


lo manipulan.
 La información almacenada es permanente
 Puede ser accedido por distintos programas en distintos momentos
 Capacidad de almacenamiento.

CAMPO
Es un ítem o elemento de datos (tipos de datos) como nombre, número de empleados,
número de ciudad, número de identificación...

Está caracterizado por su tamaño o longitud y su tipo de dato (cadena de caracteres,


entero, lógico) los campos pueden incluso variar en longitud.

Un campo es la unidad mínima de información de un registro.

M. en A. ESMERALDA VILLEGAS ZAMUDIO


ITSA
ORGANIZACIÓN DE DATOS
UNIDAD I

Control
EJEMPLO Nombre
Campo 5 campos Dirección
Nombre
Fecha
Teléfono

1 2 3 4 5

No. Nombre Dirección Fec_nac No. Tel.


Control
03020032 Maria Insurgentes 04 Jul 85 4531046545
López 38

03020025 Juan Pérez Plutarco 01 Ene 82 4535345823


Elías Calles

0320014 Luís Ferro Av. Las 25 Sep 80 4536547894


Luminarias

REGISTRO
• Es una colección de información normalmente relativa a una entidad particular.

• Un registro es una colección de campos lógicamente relacionados.

• Pueden ser tratados como una unidad por un programa

EJEMPLO
Longitud registro
No. Nombre Dirección Fec_nac No. Tel.
Control

03020014 Luís Ferro Av. Las 25 Sep 80 4536547894


Luminarias

Todos los campos contienen DATOS


RELACIONADOS
de un SOLO ALUMNO.

M. en A. ESMERALDA VILLEGAS ZAMUDIO


ITSA
ORGANIZACIÓN DE DATOS
UNIDAD I

BASE DE DATOS:
Colección de archivos a los que se pueden accederse por un conjunto de
programas y que contienen todos ellos datos relacionados entre si.

ESTRUCTURA JERÁRQUICA:
Los conceptos de carácter, campos, registro, archivo y base de datos son
conceptos lógicos que se refieren al medio en que el usuario de computadoras ve
los datos y los organiza.

CLAVE (CAMPO LLAVE):


Una clave (key) , es un campo que identifica el registro y lo diferencia de otros
registros. Por lo que la clave debe ser diferente para cada registro.

Nombre
CURP
No Seg.
Código
No Control

REGISTRO FÍSICO O BLOQUE:


es la cantidad más pequeña de datos que pueden trasferirse en una operación de
entrada/salida entre la memoria central y los dispositivos periféricos o viceversa.

Reg. Físico: línea impresión


sector de un disco magnético

Unidades de datos lógicos y


físicos
Organización Organización Descripción
Lógica Física
Bít 01

Carácter Byte (octeto) En la mayoría de los códigos un


carácter se representa por un byte

Campo Palabra Un campo es un conjunto


relacionado de caracteres. Una
palabra de computadora es un
número fijo de bytes
Registro Bloque (1 página=bloques de Los registros pueden estar
longitud) bloqueados

Archivo Área Varios archivos se pueden


almacenar en un área de
almacenamiento
Base de Datos Áreas Colección de Archivos de datos
relacionados se pueden organizar
en una base de datos

M. en A. ESMERALDA VILLEGAS ZAMUDIO


ITSA
ORGANIZACIÓN DE DATOS
UNIDAD I

1.2. TIPOS DE ARCHIVOS

Clasificación de los archivos según su uso


Los archivos se clasifican, según su utilización, en los siguientes tres grupos:

• Archivos permanentes: contienen información que apenas varía a lo largo del


tiempo. Pueden ser de tres clases:
Archivos de constantes: su información permanece prácticamente
inamovible, utilizándose principalmente como archivo de consulta. Un archivo de este
tipo puede ser el de la red del metro de una ciudad, que contiene la descripción,
características, número de estaciones, número de trenes, etc., de cada línea.
Archivos de situación: también denominados archivos maestros, contienen la
información que refleja el estado o situación de una empresa, entidad o algún aspecto
de ella en un determinado momento.
Estos archivos se actualizan periódicamente para adaptarlos a cada nueva situación.
Archivos históricos: se obtienen de los anteriores cuando se dejan fuera de
uso para futuros estudios estadísticos o consulta. Será un archivo histórico el que
contiene la información de libros adquiridos por una biblioteca en la época de los
ochenta.
• Archivos de movimiento: en ellos se almacena la información que se utilizará para
actualizar los archivos maestros. Sus registros, denominados movimientos o
transacciones, suelen ser de tres clases: altas, bajas y modificaciones.

Una vez realizado el proceso de actualización de un archivo maestro por medio de un


archivo de movimientos, éste pierde su validez y podemos deshacernos de él.
Un archivo de este tipo para actualizar el antes mencionado de personal contratado,
es el que refleja las nuevas contrataciones, financiaciones de contratos y
modificaciones de los mismos producidas en las empresas durante el mes actual.
• Archivos de maniobra, temporales o de trabajo: tienen una vida limitada,
normalmente igual a la duración de la ejecución de un programa y se utilizan como
auxiliares de los anteriores.

Clasificación de los archivos según su contenido


Texto:
texto plano (en inglés plain text) son aquellos que están compuestos únicamente
por texto sin formato, sólo caracteres
Se les conoce también como archivos de texto llano, o texto simple, por carecer de
información destinada a generar formatos (negritas, subrayado, cursivas, tamaño, etc.)
y tipos de letra (por ejemplo, Arial, Times, Courier, etc.)

Binarios:
Contienen información de cualquier tipo, codificada en forma binaria para el
propósito de almacenamiento y procesamiento en ordenadores.

Por ejemplo los archivos informáticos que almacenan texto formateado o


fotografías, así como los archivos ejecutables que contienen programas

M. en A. ESMERALDA VILLEGAS ZAMUDIO


ITSA
ORGANIZACIÓN DE DATOS
UNIDAD I

1.3. ORGANIZACIÓN DE ARCHIVOS

La organización de un archivo se:


 Define la forma en la que los registros se almacenan sobre el soporte
de almacenamiento

 Define la forma en que se estructuran los datos en un archivo.

Existen tres tipos de organización de archivos:


• Organización Secuencial
• Organización Directa o aleatoria
• Organización Secuencial Indexada

ORGANIZACION SECUENCIAL

Los registros se graban consecutivamente cuando el archivo se crea y se debe


acceder consecutivamente cuando se leen dichos registros

Características:
El orden físico en que fueron grabados (escritos) los registros es el orden de lectura de
los mismos.

Todos los tipos de dispositivos de memoria auxiliar soportan la organización


secuencial

Los ficheros organizados secuencialmente contienen un registro particular _el último-


que contiene la marca de fin de archivo (detectable mediante la función EOF)

Principio del
Archivo
Registro 1

Registro 2

Registro N
Fin del Archivo
*

M. en A. ESMERALDA VILLEGAS ZAMUDIO


ITSA
ORGANIZACIÓN DE DATOS
UNIDAD I

En una organización secuencial para acceder a un registro n dado es obligatorio pasar


por todos los n-1 registros que le preceden.

Principio Archivo papelería


del Archivo
Registro 1
Producto Precio stock

Reg1 Libreta 10 100


Registro 2 Reg 2 Lápiz 2 1000

Reg 3 Color I 13 200

. Reg 4 Color II 15 200

. 5 - - -
6 - - -
Registro N-1
7 - - -
Registro
n Reg 8 Folder C 1.50 2000
Registro N
- - -
Marca de
Papel 123 .50 100
Fin de
* archivo *

Ventajas y Desventajas

Ventajas
• Capacidad de acceder al siguiente registro es rápida
• Si el archivo se procesa ordenadamente entonces hay eficiencia (Ventaja)
• Son muy sencillos al usar y aplicar.
Desventajas
• Si el patrón de acceso no es en orden entonces existen tiempos de accesos
muy largos.
• El mantenimiento del orden de la manipulación puede ser costoso (puede
implicar movimiento de los registros al insertar nuevos registros o al
eliminarlos. Por esto se utilizan archivos temporales de transacciones, no lo
hace en línea).
• Las búsquedas son costosas.

Usos
• Computación batch
• Cuando se manejan datos que se procesan cíclica y periódicamente

M. en A. ESMERALDA VILLEGAS ZAMUDIO


ITSA
ORGANIZACIÓN DE DATOS
UNIDAD I

ORGANIZACIÓN DIRECTA
Un archivo esta organizado en modo directo cuando el orden físico no se corresponde
con el orden lógico.
Los datos se sitúan en el archivo y se accede a ellos de forma directa –aleatoriamente-
mediante su posición, es decir el lugar relativo que ocupan.

Requerimientos para una organización directa:


• Ser almacenado en un soporte direccionable
• Los registros deben contener un campo especifico denominado clave que
identifica cada registro de modo único, es decir, 2 registros distintos no pueden
tener un mismo valor de clave
• Existencia de una correspondencia entre los posibles valores de la clave y las
direcciones disponibles sobre el soporte

En la práctica el programador no gestiona directamente direcciones absolutas, sino


direcciones relativas respecto al principio del archivo. El programador crea una
relación perfectamente definida entre la clave indicativa de cada registro y su
posición física dentro del dispositivo de almacenamiento.

Organización Directa
Principio del
Archivo

Orden Orden No. Nombre Dirección Fec_nac No. Tel.


Lógico Físico
Control
1
03020032 Maria Insurgentes 38 04 Jul 85 4531046545
3 2 López
03020025 Juan Pérez Plutarco Elías 01 Ene 82 4535345823
1 3
4
5
6
03020014 Luís Ferro Av. Las 25 Sep 80 4536547894
2 7 Luminarias

Ventajas y desventajas
VENTAJAS
• La ventaja principal de un archivo relativo es la habilidad de acceder registros
individuales directamente, es decir, que los registros se pueden leer y escribir
en cualquier orden y posición.
• Son de rápido acceso a la información

DESVENTAJAS
• El inconveniente mayor de esta organización es que se necesita programar la
relación existente entre el contenido de un registro y la posición que ocupa Su
desventaja radica (dependiendo de la función de mapeo) en que se puede

M. en A. ESMERALDA VILLEGAS ZAMUDIO


ITSA
ORGANIZACIÓN DE DATOS
UNIDAD I

presentar una misma dirección para diferentes valores de llave, es decir, se


presentan colisiones.
• Otra desventaja es el desperdicio de espacio debido a la distribución al azar de
los registros.

ORGANIZACIÓN SECUENCIAL INDEXADA

Se dice cuando los registros (datos) están almacenados de forma secuencial y para
ser leídos necesitan de un índice.

Solamente son soportados por dispositivos de almacenamiento de acceso directo.

Características:

Un archivo está organizado en forma secuencial indexada si:


• El tipo de sus registros contiene un campo clave identificador
• Los registros están situados en un soporte direccionable por el orden de los
valores indicados por clave
• Existe un índice con cada una de la posiciones direccionables, que almacena la
dirección de la posición y el valor de la clave; en esencia, el índice contiene la
clave del último registro y la dirección de acceso al primer registro del bloque

Organización secuencial Indexada


Clave Datos
Clave Dirección
010
15 010 dirección 011
24 020 .
36 030
clave
019 15 lápiz
54 040 020

.
.
029 24 libreta
240 090 030

Área de índices .
039 36 folder
040
.
049 54 marcador Área primaria o
datos
050

M. en A. ESMERALDA VILLEGAS ZAMUDIO


ITSA
ORGANIZACIÓN DE DATOS
UNIDAD I

Estructura de una organización secuencial indexada

Un archivo en organización secuencial indexada consta de lo siguiente:


• Área de datos, o primaria contiene lo registros en forma secuencial y está
organizada en secuencia de claves sin dejar huecos intercalados
• Área de índices, es una tabla que contiene los niveles de índices, la existencia
de varios índices enlazados se denomina nivel de indexación
• Área de desbordamiento o excedente, utilizada, si fuese necesario, para las
actualizaciones.

El área primaria contendrá los registros de datos, clasificados en orden ascendente


por su campo clave. El área de índices es un archivo secuencial creado por el sistema,
en el que cada registro establece una división (segmento) en el área primaria, y
contiene la dirección de comienzo del segmento y la clave más alta del mismo. De
esta manera el sistema accede de forma directa a un segmento del área primaria a
partir del área de índices, de forma similar a la búsqueda de un capítulo de un libro a
partir de su índice.

Por último, se reserva un espacio llamado área de excedentes, para añadir nuevos
registros que no pueden ser colocados en el área primaria cuando se produce una
actualización del archivo. Esta organización presenta la ventaja de un rápido acceso,
y, además, el sistema se encarga de relacionar la posición de cada registro con su
contenido por medio del área de índices. También es trabajo del sistema la gestión de
las áreas de índices y excedentes.

VENTAJAS Y DESVENTAJAS
VENTAJAS
• Rápido acceso
• El sistema de gestión de archivos se encarga de relacionar la posición de cada
registro con su contenido mediante la tabla de índices

DESVENTAJAS
• Desaprovechamiento de espacio, por quedar huecos intermedios cada vez que
se eliminan registros del archivo
• Se necesita espacio adicional para el área de índices

1.4. OPERACIONES CON ARCHIVOS

OPERACIONES SOBRE ARCHIVOS


Elegida la organización y el método de acceso de un archivo, se debe de considerar
todas las posibles operaciones que conciernen a los registros de un archivo.

• Creación
• Consulta (Archivo)
• Actualización (altas, bajas, modificación, consulta) (Registros)
• Clasificación
• Reorganización
• Destrucción (de un archivo)
• Reunión, Fusión
• Rotura, Estallido

M. en A. ESMERALDA VILLEGAS ZAMUDIO


ITSA
ORGANIZACIÓN DE DATOS
UNIDAD I

CREACION DE UN ARCHIVO
Es la primera operación de un archivo; implica la elección de un entorno descriptivo
que permita un ágil, rápido y eficaz tratamiento del archivo.

Para utilizar un archivo, éste tiene que existir. Por lo que la creación exige
organización, estructura, localización o reserva de espacio en el soporte de
almacenamiento.

CONSULTA DE UN ARCHIVO
Permite al usuario acceder al archivo de datos para conocer el contenido de uno,
varios o todos los registros.

ACTUALIZACION DE UN ARCHIVO
Permite tener actualizado (al día) el archivo, de tal modo que sea posible realizar las
siguientes operaciones con sus registros.
• Consulta del contenido de un registro
• Inserción de un registro nuevo en el archivo
• Supresión de un registro existente
• Modificación de un registro

CLASIFICACION DE UN ARCHIVO
La clasificación u ordenación del contenido de un archivo (registros) se realizará de
acuerdo con el valor de un campo específico, pudiendo ser ascendente o
descendente; alfabética o numérica.

REORGANIZACION DE UN ARCHIVO
Las operaciones sobre archivos modifican la estructura inicial o la óptima de un
archivo. Los índices, enlaces (punteros), zonas de sinónimos, zonas de
desbordamiento, etc. Se modifican con el paso del tiempo, lo que hace a la operación
de acceso a un registro cada vez más lenta.

Por lo que la reorganización consiste en la copia de un nuevo archivo a partir del


archivo modificado, a fin de obtener una nueva estructura lo más optima posible.

DESTRUCCION DE UN ARCHIVO
Es la operación inversa a la creación, cuando se destruye (anula o elimina) un archivo,
éste ya no se puede utilizar y por consiguiente, no se podrá acceder a ninguno de sus
registros.

M. en A. ESMERALDA VILLEGAS ZAMUDIO


ITSA
ORGANIZACIÓN DE DATOS
UNIDAD I

REUNION, FUSION DE UN ARCHIVO

REUNION Permite obtener un archivo a partir de otros varios.


FUSION Cuando se reúnen varios archivos en uno solo, intercalándose unos en
otros, siguiendo criterios determinados.

ROTURA/ESTALLIDO DE UN ARCHIVO
Es la operación de obtener varios archivos a partir de un mismo archivo inicial.

OPERACIONES MÁS USUALES EN LOS REGISTROS:


• Consulta
• Modificación
• Inserción
• Borrado

BIBLIOGRAFIA:
Fundamentos de Programación “Algoritmos y Estructura de Datos”
Luís Joyanes Aguilar

M. en A. ESMERALDA VILLEGAS ZAMUDIO

También podría gustarte