Está en la página 1de 31

Conceptos Bsicos de Archivos

Instituto Tecnolgico de Hermosillo

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Al igual que en otras disciplinas la informacin


se esquematiza como un sistema de Entrada,
Proceso y Salida.
En donde los datos (entrada) son el insumo
que requieren del procesamiento (proceso) para
producir la Informacin (salida).

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Entrada
de Datos

Procesamien
to de Datos

Salida de
Informaci
n

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Datos: Sucesos, hechos, eventos que son


REGISTRADOS a travs de medicin (cuantitativa
o cualitativa), observacin, etc.
Informacin: Son datos manipulados o
procesados que son presentados de manera
adecuada a los usuarios para servir de soporte a
la toma de decisiones (organizaciones) con las
caractersticas de Exactitud, Relevancia y
Oportunidad

Unidad I: Conceptos Bsicos de Archivos


Datos

Capacitacin.
Captura.
Registro.

Ordenamiento.
Op. Aritmticas.
Op. Lgicas.
Presentaciones de
Reportes.
Condensados.
Consultas.
Sumarios

Organizacin de

Usuarios
Directos.
Usuarios
Indirectos

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Tipo de Datos

Estructura de Datos

Primitivo
s

Simple

Compuesto

Entero

Arreglo

Lineal

No
lineal

Secuencial

Booleano

Registro

Cola

rbol
Binario

Relativo

Pila

B-Tree

Indexado

Lista

B+Tree

Multillave

Carcter
Real

Compuest
os

Cadena

rbol
General

Organizacin
de Archivos

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Campo: Los datos pueden ser representados por nmeros y


caracteres, de tal manera que un dato como el nombre de un
empleado, el nmero de control de un alumno o un precio pueden
ser identificados por un elemento que se le llama campo, entonces
obtendramos los campos, nombre, control y precio.
Registro: Un registro es el conjunto completo de datos
relacionados pertenecientes a una entrada, tal como un cheque
bancario. Al ser considerado como una unidad nica, el cheque
bancario es, por lo tanto, un registro que consta de 7 campos
separados, todos ellos relacionados con la transaccin de pago.
Archivo: Un archivo es una coleccin de registros relacionados. Se
incluye cada registro en un archivo ya que pertenece a la misma
entidad. Por ejemplo un archivo de cuentas est formado
solamente por las cuentas de los clientes.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

En computacin el trmino Archivo


tiene varios significados y clasificaciones:
Archivos de texto: secuencia de
caracteres (ASCII).
Archivos de datos: Son estructurados,
o tambin conocido como FORMATEADOS (
con comas, espacios fijos puntos y comas
etc.)

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Archivo Maestro: Contiene los datos que representan el


estado actual de una organizacin o empresa.
Archivo Trabajo: Son los archivos auxiliares utilizados por
los programas y que son regularmente borrados por estos
una vez que son utilizados. Se dice que son transparentes
para el usuario.
Archivo Respaldo: Es una copia obtenida del archivo
maestro con el sentido de proteger los datos en caso de
que el maestro se deteriore.
Archivo Fuente: Contiene el cdigo de algn lenguaje de
programacin que utiliza los datos para procesarlos en
alguna solucin para la empresa
Archivo de Transacciones: Tambin es auxiliar en el
proceso de Actualizacin del archivo maestro (siempre y
cuando sea archivo Secuencial).

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Archivos de Entrada (input): Son los archivos que


alimentan un procesamiento de datos, o sea solo son
ledos, ejemplo: El archivo de transacciones en el
procesamiento de la actualizacin del maestro en la
organizacin secuencial.
Archivos de Salida (output): son los archivos que solo son
escritos, y son donde los datos de salida de un
procesamiento son escritos. Ejemplo el archivo de
transacciones rechazadas en la actualizacin del maestro en
la organizacin secuencial.
Archivo de Entrada/Salida (input/output): Estos archivos
son ledos y escritos en el procesamiento de datos, o sea
proporcionan los datos de entrada al proceso y tambin los
datos procesados son escritos en el mismo. Ejemplo los
archivos directos implementados en dispositivos de acceso
aleatorio, presentan esta caracterstica.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Archivos Secuenciales: (datos en forma contigua, se


puede guardar tanto cinta, como en discos magnticos,
impractico para el acceso directo de un dato)
Archivos Directos: Necesitan se guardados en
dispositivos de acceso directo( disco, etc.) , el acceso
directo a un solo dato si puede ser efectuado.
Archivos Indexados: Tambin se puede conseguir el
acceso directo a un dato especifico sobre un archivo
secuencial que es el de datos, aunque se requiere para
hacerlo de un archivo auxiliar llamado ndice.
Archivos Multillave: El acceso directo puede realizarse
con caractersticas distintas de los datos, para hacerlo
requiere de varios ndices organizados en un archivo.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Creacin: Esta operacin hace nacer un archivo con los datos


que son escritos por algn procesamiento. Existen dos formas:
Cargado de registros y Creacin de estructura(esqueleto) previa
al guardado de datos.
Actualizacin: Es el procesamiento en el cual los registros pueden
tener las siguientes modificaciones: baja oeliminacin de
registros de datos, modificacin de registros de datos o Alta o
agregacin de registros.
Mantenimiento: Es el proceso que permite agregar, modificar o
eliminar CAMPOS del archivo. Existen dos tipos de
mantenimiento:
Reorganizacin: cambiar la organizacin a otra.
Reestructuracin: cambios con los tipos y/o tamaos de
campos
Recuperacin: Es el acceso a un archivo con el propsito de
extraccin de informacin, si el volumen a extraer es bajo se
dice que es una consulta y normalmente se despliega por
pantalla, su modo de procesamiento es interactivo. Si el volumen
es alto, es la generacin de reportes, el modo de procesamiento
es en Lote.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Volatilidad: se refiere a las supresiones, adiciones y


cambios que se efectan en un periodo determinado.
Cuando se acceda a un archivo varias veces en una
jornada, se dice que tiene elevada volatilidad. Ejemplo:
sistemas de reservacin, bancos, etc.
Actividad: Es la medida de proporcin de registros que se
accedan en un lote de actualizacin. La proporcin de
actividad es igual al numero de registros procesados en un
Lote, comparado con el numero de registros total del
archivo.
Tamao: Se refiere al espacio ocupado por el archivo en el
medio de almacenamiento. Debe considerarse no solo la
ocupacin actual del archivo sino tambin la posibilidad de
un crecimiento futuro.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Abrir: Esta operacin permite tener acceso posteriormente


a los registros de datos para acceder.
Cerrar: esta operacin busca proteger los datos de los
archivos a posibles accesos por error.
Leer registro: Esta operacin de lectura lleva informacin
(bloque de datos) del registro ledo en el medio de
almacenamiento a la memoria.
Grabar registro: Esta operacin lleva un (bloque de
datos) registro de la memoria hasta el medio de
almacenamiento.
Saltar al registro N: Esta operacin lleva el puntero
hasta un registro especifico (N). Solo para archivos
organizados directos.
Reinicio de apuntador: esta operacin lleva el
apuntador a hasta el inicio del archivo.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

El registro es un tipo de dato estructurado constituido por un


conjunto de elementos (campos) que pueden ser de diferentes
tipos de datos, ejemplo:
Registro: empleado

Elementos del registro empleado: Numero (Entero)


Nombre (Cadena[30])
Departamento (Entero)
Puesto (Entero)
Sueldo (Real)
Definicin de registros:
Declaraciones
Variables
NomRegistro: Registro
Dato1: Tipo de dato
Dato2: Tipo de dato
.
DatoN: Tipo de dato
FinRegistro

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Abrir archivo Escritura X


Leer datos A , B
DO
ESCRIBIR REGISTRO CON DATOS A Y B EN EL ARCHIVO X
Leer datos A, B
WHILE A <> 0

El siguiente algoritmo permite agregar registro a un archivo previamente


creado:

Abrir archivo Agregacin X


Leer datos A , B
DO
AGREGAR REGISTRO CON DATOS A Y B EN EL ARCHIVO X
Leer datos A, B
WHILE A <> 0

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

INICIO
Abrir el archivo para lectura X.
LEER REGISTRO DEL ARCHIVO.
WHILE no sea fin de archivo
1. IF es una bandera de control
THEN
A. Imprimir resumen y
pie de pgina
2. ENDIF
3. Imprimir detalle para este registro
4. Acumular a totales
5. Leer siguiente registro DEL ARCHIVO
ENDWHILE
Imprimir resumen y pie de pgina
Fin

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Al estar utilizando un archivo secuencial como MAESTRO, el realizar


las operaciones de actualizacin se llevar con el auxilio de un
archivo de transacciones, debido a que se realizar el proceso en
lote para que sea mas eficiente. El proceso se muestra en la
siguiente figura:
Archivos
Transaccion
es
Modificado

Archivo
Maestro
Viejo
Actualizacin

Archivo
Transaccion
es
Rechazadas

Archivo
Maestro
Nuevo

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Abrir archivo Lectura X


Colocar puntero al inicio del archivo
Solicitar Numero registro a buscar
Leer N
Mover puntero hasta registro N
IF existe Registro THEN
Leer Registro Datos en el archivo en
REG
|Imprimir REG
else
Imprimir no se encontr el registro
buscado
endif
fin

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

La transmisin de informacin entre memoria


primaria y secundaria se lleva a cabo a travs de
operaciones bsicas de lectura y escritura de
registros pero con unidades de tamao fijo
denominados lotes, de tal manera que se pueden
definir de la siguiente manera:
Bloque: Es la cantidad ms pequea de datos
que puede ser transferida entre memoria
secundaria y primaria en un acceso a un archivo.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Los datos son arreglados de acuerdo a alguna relacin


abstracta, esto es, depende de la aplicacin requerida. El
usuario siempre ve el archivo como una secuencia de
registro continuo o elementos lgicos.
Los registros pueden ser de longitud fija o longitud
variable, los cuales pueden tener llave o no tenerla, los
registros fijos son elementos lgicos del mismo tamao, y
los registros variables son elementos lgicos de diferentes
tamaos.
La longitud fija en el tamao del campo produce un
desperdicio de espacio, pero en cambio facilita la
localizacin y extraccin de la informacin en dicho campo,
al no tener que preocuparse por su tamao.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

En el caso de longitud variable sucede al revs, hay un


mejor aprovechamiento en espacio, pero se complica la
localizacin y extraccin de informacin.
Si el registro contiene un nmero fijo de campos de
longitud fija cada uno de ellos, entonces ser de longitud
fija.
Si el registro contiene un nmero variable de campos
de longitud fija cada uno de ellos, entonces ser de
longitud variable.
Si el registro contiene un nmero variable de campo en
que alguno de ellos sea de longitud variable, entonces ser
de longitud variable.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Los datos son arreglados por su


adyacencia fsica, esto es, dependiente del
dispositivo de almacenamiento
secundario; cintas magnticas o discos
magnticos (discos flexibles, discos duros,
paquete de disco, etc.). Los registros son
de tamao fijo o tamao variable y
pueden organizarse de varia formas para
constituir archivos fsicos.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

En este dispositivo el archivo fsico est formado por un


conjunto de registros fsicos, los bloques estn organizados
en forma contigua, ya que se asignan en forma
consecutiva.
La cinta magntica es uno de los medios ms
conocidos y menos caros de almacenar datos en sistemas
de todos los tamaos. Este mtodo de almacenamiento
secundario de archivos tiene ventajas y desventajas
especficas que se deben superar.
Los datos se almacenan a lo largo de la superficie de
la cinta en una densidad especfica, medida en
bytes/pulgada (bpi). La densidad estndar del registro se
mide por el nmero de bpi. La densidad de los sistemas de
red principal es de 1600 y 6250 bpi.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

La densidad de registros de una unidad de cinta magntica


es fija y no se puede alterar, pero muchos modelos tienen la
opcin de almacenar en dos tipos de densidad distintas.

Los datos se leen o se miden en la cinta en bloques de


registros fsicos y solo cuando la cinta se mueve hacia delante,
a travs de la unidad de cinta, esta pasa por la cabeza de
lectura y escritura de la unidad. La cinta, para y recomienza
cuando el sistema le dice ala unidad cinta que lea el siguiente
registro fsico.

Con el fin de permitir un espacio para que la unidad de


cinta se detenga y recomience el movimiento de la cinta sin
perder datos, se utiliza espacios entre los bloques para separar
cada bloque. Un espacio entre los bloques (tambin llamado
espacio entre los registros) es un longitud de cinta en blanco
que mide 0.3 pulgadas.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Para hacer un mejor uso del espacio de almacenamiento,


usualmente los analistas en sistemas reducen el nmero de los
espacios necesarios entre los lotes mediante la creacin de bloques.
Cada registro fsico, ya sea que contenga 1 byte de datos o una
entidad mucho mayor, es precedido y seguido por un espacio entre
los bloques.
La creacin de bloques ocurre cuando el sistema almacena
varios registros lgicos dentro de un nico registro fsico. El nmero
de registro en el bloque se llama factor de bloqueo. Si almacenar un
archivo de registros mdicos en una cinta magntica, el analista
especifica un factor de 30, el sistema almacenar 30 registros lgicos
dentro de cada bloque.
Todos los bloques en un archivo de cinta magntica utilizan el
mismo factor de bloqueo. As, si un bloque es registrado con un factor
de 30, todos juntan en bloques de 30.un bloque puede ser tan grande
como sea necesario, siempre que se pueda leer en la memoria
principal aun tiempo.
La longitud mxima de cualquier bloque esta determinada, por el
nmero que puede contener el buffer.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Los datos se escriben o se leen de los discos solo cuando


esta girando dentro de la unidad de disco. La rotacin del disco
vara de aproximadamente 200 a varios miles de revoluciones
por minuto, dependiendo del drive que se utilice
Las cabezas de lectura y escritura detectan en forma
electrnica los datos almacenados en la superficie del disco.
Normalmente, las cabezas de lectura y escritura son parte del
drive, sin embargo en los sistemas Winchester, las cabezas
vienen sellados en el mismo paquete del disco para mejorar la
velocidad de acceso.
Los datos se almacenan en la superficie del disco en una
o mas pistas, que son crculos concntricos con una capacidad
fija de almacenamiento medido en bytes con pista. Los
disquetes pequeos tienen menos de 34 pistas por superficie,
mientras que los grandes tienen varios cientos de pistas por
superficie. Cada pista se identifica mediante un nmero (desde
0 en orden ascendente con movimientos de 1) y un nmero de
superficie.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Las cabezas de lectura y escritura en un disco estn


instaladas juntos.
Las cabezas en cada superficie pueden accesar una sola
pista en esa superficie. Por lo tanto, si existen 20 superficies
en un paquete de disco, el sistema puede escribir o leer de
cualquiera de las 20 pistas. Cuando el brazo de acceso se
posiciona. Las pistas identificadas con el mismo nmero
forman lo que se conoce como un cilindro.

Para accesar aun registro especfico, el programa debe


terminar y especificar el cilindro y superficie donde se
encuentra el registro.
Este concepto es un aspecto importante de los dos
mtodos de direccionamiento utilizadas en dispositivos de
acceso directo:
Direccionamiento de pista y de sector.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

La forma de direccionamiento de uso ms comn en la


computadoras grandes utiliza el concepto de direccionamiento,
pista /cilindro.
Punto ndice: La distribucin general de una pista bajo el
concepto de pista /cilindro, consiste de un punto ndice, direccin
inicial, registro descriptor de la pista y registro de datos. El punto
ndice seala el comienzo de una pista, todas las pistas del disco
estn sincronizadas con el punto ndice.
Direccin Inicial: Durante la inicializacin, el sistema escribe la
direccin inicial y la pista.
Si por alguna razn el sistema no se puede escribir una direccin
inicial, el dispositivo no se puede utilizar. La direccin inicial consta de
4 datos.
El byte bandera indica si la pista es una pista primaria o
alternativa.
El cilindro y ms nmero de carga de lectura y escritura
identifican juntos una pista especfica en el disco, caracterstica
esencial para los mtodos de direccionamiento directo y por hashing.

Los bytes de verificacin son par la deteccin de errores.

Unidad I: Conceptos Bsicos de Archivos


Datos

Organizacin de

Es el registro descriptor de la misma, el cual describe


como se organizan los datos de la parte restante de la misma.
Se incluyen nueve datos. Bytes bandera, nmero de cilindros,
nmero de cabeza de lectura y escritura, se repiten en el
registro descriptor. Ya que en caso de que surja la necesidad,
se puedan mover los datos de una pista primaria a una
alternativa.
El nmero de registro es el nmero secuencial del
registro en la pista.
Los nmeros de cilindro, cabeza y registro conforman la
identificacin del registro, la cual distingue un registro en un
disco de otro y, junto con los detalles de longitud de los datos,
describe el rea tomada en cuenta.
El byte de longitud de la llave y los bytes de longitud de
los datos describe la cantidad de espacio abarcado por cada
registro. Los bytes de longitud de los datos son instrumentos
para almacenar los registros de longitud variable, los bytes de
verificacin son para control de errores.

Unidad I: Conceptos Bsicos de Archivos


Datos

Regresar a ndice de Unidades

Organizacin de

También podría gustarte