Está en la página 1de 70

Unidad I

Introducción
Introducción

Para poder acceder a determinada información en cualquier


momento, se necesitará que ella esté depositada en soportes
físicos los cuales la almacenan en forma permanente.

Este es el caso Memoria externa o auxiliar como:

 Disquete
 HD (disco duro)
 Cinta magnética, etc.
 Tarjetas perforadas
Introducción

Las cuales sin necesidad de estar conectadas a la


corriente eléctrica, la información almacenada en ella
permanece allí.

La forma de almacenar la información en ellos es


mediante unas estructuras de Datos llamadas ARCHIVOS
o FICHEROS (file).

 ARCHIVOS DE DATOS
 ARCHIVOS DE PROGRAMA
Introducción
Objetivos (entre otros...)

 Almacenamiento permanente
 Manipulación de un gran numero de datos
 Independencia de los programas
 Residentes en soportes externos

Estructura Archivos => Colección de Registros


Registros => Colección de campos (tamaño, longitud,...)
Campo => es la mínima unidad de información
1.1 Concepto de Archivo

¿Qué es un Archivo?

Procede del latín archivum, aunque su origen más


remoto se encuentra en la lengua griega y puede
traducirse como “residencia de los magistrados”

Usado para nombrar al conjunto ordenado de


documentos que una sociedad, una institución o una
persona elabora en el marco de sus actividades y
funciones.
1.1 Concepto de Archivo

En el área Informática

Un archivo es una colección de registros lógicamente


relacionados.

Un Registro es una estructura de campos de datos


lógicamente relacionados, los cuales tienen un formato
único, se almacenan juntos para algún propósito común
1.1 Concepto de Archivo

Los datos son:


Los valores que recibe el computador a través de
distintos medios, y que es manipulada mediante el
procesamiento de los algoritmos de programación.

Su contenido puede ser prácticamente cualquiera:

 Estadísticas
 Números
 Descriptores, etc..

Que por separado no tienen relevancia, pero que en conjunto


pueden ser una información completa y específica.
1.1 Concepto de Archivo

Los datos son:


Los valores que recibe el computador a través de
distintos medios, y que es manipulada mediante el
procesamiento de los algoritmos de programación.

Su contenido puede ser prácticamente cualquiera:

 Estadísticas
 Números
 Descriptores, etc..

Que por separado no tienen relevancia, pero que en conjunto


pueden ser una información completa y específica.
1.1 Concepto de Archivo

¿Cómo se Estructura del archivo?

Un archivo (File) es una estructura diseñada para contener


datos, estos están organizados de forma tal que se puedan
consultar, modificar, agregar o eliminar.
El cual debe contar con un identificador (nombre) que lo
diferencie de los demás, el cual debe de ser representativo
de su contenido.
1.1 Concepto de Archivo

Existen tres buenas razones para


estructurar una colección de datos como un archivo:

1. Almacenar datos independientemente de la ejecución de


un programa particular, un archivo proporciona un medio
perméate.
2. Pueden almacenar grandes volúmenes de información
que no podrían almacenarse en memoria principal.
3. Se puede usar solo una pequeña parte de la colección
por el programa, haciendo ilógico almacenar toda la
información simultáneamente en memoria principal.
1.1 Concepto de Archivo

Existen tres buenas razones para


estructurar una colección de datos como un archivo:

1. Almacenar datos independientemente de la ejecución de


un programa particular, un archivo proporciona un medio
perméate.
2. Pueden almacenar grandes volúmenes de información
que no podrían almacenarse en memoria principal.
3. Se puede usar solo una pequeña parte de la colección
por el programa, haciendo ilógico almacenar toda la
información simultáneamente en memoria principal.
1.1 Concepto de Archivo

¿Cuándo se utilizan?

Cuando se desea almacenar datos de manera persistente, o


para guardarlos en memoria secundaria con el fin de no
utilizar memoria primaria, dado que esta última es
normalmente más escasa que la anterior.

Dependiendo de cada sistema de archivos, los ficheros


pueden tener atributos particulares como:
 Fecha de creación y/o última modificación
 Dueño
 Permisos de acceso.
1.1 Concepto de Archivo

¿Cuándo se utilizan?

La capacidad de almacenamiento de un archivo se limita por


el volumen disponible en la memoria secundaria y los límites
definidos por el sistema (archivos/operativo).

Su tipo es definido por el tipo de organización de los datos


almacenados y la interpretación que realiza el software que
los escribe o los lee.
En Resumen

Un registro es un conjunto de campos referentes a una


entidad en particular y constituyen
una unidad para su proceso.

ejemplo de un registro-: información de un


alumno, con los campos: clave, apellido y
nombre, domicilio, fecha de nacimiento, entre otros
campos.

Registro
En Resumen

Un registro es un conjunto de campos referentes a una


entidad en particular y constituyen
una unidad para su proceso.

ejemplo de un registro:
información de un alumno, con los campos: clave,
apellido y nombre, domicilio, fecha de nacimiento, entre
otros campos.

Registro
Estructura de datos de un Archivo

Un Campo es un conjunto de caracteres capaz de


suministrar una determinada información referida a un
concepto; al definirlo debemos indicar claramente sus
tres características:
 Nombre: Es el identificador del conjunto
de caracteres que almacenara.
 Tipo: Tipo de dato que puede almacenar
(carácter, String, entero, etc.).
 Tamaño: Cantidad de caracteres que
puede contener.
Estructura de datos de un Archivo

Ejemplo: si tenemos que definir al campo número de


documento resultaría:

Nombre: Documento
Tipo: Numérico
Tamaño: 8 enteros

Un campo es la entidad lógica más pequeña, consiste en un


conjunto de byte que conforman un dato.
Estructura de datos de un Archivo

Un Registro es un conjunto de campos referentes a una


entidad en particular y constituyen una unidad para su
proceso.

Ejemplo: la información de un Alumno, que contiene los


Campos:

 NoCtrl
 Apat
 Amat
 Nombre
 Domicilio
 FechaNac.
1.2 Tipos de archivo

Existen seis tipos básicos de archivos, clasificados por la


función que desempeñan en in sistema informático.

1. Maestro: representa una visión estática de algún


aspecto de los negocios de una organización en un
momento dado.(clientes, facturas, inventario, etc.),
contiene datos relativamente permanentes de estado
histórico.
1.2 Tipos de archivo

2. Transacciones: almacena los cambios que se aplican a


los archivos maestros, puede contener datos para
agregar, borrar o modificar un registro. Cada registro
representa un cambio de alguna cosa, cuyo estatus es
registrado en un archivo maestro.
1.2 Tipos de archivo

3. Reportes: contiene datos que son fomentados para su


presentación al usuario. Puede ser impresos, o
presentarse en la pantalla.
1.2 Tipos de archivo

4. Trabajo: es un archivo temporal, se usan comúnmente


para pasar datos creados por un programa a otro.

5. Programa: contiene las instrucciones para procesar


datos, los cuales pueden almacenarse en otros
archivos o residir en memoria. Las instrucciones
pueden estar en código fuente, o ser el resultado de
una compilación.
1.2 Tipos de archivo

6. Texto: contiene los datos alfanuméricos y gráficos


ingresados agraves de un programa editor de textos.
1.2 Tipos de archivo

De acuerdo a los datos que almacenan se encuentran:

ASCII
American Standard Code for Information Interchange:

Es un estándar que asigna un


valor numérico a cada carácter,
con lo que se pueden representar
los documentos llamados de
Texto Plano, es decir, los que son
legibles por seres humanos.
1.2 Tipos de archivo

De acuerdo a los datos que almacenan se encuentran:

Binario:

almacena información en un lenguaje al que sólo la propia


computadora comprende.

Ejemplo:
 imágenes (jpg, .gif, .tiff, .bmp)
 Video (.mpg, .mov, .avi, .gif)
 Empaquetados (zip, .Z, .gz, .tar, .)
 Ejecutables (.exe, .com, .cgi, .o, .a)
 Procesadores de palabras(.doc)
1.3 Organizaciones de archivos

Es la colección de registros lógicos en el archivo y la percepción que


tiene el programador acerca de la disposición lógica de los registros
almacenados en el archivo

La cual tiene una técnica de acceso, mediante la cual estos registros


pueden ser accedidos.

Esta técnicas son llamada organización de archivos y son:

 Secuencial
 Secuencial indexado
 Directa/Relativa (Random)
1.3.1 Organizaciones de archivos
Secuenciales

Es la manera básica de organizar un conjunto de registros,


que forman parte del archivo.

En este los registros quedan grabados consecutivamente


cuando el archivo se crea y debe accederse
consecutivamente.
1.3.1 Organizaciones de archivos
Secuenciales

El término implica que lógicamente los registros del archivo


están almacenados en forma adyacente,
Uno tras otro en orden de llegada.

 El acceso a algún registro, se deben leer


todos los registros que están almacenados
antes de éste.
 El orden físico de los registros, es el orden
de lectura de los mismos.
1.3.1 Organizaciones de archivos
Secuenciales

Características:

 La escritura de nuevos registros siempre se hace al final


del archivo.
 Para leer un registro del archivo hay que avanzar siempre,
si la zona está antes de la zona actual de lectura, será
necesario regresar el puntero de lectura del archivo.
 Los archivos sólo se pueden abrir para lectura o para
escritura, nunca de los dos modos a la vez.
1.3.1 Organizaciones de archivos
Secuenciales

Características:

 La escritura de nuevos registros siempre se hace al final


del archivo.
 Para leer un registro del archivo hay que avanzar siempre,
si la zona está antes de la zona actual de lectura, será
necesario regresar el puntero de lectura del archivo.
 Los archivos sólo se pueden abrir para lectura o para
escritura, nunca de los dos modos a la vez.
1.3.1 Organizaciones de archivos
Secuenciales

Estructura de un archivo secuencial:

Normalmente cada registro tiene una estructura compuesta


por una cantidad finita de campos relacionados entre sí .
 campos de distinto tipo
 uno denomina campo llave “identificación única del registro”
1.3.1 Organizaciones de archivos
Secuenciales

Estructura de un archivo secuencial:

Ejemplo:
1.3.1 Organizaciones de archivos
Secuenciales

Estructura de un archivo secuencial:

Ventajas:

 Proveen la mejor utilización de espacio y son rápidos cuando los registros


son accesados secuencialmente.
 Son muy sencillos de usar y aplicar
 Capacidad de acceso al "siguiente" registro rápidamente

Desventaja:

 El acceso a un registro en particular es pobre, no se puede hacer


individualmente.
1.3.2 Organizaciones de archivos
Secuenciales Indexado
Un diccionario es un archivo secuencial:

los registros son las entradas


Las claves son las palabras definidas por las entradas.

Para buscar una palabra no se realiza de manera secuencial, sino


que se abre el diccionario por la letra inicial de la palabra.

Si se desea buscar “índice”:


1. se abre este por la letra I
2. en su 1er pag. se busca la cabecera de la página hasta
encontrar la página mas próxima a la palabra.
3. buscando a continuación palabra a palabra hasta encontrar
“índice”.
1.3.2 Organizaciones de archivos
Secuenciales Indexado

El diccionario típico de archivos secuencial-indexado con dos


niveles de índices, el nivel superior para las letras iniciales y el
nivel menor para las cabeceras de páginas se guardaran en un
archivo de índice independiente de las entradas del diccionario
(archivo de datos).

Por consiguiente, cada archivo secuencial-indexado consta de un


archivo índice y un archivo de datos.
1.3.2 Organizaciones de archivos
Secuenciales Indexado

Un archivo de esta tipo de organización se caracteriza por:

 El tipo de sus registros contienen un campo clave que lo


identifica como único
 Los registros están situados en un soporte direcciónatele por el
orden de los valores indicados por la clave.
 Tiene un índice para cada posición, la dirección de la posición y
el valor de la clave; el índice contiene la clave del último
registro y la dirección de acceso al primer registro del bloque.
1.3.2 Organizaciones de archivos
Secuenciales Indexado

Ejemplo:
1.3.2 Organizaciones de archivos
Secuenciales Indexado

Ventajas:

 Son de rápido acceso.


 El sistema gestor de archivos se encarga de relacionar la
posición de cada registro con su contenido mediante la tabla de
índices.

Desventajas:

 Se requiere especio adicional para el área de índices.


1.3.3 Organizaciones de archivos
Directa/Relativa (Random)

Este tipo de organización el orden físico de los registros no


corresponde con el orden lógico.

Los datos se sitúan en el archivo y se accede a ellos


mediante su posición, es decir, el lugar relativo que
ocupan.
1.3.3 Organizaciones de archivos
Directa/Relativa (Random)

Un archivo consta de registros ordenados por su dirección


relativa, sus los principales atributos:

 La lectura de los registros como orden secuencial o


secuencial indexado.
 Cada registro deben contar con un identificador que lo
haga un registro como único (campo llave).

“ dos registros no pueden tener la misma clave”


1.3.3 Organizaciones de archivos
Directa/Relativa (Random)

 Almacenamiento en un soporte direccionable.

 Existencia de una correspondencia entre los posibles


valores de la clave y las direcciones posibles sobre el
soporte.
1.3.3 Organizaciones de archivos
Directa/Relativa (Random)

Ventajas

 Se pueden leer y escribir registros en cualquier orden y


posición.
 Son muy rápidos de acceso a la información que
contienen.
 la habilidad de acezar registros individuales
directamente.
1.3.3 Organizaciones de archivos
Directa/Relativa (Random)

Desventajas

 Requiere programar la relación existente entre el la llave


y la posición que ocupara.
 Se puede presentar la misma dirección para diferentes
valores de llave, es decir, se presentan COLISIONES.
 El desperdicio de espacio debido a la distribución al azar
de los registros, pueden existir huecos libres entre los
registros.
1.4 Operaciones sobre archivos

Desde el punto de vista del desarrollador, el manejo de


archivos es importante ya que los programas pueden leer o
escribir en ellos.

Para ello se debe implementar:

 Procedimientos
 Funciones

Para comunicar al sistema operativo la operación a realizar y


obtener una respuesta de este.
1.4 Operaciones sobre archivos

El SO debe mantener cierta información sobre los archivos


que manipula:

 Soporte físico
 Tipo de organización
 Inicio y fin del archivo

Los principales procedimientos sobre tipos de archivos son


1.4.1 Creación de Archivos

Esta operación asigna el espacio para el archivo donde


después los datos serán cargados “Esqueleto del archivo”

Esta es la primera operación sobre un archivo, mediante la


cual se introduce la información del archivo en un soporte
de almacenamiento de datos.

Para ser utilizado, este debe existir, es necesario que se


haya creado previamente.
1.4.1 Creación de Archivos

Esta exige:

 Organización
 Estructura
 Localización (soporte de almacenamiento)

Durante la creación esta se requieren:

 Nombre del dispositivo


 Nombre de archivo
 Tamaño
 Organización, etc.
1.4.1 Creación de Archivos

Al momento de la creación puede suceder:

 Que sea creado por primera vez en un soporte


determinado
 Proceder de otro que ya existe
 Ser el resultado de un cálculo, condición, etc. o ambas
cosas a la vez
1.4.2 Actualización de Archivos

Cambiar el contenido de un archivo para hacer que refleje un


momento transitorio más actual del mundo real es a lo cual se le
llama, actualización de archivos.

Estos cambios pueden incluir:

a) La inserción de nuevos registros, por ejemplo, la adición de un


registro para un empleado de nuevo ingreso en la compañía.
b) La modificación de datos a registros que ya existen en un
archivo, por ejemplo, cambiar el sueldo del empleado, cambiar
el indicativo de estado del empleado(activo/no activo/licencia).
1.4.3 Recuperación de información de Archivos

Es el acceso a un archivo con el propósito de extraer


información (consultar)

Formulada Mediante un lenguaje de consulta

 Traduce las preguntas del usuario en instrucciones


 Usadas directamente para acezar el archivo.
1.4.3 Recuperación de información de Archivos

Existen dos clases de recuperación de información:

 La recuperación comprensiva
 información de todos los registros del archivo (reportes)

 La recuperación selectiva
 aplica criterios de clasificación de registros
1.4.4 Mantenimiento de Archivos

Son los cambios hechos sobre los archivos


para mejorar la eficiente de los programas que los accedan

Existen dos clases de operaciones:

 Restructuración de un archivo:
Implica Cambios Estructurales al Archivo

por ejemplo, cambiar la longitud de un campo, agregar uno


nuevo al registro, re-secuenciar los registros del archivo,
etc.
1.4.4 Mantenimiento de Archivos

 Reorganización del archivo


Implica cambiar la organización a otro tipo
Ya que la organización difiere en sus requerimientos
1.4.5 Apertura y Cierre de Archivos

Para que un programa pueda utilizar un archivo, la primera


operación a realizar es:

La apertura del archivo: mediante un procedimiento que


identifique el archivo (nombre, ubicación) y el modo que se
empleara.

El SO construye a partir de esto UN DESCRIPTOR DE


ARCHIVO, con el cual se refiriera al archivo por un
número / variable asociado a este descriptor. “de manera
interna”
1.4.5 Apertura y Cierre de Archivos

El modo de apertura determina las operaciones que se


podrán realizar sobre el mismo:

Ejemplo:

No podríamos escribir en un archivo si en el descriptor


especifica que se abrió como “SOLO LECTURA”.
1.4.5 Apertura y Cierre de Archivos

Cuando va a ser Utilizado, se requiere indicar al SO:

 EL fin de uso para que libere el descriptor del archivo


 Asegurando que se almacene en el soporte físico
1.4.5 Apertura y Cierre de Archivos

Para cerrar un archivo el programa debe utilizar;

Un procedimiento de cierre, indicando el descriptor de


archivo interno (numero/variable).

Evidentemente para el uso de


un archivo, este debe existir,
por ello debe de haberse creado
en algún momento.
1.4.5 Apertura y Cierre de Archivos

Al abrirlo para lectura, la información debe haberse


almacenado sobre un soporte y ser utilizable.

 Si se realiza la apertura para escritura y no existe, en


lenguajes eso al SO lo cree automáticamente (en caso
contrario se debe crear previamente)
 Si ya existiera, su contenido será borrado y empezara a
escribirse desde el inicio.
1.4.5 Apertura y Cierre de Archivos

La forma de evitar el borrado de contenidos si se desea añadir datos


nuevos a los existentes, es NECESARIO ABRIRLO DE MODO AÑADIR.

Para la creación de un nuevo archivo es necesario saber:

 Nombre dispositivo: soporte dónde de se almacenara fiscalmente el


archivo
 Nombre del archivo: identificador que lo diferencia de los otros
 Tamaño del archivo: especio necesario para la creación del archivo
 Organización del archivo: tipo de organización del archivo
 Tamaño del bloque (registro físico): cantidad de datos que se leen o
escriben en cada operación de E/S
1.4.5 Apertura y Cierre de Archivos

Errores en la creación de archivos:

 Existencia de otro archivo con el mismo nombre en el soporte


 El dispositivo no tiene especio disponible para crear el archivo
 El dispositivo no está operando
 Problemas en el hardware
 Parámetros de entrada con errores
1.5 Almacenamiento y medios físicos

Las organizaciones requieren su información sea preservada para su


posterior manipulación.
Por ello:

 Necesarios tener un soporte de almacenamiento especial


 Debe preservarse indefinidamente

Por ello es necesaria la transcripción de los medio de almacenamiento


viejos a nuevos:

 Por inestabilidad
 Por tecnologías de grabación obsoletas
 Por avances tecnológicos
1.5 Almacenamiento y medios físicos

Los principales dispositivos de almacenito estreno que se utilizan


para preservar los datos son:

1.5.1 Cintas magnéticas

En estas la información es registrada en forma de puntos


magnetizados a lo largo de varias pistas paralelas para
representar los símbolos binarios 1 y 0.

Los Datos son grabados o leídos por medio de una cabeza


magnética, en el caso de los procesadores hay tantas cabezas
como pistas paralelas.
1.5 Almacenamiento y medios físicos

1.5.1 Cintas magnéticas

Características:
 Material plástico recubierto de óxido férrico
 Ancho de menos de 2 cm, sobre la cual la información es registrada

Varias unidades de cinta pueden ser interconectadas al mismo


procesador, permitiendo de esta manera almacenar millones de
datos, registrándolos o leyéndolos a la velocidad de
aproximadamente 15,000 números y letras por segundo.
1.5 Almacenamiento y medios físicos

1.5.1 Cintas magnéticas

Ventajas:
 
Alta densidad de datos: Puede grabar 800,1600, 2400, 3200, 4000,
4800, 5600 y hasta 6400 bytes en cada pulgada dependiendo de la
unidad de cinta que utilice “6400 cart/pulgada” esto depende de la
longitud de la cinta

Bajo costo y facilidad de manejo: costo aproximado 20 dólares. Y


dado que el carrete es compacto y pesa menos de 1.5 kg, ocupa muy
poco espacio de almacenamiento y es fácil de manejar.
1.5 Almacenamiento y medios físicos

1.5.1 Cintas magnéticas

Desventajas:
Falta de acceso directo a los registros: es de acceso
secuencial por ello se requiere procesar toda la cinta para
actualizar.

Si se requiere acceso a los registros de manera aleatoria,


no se debe almacenar en este tipo; se requiere demasiado
tiempo en montar y desmontar, se desperdiciaría mucho
tiempo máquina en la lectura de registros que no necesitan.
1.5 Almacenamiento y medios físicos

1.5.1 Cintas magnéticas

Desventajas:

Problemas ambientales: Las partículas de polvo y la falta de


control de los niveles de la temperatura o humedad pueden
causar errores en la lectura de cintas. Las cintas y sus
envases deben etiquetarse y controlarse cuidadosamente
para no borrar por error un archivo importante.
Organización de Archivos

Tomando en cuenta los tipos, características, operaciones


y ventajas de los ARCHIVOS que se pueden manejar al
estructurar un sistema de información.

¿Cual de las diferentes organizaciones es la mas idónea


en el manejo de archivos de datos?
Organización de Archivos

La gestión de archivos tiene los siguientes objetivos:

 Optimizar la categorización de la información.


 Facilitar el acceso a los documentos.
 Revisar y garantizar la validez de los archivos.
 Brindar soporte directo ante el manejo de los datos y para
los dispositivos de almacenamiento.
 Minimizar la pérdida de datos.

Propósito es la organizada de la información


Criterios para Elegir un tipo de
Organización

 Rápido Acceso
 Economía de Almacenamiento
 Facilidad de Uso

La elección de la organización determina el


rendimiento. Algunas mediadas de rendimiento son:

a) Almacenamiento requerido por un registro.


b) Tiempo de búsqueda de un registro.
c) Tiempo requerido para leer todo el archivo.
d) Tiempo requerido para insertar un registro.
e) Tiempo para modificar un registro.
En Resumen

1.1 Concepto de Archivo


1.2 Tipos de archivo
1.3 Organizaciones de archivos
1.4 Operaciones sobre archivos
1.5 Almacenamiento y medios físicos

También podría gustarte