Está en la página 1de 14

Administracion y Organizacion de Datos

IINF-2010-220

Unidad I Introducción

1.1 Concepto de archivo

¿Qué es un Archivo?

Procede del latín archivum, aunque su origen más remoto se encuentra en la lengua griega y
puede traducirse como “residencia de los magistrados”. El término se utiliza para nombrar al
conjunto ordenado de documentos que una sociedad, una institución o una persona elabora en el
marco de sus actividades y funciones.

El lugar donde se custodian documentos importantes para una organización también se conoce
con el nombre de archivo.

En el área informática, un archivo es una colección de registros lógicamente relacionados. Un


Registro es una estructura de campos o de elementos de información (datos) lógicamente
relacionados. Por lo general, todos los registros de un archivo tienen un formato único; los cuales
se almacenan juntos para algún propósito común.

Los datos son, así, la información (valores o referentes) que recibe el computador a través de
distintos medios, y que es manipulada mediante el procesamiento de los algoritmos de
programación. Su contenido puede ser prácticamente cualquiera: estadísticas, números,
descriptores, que por separado no tienen relevancia para los usuarios del sistema, pero que en
conjunto pueden ser interpretados para obtener una información completa y específica.

¿Cómo se Estructura del archivo?

Un archivo (File) es una estructura diseñada para contener datos, estos están organizados de
forma tal que se puedan consultar, modificar, agregar o eliminar. El cual debe contar con un
identificador (nombre) que lo diferencie de los demás. El cual debe de ser representativo de su
contenido.
En resumen, podríamos decir que un archivo está formado por un conjunto de registros, y estos a
su vez por un conjunto de campos.
Administracion y Organizacion de Datos
IINF-2010-220

Existen tres buenas razones para estructurar una colección de datos como un archivo:

 Almacenar datos independientemente de la ejecución de un programa particular, ya que


cuando un programa ejecutable finaliza, los datos en el espacio de memoria se reasigna y lo
almacenado en la memoria principal se pierde. En comparación con un archivo proporciona
un medio perméate.
 Pueden almacenar grandes volúmenes de información que no podrían almacenarse en
memoria principal.
 Los datos podrían almacenarse como archivos, debido a que solo una pequeña parte de la
colección fuera usada por el programa en algún momento dado, haciendo ilógico almacenar
toda la información simultáneamente en memoria principal.

Los archivos se utilizan cuando se desea almacenar datos de manera persistente, o para
guardarlos en memoria secundaria con el fin de no utilizar memoria primaria, dado que esta
última es normalmente más escasa que la anterior.

Dependiendo de cada sistema de archivos, los ficheros pueden tener atributos particulares como,
por ejemplo, fecha de creación, fecha de última modificación, dueño y permisos de acceso.

La capacidad de almacenamiento de un archivo se limita por el volumen disponible en la memoria


secundaria y los límites definidos por el sistema (archivos/operativo).

Su tipo es definido por el tipo de organización de los datos almacenados y la interpretación que
realiza el software que los escribe o los lee.

Estructura de datos de un Archivo:

Un Campo es un conjunto de caracteres capaz de suministrar una determinada información


referida a un concepto; al definirlo debemos indicar claramente sus tres características:

 Nombre: Es el identificador del conjunto de caracteres que almacenara.


 Tipo: Tipo de dato que puede almacenar (carácter, String, entero, etc.).
 Tamaño: Cantidad de caracteres que puede contener.

Ejemplo: si tenemos que definir al campo número de documento resultaría:

 Nombre: documento
Administracion y Organizacion de Datos
IINF-2010-220
 Tipo: numérico
 Tamaño: 8 enteros

Un campo es la entidad lógica más pequeña, consiste en un conjunto de byte que conforman un
dato. Un campo es la unidad mínima de información de un registro.

Un Registro es un conjunto de campos referentes a una entidad en particular y constituyen una


unidad para su proceso.

Ejemplo: la información de un Alumno, que contiene los Campos:

 NoCtrl
 Apat
 Amat
 Nombre
 Domicilio
 FechaNac.

1.2 Tipos de archivo

Existen seis tipos básicos de archivos, clasificados por la función que desempeñan en in sistema
informático.

1. Maestro: representa una visión estática de algún aspecto de los negocios de una organización
en un momento dado.( nomina, clientes, inventario, etc.), contiene datos relativamente
permanentes de estado histórico.
2. Transacciones: almacena los cambios que se aplican a los archivos maestros, puede contener
datos para agregar, borrar o modificar un registro. Cada registro representa un evento o
cambio de alguna cosa, cuyo estatus es registrado en un archivo maestro.
3. Reportes: contiene datos que son fomentados para su presentación al usuario. Puede ser
impresos, o presentarse en la pantalla.
4. Trabajo: es un archivo temporal, se usan comúnmente para pasar datos creados por un
programa a otro.
5. Programa: contiene las instrucciones para procesar datos, los cuales pueden almacenarse en
otros archivos o residir en memoria. Las instrucciones pueden estar en código fuente, o ser el
resultado de una compilación.
6. Texto: contiene los datos alfanuméricos y gráficos ingresados agraves de un programa editor
de textos.
Administracion y Organizacion de Datos
IINF-2010-220
De acuerdo a los datos que almacenan se encuentran:

 ASCII (American Standard Code for Information Interchange): Es un estándar que


asigna un valor numérico a cada carácter, con lo que se pueden representar los
documentos llamados de Texto Plano, es decir, los que son legibles por seres humanos.
 Binario: esta clase de archivos, en cambio, almacena información en un lenguaje al que
sólo la propia computadora comprende, por ejemplo imágenes (jpg, .gif, .tiff, .bmp),Video
(.mpg, .mov, .avi, .gif),Empaquetados (zip, .Z, .gz, .tar, .) , Ejecutables (.exe, .com, .cgi, .o,
.a), Procesadores de palabras(.doc)

1.3 Organizaciones de archivos

La Organización de un archivo es la colección de registros lógicos en el archivo y la percepción que


tiene el programador acerca de la disposición lógica de los registros almacenados en el archivo;
Esta tiene alguna técnica de acceso mediante el cual estos registros pueden ser accedidos.

La técnica utilizada para representar y almacenar registros en archivos es llamada organización de


archivos. Las cuales son:

 Secuencial
 Secuencial indexado
 Directa/Relativa (Random)

1.3.1 Organizaciones de archivos Secuenciales

Es la manera básica de organizar un conjunto de registros, que forman parte del archivo. En un
archivo secuencial los registros quedan grabados consecutivamente cuando el archivo se crea y
debe accederse consecutivamente.

El término implica que lógicamente los registros del archivo están


almacenados consecutivamente; esto es, en forma adyacente, los
registros son almacenados uno tras otro en orden de llegada.

El acceso a algún registro, se deben leer todos los registros que están
almacenados antes de éste.

El orden físico de los registros, es el orden de lectura de los mismos.


Administracion y Organizacion de Datos
IINF-2010-220

Características:
 La escritura de nuevos registros siempre se hace al final del archivo.

 Para leer un registro del archivo hay que avanzar siempre, si la zona está antes de la zona
actual de lectura, será necesario "rebobinar" o regresar el puntero de lectura del archivo.

 Los archivos sólo se pueden abrir para lectura o para escritura, nunca de los dos modos a la
vez.

Estructura de un archivo secuencial:

Normalmente cada registro tiene una estructura compuesta por una cantidad finita de
campos y todos ellos están relacionados entre sí y hacen referencia a una unidad. La
estructura de un registro tiene generalmente campos de distinto tipo y uno de ellos se
denomina campo llave para identificar en forma única a cada registro.

Ejemplo:

Ventajas:
 Proveen la mejor utilización de espacio y son rápidos cuando los registros son accesados
secuencialmente.

 Son muy sencillos de usar y aplicar

 Capacidad de acceso al "siguiente" registro rápidamente

Desventaja:
 El acceso a un registro en particular es pobre, no se puede hacer individualmente.
Administracion y Organizacion de Datos
IINF-2010-220
1.3.2 Organizaciones de archivos Secuenciales Indexado

Un diccionario es un archivo secuencial, cuyos registros son las entradas y cuyas claves son las
palabras definidas por las entradas. Para buscar una palabra no se realiza de manerai secuencial,
sino que se abre el diccionario por la letra inicial de la palabra. Si se desea buscar “índice”, se abre
este por la letra I y en su primera página se busca la cabecera de la página hasta encontrar la
página ms próxima a la palabra., buscando a continuación palabra a palabra hasta encontrar
“índice”.

El diccionario típico de archivos secuencial-indexado con dos niveles de índices, el nivel superior
para las letras iniciales y el nivel menor para las cabeceras de páginas se guardaran en un archivo
de índice independiente de las entradas del diccionario (archivo de datos).

Por consiguiente, cada archivo secuencial-indexado consta de un archivo índice y un archivo de


datos.

Un archivo de esta tipo de organización se caracteriza por:

 El tipo de sus registros contienen un campo clave que lo identifica como único

 Los registros están situados en un soporte direcciónatele por el orden de los valores indicados
por la clave.

 Tiene un índice para cada posición, la dirección de la posición y el valor de la clave; el índice
contiene la clave del último registro y la dirección de acceso al primer registro del bloque.

Ejemplo:

Ventajas:
 Son de rápido acceso.
 El sistema gestor de archivos se encarga de relacionar la posición de cada registro con su
contenido mediante la tabla de índices.
Desventajas:
Administracion y Organizacion de Datos
IINF-2010-220
 Se requiere especio adicional para el área de índices.

1.3.3 Organizaciones de archivos Directa/Relativa (Random)

Este tipo de organización el orden físico de los registros no corresponde con el orden lógico. Los
datos se sitúan en el archivo y se accede a ellos directa, aleatoriamente, mediante su posición, es
decir, el lugar relativo que ocupan.

Un archivo consta de registros ordenados por su dirección relativa. los principales atributos de
archivo relativa organización:

 Se pueden leer los registros en orden secuencial como en secuencial.


 Los registros deben contener un campo específico denominado clave que identifica a cada
registro como único, es decir, dos registros no pueden tener el mismo valor clave.
 Almacenamiento en un soporte direccionable.
 Existencia de una correspondencia entre los posibles valores de la clave y las direcciones
posibles sobre el soporte.

Ventajas

 Se pueden leer y escribir registros en cualquier orden y posición. Son muy rápidos de acceso a
la información que contienen.
 la habilidad de acezar registros individuales directamente.

Desventajas

 Requiere programar la relación existente entre el contenido de un registro y la posición que


ocupa.
 Radica (dependiendo de la función de mapeo) en que se puede presentar una misma dirección
para diferentes valores de llave, es decir, se presentan colisiones.
El desperdicio de espacio debido a la distribución al azar de los registros, pueden existir huecos
libres entre los registros.
Administracion y Organizacion de Datos
IINF-2010-220

1.4 Operaciones sobre archivos

Desde el punto de vista del desarrollador, el manejo de archivos es importante ya que los
programas pueden leer o escribir en ellos.

Para ello se debe implementar procedimientos y funciones para comunicar al sistema operativo la
operación a realizar y obtener una respuesta de este.

El sistema operativo debe mantener cierta información sobre los archivos que manipula (como
soporte físico, tipo de organización, inicio y fin del archivo). Los principales procedimientos
básicos, que se pueden realizar con los diferentes tipos de archivos.

1.4.1 Creación de Archivos

La creación inicial de un archivo se considera como la carga del archivo. En esta operación se
asigna el espacio para el archivo y después los datos son cargados dentro de ese “Esqueleto” de
archivo.

La creación es la primera operación que se hará con un archivo, mediante la cual se introduce la
información correspondiente al archivo en un soporte de almacenamiento de datos.

Para poder utilizar un archivo, este debe existir, es decir, es necesario que se haya creado
previamente.

La creación exige organización, estructura, localización o reserva de espacio en el soporte de


almacenamiento. En un entorno de computadoras, durante la creación es necesario darle una
serie de datos: Nombre del dispositivo, nombre de archivo, tamaño, organización, etc.-

Al momento de la creación puede suceder que sea creado por primera vez en un soporte
determinado, proceder de otro que ya existe, ser el resultado de un cálculo, condición, etc.- o
ambas cosas a la vez.

1.4.2 Actualización de Archivos

Cambiar el contenido de un archivo para hacer que refleje un momento transitorio más actual del
mundo real es a lo cual se le llama, actualización de archivos. Estos cambios pueden incluir

a) La inserción de nuevos registros, por ejemplo, la adición de un registro para un empleado de


nuevo ingreso en la compañía.

b) La modificación de datos a registros que ya existen en un archivo, por ejemplo, cambiar el


sueldo del empleado, cambiar el indicativo de estado del empleado(activo/no activo/licencia).
Administracion y Organizacion de Datos
IINF-2010-220
c) La supresión de registros del archivo, esto es, borrar el registro de un empleado que se salió
de la compañía.

De esta forma, la actualización del archivo representa una imagen más actual de la realidad.

Implicaciones:

 Los registros se pueden modificar y regrabar en el mismo archivo ( archivo de entrada-salida)

 Nuevos registro pueden ser insertados en espacios desocupados del archivo

 Los registros pueden ser borrados para reutilizar el espacio dejado por estos

 En algunas restricciones es que un archivo no puede ser actualizado en el mismo lugar, para
ello se utiliza el archivo actual como entrada y genera un archivo nuevo de salida con los datos
actualizados del primero.

1.4.3 Recuperación de información de Archivos

El acceso a un archivo con el propósito de extraer información significativa es llamado


recuperación de información.

La Consulta se formula por lo general mediante un lenguaje de consulta, es un programa que


traduce las preguntas del usuario en instrucciones que son usadas directamente para acezar el
archivo.

Existen dos class de recuperación de información:

 La recuperación comprensiva reporta información de todos los registros del archivo (reportes)

 La recuperación selectiva aplica algunos criterios de clasificación para seleccionar cuales


registros proporcionan información para la salida.

1.4.4 Mantenimiento de Archivos

Cambios hechos sobre los archivos para mejorar la eficiente de los programas que los accedan son
conocidos como actividades de mantenimiento. Existen dos clases de operaciones:

 Restructuración de un archivo, implica que es necesario aplicar cambios estructurales, por


ejemplo, cambiar la longitud de un campo, agregar uno nuevo al registro, re secuenciar los
registros del archivo, etc.
Administracion y Organizacion de Datos
IINF-2010-220
 Reorganización del archivo, implica cambiar la organización de un archivo a otro tipo, ya que
la organización de un archivo difiere en sus requerimientos de mantenimiento.

1.4.5 Apertura y Cierre de Archivos

Para que un programa pueda utilizar un archivo, la primera operación a realizar es la apertura del
archivo. Para la cual debe utilizar un procedimiento que identifique el archivo (nombre,
ubicación) y el modo que se empleara.

El sistema operativo construye a partir de esto un descriptor de archivo, de manera que el


programa ya no se refiere al archivo por su identificador, sino por un número / variable asociado a
este descriptor, que a partir de aquí será el identificador interno del programa.

El modo de apertura determina las operaciones que se podrán realizar sobre el mismo, por
ejemplo no podríamos escribir en un archivo si en el descriptor especifica que se abrió como
“solo lectura”.

Cuando un archivo no vaya a ser utilizado, es necesario indicar al sistema operativo; con el fin de
que este libere el descriptor del archivo, asegurando que el archivo quede almacenado en el
soporte de almacenamiento físico. Para cerrar un archivo el programa debe utilizar un
procedimiento de cierre, indicando el archivo por medio de su identificador interno
(numero/variable).

Evidentemente para el uso de un archivo, este debe existir, por ello debe de haberse creado en
algún momento.

Al abrir un archivo para lectura, la información de este tiene que haberse almacenado sobre un
soporte y ser utilizable.

Si se realiza la apertura de un archivo para escritura y no existe archivo con ese nombre, en
muchos lenguajes eso indica que el sistema operativo lo creara de forma automática (en caso
contrario se debe crear previamente), si ya existiera un archivo, su contenido será borrado y
empezara a escribirse desde el inicio.

La forma de evitar el borrado de contenidos si se desea añadir datos nuevos a los existentes, es
necesario abrirlo de modo añadir, los datos nuevos se escribirán en el archivo sin borrar los datos
anteriores.

Para la creación de un nuevo archivo es necesario saber:

 Nombre dispositivo: soporte dónde de se almacenara fiscalmente el archivo


 Nombre del archivo: identificador que lo diferencia de los otros
 Tamaño del archivo: especio necesario para la creación del archivo
Administracion y Organizacion de Datos
IINF-2010-220
 Organización del archivo: tipo de organización del archivo
 Tamaño del bloque (registro físico): cantidad de datos que se leen o escriben en cada
operación de E/S

Errores en la creación de archivos:

 Existencia de otro archivo con el mismo nombre en el soporte


 El dispositivo no tiene especio disponible para crear el archivo
 El dispositivo no está operando
 Problemas en el hardware
 Parámetros de entrada con errores

1.5 Almacenamiento y medios físicos

Las organizaciones requieren su información sea preservada para su posterior manipulación.

Para ello es necesarios tener un soporte de almacenamiento especial si es necesario registrar la


por un tiempo indefinido. Para la información que debe preservarse indefinidamente, la
transcripción periódica de los viejos medios a otros nuevos medios se hace necesaria, no sólo
debido a que el medio es inestable, sino también porque la tecnología de grabación se hace
obsoleta y los avances tecnológicos crean mejores medios de almacenamiento.

Los principales dispositivos de almacenito estreno que se utilizan para preservar los datos son:

1.5.1 Cintas magnéticas

Son de un material plástico recubierto de óxido férrico, de un ancho de menos de 2 cm, sobre la
cual la información es registrada en forma de puntos magnetizados o no magnetizados a lo largo
de varias pistas paralelas para representar los símbolos binarios 1 y 0. Así como en una grabadora
común de sonido los datos son grabados o leídos por medio de una cabeza magnética, en el caso
de los procesadores hay tantas cabezas como pistas paralelas.

Varias unidades de cinta pueden ser interconectadas al mismo procesador, permitiendo de esta
manera almacenar millones de datos, registrándolos o leyéndolos a la velocidad de
aproximadamente 15,000 números y letras por segundo.

Ventajas:

Alta densidad de datos: Un carrete común de cinta de 10½ ‘’ de diámetro. Tiene una longitud de
2400 pies. Y puede grabar 800,1600, 2400, 3200, 4000, 4800, 5600 y hasta 6400 bytes en cada
pulgada dependiendo de la unidad de cinta que utilice, por lo tanto, si se graban 6400 caracteres
en una pulgada de cinta y si la cinta tiene una longitud de 28800 pulgadas entonces la capacidad
máxima de la cinta será de 184,320,00 bytes.
Administracion y Organizacion de Datos
IINF-2010-220
Bajo costo y facilidad de manejo: Un carrete de 10½’’ cuesta menos de 20 dólares. Y dado que el
carrete es compacto y pesa menos de 1.5 kg, ocupa muy poco espacio de almacenamiento y es
fácil de manejar.

Desventajas:

Falta de acceso directo a los registros: La cinta es un medio de acceso secuencial que se utiliza
para el procesamiento por lotes. Es necesario leer y procesar toda la cinta para actualizar todos
los registros de un archivo organizados en forma secuencial. Si se requiere acceso frecuente a los
registros del archivo en forma rápida y aleatoria, el archivo no deberá almacenarse en cinta
magnética; se requiere demasiado tiempo de operador para montar y desmontar cintas, se
desperdiciaría mucho tiempo máquina en la lectura de registros que no necesitan.

Problemas ambientales: Las partículas de polvo y la falta de control de los niveles de la


temperatura o humedad pueden causar errores en la lectura de cintas. Las cintas y sus envases
deben etiquetarse y controlarse cuidadosamente para no borrar por error un archivo importante.

1.5.2 Discos Duros

Los sistemas de discos duros son muy importantes como medio de almacenamiento, porque
pueden almacenar más datos y se puede recuperar éstos más rápidamente que en los diskettes.
Los discos duros contienen una o más superficies rígidas para grabar datos, cada una cubierta con
un óxido metálico que registra cargas magnéticas.

La cabeza de E/R se encuentra típicamente a unos catorce millonésimos de pulgada por encima de
la superficie del disco. Los platos giran sobre un eje aproximadamente a 3600 rpm, 12 veces más
rápido que los disquetes (cuanto más rápido gire un disco, más pronto la cabeza de lectura /
escritura puede encontrar datos).

La estructura física se organiza en platos, y en la superficie de cada una de sus dos caras existen
pistas concéntricas, como surcos de un disco de vinilo, y las pistas se dividen en sectores. El disco
duro tiene una cabeza en cada lado de cada plato, y esta cabeza es movida por un motor cuando
busca los datos almacenados en una pista y un sector concreto

Ventajas

 Los registros en disco pueden almacenarse en forma secuencial y procesarse como los
registros en cinta magnética o, pueden almacenarse para procesarlos en forma directa.
 Puede tenerse acceso a cualquier registro de disco en línea y pueden actualizarse en unos
cuantos milisegundos. No es necesario clasificar las transacciones.
Administracion y Organizacion de Datos
IINF-2010-220
 Puede utilizarse una sola transacción de entrada de datos para actualizar los registros de disco
en línea de varios archivos relacionados entre sí.

Desventajas

 Cuando se actualiza un archivo en cinta magnética, la cinta maestra anterior no suele sufrir
alteraciones y sigue disponible durante cierto tiempo, en caso de que se presentaran fallas en
el sistema. En cambio, cuando se actualizan los registros de un archivo en disco, es posible
que se borren los registros anteriores cuando los registros nuevos se graban en el disco, quizá
la información almacenada en un disco duro fijo quede inaccesible o se pierda si hay una falla
de disco.

 Ha habido gente que elude las medidas de seguridad y logra tener acceso a archivos
importantes de disco en línea desde terminales remotas. Estos archivos han sido
manipulados y hasta destruidos. Es más fácil mantener esta seguridad en cinta magnética.

1.5.3 Almacenamiento Flash

Es una tecnología de almacenamiento de datos basada en una memoria de alta velocidad que se
programa eléctricamente. La velocidad del almacenamiento flash es lo que le dio el nombre:
escribe datos y realiza operaciones de I/O aleatorias a la velocidad del flash.

Es un tipo de memoria no volátil que se denomina «memoria flash». La memoria no volátil no


requiere alimentación para mantener la integridad de los datos almacenados con lo que, si se
interrumpe el suministro, no se pierde nada. Dicho de otro modo, la memoria no volátil no
«olvida» los datos que ha almacenado cuando el disco se desconecta.

El almacenamiento flash utiliza celdas de memoria para almacenar datos. Las celdas que tienen
datos escritos anteriormente se tienen que borrar antes de poder escribir datos nuevos en ellas. El
almacenamiento flash también se presenta en varias formas: desde dispositivos USB a cabinas all-
flash empresariales.

Debido a su alta velocidad, durabilidad y bajo consumo de energía, resulta ideal para muchos usos,
como por ejemplo en cámaras digitales, teléfonos móviles, impresoras, PDA, ordenadores laptop
y dispositivos que puedan almacenar y reproducir sonido. Además, este tipo de memoria no
tiene partes móviles, lo que la hace más resistente a eventuales golpes.

Ventajas:

 Bajo costo
 Son resistentes en comparación a los cd´s o dvd´s ya que no se rallan
 Fácil y ligeras de transportar
Administracion y Organizacion de Datos
IINF-2010-220
 Gran capacidad de almacenamiento en comparación con los cd´s o dvd´s
 Puede usarse en muchos dispositivos
 Se puede escribir, borrar, escribir hasta un millón de veces
 Se puede almacenar música, fotos, documentos...
 Puede hacer uso cualquier persona, ya que sólo se debe conectar, no hace falta instalar ni
configurar ningún programa

Desventajas:
 Falta de privacidad de los datos, ya que en caso de olvido o perdida, cualquier persona puede
acceder a la información
 En cualquier momento puede dejar de funcionar por que ha variado el voltaje mientras estaba
conectado, usarlo durante muchos años constantemente, por caídas al suelo...
 Al ser de tamaños pequeños se pueden perder fácilmente o incluso dejarlo olvidado en algún
dispositivo puesto
 Como se puede usar en cualquier ordenador, son susceptibles a ataques de virus
 Dañar o perder información, por no extraer correctamente el usb, dando a expulsar

Bibliografía

https://definicion.de/archivo/

https://concepto.de/dato-en-informatica/#ixzz5tlc4KGDR

Loomis, Mary E. S. , Estructura de datos y organización de archivos, 2a ed., México, D.F. : Prentice
Hall Hispanoamericana, 1991.

https://www.itescam.edu.mx/portal/asignatura.php?clave_asig=IFF-1003&carrera=IINF-2010-
220&id_d=56

También podría gustarte