Está en la página 1de 9

FACULTAD DE ESTUDIOS SUPERIORES ARAGON

BASE DE DATOS

ARCHIVOS

MTI. OMAR MENDOZA GONZALEZ

AGOSTO DE 2008

Archivos

Bases de Datos

Archivos
Archivo. Un archivo es una estructura de informacin conformada por un conjunto de registros. Estos registros a su vez estn compuestos por una serie de caracteres o bytes. Actualmente las organizaciones estn utilizando bases de datos para generar resultados o para compartir dicha informacin con otros sistemas. Sin embargo, los principales componentes de las bases de datos son los archivos. Las formas en las cuales pueden organizarse los archivos, son archivos secuenciales o archivos directos. En los archivos secuenciales los registros estn almacenados en una secuencia que dependen de algn criterio definido. Registro: Es una coleccin de campos (atributos) Un registro, es el conjunto de informacin referida a una misma persona u objeto. Un registro vendra a ser algo as como una ficha. Campo: Unidad bsica de una base de datos. Un campo puede ser, por ejemplo, el nombre de una persona. Los nombres de los campos, no pueden empezar con espacios en blanco y caracteres especiales. No pueden llevar puntos, ni signos de exclamacin o corchetes. Si pueden tener espacios en blanco en el medio. La descripcin de un campo, permite aclarar informacin referida a los nombres del campo. El tipo de campo, permite especificar el tipo de informacin que cargremos en dicho campo, esta puede ser: a.- Texto: para introducir cadenas de caracteres hasta un mximo de 255 b.- Memo: para introducir un texto extenso. Hasta 65.535 caracteres c.- Numrico: para introducir nmeros d.- Fecha / Hora: para introducir datos en formato fecha u hora e.- Moneda: para introducir datos en formato nmero y con el signo monetario f.- Autonmerico.- en este tipo de campo, Access numera automticamente el contenido g.- S / No: campo lgico. Este tipo de campo es slo si queremos un contenido del tipo Si / No, verdadero / Falso, etc. h.- Objeto OLE: para introducir una foto, grfico, hoja de clculo, sonido, etc. i.- Hipervnculo: podemos definir un enlace a una pgina Web

Almacenamiento Fsico de Datos En un sistema de cmputo es evidente que existe la necesidad por parte de los usuarios y aplicaciones de almacenar datos en algn medio, a veces por periodos largos y a veces por instantes. Cada aplicacin y cada usuario debe tener ciertos derechos con sus datos, como son el poder crearlos y borrarlos, o cambiarlos de lugar; as como tener privacidad contra otros usuarios o aplicaciones. El subsistema de archivos del sistema operativo se debe encargar de estos detalles, adems de establecer el formato fsico en el cual almacenar los datos en discos duros, cintas o discos flexibles. Debe ser conocido por todos que tradicionalmente la informacin en los sistemas modernos se almacena en discos duros, flexibles y unidades de disco ptico, y en todos ellos se comparten algunos esquemas bsicos para darles formato fsico: las superficies de almacenamiento son divididas en crculos concntricos llamados "pistas" y cada pista se divide en "sectores". A la unin lgica de varias pistas a travs de varias superficies "paralelas" de almacenamiento se les llama "cilindros", los cuales son inspeccionados al momento de lectura o escritura de datos por las respectivas unidades fsicas llamadas "cabezas". Las superficies de almacenamiento reciben el nombre de "platos" y generalmente estn en movimiento rotatorio para que las cabezas acceden a las pistas que los componen.

Archivos

Bases de Datos

Los datos se escriben a travs de los sectores en las pistas y cilindros modificando las superficies por medio de las cabezas. El tiempo que una cabeza se tarda en ir de una pista a otra se le llama "tiempo de bsqueda" y depender de la distancia entre la posicin actual y la distancia a la pista buscada. El tiempo que tarda una cabeza en ir del sector actual al sector deseado se le llama tiempo de latencia y depende de la distancia entre sectores y la velocidad de rotacin del disco. El impacto que tiene las lecturas y escrituras sobre el sistema est determinado por la tecnologa usada en los platos y cabezas y por la forma de resolver las peticiones de lectura y escritura, es decir, los algoritmos de planificacin.

Algoritmos de planificacin de peticiones Los algoritmos de planificacin de peticiones de lectura y escritura a discos se encargan de registrar dichas peticiones y de responderlas en un tiempo razonable. Los algoritmos ms comunes para esta tarea son: Primero en llegar, primero en ser servido ( FIFO ): Las peticiones son encoladas de acuerdo al orden en que llegaron y de esa misma forma se van leyendo o escribiendo las mismas. La ventaja de este algoritmo es su simplicidad y no causa sobrecarga, su desventaja principal es que no aprovecha para nada ninguna caracterstica de las peticiones, de manera que es muy factible que el brazo del disco se mueva muy ineficientemente, ya que las peticiones pueden tener direcciones en el disco unas muy alejadas de otras. Por ejemplo, si se estn haciendo peticiones a los sectores 6,10,8,21 y 4, las mismas sern resueltas en el mismo orden. _ Primero el ms cercano a la posicin actual: En este algoritmo las peticiones se ordenan de acuerdo a la posicin actual de la cabeza lectora, sirviendo primero a aquellas peticiones ms cercanas y reduciendo, as, el movimiento del brazo, lo cual constituye la ventaja principal de este algoritmo. Su desventaja consiste en que puede haber solicitudes que se queden esperando para siempre, en el infortunado caso de que existan peticiones muy alejadas y en todo momento estn entrando peticiones que estn ms cercanas. Para las peticiones 6,10,8,21 y 4, las mismas sern resueltas en el orden 4,6,8,10 y 21. Por exploracin ( algoritmo del elevador ): En este algoritmo el brazo se estar moviendo en todo momento desde el permetro del disco hacia su centro y viceversa, resolviendo las peticiones que existan en la direccin que tenga en turno. En este caso las peticiones 6,10,8,21 y 4 sern resueltas en el orden 6,10,21,8 y 4; es decir, la posicin actual es 6 y como va hacia los sectores de mayor numeracin (hacia el centro, por ejemplo), en el camino sigue el sector 10, luego el 21 y ese fue el ms central, as que ahora el brazo resolver las peticiones en su camino hacia afuera y la primera que se encuentra es la del sector 8 y luego la 4. La ventaja de este algoritmo es que el brazo se mover mucho menos que en FIFO y evita la espera indefinida; su desventaja es que no es justo, ya que no sirve las peticiones en el orden en que llegaron, adems de que las peticiones en los extremos interior y exterior tendrn un tiempo de respuesta un poco mayor. Por exploracin circular: Es una variacin del algoritmo anterior, con la nica diferencia que al llegar a la parte central, el brazo regresa al exterior sin resolver ninguna peticin, lo cual proveer un tiempo de respuesta ms cercana al promedio para todas las peticiones, sin importar si estn cercas del centro o del exterior.

Archivos

Bases de Datos

Mtodos de acceso en los sistemas de archivos Los mtodos de acceso se refieren a las capacidades que el subsistema de archivos provee para accesar datos dentro de los directorios y medios de almacenamiento en general. Se ubican tres formas generales: acceso secuencial, acceso directo y acceso directo indexado. Acceso secuencial: Es el mtodo ms lento y consiste en recorrer los componentes de un archivo uno en uno hasta llegar al registro deseado. Se necesita que el orden lgico de los registros sea igual al orden fsico en el medio de almacenamiento. Este tipo de acceso se usa comnmente en cintas y cartuchos. Acceso directo: Permite accesar cualquier sector o registro inmediatamente, por medio de llamadas al sistema como la de seek. Este tipo de acceso es rpido y se usa comnmente en discos duros y discos o archivos manejados en memoria de acceso aleatorio. Acceso directo indexado: Este tipo de acceso es til para grandes volmenes de informacin o datos. Consiste en que cada archivo tiene una tabla de apuntadores, donde cada apuntador va a la direccin de un bloque de ndices, lo cual permite que el archivo se expanda a travs de un espacio enorme. Consume una cantidad importante de recursos en las tablas de ndices pero es muy rpido.

Archivos

Bases de Datos

Sistema de Archivos Un sistema de archivos consta de tipos de datos abstractos, que son necesarios para el almacenamiento, organizacin jerrquica, manipulacin, navegacin, acceso y consulta de datos. La mayora de los sistemas operativos poseen su propio sistema de archivos. Los sistemas de archivos son representados ya sea textual o grficamente utilizando gestores de archivos o shells. En modo grfico a menudo son utilizadas las metforas de carpetas (directorios) conteniendo documentos, archivos y otras carpetas. Un sistema de archivos es parte integral de un sistema operativo moderno. Los sistemas de archivos ms comunes utilizan dispositivos de almacenamiento de datos que permiten el acceso a los datos como una cadena de bloques de un mismo tamao, a veces llamados sectores, usualmente de 512 bytes de longitud. El software del sistema de archivos es responsable de la organizacin de estos sectores en archivos y directorios y mantiene un registro de qu sectores pertenecen a qu archivos y cules no han sido utilizados. En la realidad, un sistema de archivos no requiere necesariamente de un dispositivo de almacenamiento de datos, sino que puede ser utilizado tambin para acceder a datos generados dinmicamente, como los recibidos a travs de una conexin de red. Generalmente un sistema de archivos tiene directorios que asocian nombres de archivos con archivos, usualmente conectando el nombre de archivo a un ndice en una tabla de asignacin archivos de algn tipo, como FAT en sistemas de archivos MS-DOS o los inodos de los sistemas Unix. La estructura de directorios puede ser plana o jerrquica (ramificada o "en rbol"). En algunos sistemas de archivos los nombres de archivos son estructurados, con sintaxis especiales para extensiones de archivos y nmeros de versin. En otros, los nombres de archivos son simplemente cadenas de texto y los metadatos de cada archivo son alojados separadamente. En sistemas de archivos jerrquicos, en lo usual, se declara la ubicacin precisa de un archivo con una cadena de texto llamada "ruta". La nomenclatura para rutas vara ligeramente de sistema en sistema, pero mantienen por lo general una misma estructura. Una ruta viene dada por una sucesin de nombres de directorios y subdirectorios, ordenados jerrquicamente de izquierda a derecha y separados por algn carcter especial que suele ser una barra (/) o barra invertida (\) y puede terminar en el nombre de un archivo presente en la ltima rama de directorios especificada. As, por ejemplo, en un sistema Unix la ruta a la cancin preferida del usuario "pedro" sera algo como: /home/pedro/msica/Magic Mushrooms - Open Source.ogg Un ejemplo anlogo en un sistema de archivos Windows se vera como: C:\Mis documentos\Mi msica\Magic Mushrooms - Open Source.ogg Los sistemas de archivos tradicionales proveen mtodos para crear, mover y eliminar tanto archivos como directorios, pero carecen de mtodos para crear, por ejemplo, enlaces adicionales a un directorio o archivo (enlaces "duros" en Unix) o renombrar enlaces padres (".." en Unix). El acceso seguro a sistemas de archivos bsicos puede estar basado en los esquemas de lista de control de acceso o capacidades. Las listas de control de acceso hace dcadas que demostraron ser inseguras, por lo que los sistemas operativos experimentales utilizan el acceso por capacidades. Los sistemas operativos comerciales an funcionan con listas de control de acceso. Los sistemas de archivos pueden ser clasificados en tres ramas: sistemas de archivos de disco, sistemas de archivos de red y sistemas de archivos de propsito especial.

Archivos

Bases de Datos

Operaciones soportadas por el subsistema de archivos Independientemente de los algoritmos de asignacin de espacio, de los mtodos de acceso y de la forma de resolver las peticiones de lectura y escritura, el subsistema de archivos debe proveer un conjunto de llamadas al sistema para operar con los datos y de proveer mecanismos de proteccin y seguridad. Las operaciones bsicas que la mayora de los sistemas de archivos soportan son: Crear ( create ) : Permite crear un archivo sin datos, con el propsito de indicar que ese nombre ya est usado y se deben crear las estructuras bsicas para soportarlo. Borrar ( delete ): Eliminar el archivo y liberar los bloques para su uso posterior. Abrir ( open ): Antes de usar un archivo se debe abrir para que el sistema conozca sus atributos, tales como el dueo, la fecha de modificacin, etc. Cerrar ( close ): Despus de realizar todas las operaciones deseadas, el archivo debe cerrarse para asegurar su integridad y para liberar recursos de su control en la memoria. Leer o Escribir ( read, write ): Aadir informacin al archivo o leer el caracter o una cadena de caracteres a partir de la posicin actual. Concatenar ( append ): Es una forma restringida de la llamada write, en la cual slo se permite aadir informacin al final del archivo. Localizar ( seek ): Para los archivos de acceso directo se permite posicionar el apuntador de lectura o escritura en un registro aleatorio, a veces a partir del inicio o final del archivo. Leer atributos: Permite obtener una estructura con todos los atributos del archivo especificado, tales como permisos de escritura, de borrado, ejecucin, etc. Poner atributos: Permite cambiar los atributos de un archivo, por ejemplo en UNIX, donde todos los dispositivos se manejan como si fueran archivos, es posible cambiar el comportamiento de una terminal con una de estas llamadas. Renombrar ( rename ): Permite cambiarle el nombre e incluso a veces la posicin en la organizacin de directorios del archivo especificado. Los subsistemas de archivos tambin proveen un conjunto de llamadas para operar sobre directorios, las ms comunes son crear, borrar, abrir, cerrar, renombrar y leer. Sus funcionalidades son obvias, pero existen tambin otras dos operaciones no tan comunes que son la de crear una liga y la de destruir la liga. La operacin de crear una liga sirve para que desde diferentes puntos de la organizacin de directorios se pueda accesar un mismo directorio sin necesidad de copiarlo o duplicarlo. La llamada a destruir la liga lo que hace es eliminar esas referencias, siendo su efecto la de eliminar las ligas y no el directorio real. El directorio real es eliminado hasta que la llamada a destruir liga se realiza sobre l. Algunas facilidades extras de los sistemas de archivos Algunos sistemas de archivos proveen herramientas al administrador del sistema para facilitarle la vida. Las ms notables es la facilidad de compartir archivos y los sistemas de cuotas. La facilidad de compartir archivos se refiere a la posibilidad de que los permisos de los archivos o directorios dejen que un grupo de usuarios puedan accesarlos para diferentes operaciones" leer, escribir, borrar, crear, etc. El dueo verdadero es quien decide qu permisos se aplicarn al grupo e, incluso, a otros usuarios que no formen parte de su grupo. La facilidad de cotas se refiere a que el sistema de archivos es capaz de llevar un control para que cada usuario pueda usar un mximo de espacio en disco duro. Cuando el usuario excede ese lmite, el sistema le enva un mensaje y

Archivos

Bases de Datos

le niega el permiso de seguir escribiendo, obligndolo a borrar algunos archivos si es que quiere almacenar otros o que crezcan. La versin de UNIX SunOS contiene esa facilidad.

Sistemas de Archivos Aislados Los sistemas de archivos aislados son aquellos que residen en una sola computadora y no existe la posibilidad de que, an estando en una red, otros sistemas puedan usar sus directorios y archivos. Por ejemplo, los archivos en discos duros en el sistema MS-DOS clsico se puede ver en esta categora.

Sistemas de Archivos Compartidos o de Red Estos sistemas de archivos es factible accesarlos y usarlos desde otros nodos en una red. Generalmente existe un servidor que es la computadora en donde reside el sistema de archivos fsicamente, y por otro lado estn los clientes, que se valen del servidor para ver sus archivos y directorios de manera como si estuvieran localmente en el cliente. Algunos autores les llaman a estos sistemas de archivos sistemas de archivos distribuidos lo cual no se va a discutir en este trabajo. Los sistemas de archivos compartidos en red ms populares son los provistos por Netware, el Remote Filke Sharing ( RFS en UNIX ), Network File System ( NFS de Sun Microsystems ) y el Andrew File System ( AFS ). En general, lo que proveen los servidores es un medio de que los clientes, localmente, realicen peticiones de operaciones sobre archivos los cuales con atrapadas por un driver o un mdulo en el ncleo del sistema operativo, el cual se comunica con el servidor a travs de la red y la operacin se ejecuta en el servidor. Existen servidores de tipo "stateless y no-stateless". Un servidor "stateless" no registra el estado de las operaciones sobre los archivos, de manera que el cliente se encarga de todo ese trabajo. La ventaja de este esquema es que si el servidor falla, el cliente no perder informacin ya que sta se guarda en memoria localmente, de manera que cuando el servidor reanude su servicio el cliente proseguir como si nada hubiese sucedido. Con un servidor "no-stateless", esto no es posible. La proteccin sobre las operaciones se lleva a cabo tanto el los clientes como en si el usuario quiere ejecutar una operacin indebida sobre un archivo, recibir un error y posiblemente se enve un registro al subsistema de seguridad para administrador del sistema de dicho intento de violacin. En la prctica, el conjunto de permisos que cada usuario tiene sobre el total de almacena en estructuras llamadas listas de acceso ( access lists ). el servidor: mensaje de informar al archivos se

Archivos

Bases de Datos

Tipos de archivos. La mayora de los sistemas operativos tienen tres tipos bsicos de archivos: regulares, directorios y archivos especiales. Los archivos especiales se utilizan (como hace UNIX) para modelar dispositivos de disco y terminales. Los archivos regulares se subdividen en tipos distintos en base a su uso. Los tipos diferentes se distinguen por medio de nombres que terminan con extensiones de archivo distintas. Por ejemplo: XXX.PAS: XXX.TCL: XXX.DOC: XXX.OBJ: XXX.EXE: XXX.TXT: XXX.BAT: programa fuente en lenguaje PASCAL. programa fuente en lenguaje TCL-TK. documento escrito con el procesador de textos WORD. archivo objeto (salida del compilador an no linkada). programa binario ejecutable. archivo de texto ASCII. archivo de procesamiento de comandos por lotes.

En algunos sistemas las extensiones son simplemente un convencionalismo, el sistema operativo mismo no las utiliza para nada. En otros sistemas, el sistema operativo refuerza rgidamente las reglas que se relacionan con la nominacin. Por ejemplo, no ejecutar un archivo a menos que ste termine en .EXE. Otras posibles clasificaciones de los archivos, atendiendo a diversos criterios, son las siguientes: Segn la longitud de los registros. Los registros que componen un archivo pueden o no tener todos la misma longitud. Esto puede ser debido a la existencia de campos de longitud variable o por haber campos que se repiten un nmero variable de veces (o por ambas cosas). Por lo que respecta a la longitud de sus registros, los archivos pueden ser de uno de los siguientes tipos: Longitud fija. Todos los registros tienen la misma longitud. Longitud variable. El sistema reserva una palabra al comienzo de cada registro para anotar su longitud. Delimitados. El sistema incluye un carcter especial, para indicar el final del registro. En este caso se dice que el archivo es de tipo texto. Indefinido. En este caso el sistema operativo no realiza ninguna gestin sobre la longitud de los registros del archivo. El programa de usuario es el que se encarga de localizar el principio y el final de cada registro. Segn el uso que se hace de ellos. Dentro de una aplicacin informtica se pueden utilizar los archivos para realizar funciones diversas. Conocer la funcin que va a desempear un archivo es fundamental para su organizacin. Podemos establecer una clasificacin de los archivos atendiendo a la funcin que desempean: Un archivo permanente contiene informacin relevante para una aplicacin, es decir, los datos necesarios para el funcionamiento de la misma. Su vida es larga y normalmente no puede generarse de forma inmediata a partir de otros archivos. Un archivo temporal contiene informacin que es relevante para un determinado proceso o programa, pero no para el conjunto de la aplicacin. Se genera a partir de los datos de los archivos permanentes o para actualizar stos, y su vida es generalmente muy corta.

Archivos

Bases de Datos

Dentro de los archivos permanentes, podemos distinguir: Archivos maestros. Un archivo maestro contiene el estado actual de los datos susceptibles de ser modificados en la aplicacin. En general, todos los procesos estn orientados a actualizar el archivo maestro o a obtener resultados de l. Ej : el archivo de clientes de un banco, en el los registros contienen informacin de identificacin de clientes, su saldo, etc. Archivos constantes. Un archivo constante es aquel que contiene datos fijos para la aplicacin. En l no son frecuentes las modificaciones, normalmente se accede slo para consultar datos. Ej: el archivo que contenga los intereses para los distintos tipos de cuentas bancarias. Archivos histricos. Un archivo histrico es aquel que contiene datos que fueron actuales en tiempos anteriores. Se conservan para poder reconstruir situaciones anteriores. En algunos casos puede estar formado simplemente por los registros borrados del archivo maestro. Ej: Un archivo que contenga los datos de los clientes que se han dado de baja en una entidad bancaria. Los archivos temporales se pueden clasificar en: Archivos intermedios. Se utilizan para almacenar resultados de un programa que han de ser utilizados por otro, dentro de una misma aplicacin. Archivos de maniobras. Se utilizan para almacenar los datos propios de un programa que no se pueden conservar en memoria principal por falta de espacio. Se encuentran normalmente en programas de clculo numrico, compiladores y editores. Su vida es siempre menor que el tiempo de ejecucin del programa. Archivos de resultados. Se utilizan para almacenar datos elaborados que van a ser transferidos a un dispositivo de salida, por ejemplo un archivo de impresin, que contiene datos que van a ser transferidos a una impresora.

También podría gustarte