Está en la página 1de 27

GESTIN DE BASE DE DATOS

ORGANIZACIN RELATIVA INDIRECTA O ALEATORIA

ORGANIZACIN INTERNA DE ARCHIVOS


Nos encontramos ahora con la organizacin relativa, que es ms compleja que la secuencial. La idea bsica de la organizacin relativa consiste en guardar fsicamente los registros en lugares de la memoria secundaria no consecutivos.

Cmo podemos encontrar dnde est cada registro?


La nica solucin es utilizar un campo clave de entre todos los del registro. Ese campo clave, que suele ser numrico, permite averiguar la direccin fsica donde est almacenado el registro en la memoria secundaria mediante un algoritmo de transformacin. Por eso, la clave suele denominarse direccin de memoria lgica, para distinguirlo de la direccin de memoria fsica donde efectivamente se encuentra guardado el registro. Esta transformacin de claves para obtener direcciones fsicas se denomina hashing.

Los archivos relativos son ms verstiles que los secuenciales porque permiten acceder a cualquier parte del fichero en cualquier momento, como si fueran arrays. Las operaciones de lectura y escritura pueden hacerse en cualquier punto del archivo. Los archivos con organizacin relativa tienen dos variantes: los archivos directos y los archivos aleatorios o indirectos.

Cmo podemos encontrar dnde est cada registro?

Comprender el hashing
Supongamos que un archivo almacenado en una memoria secundaria contiene 5 registros, que llamaremos R1, R2, R3, R4 y R5. En un archivo secuencial, los cinco registros estarn almacenados en posiciones consecutivas de la memoria. Si R1 se guarda, por ejemplo, en la direccin 1000 de la memoria secundaria y cada registro lgico ocupa exactamente un registro fsico, tendremos que los registros estarn guardados en estas direcciones:

Comprender el hashing
En cambio, si el archivo es relativo, cada registro estar almacenado en posiciones no consecutivas de la memoria secundaria. Por ejemplo, podran estar en estas direcciones:

Cmo localizar los archivos en memoria secundaria


Para eso se utiliza el hashing. Cada registro debe tener un campo clave (que denominaremos R1.clave, R2.clave, etc). El hashing consiste en aplicar una funcin de transformacin a cada clave. Esa funcin se denomina funcin hash.

Organizacin relativa aleatoria (o indirecta)


Dependiendo de la funcin hash empleada pueden surgir colisiones, es decir, claves que proporcionan la misma direccin fsica. Por ejemplo, si la funcin hash es f(clave) = clave / 2 (divisin entera), tendremos que los registros con clave 500 y 501 intentarn ocupar la misma direccin fsica: la 250.

Organizacin relativa aleatoria (o indirecta)


Otras funciones hash, como la ya vista f(clave) = clave x 2, no producen colisiones, pero en cambio provocan que muchas direcciones fsicas no sean utilizadas, con lo que se desaprovecha el espacio de almacenamiento.

Ventajas
No es necesario ordenar el fichero. Son muy rpidos en el tratamiento individual de registros. Permiten realizar accesos secuenciales. Permite realizar operaciones de lectura y escritura simultneamente.

Inconvenientes

Se quedarn muchos huecos libres si no elegimos la funcin hash adecuada.

Operaciones con organizacin relativa indirecta o aleatoria


DIRECCIN FSICA DIRECCIN LGICA REGISTRO 1 Lectura:

301
Algoritmo

CLAVE 3560

NOMBRE Jose REGISTRO 2

APELLIDO Hernndez

Escritura

Actualizacin

302 303

CLAVE 1256

NOMBRE Mara REGISTRO 3

APELLIDO Garca

Borrado

CLAVE 3458

NOMBRE Francisco

APELLIDO Castro

- Los rboles-B son estructuras de datos de rbol que se encuentran comnmente en las implementaciones de bases de datos y sistemas de archivos. - Los rboles B se usan para almacenar conjuntos y especialmente para representar archivos externos (estructura para ndices en sistemas de BD).
Idea: almacenamiento de registros en archivos, los archivos se depositan en bloques de almacenamiento externo. La idea es pensar a los nodos como bloques fsicos.

rbol B

EJEMPLO DE ARBOL B

rbol B+
-Los rboles B+ constituyen otra mejora sobre los rboles B,pues conservan la propiedad de acceso aleatorio rpido y permiten adems un recorrido secuencial rpido. -En un rbol B+ todas las claves se encuentran en hojas,duplicndose en la raz y nodos interiores aquellas que resulten necesarias para definir los caminos de bsqueda. -Su principal caracterstica es que todas las claves se encuentran en las hojas. Los rboles B+ ocupan algo ms de espacio que los rboles B, pues existe duplicidad en algunas claves. En los rboles B+ las claves de las pginas raz e interiores se utilizan nicamente como ndices.

EJEMPLO DE ARBOL B+

Cuestionario
1.- En qu lugar se guardan los registros? a) Memoria primaria b) Memoria secundaria (consecutivo) c) Memoria secundaria (no consecutivo)

Cuestionario
2.-Qu utilizamos para encontrar cada registro? a) ndice b) Campo ndice c) Campo clave

Cuestionario
3.-Qu podemos averiguar a travs del campo clave? a) Direccin fsica b) Direccin lgica c) Ambas son correctas.

Cuestionario
4.-Qu contiene el campo clave?

a) Direccin fsica b) Direccin lgica c) Registros.

Cuestionario
5.-Cules de estas son ventajas de la organizacin relativa aleatoria o indirecta? a) Ordenar el fichero. b) Realiza accesos secuenciales. c)Lectura y escritura simultnea.

Cuestionario
6.-Cules de estas son inconvenientes de la organizacin relativa aleatoria o indirecta? a) Huecos libres. b) Desfragmentacin. c)A y C son correctas.

Cuestionario
7- En qu tipos de estructuras se encuentran los rboles B?
a)En hojas de clculo y bases de datos. b) En redes locales y sistemas de archivos. c) En bases de datos y sistemas de archivos.

Cuestionario
8- Para qu se usan los rboles B?
a) Almacenar conjuntos y representar archivos externos. b) Almacenar conjuntos y representar archivos internos. c)Las dos respuestas son incorrectas.

Cuestionario
9- Cul es la mejora que se ha incluido en los rboles B+ con respecto a los rboles B?
a)Recorrido descendente amplificado b)Recorrido secuencial rpido. c)Recorrido aleatorio.

Autores

1 A.S.I.R A
Dbora Garca Garca Gabriel Moreno Sanchez Fran Gaviln Escriche Juan Carlos Herencia Castro Samuel Loiudice Guerrero

BiBliografa

- Organizacin Relativa Aleatoria o Indirecta

http://profeblog.es/blog/alfredo/2008/05/17/ficheros-directos-y-aleatorios-fundamentos -Estructura de datos de rboles B y B+ http://wwwdi.ujaen.es/asignaturas/eedd2/tema6.pdf http://wapedia.mobi/es/%C3%81rbol-B http://wapedia.mobi/es/%C3%81rbol-B%2B http://es.wikipedia.org/wiki/%C3%81rbol-B http://es.wikipedia.org/wiki/%C3%81rbol-B%2B

También podría gustarte