Está en la página 1de 14

Universidad Nacional Pedro Henríquez Ureña

Estructura de Datos y Algoritmos

Sustentante:
Jeily Yisnely Rodríguez Jáquez
Max Javier Abreu Rodriguez

Matricula:
16-1913
16-2367

Tema:
Resumen del capítulo 7 y 8

Profesor:
Ambiorix Liriano
Fecha:
05 de junio de 2020
Algoritmos de ordenación de archivos

FLUJOS Y ARCHIVOS

Un fichero de datos o, simplemente, un archivo es una colección de registros


relacionados entre sí, con aspectos en común y organizados para un propósito
específico.

Un archivo en una computadora es una estructura diseñada para contener datos.

Por ejemplo, un archivo de una sección contiene un conjunto de registros de los


estudiantes de esa sección. Otro ejemplo, el archivo de nóminas de una empresa, etc.

Los datos están organizados de tal modo que puedan ser recuperados fácilmente,
actualizados o borrados y almacenados de nuevo en el archivo con todos los cambios
realizados.

Según las características del soporte empleado y el modo en que se han organizado
los registros, se consideran dos tipos de acceso a los registros de un archivo:

•  Acceso secuencial.

•  Acceso directo.

El acceso secuencial implica el acceso a un archivo según el orden de


almacenamiento de sus registros, uno tras otro.

El acceso directo implica el acceso a un registro determinado, sin que ello implique


la consulta de los registros precedentes. Este tipo de acceso sólo es posible con
soportes direccionales.

Un flujo (stream) es una abstracción que se refiere a un flujo o corriente de datos que
fluyen entre un origen o fuente (productor) y un destino o sumidero (consumidor).

Los streams, logran unificar la forma en la que se transfieren datos, no importa si con


un archivo, por una salida de red o en la memoria principal de la máquina.
Abrir un archivo supone crear un objeto que queda asociado a un flujo. Al comenzar la
ejecución de un programa, en Java se crean automáticamente tres objetos flujo, son
tres canales por los que pueden fluir datos, de entrada o de salida.

Estos son objetos definidos en la clase System:

● System.in; Objeto entrada estándar; permite la entrada al programa de flujos de


bytes desde el teclado.

● System.out; Objeto salida estándar; permite al programa la salida de datos por


pantalla.

● System.err; Objeto para salida estándar de errores; permite al programa la salida


de errores por pantalla.

En Java, un archivo es simplemente un flujo externo, una secuencia de bytes


almacenados en un dispositivo externo (normalmente en disco). Si el archivo se abre
para salida, es un flujo de archivo de salida. Si el archivo se abre para entrada, es un
flujo de archivo de entrada.

CLASE File

Un archivo consta de un nombre, además de la ruta que indica donde está ubicado, por
ejemplo, “C:\pasaje.dat”. Este identificador del archivo (cadena de caracteres) se
transmite al constructor del flujo de entrada o de salida que procesa al fichero:

FileOutputStream f = new FileOutputStream("C:\pasaje.dat");

Este tipo de objeto contiene el nombre del archivo, la ruta y más propiedades relativas
al archivo.

La clase File define métodos para conocer propiedades del archivo (última 
modificación, permisos de acceso, tamaño ...); también, métodos para
modificar alguna característica del archivo.

Los constructores de File permiten inicializar el objeto con el nombre de un archivo y la


ruta donde se encuentra. También permiten inicializar el objeto con otro objeto File
como ruta y el nombre del archivo.
● public File(String nombreCompleto) Crea un objeto File con el 
nombre y ruta del archivo pasado como argumento.

● public File(String ruta, String nombre) Crea un objeto File con la ruta 


y el nombre del archivo pasado como argumentos.

● public File(File ruta, String nombre) Crea un objeto File con un primer 


argumento que a su vez es un objeto File con la ruta y el 
nombre del archivo como segundo argumento.

FLUJOS Y JERARQUÍA DE CLASES

Todo el proceso de entrada y salida en Java se hace a través de flujos (stream). En


los programas hay que crear objetos stream y, en muchas ocasiones, hacer uso de los
objetos in, out de la clase System.

Los flujos de datos, de caracteres de bytes se pueden clasificar en flujos de entrada y


en flujos de salida.

Archivos de bajo nivel (FileInputStream y FileOutputStream)

Java declara dos clases (derivan directamente de la clase Object): InputStream y


OutputStream.

Ambas son clases abstractas que declaran métodos que deben de redefinirse en sus
clases derivadas.

InputStream es la clase base de todas las clases definidas para flujos de entrada, y
OutputStream es la clase base de todas las clases definidas para flujos de salida.

Las clases FileInputStream y FileOutputStream se utilizan para leer o escribir bytes en


un archivo; objetos de estas dos clases son los flujos de entrada y salida,
respectivamente, a nivel de bytes.
Los constructores de ambas clases permiten crear flujos (objetos) asociados a un
archivo que se encuentra en cualquier dispositivo, de modo que el archivo queda
abierto.

Por ejemplo, el flujo mf se asocia al archivo Temperatura.dat del directorio por defecto:

FileOutputStream mf = newFileOutputStream("Temperatura.dat");

Las operaciones que a continuación se realicen con mf escriben secuencias de bytes


en el archivo Temperatura.dat. La clase FileInputStream dispone de métodos para leer
un byte o una secuencia de bytes.

A continuación se escriben los métodos mas importantes:

◦ FileInputStream(String nombre) throws FileNotFoundException; Crea un 


objeto inicializado con el nombre de archivo que se pasa como 
argumento.

◦ FileInputStream(File nombre) throws FileNotFoundException; Crea un 


objeto inicializado con el objeto archivo pasado como argumento.

◦ int read() throws IOException; Lee un byte del flujo asociado. Devuelve –1 si
alcanza el fin del fichero.

◦ int read(byte[] s) throws IOException; Lee una secuencia de bytes del flujo y se
almacena en el array s. Devuelve –1 si alcanza el fin del fichero, o bien el número
de bytes leídos.

◦ int read(byte[] s, int org, int len) throws IOException; Lee una secuencia de
bytes del flujo y se almacena en array s desde la posición org y un máximo de len
bytes. Devuelve –1 si alcanza el fin del fichero, o bien el númerode bytes leídos.

◦ void close()throws IOException; Cierra el flujo,el archivo queda disponible para


posterior uso.
ORDENACIÓN DE UN ARCHIVO

Los algoritmos de ordenación interna, en memoria principal, utilizan arrays para


guardar los elementos a ordenar.

La ordenación externa es la ordenación de los objetos (registros) de una archivo


mediante archivos auxiliares.

Está ligada con los archivos y los dispositivos en que se encuentra, al leer el archivo
para realizar la ordenación el tiempo de lectura de los registros es notablemente mayor
que el tiempo que se tarda en realizar las operaciones de ordenación.

MEZCLA DIRECTA

Es el método mas simple de ordenación externa, utiliza el esquema iterativo de separar


secuencias de registros y su mezcla. Se opera con el archivo original y dos archivos
auxiliares.

El proceso consiste en:

◦ 1. Separar los registros individuales del archivo original O en dos archivos, F1


y F2.

◦ 2. Mezclar los archivos F1 y F2 combinando registros aislados (según sus


claves) y formando pares ordenados que son escritos en el archivo O.

◦ 3. Separar pares de registros del archivo original O en los dos archivos auxiliares
F1 y F2.

◦ 4. Mezclar F1 y F2 combinando pares de registros y formando cuádruplos


ordenados que son escritos en el archivo O.

◦ 5. Se repiten los pasos de separación y mezcla, combinando cuádruplos para


formar óctuplos ordenados.

Fusión Natural
El método de fusión natural mejora el tiempo de ejecución de la mezcla directa al
introducir una pequeña variación respecto a la longitud de las secuencias de registros.
En el método de mezcla directa, las secuencias de registros tienen longitudes que son
múltiplos de dos: 1, 2, 4, 8, 16... de tal forma que el número de pasadas a realizar es
fijo, dependiente del número de registros.

Algoritmo de la fusión natural

La característica fundamental de este método es la mezcla de secuencias ordenadas


máximas, o simplemente tramo máximo.

Una secuencia ordenada ai ... aj es tal que:

MEZCLA EQUILIBRADA MÚLTIPLE

La eficiencia de los métodos de ordenación externa es directamente proporcional al


número de pasadas.

Para aumentar la eficiencia hay que reducir el número de pasadas, de esa forma se
reduce el número de operaciones de entrada/salida en dispositivos externos.

Los pasos que sigue el algoritmo son:

1. Distribuir registros del archivo original por tramos en los m/2 primeros archivos
auxiliares. A continuación, estos se consideran archivos de entrada.

2. Mezclar tramos de los m/2 archivos de entrada y escribirlos consecutivamente en los


m/2 archivos de salida.

3. Cambiar la finalidad de los archivos, los de entrada pasan a ser de salida y


viceversa; repetir a partir del segundo paso hasta que quede un único tramo, entonces
la secuencia está ordenada.
Cambio de finalidad de un archivo: entrada ↔ salida

La forma de cambiar la finalidad de los archivos (entrada ↔ salida) se hace


mediante una tabla de correspondencia entre índices de archivo, de tal forma que, en
lugar de acceder a un archivo por el índice del array, se accede por la tabla, la cual
cambia alternativamente los índices de los archivos y, de esa forma, pasan,
alternativamente, de ser de entrada a ser de salida (flujos de  entrada, flujos 
de salida).

Control del número de tramos

El primer paso del algoritmo realiza la distribución de los tramos del archivo original en
los archivos de entrada, a la vez determina el número de tramos del archivo. En todo
momento es importante conocer el número de tramos, ya que cuando queda sólo uno
el archivo está ordenado, y éste será el archivo f[c[0]].

MÉTODO POLIFÁSICO DE ORDENACIÓN EXTERNA

El método polifásico utiliza m archivos auxiliares para ordenar n registros de un archivo.


La característica que marca la diferencia de este método respecto a los otros es que
continuamente se consideran m-1 archivos de entrada, desde los que se mezclan
registros, y un archivo de salida.

En el momento en que uno de los archivos de entrada alcanza su final hay un cambio
de cometido, pasa a ser considerado como archivo de salida, y el archivo que en ese
momento era de salida pasa a ser de entrada y la mezcla de tramos continúa. La
sucesión de pasadas continúa hasta alcanzar el archivo ordenado.

Cabe recordar la propiedad base de todos los métodos de mezcla: la mezcla de 


k tramos de los  archivos de entrada se transforma en k tramos 
en el archivo de salida.
Las principales diferencias de la ordenación polifásica respecto a la mezcla
equilibrada múltiple son:

1. En cada pasada hay un sólo archivo destino (salida), en vez de los m/2 que
necesita la mezcla equilibrada múltiple.

2. La finalidad de los archivos (entrada, salida) cambia en cada pasada, rotando los


índices de los archivos. Esto se controla mediante un tabla de correspondencia de
índices de archivo. En la mezcla múltiple siempre se intercambian m/2 archivos origen
(entrada) por m/2 archivos destino (salida).

3. El número de archivos origen (de entrada) varía dependiendo del número de tramo
en proceso.

4. Puede ocurrir que se alcance el último registro del archivo m-1 y sean necesarias
más mezclas que utilicen tramos ficticios de ese archivo.

CAPITULO 8

Lista enlazada

Una lista enlazada es una colección o secuencia de elementos dispuestos uno detrás
de otro, en la que cada elemento se conecta al siguiente elemento por un “enlace” o
“referencia”.

Los nodos se componen de dos partes (campos): la primera parte contiene la


información y es, por consiguiente, un valor de un tipo genérico (denominado Dato,
Tipo Elemento, Info, etc.), y la segunda parte es una referencia (denominado enlace o
siguiente) que apunta (enlaza) al siguiente elemento de la lista.
CLASIFICACIÓN DE LISTAS ENLAZADAS

Las listas se pueden dividir en cuatro categorías:

• Listas simplemente enlazadas. Cada nodo (elemento) contiene un único enlace que lo
conecta al nodo siguiente o nodo sucesor. La lista es eficiente en recorridos directos
(“adelante”).

• Listas doblemente enlazadas. Cada nodo contiene dos enlaces, uno a su nodo
predecesor y otro a su nodo sucesor. La lista es eficiente tanto en recorrido directo
(“adelante”) como en recorrido inverso (“atrás”).

• Lista circular simplemente enlazada. Una lista enlazada simplemente en la que el


último elemento (cola) se enlaza al primer elemento (cabeza) de tal modo que la lista
puede ser recorrida de modo circular (“en anillo”).

• Lista circular doblemente enlazada. Una lista doblemente enlazada en la que el último
elemento se enlaza al primer elemento y viceversa. Esta lista se puede recorrer de
modo circular (“en anillo”) tanto en dirección directa (“adelante”) como inversa (“atrás”).

TIPO ABSTRACTO DE DATOS (TAD) LISTA

Una lista se utiliza para almacenar información del mismo tipo, con la característica de
que puede contener un número indeterminado de elementos y que estos elementos
mantienen un orden explícito. Una lista es una estructura de datos dinámica. El número
de nodos puede variar rápidamente en un proceso, aumentando por inserciones o
disminuyendo por eliminación de nodos.
OPERACIONES en LISTAS ENLAZADAS

La implementación del TAD Lista requiere, en primer lugar, declarar la clase Nodo, en
la que se combinarán sus dos partes: el dato (entero, real, doble, carácter o referencias
a objetos) y un enlace. Además, la clase Lista con las operaciones y el atributo con la
cabeza de la lista. Las operaciones tendrán las siguientes funciones:

 Inicialización o creación de un nodo: Una lista enlazada se compone de una


serie de nodos enlazados mediante referencias. En Java, se declara una clase
para contener las dos partes del nodo: dato y enlace. Como valor de la
referencia cabeza para una lista enlazada que no tiene nodos. Tal lista se
denomina lista vacía (cabeza = null).

 Insertar elementos en la lista: La posición más fácil y, a la vez, más eficiente en


donde insertar un nuevo elemento de una lista es en la cabeza, es decir, por el
primer nodo de la lista. El proceso de inserción se resume en este algoritmo:

1. Crear un nodo e inicializar el campo dato al nuevo elemento. La referencia del


nodo creado se asigna a nuevo, variable local del método.

2. Hacer que el campo enlace del nuevo nodo apunte a la cabeza (primero) de la
lista original.

3. Hacer que primero apunte al nodo que se ha creado.

La inserción al final de la lista se debe crear un nodo, inicializando su dato a


entrada. El campo enlace del último nodo queda apuntando al nodo creado y así
se enlaza, como nodo final, a la lista y la última sentencia pone la variable ultimo
al nuevo último nodo de la lista.

La inserción para insertar entre dos nodos (n1, n2) requiere las siguientes
etapas:

1. Crear un nodo con el nuevo elemento y el campo enlace a null. La referencia


al nodo se asigna a nuevo.

2. Hacer que el campo enlace del nuevo nodo apunte al nodo n2, ya que el nodo
creado se ubicará justo antes de n2 (en la Figura 8.7, el nodo 40).

3. La variable referencia anterior tiene la dirección del nodo n1 (en la Figura 8.7,
el nodo 25), y eso exige hacer que anterior.enlace apunte al nodo creado.

 Eliminar elementos de la lista: La operación de eliminar un nodo de una lista


enlazada supone enlazar el nodo anterior con el nodo siguiente al que se desea
eliminar y liberar la memoria que ocupa. El algoritmo para eliminar un nodo que
contiene un dato sigue estos pasos:

1. Búsqueda del nodo que contiene el dato. Se ha de obtener la dirección del


nodo a eliminar y la dirección del anterior.

2. El enlace del nodo anterior que apunte al siguiente nodo del cual se elimina.

3. Si el nodo a eliminar es el cabeza de la lista (primero), se modifica primero


para que tenga la dirección del siguiente nodo.
4. Por último, la memoria ocupada por el nodo se libera. Es el propio sistema el
que libera el nodo, al dejar de estar referenciado

 Buscar elementos de la lista: La operación búsqueda de un elemento en una


lista enlazada recorre la lista hasta encontrar el nodo con el elemento. El
algoritmo que se utiliza para localizar un elemento en una lista enlazada, una
vez encontrado el nodo, devuelve la referencia a ese nodo (en caso negativo,
devuelve null). Otro planteamiento es que el método devuelve true si encuentra
el nodo con el elemento y false si no está en la lista.

 Recorrer la lista enlazada: Una operación común a todas las estructuras


enlazadas es recorrer o visitar todos los nodos de la estructura. En una lista
circular, el recorrido puede empezar en cualquier nodo e ir procesando
iterativamente cada nodo hasta alcanzar el de partida. El método (miembro de la
clase ListaCircular) que se va a escribir inicia el recorrido en el nodo siguiente al
de acceso a la lista, lc, termina cuando alcanza el nodo lc. El proceso que se
realiza con cada nodo consiste en escribir su contenido.

 Comprobar si la lista está vacía: Cuando el valor de la referencia cabeza para


una lista enlazada que no tiene nodos (cabeza = null).

LISTAS ENLAZADAS GENÉRICAS

La definición de una lista está muy ligada al tipo de datos de sus elementos; así, se han
puesto ejemplos en los que el tipo es int, otros en los que el tipo es double, otros String.
Declarando el campo dato de tipo Object se consigue una lista genérica, válida para
cualquier tipo de dato, aunque exigirá muchas conversiones de datos cuando se
concrete para un tipo de dato particular.

Es preciso recordar que la clase Object (incuida en el paquete java.lang) es la clase


base de cualquier clase no derivada. Cualquier referencia a un objeto se puede asignar
a una variable de tipo Object. Entonces, si se define el campo dato de tipo Object, la
conversión automática permite crear listas enlazadas de cualquier tipo de objetos,
aunque, siempre tendrán que ser listas de objetos. Para manejar una lista cuyos datos
son de un tipo simple, por ejemplo, entero (int), es preciso crear objetos de la clase
envolvente que le correspondan; en el caso del tipo int la clase Integer

También podría gustarte