Solucion de Colisiones

Ingeniería de Sistemas
Ciencias de la Computación II
Solución de Colisiones
Maicol A. Garzón, Diego A. Velez & Brayan S. Parra

Octubre 2020
1. Solución de Colisiones para Búsquedas Internas
1.1. Según Cairó

“La elección de un método adecuado para resolver colisiones es tan importante
como la elección de una buena función hash. Cuando esta obtiene una misma
dirección para dos claves diferentes, es está ante una colisión. Normalmente
cualquiera que sea el método elegido resulta costoso tratar las colisiones. Es por
ello que se debe hacer un esfuerzo importante para encontrar la función que ofrezca
la mayor uniformidad en la distribución de las claves.” 1 (Cairó, 2006).
1.1.1. Reasignación
Prueba Lineal:
Básicamente consiste en realizar una búsqueda secuencial después de que se
encuentre una colisión tratando el arreglo como una estructura circular.
“El método de prueba lineal consiste en que una vez que se detecta la colisión, se
recorre el arreglo secuencialmente a partir del punto de colisión, buscando al
elemento. El proceso de búsqueda concluye cuando el elemento es hallado o
cuando se encuentra una posición vacía. El arreglo se trata como una estructura
circular: el siguiente elemento después del último es el primero.” 2 (Cairó, 2006).
Ejemplo:
Tenemos un arreglo de 10 elementos con el cual vamos a usar una función hash
modulo:
H ( k )= ( k mod 10 ) +1
Insertando las claves 25, 43 y 56 en nuestro arreglo tenemos:
1 2 3 4 5 6 7 8 9 10
43 25 56
Ahora queremos insertar el 35, pero resulta que la función hash nos arroja la
dirección 6 para esta clave lo que genera una colisión porque esta posición ya esta
ocupada. Entonces lo que hacemos es recorrer el arreglo secuencialmente desde el
punto de la colisión hasta que encontremos una posición vacía y pongamos la clave
ahí. La primera posición vacía después de la 6 que fue donde estuvo la colisión es
la 8 entonces ahí va el 35.
1 2 3 4 5 6 7 8 9 10
43 25 56 35
Al hacer la búsqueda el proceso es el mismo, si se quiere buscar la clave 35, la

función hash nos envía a la posición 6 del arreglo, pero resulta que ahí no esta la
clave que buscamos, entonces empezamos a recorrer el arreglo desde la posición 6
hasta encontrarlo.
1 2 3 4 5 6 7 8 9 10
43 25 56 35
1
Osvaldo Cairó (2006) Estructuras de Datos, Cap. 9.2.8, Pág. 406
2
Osvaldo Cairó, OP CIT, Cap. 9.2.9, Pág. 407
En la posición 7 tampoco esta entonces seguimos.
1 2 3 4 5 6 7 8 9 10
43 25 56 35
Finalmente encontramos la clave en la posición 8.
1 2 3 4 5 6 7 8 9 10
43 25 56 35
Prueba cuadrática:
“El método de la prueba cuadrática es similar al anterior. La diferencia consiste en
que en el de la prueba cuadrática las direcciones alternativas se generaran como
D+1, D+ 4, D+9, …, D+i 2 en vez de D+i. Esta variación permite una mejor
distribución de las claves que colisionan.”3 (Cairo, 2006).
Ejemplo:
Una vez más tenemos un arreglo de 10 elementos con el cual vamos a usar una
función hash modulo:
H ( k )= ( k mod 10 ) +1
1 2 3 4 5 6 7 8 9 10
43 25 56
dirección D=6 para esta clave lo que genera una colisión porque esta posición ya
está ocupada. Entonces lo que hacemos es generar una posición nueva a partir de
D+i 2 y empezamos con i=1, entonces tenemos la pocision 6+12 =7. La posición 7
también está ocupada entonces seguimos con i=2 y tenemos 6+22 =10. Esta
posición esta vacía entonces ahí va la clave 35.
1 2 3 4 5 6 7 8 9 10
43 25 56 35
Al hacer la búsqueda el proceso es el mismo, si se quiere buscar la clave 35, la

función hash nos envía a la posición D=6 del arreglo, pero resulta que ahí no está
la clave que buscamos.
1 2 3 4 5 6 7 8 9 10
43 25 56 35
Entonces buscamos en la dirección D+i 2 empezando con i=1entonces 6+12 =7
1 2 3 4 5 6 7 8 9 10
43 25 56 35
3
Como aquí tampoco esta seguimos con i=2 y entonces buscamos en 6+22 =10
1 2 3 4 5 6 7 8 9 10
43 25 56 35
Y encontramos la clave 35 en la posición 10.
Doble Dirección Hash:

“El método de doble dirección hash consiste en que una vez se detecta la colisión,
se genera otra dirección aplicando la misma función hash a la dirección previamente
obtenida. El proceso se detiene cuando el elemento es hallado, o cuando se
encuentra una posición vacía.”4 (Cairó, 2006).
Ejemplo:
Una vez más tenemos un arreglo de 10 elementos con el cual vamos a usar una
función hash modulo:
H ( k )= ( k mod 10 ) +1
1 2 3 4 5 6 7 8 9 10
43 25 56
dirección D=6 para esta clave lo que genera una colisión porque esta posición ya
está ocupada. Entonces lo que hacemos es tomar la dirección D+1 como si esta
fuera una clave y aplicarle la misma función hash que estamos usando para obtener
otra dirección. Así tenemos la dirección H ( D+ 1 )=( ( 6+1 ) mod 10 ) +1=( 7 mod 10 ) +1=8.
Como esta posición esta vacía insertamos el 35 aquí.
1 2 3 4 5 6 7 8 9 10
43 25 56 35
Podemos seguir este mismo proceso para insertar las claves 54 y 13 y

obtendríamos:
1 2 3 4 5 6 7 8 9 10
43 54 25 56 35 13
Y si quisiéramos buscar la clave 13 entonces la función hash nos arroja la dirección

D=4 en la cual no encontramos la clave que buscamos
1 2 3 4 5 6 7 8 9 10
43 54 25 56 35 13
Entonces buscamos en la dirección ( ( 4+1 ) mod 10 ) +1= (5 mod 10 )+1=6

1 2 3 4 5 6 7 8 9 10
4
43 54 25 56 35 13
Resulta que en esta posición tampoco esta entonces buscamos en la dirección

( ( 6+ 1 ) mod 10 ) +1=8
1 2 3 4 5 6 7 8 9 10
43 54 25 56 35 13
En la posición 8 tampoco está la clave 13 entonces volvemos a aplicar la función

hash y buscamos en la dirección ( ( 8+1 ) mod 10 ) +1=10
1 2 3 4 5 6 7 8 9 10
43 54 25 56 35 13
Finalmente hemos encontrado la clave en esta posición.
1.1.2. Arreglos Anidados
“El método de arreglos anidados consiste en que cada elemento del arreglo tenga
otro arreglo en el cual se almacenen los elementos que colisionan” 5 (Cairo, 2006)
Ejemplo:
modulo:
H ( k )= ( k mod 10 ) +1
Cada una de las posiciones de este arreglo tendrá otro arreglo de tamaño V elegido
arbitrariamente, en este caso v=2
1 2 3 4 5 6 7 8 9 10
43 25 56
Ahora queremos insertar el 35. La función hash nos arroja la posición 6, y en el

arreglo que esta en la posición 6 de nuestro arreglo principal ya tenemos el dato 25
en la primera posición, pero la segunda esta desocupada, entonces simplemente
ponemos la clave ahí.
1 2 3 4 5 6 7 8 9 10
43 25 56
35
Al buscar la clave 35 el proceso es igual de sencillo. La función hash para 35 nos

arroja la dirección 6, entonces en el arreglo de la posición 6 de nuestro arreglo
principal hacemos una sencilla búsqueda secuencial y encontramos la clave.
1 2 3 4 5 6 7 8 9 10
43 25 56
5
35
Este método de solución de polisones es muy sencillo, pero a la vez muy ineficiente
en cuanto a espacio y resulta un problema adicional escoger un tamaño V adecuado
para los arreglos internos.
1.1.3. Encadenamiento
“El método de encadenamiento consiste en que cada elemento del arreglo tenga un
apuntador a una lista ligada, la cual se ira generando y almacenará los valores que
colisionan. Es el método mas eficiente debido al dinamismo propio de las listas.
Cualquiera que sea el numero de colisiones que se presenten, se podrán resolver
sin inconvenientes.”6 (Cairo, 2006).
Ejemplo:
modulo:
H ( k )= ( k mod 10 ) +1
Cada una de las posiciones de este arreglo tendrá un apuntador a una lista ligada
que al principio estará vacía.
Ahora queremos insertar el 35. La función hash nos arroja la posición 6, en esta
posición ya está la clave 25 entonces recorremos la lista asociada con esta posición
y vemos que esta vacía entonces agregamos la clave 35.
6
Y si quisiéramos insertar la clave 13 la cual aplicando la función hash nos da la
dirección 4 que ya está ocupada, tendríamos:
Por ejemplo, para buscar la clave 13, la función hash nos da la dirección 4, pero en
esta posición no encontramos la clave entonces recorremos la lista asociada a esta
posición hasta encontrar la clave que buscamos.
1.2. Según Sedgewick
“El primer paso en una búsqueda por transformación de claves es computar una
función hash que transforma la clave de búsqueda en una dirección de memoria.
Ninguna función hash es perfecta y dos o mas claves diferentes pueden terminar
con la misma dirección: la segunda parte de una búsqueda hash es un proceso de
solución de colisiones que se encarga de dichas claves.” 7 (Sedgewick, 1983).
1.2.1. Prueba Lineal

“El método mas simple de direccionamiento abierto es llamado prueba lineal:
cuando hay una colisión, solo hay que probar con la siguiente posición en la tabla” 8
(Sedgewick, 1983).
Básicamente lo que Sedgewick nos dice es que si usamos una función hash para
hallar una clave en un arreglo y que si en la posición que esta nos arroja no
encontramos la clave busquemos en la posición siguiente y que aquí pueden pasar
3 cosas: que encontremos la clave, que encontremos una posición vacía (lo que
quiere decir que el la clave no esta en el arreglo) y que encontremos otra clave que
no es la que buscamos en cuyo caso debemos buscar en la siguiente posición a
esa.
Ejemplo:
Sedgewick en su libro propone un ejemplo similar al siguiente:
Supongamos que tenemos un arreglo de 6 posiciones y usando una cierta función
hash insertamos las siguientes claves:
Clave A S E A S
hash 1 0 5 1 0
Para insertar las primeras 3 claves no tenemos problema
0 1 2 3 4 5
S A E
Sin embargo, al insertar la cuarta clave, que tiene como dirección hash la posición 1
vemos que se presenta una colisión. Entonces miramos la siguiente posición del
arreglo que es la 2, y como esta esta vacía ponemos la clave ahí.
0 1 2 3 4 5
S A A E
Luego al insertar la ultima clave con dirección hash 0 tenemos otra colisión, al mirar
la siguiente posición del arreglo vemos que esta también esta ocupada entonces
miramos la siguiente a esa y como esa también esta ocupada miramos la siguiente
hasta que llegamos a la posición 3 que no esta ocupada entonces ponemos ahí la
clave S.
0 1 2 3 4 5
S A A S E
7
Robert Sedgewick (1983) Algorithms, Cap. 16, Pág. 201
8
Robert Sedgewick, OP CIT, Cap. 16, Pág. 205
1.2.2. Doble Hash
“La estrategia básica es la misma que la prueba lineal; la única diferencia es que en
lugar de examinar cada entrada sucesiva que sigue a una posición colisionada,
usamos una segunda función hash para obtener un incremento arreglado para usar
en la secuencia de prueba”9 (Sedgewick, 1983).
Sedgewick propone escoger con cuidado una segunda función hash para que al
momento de una colisión apliquemos la segunda función hash a la clave y como
dirección usemos la suma de la primera y segunda dirección hash.
Ejemplo:
Supongamos que tenemos un arreglo de 6 posiciones y usando una cierta función
hash insertamos las siguientes claves:
Clave A S E A S
hash 1 0 5 1 0
Escogemos cuidadosamente una segunda función hash para tratar con las
colisiones. En este ejemplo la segunda dirección hash escogida nos da las
direcciones:
Clave A S E A S
Hash 1 1 0 5 1 0
Hash 2 3 4 2 3 4
Para insertar las primeras 3 claves no tenemos problema
0 1 2 3 4 5
S A E
Sin embargo, al insertar la cuarta clave, que tiene como dirección hash la posición 1
vemos que se presenta una colisión. Entonces vemos que el uso de la segunda
función hash en la clave nos da la dirección hash 3, ahora sumamos la primera
dirección hash con esta segunda y nos da la dirección 1+3=4. La posición 4 del
arreglo esta vacía entonces ponemos ahí la clave A.
0 1 2 3 4 5
S A A E
Luego, para insertar la clave S esta también nos genera una colisión en la posición
0. Entonces usamos la segunda dirección hash que es 4 y la suma de ambas
direcciones nos da la dirección 4, pero vemos que esta posición del arreglo también
está ocupada por lo que ahora tomamos esta dirección y le sumamos de nuevo la
segunda dirección hash es decir 4 + 4=8, esta dirección se sale del arreglo que es
de tamaño 6 pero este lo recorremos circularmente por lo que la dirección es
8 mod 6=2, esta posición esta vacía entonces ponemos la clave S ahí.
0 1 2 3 4 5
S A S A E
9
1.2.3. Encadenamiento separado
“El método mas sencillo es simplemente construir una lista ligada, para cada
dirección de la tabla, de los registros que tienen esa misma dirección hash.” 10
(Sedgewick, 1983).
Ejemplo:
Supongamos que tenemos un arreglo de 10 posiciones y que usamos una cierta
función hash para insertar las siguientes claves:
Clave A S E A R C H I N G
hash 1 8 5 1 7 3 8 9 3 7
Como vemos hay varias direcciones hash que se repiten, sin embargo, como en
cada posición del arreglo hay una lista, al momento de insertar una clave en una
posición en la que ya se haya insertado previamente esta se agregará a la lista y no
habrá colisión. Al insertar las claves de nuestro ejemplo tenemos:
0 1 2 3 4 5 6 7 8 9
A C E R S I
A N G H
1.3. Según Joaquín Fernández
Joaquín Fernández, profesor de La Universidad de Granada en España,

propone unos métodos básicos para la resolución de colisiones. “uno de ellos
depende de la idea de mantener listas enlazadas de sinónimos, y los otros dos del
cálculo de una secuencia de localizaciones en la tabla hash hasta que se encuentre
que se encuentre una vacía. El análisis comparativo de los métodos se hará en
base al estudio del número de localizaciones que han de examinarse hasta
determinar dónde situar cada nueva clave en la tabla.” 11 (Fernández, 2000)
A continuación, se presenta una serie de ejemplos para cada caso, en cada caso
los ejemplos el tamaño de la tabla será M=13 y la función hash h 1(k) que
utilizaremos será:
HASH = Clave mod M
y los valores de la clave k que consideraremos son los expuestos en la siguiente

tabla:
10
11
Fernández, J. (2000). TABLAS HASH
Tabla H: Valores ejemplo de claves Kj (Fernández, 2000)
1.3.1 Encadenamiento separado o Hashing Abierto
Según Fernández, “La manera más simple de resolver una colisión es

construir, para cada localización de la tabla, una lista enlazada de registros cuyas
claves caigan en esa dirección. Este método se conoce normalmente con el nombre
de encadenamiento separado y obviamente la cantidad de tiempo requerido para
una búsqueda dependerá de la longitud de las listas y de las posiciones relativas de
las claves en ellas. Existen variantes dependiendo del mantenimiento que hagamos
de las listas de sinónimos (FIFO, LIFO, por valor Clave, etc.), aunque en la mayoría
de los casos, y dado que las listas individuales no han de tener un tamaño excesivo,
se suele optar por la alternativa más simple, la LIFO.” 11(Fernández, 2000)
En otras palabras, si las listas se mantienen en orden esto puede verse como una
generalización del método de búsqueda secuencial en listas. La diferencia es que
en lugar de mantener una sola lista con un solo nodo cabecera se mantienen M
listas con M nodos cabecera de forma que se reduce el número de comparaciones
de la búsqueda secuencial. Con los datos de la Tabla H y con la alternativa LIFO, la
tabla quedaría como se muestra en la siguiente figura:
Tabla Hash usando encadenamiento separado (Fernández, 2000)
1.3.2 Direccionamiento abierto o Hashing Cerrado.
Fernández afirma: “Otra posibilidad consiste en utilizar un vector en el que se

pone una clave en cada una de sus casillas. En este caso nos encontramos con el
problema de que en el caso de que se produzca una colisión no se pueden tener
ambos elementos formando parte de una lista para esa casilla. Para solucionar ese
problema se usa lo que se llama re-hashing. El re-hashing consiste en que una vez
producida una colisión al insertar un elemento se utiliza una función adicional para
determinar cuál será la casilla que le corresponde dentro de la tabla, a esta función
la llamaremos función de re-hashing, reh i(k).
A la hora de definir una función de re-hashing existen múltiples posibilidades, la más

simple consiste en utilizar una función que dependa del número de intentos
realizados para encontrar una casilla libre en la que realizar la inserción, a este tipo
de re-hashing se le conoce como hashing lineal.” 12 (Fernández, 2000)
La función de re-hashing lineal es de la siguiente forma:
ℜhi (k )=( h(k )+(i−1))mod M , i=2,3,4 , .. .
Cabe aclarar aquí que se debe verificar si la casilla a la que se va a guardar esta
ocupada cada vez que se genere el cálculo, si es así, se continúa con la siguiente
iteración de i, hasta que se encuentre una casilla libre.
Al llevar a cabo la inserción de las claves de la Tabla H, el estado de la tabla hash

será el que se puede observar a continuación. Adicionalmente, aparece el número
de intentos que han sido necesarios para insertar cada una de las claves.
12
Tabla Hash con Inserción con direccionamiento abierto (Fernández, 2000)
En el ejemplo, después de insertar las 7 primeras claves aparece la Tabla A. Al a

insertar la clave 147, esta queda situada en la casilla 6, (tabla B) una vez que no se
han encontrado vacías las casillas 4 y 5. Se puede observar que antes de la
inserción del 147 había agrupaciones de claves en las localizaciones 4,5 y 7,8, y
después de la inserción, esos dos grupos se han unido formando una agrupación
primaria mayor, esto implica que si se trata de insertar un elemento al que le
corresponde algunas de las casillas que están al principio de esa agrupación el
proceso de re-hashing tendrá de recorrer todas esas casillas con lo que se
degradará la eficiencia de la inserción.
Fernández propone un solución a este problema: “Para intentar evitar el problema

de las agrupaciones que acabamos de ver podríamos utilizar la siguiente función de
re-hashing:
reh i( k )=(h(k )+(i−1)∗C) mod M C>1 y primo relativo con M
Pero aunque esto evitaría la formación de agrupaciones primarias, no solventará el

problema de la formación de agrupaciones secundarias (agrupaciones separadas
por una distancia C). El problema básico de re-hashing lineal es que para dos
claves distintas que tengan el mismo valor para la función hash se irán obteniendo
exactamente la misma secuencia de valores al aplicar la función de re-hashing,
cunado lo interesante sería que la secuencia de valores obtenida por el proceso de
re-hashing fuera distinta.” 13(Fernandez, 2000)
Fernandez, comenta una serie de condiciones para una función re-hashing, mucho
más óptima:
● Sea fácilmente calculable (con un orden de eficiencia constante),

● que evite la formación de agrupaciones,
13
● que genere una secuencia de valores distinta para dos claves distintas
aunque tenga el mismo valor de función hash,
● que garantice que todas las casillas de la tabla son visitadas.
Una función de re-hashing que cumple estas condiciones es la mencionada en el

siguiente apartado.
1.3.4 Re-hashing doble
Fernández, define una nueva función re-hashing doble de la siguiente forma:
h i(k )=(h i−1(k )+h 0( k ))mod M ,i=2,3,4 ,.. .
con h 0( k )=1+k mod (M −2) y h 1(k )=h (k )
“Existe la posibilidad de hacer otras elecciones de la función h 0(k) siempre que la

función escogida no sea constante. Esta forma de re-hashing doble es
particularmente buena cuando M y M-2 son primos relativos. Hay que tener en
cuenta que si M es primo entonces es seguro que M-2 es primo relativo suyo
(exceptuando el caso trivial de que M=3).” 13 (Fernández, 2000)
Al aplicar el método según los datos de la Tabla H, se obtienen las siguientes

tablas. En la primera se incluyen los valores de h para cada clave y en la segunda
pueden verse las localizaciones finales de las claves en la tabla así como las
pruebas requeridas para su inserción.
Valores h0 y h1 para cada clave Localización final de las claves

(Fernández, 2000) 14
14
2. Solución de Colisiones para Búsquedas Externas
2.1. Según Cairó
“Para evitar las colisiones se debe elegir un tamaño adecuado de cubetas y de

bloques. Con respecto a las cubetas, si se definen muy pequeñas el numero de
colisiones aumenta, mientras que si se definen muy grandes se pierde eficiencia en
cuanto a espacio de almacenamiento.” 15 (Cairó, 2006).
2.1.1. Uso de áreas Independientes para las Colisiones
“El uso de áreas independientes para colisiones consiste en definir áreas separadas
-secundarias- de las áreas primarias de almacenamiento, en las que se
almacenaran todos los registros que hayan colisionado. El área de colisiones
puedes estar organizada de diferentes maneras. Una alternativa consiste en tener
en el área común a todas las cubetas. En consecuencia, si se produce una colisión
habrá que buscar a lo largo del área secundaria hasta encontrar el elemento
deseado.”16 (Cairó, 2006).
Ejemplo:
Supongamos que tenemos una estructura de 6 cubetas con 2 registros por cubeta:
0 1 2 3 4 5
Almacenamiento primario
Entonces definimos un área separada de esta solo para los datos que colisionan,
por ejemplo:
0 1 2 3 4 5
Área de Colisiones
Ahora, si insertáramos las claves 2, 7, 12, 15, 24 y 38 usando la función hash

modulo tendríamos en las cubetas:
0 1 2 3 4 5
12 7 2 15
24 38
Luego si intentáramos insertar la clave 14, tendríamos una colisión en la cubeta 2.

Entonces hacemos uso del área de colisiones y ponemos la clave ahí.
0 1 2 3 4 5
14
Área de Colisiones
15
16
Osvaldo Cairó, OP CIT, Pág. 431
Así, cada vez que haya una colisión, la clave que no se puede insertar en la
respectiva cubeta va al área de colisiones. Por ejemplo, al insertar la clave 54:
0 1 2 3 4 5
12 7 2 15
24 38
0 1 2 3 4 5
14 54
Área de Colisiones
Y cuando se realice la búsqueda de una clave y esta no se encuentre en la cubeta

correspondiente porque hubo una colisión entonces se realiza una búsqueda
secuencial sobre el área de colisiones.
“Otra forma de organizar el área de colisiones consiste en dividirla en bloques,

asociando cada uno de ellos a uno del área primaria. Esta alternativa optimiza el
tiempo de búsqueda en el área de colisiones, pero tiene el inconveniente de que
estos bloques podrían saturase, ocasionando nuevamente colisiones.” 17 (Cairó,
2006).
Ejemplo:
Supongamos que tenemos la misma estructura de 6 cubetas y 2 registros con las
mismas claves que en el anterior ejemplo:
0 1 2 3 4 5
12 7 2 15
24 38
Ahora, la diferencia es que el área de colisiones esta dividida también y a cada

cubeta del almacenamiento primario le corresponde un bloque en el área de
colisiones.
0 1 2 3 4 5
Área de Colisiones
Entonces si intento insertar la clave 14 que hace colisión en la cubeta 2 del

almacenamiento principal entonces la guardo en el bloque 2 del área de colisiones.
0 1 2 3 4 5
14
Área de Colisiones
17
Y si intento insertar la clave 54 que hace colisión en la cubeta 0 del almacenamiento
principal entonces la guardo en el bloque 0 del área de colisiones.
0 1 2 3 4 5
54 14
Área de Colisiones
Esto hace la búsqueda en el área de colisiones por que cuando busque una clave
que tenga colisión en una cubeta del almacenamiento principal entonces no tengo
que recorrer toda el área de colisiones buscando la clave colisionada, sino que solo
busco en el bloque correspondiente.
2.1.2. Uso de Áreas de Colisiones Entre los Bloques de Almacenamiento

Primario
“El uso de áreas de colisiones entre los bloques de almacenamiento primario
consiste en definir áreas de colisiones entre los bloques de almacenamiento
primario. Este método es similar al presentado en búsqueda interna bajo el nombre
de reasignación. Una vez detectada una colisión en un bloque se de3be buscar en
el área de colisiones inmediata a dicho bloque. Si el elemento no se encuentra y el
área de colisiones está llena se continuará la búsqueda a través de las otras áreas
de colisiones. El proceso termina cuando el elemento se encuentra o bien cuando
existen espacios vacíos en un bloque -el elemento buscado no se encuentra en el
archivo-.”18 (Cairó, 2006).
Ejemplo:
Para este método do solución se usa una estructura de cubetas un tanto diferente,
aquí se definen las cubetas y a continuación de cada una de estas un bloque de
colisiones correspondiente a la cubeta. Aquí todo se hace en la misma área de
almacenamiento, no se define ningún área secundaria o algo por el estilo, entonces
por ejemplo si definimos una estructura de 3 cubetas tendremos:
Cubeta 1 Área de Cubeta 2 Área de Cubeta 3 Área de

colisiones 1 colisiones 2 colisiones 3
Y cuando alguna clave haga colisión en la cubeta 1 por ejemplo, esta se guarda en
el área de colisiones 1, si resulta que esta área está llena entonces se guarda en el
área de colisiones 2 y así sucesivamente. Así mismo cuando se haga la búsqueda
de una clave en la cubeta 1 y esta no se encuentre aquí entonces se busca en el
área de colisiones 1 y si no se encuentra ahí entonces se busca en el área de
colisiones 2 y así sucesivamente.
2.2. Según Archivos Hash: Implementación y Aplicaciones
En Archivos Hash: Implementación y Aplicaciones, los autores expresan: “Los

conceptos, elementos y técnicas para implementar una tabla hash en memoria
principal son perfectamente extrapolables a la organización de un archivo en disco
para favorecer búsquedas externas rápidas, siempre que se cuente con la
18
capacidad del acceso directo al contenido del archivo y se esté dispuesto a permitir
espacio extra de almacenamiento” 19. (Frittelli, 2006).
2.3. Según Bruno López Takeyas
Asume que “los métodos de manejo de las tablas hash y sus respectivos métodos
para la resolución de colisiones son aplicables al Hashing dinámico en memoria
secundaria, sin embargo, dice que existen métodos que son aplicables solamente
en memoria secundaria”. 20Esos son: el uso de áreas Independientes y el uso de
áreas de colisiones entre los bloques de almacenamiento primario, en ese
apartado se cita tanto la explicación, como los ejemplos usados en el libro de
Osvaldo Cairó (Estructuras de Datos), los cuales ya se explico en la sección 2.1 de
este mismo informe
19
Frittelli, V., Steffolani, F., Harach, J., Serrano, D., Fernández, J., Scarafia, D., Teicher, R., ... Strub, A. (2013)
Archivos Hash: Implementación y Aplicaciones, Universidad Tecnológica Nacional, Facultad Regional Córdoba
Pág 2.
20
López Takeyas, B. (2007). Administración de Archivos. TRATAMIENTO DE COLISIONES.
Bibliografía
Robert Sedgewick (1983) Algorithms, Addison-Wesley Publishing Company Inc.
Osvaldo Cairó & Silvia Guardati (2006) Estructuras de Datos, Tercera Edicion,
McGraw-Hill Interamericana.
Fernández Valdivia, J. (2000). TABLAS HASH. Departamento de Ciencias de la

Computación e I.A | Universidad de Granada.
Recuperado el 05 de noviembre del 2020 desde:
http://decsai.ugr.es/~jfv/ed1/tedi/cdrom/docs/tablash.html
Frittelli, V., Steffolani, F., Harach, J., Serrano, D., Fernández, J., Scarafia, D.,
Teicher, R., ... Strub, A. (2013) Archivos Hash: Implementación y Aplicaciones,
Universidad Tecnológica Nacional, Facultad Regional Córdoba Pág 2.
Recuperado el 05 de noviembre del 2020 desde:
http://conaiisi.unsl.edu.ar/2013/121-493-1-DR.pdf
López Takeyas, B. (2007). Administración de Archivos. TRATAMIENTO DE

COLISIONES.
Recuperado el 05 de octubre del 2020 desde:
http://www.itnuevolaredo.edu.mx/takeyas/Apuntes/Administracion_Archivos/index.ht
m

Solucion de Colisiones

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Solucion de Colisiones

Cargado por

Copyright:

Formatos disponibles

Ingeniería de Sistemas

Maicol A. Garzón, Diego A. Velez & Brayan S. Parra

1.1. Según Cairó

Insertando las claves 25, 43 y 56 en nuestro arreglo tenemos:

Al hacer la búsqueda el proceso es el mismo, si se quiere buscar la clave 35, la

Finalmente encontramos la clave en la posición 8.

Insertando las claves 25, 43 y 56 en nuestro arreglo tenemos:

Al hacer la búsqueda el proceso es el mismo, si se quiere buscar la clave 35, la

Entonces buscamos en la dirección D+i 2 empezando con i=1entonces 6+12 =7

Y encontramos la clave 35 en la posición 10.

Doble Dirección Hash:

Insertando las claves 25, 43 y 56 en nuestro arreglo tenemos:

Podemos seguir este mismo proceso para insertar las claves 54 y 13 y

Y si quisiéramos buscar la clave 13 entonces la función hash nos arroja la dirección

Entonces buscamos en la dirección ( ( 4+1 ) mod 10 ) +1= (5 mod 10 )+1=6

Resulta que en esta posición tampoco esta entonces buscamos en la dirección

En la posición 8 tampoco está la clave 13 entonces volvemos a aplicar la función

Finalmente hemos encontrado la clave en esta posición.

1.1.2. Arreglos Anidados

Ahora queremos insertar el 35. La función hash nos arroja la posición 6, y en el

Al buscar la clave 35 el proceso es igual de sencillo. La función hash para 35 nos

1.2.1. Prueba Lineal

Para insertar las primeras 3 claves no tenemos problema

Para insertar las primeras 3 claves no tenemos problema

1.3. Según Joaquín Fernández

Joaquín Fernández, profesor de La Universidad de Granada en España,

HASH = Clave mod M

y los valores de la clave k que consideraremos son los expuestos en la siguiente

1.3.1 Encadenamiento separado o Hashing Abierto

Según Fernández, “La manera más simple de resolver una colisión es

1.3.2 Direccionamiento abierto o Hashing Cerrado.

Fernández afirma: “Otra posibilidad consiste en utilizar un vector en el que se

A la hora de definir una función de re-hashing existen múltiples posibilidades, la más

La función de re-hashing lineal es de la siguiente forma:

ℜhi (k )=( h(k )+(i−1))mod M , i=2,3,4 , .. .

Al llevar a cabo la inserción de las claves de la Tabla H, el estado de la tabla hash

En el ejemplo, después de insertar las 7 primeras claves aparece la Tabla A. Al a

Fernández propone un solución a este problema: “Para intentar evitar el problema

reh i( k )=(h(k )+(i−1)∗C) mod M C>1 y primo relativo con M

Pero aunque esto evitaría la formación de agrupaciones primarias, no solventará el

● Sea fácilmente calculable (con un orden de eficiencia constante),

Una función de re-hashing que cumple estas condiciones es la mencionada en el

1.3.4 Re-hashing doble

Fernández, define una nueva función re-hashing doble de la siguiente forma:

h i(k )=(h i−1(k )+h 0( k ))mod M ,i=2,3,4 ,.. .

con h 0( k )=1+k mod (M −2) y h 1(k )=h (k )

“Existe la posibilidad de hacer otras elecciones de la función h 0(k) siempre que la

Al aplicar el método según los datos de la Tabla H, se obtienen las siguientes

Valores h0 y h1 para cada clave Localización final de las claves

2.1. Según Cairó

“Para evitar las colisiones se debe elegir un tamaño adecuado de cubetas y de

2.1.1. Uso de áreas Independientes para las Colisiones

Ahora, si insertáramos las claves 2, 7, 12, 15, 24 y 38 usando la función hash

Luego si intentáramos insertar la clave 14, tendríamos una colisión en la cubeta 2.

Y cuando se realice la búsqueda de una clave y esta no se encuentre en la cubeta

“Otra forma de organizar el área de colisiones consiste en dividirla en bloques,

Ahora, la diferencia es que el área de colisiones esta dividida también y a cada

Entonces si intento insertar la clave 14 que hace colisión en la cubeta 2 del

2.1.2. Uso de Áreas de Colisiones Entre los Bloques de Almacenamiento

Cubeta 1 Área de Cubeta 2 Área de Cubeta 3 Área de

2.2. Según Archivos Hash: Implementación y Aplicaciones

En Archivos Hash: Implementación y Aplicaciones, los autores expresan: “Los

2.3. Según Bruno López Takeyas