Está en la página 1de 5

A B 32,3 5,74 6

1,2 3,44 324,64

Combinaciones posibles

JLA B J CA C JEB C

Definición similitud Jaccard


Iggy

JLA B I

J CA C

J B C

1-Calcule las similitudes de Jaccard de cada par de los


siguientes tres conjuntos: {1, 2, 3, 4}, {2, 3, 5, 7}, y {2, 4,
6}.

2-La figura
0 2
h ha has
1 2 2 y 3
3 4 0
O 1 3

es una matriz con 5 filas. Calcule la matriz de firmas si


Matriz firmas
de tres funciones hash: ℎ1(𝑥) = 2𝑥 +
utilizamos las siguientes
1 𝑚𝑜𝑑 5; ℎ2 (𝑥) = 2𝑥 + 2 𝑚𝑜𝑑 5; ℎ3 (𝑥) = 3𝑥 + 2 𝑚𝑜𝑑 5.

hs 525354
3- Verifique que si la similitud de Jacarrd entre dos
h 1010
documentos 𝑆𝑖 y 𝑆𝑗 es cero, entonces la función minhash
h da diferente en los dos documentos (𝒉(𝑺𝒊 ) ≠ 𝒉(𝑺𝒋 )).

ha 2101
4- Haga un programa en Python que visualice la función
𝑓 (𝑠) = 1 1101
hs𝑏,𝑟 − (1 − 𝑠 ) para 𝑠 = 0.1, 0.2, . . . , 0.9 y
𝑙 𝑡

l = 3 y t = 10, l = 6 y t = 20, l = 5 y t = 50.

5-Use las funciones y las clases definidas en el código


presentado en la clase para calcular la similitud de Jacard
entre cada par de documentos y la similitud aproximada
según las funciones minhash.
Sabemos que
PChn si hals JC si 5
por lo que

Isis O PChalsi his O


ha g thals
Como la probabilidad de que sean
iguales es cero siempre h si es

distinto de hcg a

También podría gustarte