2
我見過很多散列算法都有一個共同的特徵,就是數據的任何變化都會產生散列碼的總變化,儘管這樣,我想知道是否有任何已知的具有不同行爲的標準哈希算法,對於數據的微小變化,哈希變化很小,哈希變化量與數據變化量之間存在一種近似線性關係。散列數據變化的敏感性
這樣做的一個想法是創建一個哈希連接從部分數據計算的各種散列,它會使用小的部分散列或更大的最終散列,無論如何,我想知道是否有任何算法這種行爲。
我見過很多散列算法都有一個共同的特徵,就是數據的任何變化都會產生散列碼的總變化,儘管這樣,我想知道是否有任何已知的具有不同行爲的標準哈希算法,對於數據的微小變化,哈希變化很小,哈希變化量與數據變化量之間存在一種近似線性關係。散列數據變化的敏感性
這樣做的一個想法是創建一個哈希連接從部分數據計算的各種散列,它會使用小的部分散列或更大的最終散列,無論如何,我想知道是否有任何算法這種行爲。
我想你正在尋找類似Simhash的東西。它實際上是爲了找到「接近重複的」。
你能找到一個實現嗎? – alex