2011-01-29 81 views
7

散列的目標通常是將連續函數轉換爲離散函數:輸入中的小改變會導致輸出發生較大變化。然而,是否有任何散列算法可以(大致)粗略地說爲相似的輸入返回相似但仍然不同的哈希值?散列相似性

(使用此的一個例子是檢查兩個文件是否是通過檢查他們的相似性哈希「類似」。當然,有些失敗總是可以接受的。)

+0

你如何定義「相似」? – thkala 2011-01-29 00:32:02

+0

兩個大致相同長度的數據流和大約相同數據的相同順序將被認爲是相似的。 (請注意,我不需要說「這兩個相似嗎?」作爲一個布爾值,而是作爲某種數字評級系統。例如,[1,2,3,4]可能更相似到[1,2,3],而不是[4,3,2,1] ...) – Mehrdad 2011-01-29 00:32:53

回答