2014-01-31 74 views
0

我目前正在比較使用MD5sum的文件的lsit。如何使用這些散列值將類似文件分組到一個文件夾中?這兩個文件之間的哈希差異會不會更小?在JAVA中使用MD5比較文件的內容

例如:我有一個包含名稱「HELLO」的文件,另一個包含「hello」的pdf文件,這兩者大致相同。所以這些文件需要分組。我的想法發現哈希差異有幫助嗎?

還是其他想法?請幫我解決這個問題。

回答

1

否哈希值將會完全不同,並且不會有關聯。如果你想將它們統一劃分成不同的桶,你可以使用散列,但它不適用於分組類似的文件。

+0

是否有適當的方法來查找文件源哈希 – user3253099

+0

什麼是「文件源哈希」? – Kayaman

+0

我的意思是找到一個PDF文件的哈希值,我們有任何算法? – user3253099