2011-04-01 47 views
0

我正在寫一個文件系統演繹。第一遍生成md5校驗和,第二遍將文件與相同的校驗和進行比較。md5碰撞數據庫?

是否有一個不同的字符串集合,但會生成相同的md5校驗和,我可以將它們合併到我的測試用例集合中?

更新:mjv的答案指向這兩個文件,非常適合我的測試用例。

+0

儘管它已經被回答(並且不是問題的主題),但我不會從生成文件的md5開始。我首先比較他們的大小......([看到這個問題])(http://stackoverflow.com/questions/6507272/algorithm-to-find-duplicates/6507415#6507415)) – woliveirajr 2011-07-01 17:50:22

回答

3

您可以在此url處找到具有相同MD5散列的幾個不同的X.509證書文件。

我不知道MD5重複文件庫的,但你可能可以創建自己的,使用可執行文件和/或Vlastimil Klima's page on MD5 Collision

事實上MD5已經知道其與關於抗碰撞性弱點描述的技術但是我不會因爲諸如文件系統的項目而使其失去資格;你可能只想添加一些額外的標準(從計算角度來說可能非常便宜),以進一步降低重複的可能性。或者,爲了測試目的,您可以簡單地修改MD5比較邏輯,以便它認爲某些MD5值相同,即使它們不相同(例如,如果MD5的最低有效字節匹配或系統地每20個比較,或隨機...)。這可能比製造有效的MD5「雙胞胎」更痛苦。

+0

這是完美的,證書文件是正是我需要的。我不太關心衝突,因爲任何具有相同校驗和的文件都將進行完整的比較。謝謝!!! – 2011-04-01 23:04:03