2012-11-10 16 views

回答

3

我假設你的意思是「上下文觸發分段哈希」?

ssdeep project鏈接到一個名爲紙「標識使用上下文觸發分段哈希幾乎相同的文件」,由傑西·科恩布盧姆。該論文以Spamsum算法的形式介紹了CTPH的起源和目標。

總結:

  • 計算一個完整的文件哈希值,如運行sha1sum file,可以讓你找到的文件對,是完全一樣的,在時間線中的文件的總大小。

  • 使用固定大小的段進行分段散列意味着如果字節被重寫到文件的中間,那麼您可能仍然可以確定它與參考文件相同。但是,如果插入或刪除字節,則整個文件其餘部分的校驗和會發生變化。

  • CTPH應該允許識別即使在更實質差異的存在文件之間的相似性。只要變化不太大,CTPH就可以處理插入或刪除部分文件。該文件聲稱,只要文件的前三分之一或最後三分之一,Spamsum就可以識別它可能來自哪個文件。