如何使用MD5算法檢測兩個字符串之間的微小差異?我想找到幾個大字符串之間的相似百分比。至於如何我可以檢查不同,因爲:MD5散列函數
MD5("The quick brown fox jumps over the lazy dog.")
= e4d909c290d0fb1ca068ffaddf22cbd0
MD5("The quick brown fox jumps over the lazy dog")
= 9e107d9d372bb6826bd81d3542a419d6
你能給我一個解決方案,這個還是給我,可以有效地在大型字符串或大型文檔,可以使用其他哈希算法?
尋找*相似的東西*不是MD5或任何散列函數的工作。所有好的散列函數都有意放大小的差異,因爲它們的目標是減少衝突。你想要的是一個通常被稱爲「編輯距離」的度量,這意味着將一個字符串轉換爲另一個字符串所需的單個編輯的數量。 –