有兩個類似的說明,它們有80%的相似性。我需要兩個相同的ID。如何讓兩個字符串具有相同的ID,如果它們具有80%的相似性?
還有其他的id描述有60%的相似性。這些應該保留自己的ID。一旦id desc被考慮和修改,不應該被視爲參考。此外 例如:
id id description
1 pepsodent
2 pepsodent salt
3 pepsod
4 pepsodent and salt
5 peps
現在,pepsodent與pepsodent匹配salt.therefor都應當給予id作爲1 現在,作爲pepsodent鹽已被修改,則不能被用作基準的規模進一步。
如果你能定義什麼80%的相似性和/或60%的相似性實際上意味着,我們可以提供幫助。您需要準確定義哪些規則可以確定哪些描述應該與另一個描述匹配 – kbball
您可以顯示您爲此嘗試的現有SQL或VBA代碼嗎?這可能有助於引導人們給出更適合你的答案。 – halfer
你可以嘗試實現這個算法,看看它是否滿足你確定「相似性」的需求http://stackoverflow.com/questions/4243036/levenshtein-distance-in-excel –