1

我試圖讓數字出來的一些有序列表,例如列表可以 「ABCD E」,另: 「CBEADHGFIJK」如何找出哪一組列表與原始列表最相似?

所以我有一些可信的數據,這是一組有序的列表每個與一個字符串相關聯,我試圖評估哪個自動化的方式是最好的檢索給定一個字符串相同的列表,以便列表匹配(或儘可能相似)相同的字符串列表我的可信數據。

我沒有強大的統計背景,我希望你可以參考我可以使用的方法以及可以幫助我理解如何實現它們的鏈接或資源。

回答

1

解決方案將取決於您的相似性概念。一種流行的相似性度量是Levenshtein distance(從另一個字符串獲取一個字符串所需的字母添加,刪除和修改次數)。

相關問題