我一直在研究不同的算法,但還沒有找到我正在尋找的東西。 漢明距離 編輯距離(僅適用於相同長度的字符串好)(發現像小貓和sitten類似的話) 我正在尋找的東西,會找到同樣的想法的句子。 例如: Sentence 1: Josh got hurt while playing in the park.
Sentence 2: Josh fell off the slide and got hurt
我創建了一個腳本來計算兩個字符串的Levenshtein距離。現在我想根據Levenshtein距離對字符串列表進行分組。 (如果字符串的距離低於閾值,它們將處於同一個羣組中): 目前,我已經做了一些事情,但似乎沒有工作。下面是一個僞代碼: for every string in list:
create a new cluster with this string
remov
我試圖在mysql中創建一個優化的levenshtein函數。我找不到我的錯誤,我的控制檯返回我: "#1064 - You have an error in your SQL syntax; check the manual that corresponds
to your MySQL server version for the right syntax to use near
'@dif