levenshtein-distance

    3熱度

    1回答

    我寫了一個程序,從用戶處收集問題。然後它將該問題與預先定義的問題列表進行匹配並返回答案。它應該是準確的,並且只與接近(模糊匹配)的問題或用戶輸入的問題相匹配。 我SSSCE: http://ideone.com/JTcF73 代碼: #include <iostream> #include <cstdint> #include <algorithm> #include <numeric>

    2熱度

    3回答

    我正在使用字符串編輯距離(Levenshtein-distance)比較來自眼動跟蹤實驗的掃描路徑。 (現在我正在使用R中的stringdist包) 基本上,字符串的字母表示6x4矩陣中的(凝視)位置。該矩陣被配置如下: [,1] [,2] [,3] [,4] [1,] 'a' 'g' 'm' 's' [2,] 'b' 'h' 'n' 't' [3,] 'c' 'i' 'o' 'u' [

    0熱度

    2回答

    當前,在我的計算機科學課程中,我們正在討論圖以及如何使用圖找出最短距離。大約一週前,我收到了一份作業,老師給我們提供了使用整數的圖形代碼,我們必須調整它才能使用單詞列表計算Levenshtein距離。我遇到的問題是,我不明白圖表如何處理足夠的操作。我已經嘗試過使用谷歌搜索圖表,但沒有發現類似於我給出的程序類型。 我們剛剛在鏈表上完成了一個單元,並且我認爲圖的操作方式相似嗎?我知道每個節點都會指向許

    3熱度

    1回答

    我需要根據替換的自定義成本函數來計算兩個字符串之間的編輯距離。例如,我想指定用'b'替換'a'的不同成本,而不是用'c'替換'a'。 是否有R包允許我將自定義成本矩陣作爲參數傳遞?如果沒有,我將不得不爲此目的修改一個包,那麼你認爲哪個包適合實現這種擴展? 謝謝。

    0熱度

    3回答

    我一直在研究不同的算法,但還沒有找到我正在尋找的東西。 漢明距離 編輯距離(僅適用於相同長度的字符串好)(發現像小貓和sitten類似的話) 我正在尋找的東西,會找到同樣的想法的句子。 例如: Sentence 1: Josh got hurt while playing in the park. Sentence 2: Josh fell off the slide and got hurt

    2熱度

    2回答

    我正在使用OCR輸出,並且正在搜索其中的特殊字詞。 由於輸出不乾淨,我根據低於特定閾值的單詞距離查找與我的輸入相匹配的元素。 但是,我覺得Levenshtein距離或漢明距離並不是最好的方式,因爲OCR總是會犯同樣的錯誤:I爲1,0,O爲O,Q爲O ......並且這些「例如,「經典」錯誤似乎不如「A for K」重要。因此,這些距離不關心字符外觀差異的大小(低/高)。 是否有任何字距離算法,專門

    -2熱度

    2回答

    我創建了一個腳本來計算兩個字符串的Levenshtein距離。現在我想根據Levenshtein距離對字符串列表進行分組。 (如果字符串的距離低於閾值,它們將處於同一個羣組中): 目前,我已經做了一些事情,但似乎沒有工作。下面是一個僞代碼: for every string in list: create a new cluster with this string remov

    1熱度

    1回答

    我們正在導入第三方應用程序 和 的客戶記錄,同時與另一個接口進行交互,如果找不到客戶匹配,我們正在插入新客戶。 如果沒有找到確切的客戶匹配,則客戶得到重複。 現在有沒有辦法手抖接口兩者之上,並得到正確的客戶 所以現在我們需要開發工具來刪除重複的客戶 有一個人可以請建議這將是最好的實現這一目標的方法。 Levenshtein距離可能是一種選擇?其他? 在性能方面也因爲我們有超過5000個客戶 的例子

    -1熱度

    1回答

    他們是否將levenstein距離轉換爲錯誤率? 由於錯誤率是不是正好是相同的序列的一部分。

    0熱度

    1回答

    我試圖在mysql中創建一個優化的levenshtein函數。我找不到我的錯誤,我的控制檯返回我: "#1064 - You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '@dif