levenshtein-distance

    -1熱度

    1回答

    我在[R 尋找Levenshtein距離代碼Levenshtein距離的詳細代碼,但我在努力尋找一個。 我找到了一些在C,C++,...這裏: http://rosettacode.org/wiki/Levenshtein_distance#C 你知道我在哪裏可以找到在R A 翻譯可以正常工作? 這是Ç在發現提前rosettacode.org include <stdio.h> includ

    0熱度

    1回答

    我有一個錯誤,當我嘗試設置的操作成本 stringdist 任何想法,爲什麼? library(stringdist) seq = rbind( c('aaa'), c('aba'), c('aab'), c('ccc') ) 這工作完全(Levensthein距離) stringdistmatrix(a = seq, b = seq, meth

    0熱度

    1回答

    在Perl中,我想以一種自動將類似字符串聚集在一起的方式對不同長度的字符串集合進行排序 。 直覺上,我想我需要一些距離測量每對和 然後聚類例程,按距離分組。 我的字符串數量總是很小而且很短,請參閱下面的示例 。 是否有一個簡單的方法,將做我需要在 sort_magic_here? #!/usr/bin/perl use strict; my @list = ("JK_HJ_Lanc

    2熱度

    1回答

    我有兩個包含城市名稱的數據表。第一個mydf包含我們要檢查的城市列表。它由18990條記錄組成。第二個是我給出的包含353766行的參考表。 兩個表的結構如下(頭部10) structure(list(country = "LT", city = "VILNIUS", cleaned_city = "VILNIUS"), .Names = c("country", "city", "cleane

    4熱度

    1回答

    我正在嘗試安裝Levenshtein模塊,您可以看到here。 我能夠通過python setup.py build運行setup.py文件。 然後,當我立即進入蟒蛇由他端做的只是python,而在同一文件夾中的文件夾Levenshtein,我試圖將其導入: import Levenshtein, ,但我得到的以下錯誤: >>> import Levenshtein Traceback (mos

    1熱度

    2回答

    在defaultdict中使用levenshtein距離我正在做一些測序分析,我試圖根據一些標識符創建基因序列的默認字典。所以,在看下面的例子中,我創建了一個字典,並把兩個序列AGAGAG和ATATAT在同一個列表中,因爲他們有CCCCCC相同的標識符: 輸入: CCCCCCAGAGAG CCCCCCATATAT 代碼: from collections import defaultdict

    2熱度

    1回答

    我正在開發一個postgreSQL查詢,以便在我正在處理的應用程序中搜索公司名稱時允許使用模糊搜索功能。我發現並一直在使用Postgres的Levenshtein方法(fuzzystrmatch模塊的一部分),並且大部分工作正常。但是,它似乎只工作時,公司的名稱是一個字,例如: 與蘋果(它存儲在數據庫中,只是蘋果)我可以運行以下查詢,並使其工作接近完美(它返回0 Levenshtein距離): S

    4熱度

    3回答

    我正在學習php的levenshtein function在小redis實例中創建搜索以獲得匹配,即使在提交的搜索詞中存在拼寫錯誤。雖然其中大部分是相當自我解釋,但我很努力想要如何最好地使用三種不同的cost參數。 int levenshtein (string $str1 , string $str2 , int $cost_ins , int $cost_rep , int $cost_del

    1熱度

    1回答

    我有一個像 Mega Mall Mega Malls L & T Gate 6 L & T Gate 5 L & T Gate 2 Megas Mall Mega Mwll 數據現在就是我想要把它清理乾淨。我使用編輯距離1編輯距離方法,並處理Mega Mall案例。簡而言之,它會刪除L & T Gate 5,2也[我保留第一個條目]。有沒有什麼辦法可以解決這個問題,不刪除這些案件和

    3熱度

    1回答

    我想驗證數組中是否存在因子< = 2的levenshtein。所以: in_array("test", $some_array); 到類似「是否在陣,如果萊文斯坦因素< = 2可以有誤差,通過比較」 levenshtein("test", $element_of_array_by_'in_array'_function); 這是可能的,或者我必須遍歷數組?