我有一個單元格數組字典,其中包含很多單詞(約15000)。 我想爲所有的單詞對計算函數strdist(計算Levenshtein距離)。我嘗試了兩種方式,但都很慢。什麼是更有效的解決方案? 這是我的代碼(dict_keys是長度爲m的我的單元陣列): 1) matrix = sparse(m,m);
for i = 1:m-1;
matrix(i,:) = cellfun(@(u) s
我有一個字符串列表,我想根據levenstein距離過濾出過於類似的字符串。所以如果lev(list[0], list[10]) < 50;然後del list[10]。有什麼方法可以計算列表中每對字符串之間的距離,更有效率?謝謝!! data2= []
for i in data:
for index, j in enumerate(data):
s = levensht
我安裝了模塊python-Levenshtein-0.11.2。我認爲設置成功了(當我輸入help('modules')時,我在列表中看到「Levenshtein」模塊)。 但是,當我嘗試「距離」功能,我得到這個錯誤:"NameError: name 'distance' is not defined"。 我不明白爲什麼距離函數不起作用。
首先,這不是一個特定於語言的問題,下面的例子使用PHP,但更多的是用於找到答案的方法(正則表達式?)。 比方說,我有一個數組: $array = ['The Bert and Ernie game', 'The Bert & Ernie game', 'Bert and Ernie game', 'Bert and Ernie game - english version', 'Bert & Er