levenshtein-distance

    339熱度

    10回答

    我需要一種方法來多個字符串比較測試字符串並返回酷似串吧: TEST STRING: THE BROWN FOX JUMPED OVER THE RED COW CHOICE A : THE RED COW JUMPED OVER THE GREEN CHICKEN CHOICE B : THE RED COW JUMPED OVER THE RED COW CHOICE C : THE R

    2熱度

    1回答

    我正在使用Edit/Levenstein distance來衡量單詞之間的相似性。與最簡單的實現不同,我的信件有時間戳,比如說樣本號N = 0,1,2,... 我面臨的問題是我可以獲得沿着成本矩陣的不同路徑,相同(最小)的成本,而這些不同的路徑與不同的目標字符串相關聯。例如,如果我測量源字符串aa和目標字符串bab之間的距離,並且我假設源字符串在時間戳N = 0處開始,那麼我有2條成本爲2的路徑(

    0熱度

    3回答

    我在模型中寫了這些函數(我使用的是CodeIgniter)。 function getLocalIngrdname() { $this->load->database(); $query = $this->db->get('onl_local_ingrd'); foreach($query->result() as $row) $allingrd[]=$

    6熱度

    2回答

    我坐在這裏,爲我的主程序在Java中編寫一些算法(以及迄今爲止的第一個算法)。我對levenshtein算法進行了編程,這很好,因爲wiki對於新手們來說是非常好的僞代碼以及一個不錯的教程:D 然後我決定升級到Damerau並添加額外的行,但後來我讀到它不是DL算法,但是改爲OptimalStringAlignmentDistance。我嘗試閱讀actionscript代碼,以瞭解我需要添加哪些內

    8熱度

    1回答

    With Commons Lang api我可以通過LevensteinDistance計算兩個字符串之間的相似度。結果是將一個字符串更改爲另一個字符串所需的更改次數。我希望結果在0到1的範圍內,這樣可以更容易地識別字符串之間的相似性。結果會更接近0非常相似。可能嗎? 下面的例子中我使用的是: public class TesteLevenstein { public static v

    11熱度

    4回答

    我有PHP陣列上,例如: $arr = array("hello", "try", "hel", "hey hello"); 現在我想做的事情,這將是基於陣列和我的$搜索VAR的最近接近單詞數組的重新排列。 我該怎麼做?

    5熱度

    2回答

    我試圖用字典創建光學字符識別系統。 有實現的字典其實我還不=) 我聽說有基於編輯距離其採取不同符號之間的帳戶不同距離的簡單的指標。例如。 'N'和'H'非常接近,d(「THEATER」,「TNEATRE」)應該小於d(「THEATER」,「TOEATRE」),使用基本的Levenstein距離是不可能的。 請幫我找到這樣的指標。 坦克的注意。

    6熱度

    1回答

    可能重複: Counting the swaps required to convert one permutation into another 我正在尋找一種算法,只能算作某種串距離這裏只允許操作中的相鄰兩個換位字符。例如: 字符串1: 「母」 字符串2: 「moterh」 距離:2(第一交換 「H」 與 「e」 和獲得 「motehr」,然後 「H」 與 「R」 導致「moterh 「) 我

    2熱度

    1回答

    我可以添加一些基於Levenshtein距離的東西,或者類似的東西,或者逆向工程Norvig's article on spellchecking。 但是,錯別字最常用的方法是什麼? 有人寫過一個方法嗎?

    1熱度

    1回答

    我想測試SOLR爲我的應用程序找到字符串之間的百分比匹配。 我現在只爲first_name匹配配置了solr和定義的模式,我在schema(solr 3.3)中使用了text_general數據類型。 在我的文檔/ CSV我不停詞「rushik」和Solr的查詢我試圖用「rushk」搜索 - 故意去掉「我」 與Levenshtein算法 理想的距離是字符串之間上面的兩個1因此字符串之間的百分比匹配