levenshtein-distance

    0熱度

    1回答

    我有一個數據集與經度和緯度座標(兩個單獨的小數點列)。我需要對它們執行搜索並根據提供的緯度/經度座標,通過鄰近度對它們進行排序。 我不反對將列轉換爲varchar來執行匹配/反對搜索,但我知道match/against是針對單詞優化的。 按距離排序座標的最佳方法是什麼?如果有必要,我可以通過PHP來完成此操作,但我更願意在對象層執行此操作以減少服務器負載和加載時間。 我目前正在測試match/ag

    3熱度

    2回答

    我的項目正在從平面Excel文件導入一個可觀的集合+ 500K行數據,這些文件是由一組人員手動創建的。現在的問題是,這一切都需要規範化,以便客戶搜索。例如,公司字段將包含多個公司拼寫,幷包含分支,如「IBM」,然後是「IBM Inc.」和「IBM日本」等。此外,我有一些字母數字的產品名稱,如「A46-Rhizonme Pentahol」,其中僅SOUNDEX無法處理。 我可以通過讓所有的數據輸入都

    3熱度

    1回答

    我正在嘗試使用Levenshtein距離函數來比較目錄中所有其他文檔中指定文檔的文本。 我有一個基本的想法,但我不知道如何在PHP中編寫代碼。我來自C#背景,所以我會盡可能詳細地提供。 class ComputeLevenshtein { public $filePathList = new Array(); //The array that stores the absolute p

    3熱度

    1回答

    所以,我從這開始:http://en.wikibooks.org/wiki/Algorithm_Implementation/Strings/Levenshtein_distance#Ruby 這對於真正的小字符串非常適用。但是,我的字符串長度可能超過10,000個字符,並且由於Levenshtein距離是遞歸的,所以在我的Ruby on Rails應用程序中會導致堆棧太深的錯誤。 那麼,是否還有

    2熱度

    4回答

    這不是一個家庭作業;我試圖簡化和增強用C#/ Winform/Sql Server 2008編寫的現有笨重的GUI界面。如果你能夠獲取特定於這些技術的東西,這將是很酷的,但如果你能指向我其他的東西,比如Java/MySql解決方案,那麼我也會很高興。 類似的問題已經被問,但問題/答案是沒有,因爲我追求的先進:Given a list of words - what would be a good

    2熱度

    1回答

    我想要一個高效或合理的算法來獲取用戶提交的測試結果,並將它們與幾個配置文件的值進行比較以找到匹配網上約會服務如何與適合的伴侶的答案相匹配)。 我真的不知道如何去做這件事。如果用戶回答10個有關自己的問題,並且有10個候選人與他匹配,則我們正在通過數據庫查看數千個比較結果。必須有更好的方法來做到這一點。 在我所做的研究中,也許我可以用Levenshtein距離函數來完成這項工作,但我不知道該怎麼做,

    7熱度

    2回答

    給出2個字符串s和t。我需要找到s編輯距離(Levenshtein距離)到t的每個子串。實際上我需要知道s中每個i位置對於從位置i開始的所有子串的最小編輯距離是多少。 例如: t = "ab" s = "sdabcb" 我需要得到類似的東西: {2,1,0,2,2} 說明: 1st position: distance("ab", "sd") = 4 (2*subst) distanc

    4熱度

    1回答

    我對如何完成此任務沒有想法。我正在計算單詞的頻率,實際上是單詞的基本形式(例如,跑步將被計爲跑步)。我查閱了一些Levenshtein距離的實現(我遇到的一個實現是from dotnerperls)。 我也嘗試了雙倍的Metaphone,但它不是我想要的。 所以,請給我如何在分類語言類似的話,因爲算法調整Levenshtein距離算法的一些想法只是確定需要不考慮,如果他們是語言類似的編輯次數或不

    14熱度

    1回答

    我正在做排序算法的一些研究,並希望給定一個排序列表和排列該列表的一些排列,計算兩個排列之間的距離。對於Levenshtein距離的情況,這對應於計算序列與該序列的分類副本之間的距離。例如,還有「反轉距離」,其中的線性時間算法詳述於here,我正在努力實施。 有誰知道現有的python反演距離的實現和/或Levenshtein距離的優化嗎?我計算大約50,000到200,000個元素的序列,所以O(

    6熱度

    2回答

    我有一個mySQL表,人們添加他們的名字和他們的興趣。我想要使​​用某種詞彙匹配,並找到100%匹配或近似匹配。我聽說了levenshtein的距離,但不知道如何讓它在我的桌子上循環。 $input = $_POST["interest"]; $result = mysql_query("SELECT interest_desc FROM interests"); 做了一些谷歌上搜索