levenshtein-distance

    2熱度

    1回答

    是否存在用於在圖中搜索結構的levenshtein距離的泛化?

    3熱度

    1回答

    我有一個在線Web應用程序,帶有頂部菜單樹,用於打開用於執行不同任務的不同小部件。隨着應用程序越來越強大,該樹已變得龐大且難以導航。我實現了一個搜索功能,用戶只需鍵入菜單名稱或其中的一部分,然後使用正則表達式查找菜單樹中與用戶輸入內容相匹配的所有項目。我的正則表達式允許部分單詞和交換單詞,也限制搜索到每個單詞的開頭。它不允許的一件事是拼寫錯誤的單詞。我明白,爲了允許拼寫錯誤的單詞,最好不要使用正則

    1熱度

    3回答

    昨天我有一個question人們建議我用Levenshtein的方法。這是一個緩慢的查詢?也許我可以使用別的東西?

    2熱度

    2回答

    我有一個用戶上傳文章的數據庫。 我想製作一個算法,根據用戶閱讀的內容,我的網頁應用會顯示類似的文字。 我看到一些例子,如Levenshtein distance。但是這些算法測量字符串的距離而不是整篇文章。有沒有辦法從文本中提取最重要的關鍵字?當然,我知道「最重要的」是一個含糊的術語。 其他網站如何管理它? 非常感謝

    9熱度

    3回答

    我正在尋找PHP的Damerau–Levenshtein算法的實現,但似乎我找不到任何與我的朋友谷歌。到目前爲止,我必須使用PHP實現的Levenshtein(沒有Damerau轉置,這非常重要),或者獲取原始源代碼(使用C,C++,C#,Perl)並將其寫入(轉換)到PHP。 有沒有人有任何PHP實現的知識? 我在企業內部網上使用soundex和double metaphone作爲「您的意思是:

    21熱度

    3回答

    是否有包含Levenshtein距離計數功能的軟件包,該軟件以C或Fortran代碼實現?我有很多字符串來比較和stringMatch從MiscPsycho是太慢了。

    3熱度

    3回答

    我有一長串單詞,我把它放入一個非常簡單的SOLR/Lucene數據庫中。我的目標是從列表中找出單詞查詢中的「相似」單詞,其中'相似性'具體理解爲(damerau)levensthein編輯距離。我瞭解SOLR爲拼寫建議提供了這樣的距離。在我SOLR schema.xml ,我已經配置了一個字段類型string: <fieldType name="string" class="solr.StrFie

    2熱度

    1回答

    <tl;dr> 在源代碼版本控制diff補丁生成中,在我的Ruby diff實現補丁的diff實現中,使用在本文最底部列出的優化(請參閱<optimizations>)是否值得? </tl;dr> <introduction> 我編程的東西我從來沒有做過,有可能已經有工具,在那裏做我編程確切的事情,但在這一點上,我有太多的樂趣去關心,所以我仍然會從頭開始,即使有這樣的工具。 因此,無論如何,我正在

    3熱度

    1回答

    我想寫一個免費的文本搜索算法,以找到牆上的特定帖子(與Facebook使用類似類型的牆壁)。用戶假設能夠在搜索字段中寫入一些單詞並獲得包含該單詞的帖子的命中;根據比賽得分,最佳匹配在最上面,然後其他帖子按降序排列。 我使用編輯距離(Levenshtein)「e(x,y)= e」來計算每個帖子與查詢詞「x」和帖子詞「y」相比的得分,根據:score (x,y)= 2 ^(2-e)(1-min(e,|

    3熱度

    2回答

    我們最近在工作中遇到了一個有趣的問題,我們在數據庫中發現了重複的用戶提交的數據。我們意識到大部分數據之間的Levenshtein距離僅僅是兩個字符串之間的差異。這表明如果我們只是將一個字符串中的字符添加到另一個字符串中,那麼我們最終會得到相同的字符串,並且對於大多數情況來說,這似乎是我們解釋重複項目的最佳方式。 我們也想解釋拼寫錯誤。所以我們開始平均考慮人們每個字每次在網上打字錯誤的次數,並嘗試在