aho-corasick

    1熱度

    1回答

    我有這個exercice一個問題: 給定一個範圍A和1 <= A,B <= 10^18 和表示子Ni與1 <= i <= 1000一些整數到乙; 返回可能數目的總數的範圍內A,B之間(包括甲和乙)包含任何給定的子串。 輸入 A, B, i N1 N2 ... Ni 例如: 簡單輸入 10 22 2 1 10 簡單輸出 11 說明:10至22包含以下的數字的範圍內,10* 1

    2熱度

    2回答

    我正在使用Aho-Corasick文本匹配,並想知道它是否可以更改爲匹配條款而不是字符。換句話說,我希望條款成爲匹配的基礎而不是角色。舉個例子: 搜索查詢: 「他」, 一句話: 「世界,你好」, 阿霍Corasick將匹配 「他」 來了一句 「Hello World」 的索引2結束,但我寧願沒有匹配。所以,我的意思是用「術語」而不是字符。

    1熱度

    1回答

    我有一個名單上有數百萬名着名人物(來自維基數據),我需要創建一個系統,以相當短的文本有效地找到所有人提到的:它可以只是一個詞(例如「愛因斯坦」)到幾頁文字(例如維基百科頁面)。我需要系統對拼寫錯誤(比如邁克爾傑克遜而不是邁克爾傑克遜)和短格式(例如M.傑克遜)相當寬容。如果含糊不清,它應該返回所有可能的人(例如,「喬治布什」應該返回父親和兒子,以及可能的其他同名詞)。 這個related ques

    1熱度

    1回答

    如果是這樣,有人可以解釋後綴樹中的後綴鏈接的目的是爲了確切的字符串匹配嗎?

    -1熱度

    1回答

    請幫我找到這段代碼中的錯誤。我寫了一個簡單的程序,它通過Aho-Corasick算法將n個字符串添加到trie中,但它不能正常工作。輸入字符串後崩潰了。出什麼問題了用這個代碼? #include <cstdlib> #include <iostream> #include <vector> #define ALPHABET 26 using namespace std; struct

    2熱度

    1回答

    我有Aho-Corasick算法的代碼。但是當在給定的字符串列表中搜索文本時,我仍然不明白如何在查找過程中使用狀態信息。 例如我有一個字符串列表[MOSCOW][COLA],現在我需要確定CA是否在列表中,如果是,它的位置是什麼? 這是link to the code。

    1熱度

    1回答

    我在這裏得到了aho-corasick算法的代碼:http://www.komodia.com/aho-corasick。 我用它作爲指南說,添加線條並構建樹。 但是我改變它從使用std wstring到std字符串,但這應該不重要。我只是改變了typedef。 當我使用它並搜索某些東西時,如果找不到結果就沒有問題。當找到結果時,我會得到一個標準超出範圍的異常。 它崩潰的位置: if (aIte

    2熱度

    1回答

    請幫助我瞭解Aho-Corasick算法中多個模式的狀態轉換表的構造。 請給我一個簡單而詳細的解釋,以便我能理解。 我跟着this紙和here是這樣的動畫。 謝謝。用一個例子 Starting at the root, follow the path labeled by chars of Pi If the path ends before Pi, continue it by ad

    10熱度

    1回答

    我在理解Haskell中的Knuth-Morris-Pratt算法的實現方面遇到困難。 http://twanvl.nl/blog/haskell/Knuth-Morris-Pratt-in-Haskell 我特別不理解自動機的建設。我知道它使用「綁結」方法來構建它,但我不清楚,我也不知道爲什麼它應該具有正確的複雜性。 我想知道的另一件事是,你是否認爲這個實現可以很容易地推廣到實現Aho-Cora

    4熱度

    2回答

    最近我想用python2.7.5在centos5.8_x64中使用ahocorasick,但是我發現結果不正常,那麼請您告訴我原因嗎?我發現模塊運行完全在我的Windows 7與python2.7.5.Here是我的測試代碼,並在Linux中的結果。 >>> import ahocorasick >>> tree=ahocorasick.KeywordTree() >>> tree.add("