這與stackoverflow上的絕大多數問題有點不同(是的,我花時間搜索和閱讀),所以請耐心等待。Trie?在python中匹配帶尾字符的單詞
我有文字A,如:allow *,apolog *等。總共有成千上萬的這樣的條目。而且我有文件B包含一個文本的主體,與成千上萬的單詞。我希望能夠在FILE A.
例匹配的話在我的文字的話在文件B:
文件B的 「道歉」 將匹配文件中的 「apolog *」
文件B的「一個」既不匹配‘允許*’,也不是‘apolog *’
文件B的‘apologizetomenoworelseiwillkillyou’也將匹配文件的‘apolog *’
任何人都可以建議的算法/數據結構(即最好是DO-能夠在Python中),這可以幫助我實現這是什麼?我研究過的這些嘗試似乎更多地將匹配前綴到整個單詞,但在這裏,我將整個單詞匹配到前綴。因爲它們有固定的規則,所以干擾算法不存在問題,而在這種情況下,我的後綴可以是任何東西。我不想遍歷FILE A中的整個列表,因爲這需要太多時間。
如果這很混亂,我很樂意澄清。謝謝。
我不想通過文件 我的整個列表,如果你不重複throught您的文件進行迭代,你怎麼知道這個詞在文件B將匹配? – HVNSweeting 2012-08-03 05:14:49