2016-05-17 73 views
1

在拼寫錯誤檢測任務中,我使用marisa_tries數據結構用於Python 3.5的詞典。將元素添加到Marisa Trie中

短缺問題
如何在marisa_trie添加一個元素?

語境
的想法是:如果一個詞在我的詞典中,那麼它是正確的。現在,如果它不在我的詞典中,可能是不正確的。但是,我計算了整個文檔中的單詞頻率,如果單詞頻率足夠高,我想保存這個單詞,因爲它足夠頻繁,所以可能是正確的。 在這種情況下,如何將這個新詞添加到我的marisa_trie.Trie詞庫中? (不必每次都建立新的樹)?

謝謝:)

回答

2

marisa_trie.Trie實現了一個不變的線索,所以回答你的問題是:這是不可能的。

您可能想要嘗試一種名爲datrie的類似Python程序包,它支持修改和相對較快的查詢(PyPI頁面列出了針對內建的dict的一些基準)。

+0

謝謝你的回答。我會看看'datrie' :) – Arnaud