2010-10-07 38 views
4

我有一個有點大的文檔,想要停止詞消除,並用Python語言來描述這個文檔的詞彙。有沒有人知道這些的貨架包裝? 如果沒有足夠快的大型文檔代碼也是值得歡迎的。 謝謝Python中的停止詞消除和詞幹分析器

回答

8

NLTK支持這一點。

+0

是的,使用NLTK。它是開源的,可在Windows,Mac和Linux上運行。 – 2010-10-07 15:16:12

4

如果由於某種原因你不想使用NLTK,你可以嘗試PyStemmer。對於停止詞只是下載一個列表(谷歌它)和過濾出來。