我正在使用Python腳本,在其中我想刪除像「the」,「an」,「and」,「for」等常見英語單詞以及更多來自串。目前我所做的是我製作了所有這些單詞的本地列表,我只需撥打remove()
即可將它們從字符串中刪除。但我想在這裏採用一些pythonish的方式來實現這一點。已閱讀關於nltk和wordnet,但完全無能爲力,這是我應該使用和如何使用它。提取非內容英語單詞字符串 - python
編輯
好吧,我不明白爲什麼被標記爲重複我的問題不以任何方式意味着我知道停止的話,現在我只是想知道如何使用它... ..問題是關於我可以在我的場景中使用什麼,並回答這是停止詞......但是當我發佈這個問題時,我不知道任何關於停用詞的事情。
尋找「停止詞刪除」許多其他的包......和你的基本方法是不是錯了... – dsign
停用詞可能是在我的場景中很有用...現在正在搜索... thnx ...有任何鏈接停止單詞教程。 –
沒有教程對不起......但你在做什麼是正確的。只需獲取一長串停用詞,然後使用正則表達式模塊來替換空字符串的停用詞。 – dsign