1
我會問的聽起來可能聽起來非常類似於帖子Sentiment analysis with NLTK python for sentences using sample data or webservice?,但我完成了從文本解析和標記句子。我的問題是從自己的文本數據使用NLTK的情緒分類
- 無論例子到現在我在NLTK電影評論例子已經看到似乎是最類似於我的問題,但對於movie_review訓練文本已經是一種形式,因爲它有兩個文件夾的POS和NEG和文本存儲在那裏。我如何爲我的巨大文本做這種分類,手動讀取數據並將它們存儲到兩個文件夾中。這是否構成語料庫?之後,我可以像在movie_review數據中一樣使用它們嗎?
2.如果對上述問題的回答是肯定的,有沒有辦法通過任何工具來加速該任務。例如,我只想處理那裏有「Monty Python」文本的文本。然後我手動對它們進行分類,然後將它們存儲在pos和neg文件夾中。那樣有用嗎?
請幫我
創建兩個關鍵字列表意味着我必須爲正負關鍵字保存兩個列表?但我想標記正面或負面的文檔。那可能嗎? –
帶有2個關鍵字列表的想法是,您可以使用這些來自動標記文檔,而不是手動進行 – Jacob