-2
我需要建立一個分類器,將任何推特字符串分類到一個特定的類別。我有大約15個左右的類別。我有我的訓練數據集。任何想法我應該如何繼續這個?爲此使用Python或Java。建立一個文本分類器
我一直在研究Textblob和Stanford NLP分類器。我只是不確定選擇哪一個來獲得更好的結果。
我需要建立一個分類器,將任何推特字符串分類到一個特定的類別。我有大約15個左右的類別。我有我的訓練數據集。任何想法我應該如何繼續這個?爲此使用Python或Java。建立一個文本分類器
我一直在研究Textblob和Stanford NLP分類器。我只是不確定選擇哪一個來獲得更好的結果。
我喜歡在Python中使用scikit-learn進行有監督的機器學習。 http://scikit-learn.org/stable/。
對於Java,您可能會考慮DKPro https://dkpro.github.io/,因爲他們利用現有的工具包來處理各種NLP任務。
最後,無論您使用哪種工具包,您都可以考慮是否可以使用TweetNLP http://www.ark.cs.cmu.edu/TweetNLP/作爲POS標記組件。
祝你好運!