我正在使用Apache OpenNLP進行Yammer對話情緒分析。這裏的想法是將每次談話分類爲積極,消極或中性的情緒。對話可以是單個句子或一組句子。使用OpenNLP進行情緒分析
我有2個模型 - 短句分類模型和長句分類模型。短句子分類模型與較短的句子(少於10個字)爲2的截止和長句分類模型進行訓練較長的句子用5
這裏的截止訓練有素的是我的做法
- 閱讀每個對話。
- 清理它以刪除HTTP URL,特殊字符,在點等後添加空格。
- 使用SentenceDetector將對話拆分爲句子。
- 對於每個句子調用分類。如果句子短,則稱短句分類模型,否則稱爲長句分類模型。句子分類的輸出爲正,負或中性
- 總結句子分類的結果。即如果發現更積極的句子,則將對話分類爲積極的,否則相應爲否定的。
我有幾個與此相關的方法
- 做題,我需要兩個模型短短的一句話模型和長句模型。我決定這樣做的原因是因爲短句和長句的截尾不同。
- 可以遵循基於句子的分類模型,然後總結每個句子的結果以獲得對話結果。
- 是否有這個問題