所以我有大約1萬行的csv格式的twitter評論數據。我需要按照某些類別對其進行分類,例如「產品壽命」,「廉價/昂貴」,「折扣/折扣」等。預分類訓練的推特評論分類
正如您所看到的,我有多個類來分類這些推文數據進入。 問題是,我怎麼才能爲如此龐大的數據生成/創建培訓數據呢.Silly問題,但我想知道是否已經預分類/標記的評論數據來訓練我們的模型?如果不是,那麼創建用於文本/評論的多級分類的培訓數據的最佳方法是什麼?
雖然我已經嘗試並測試了NaiveBayes對於較小數據集的情感分類,但是能否請您建議我應該使用哪個分類器來解決此問題(多個類別將註釋分類)。
謝謝!
當你發佈兩次相同的問題時,你不會得到很好的處理=(請參閱http://stackoverflow.com/help/how-to-ask – alvas 2014-10-06 10:11:43
很抱歉,但是一旦我發佈了3個問題然後我不得不單獨發佈他們作爲三個職位,而背景是相同的所有這些。這就是爲什麼我發佈相同的數據的另一個方面作爲一個單獨的問題 – shalini 2014-10-06 10:42:49