1)我想對Twitter推文進行情緒分析。所以,我選擇使用datumbox-framework。我很懷疑我的訓練樣本的大小應該是多少? &如果我正在收集正面,負面,中性的訓練樣本,我是否應該爲所有訓練示例保持相同的大小? (即我可以收集10位,5位,15位中性作爲我的訓練集,或者我應該在我的訓練集中收集並保持相同大小pos = 10; neg = 10; neutral = 10的所有pos,neg,neutral)算法我用於twitter的情緒。 是海軍貝葉斯。機器學習訓練數據集的大小應該是多少?
2)訓練數據集是否有任何大小限制?
我可以知道爲什麼我的問題已經放棄投票的原因嗎? –
它可能已經被低估了,因爲它可能導致基於意見的答案。 –