假設我們有10000個文本文件,我們想分類爲政治,健康,天氣,體育,科學,教育......... 我需要培訓數據集用於文本文檔的分類,我是樸素貝葉斯分類算法。任何人都可以幫助獲取數據集。 或 是否有任何其他方法可以完成分類......我是機器學習新手請完整解釋您的答案。培訓和測試分類文本文件的數據集
實施例:
**Sentence** **Output**
1)奧巴馬贏得大選。 ----------------------------------------------->政治
2)印度贏了10個門票---------------------------------------- ------>運動
3)菸草更危險-------------------------------- ------------->健康
4)牛頓運動定律可以應用到汽車-------------->科學
任何方式將這些句子分類到各自的類別
歡迎來到StackOverflow。請閱讀並遵守幫助文檔中的發佈準則。 [主題](http://stackoverflow.com/help/on-topic)適用於此處。 – Prune