0
A
回答
2
您可以通過在Reuters
應用也可以得到Technion工業文本庫TechnionRepo
1
如果您正在構建實時文本分類系統得到了路透社語料庫,你會已經有一個語料庫的文件。任何分類器中的假設之一是,訓練數據&測試數據是相似的或來自相同的分佈。 如果您只是在此區域探索或建造樣本用具,那麼可能此鏈接可能有助於獲取一些列車數據。
相關問題
- 1. 如何在MATLAB中訓練大數據集以進行分類
- 2. 適合Java中的文本分類的訓練數據集
- 3. 基於訓練集的數據分類
- 4. 如何在apache模型訓練後對新的訓練樣例進行分類?
- 5. NLTK使用訓練分類
- 6. Tensorflow分類圖像訓練
- 7. 訓練分類模型Opennlp
- 8. 是否需要對SVM多分類的訓練數據進行混洗?
- 9. 訓練數據集
- 10. Tesseract訓練數據
- 11. 當根據訓練集訓練分類器時,如果某些訓練樣本比其他訓練樣本更值錢(更有價值),我該怎麼辦?
- 12. 將分區數據集拆分爲訓練和測試(訓練數據每個類有200個示例)
- 13. 用於二進制分類的訓練多級分類器
- 14. Java SVM文本分類,訓練和測試文件?
- 15. 手寫文本訓練tesseract
- 16. 分割訓練數據以訓練n個模型的最佳數量
- 17. opennlp疾病樣本訓練數據
- 18. Tensorflow python分類訓練與子類別
- 19. OpenCV:lbp級聯的行人訓練數據
- 20. 如何在沒有培訓數據時對聊天文本進行分類?
- 21. 如何使用Weka中新近訓練的NaiveBayes分類器對未標記的數據集進行分類
- 22. 生成keras訓練數據
- 23. FANN訓練數據集
- 24. 在weka分類器中縮放訓練數據
- 25. 貝葉斯分類器的訓練數據大小
- 26. Encog計算/分類錯誤的訓練數據
- 27. 準備一個多標記分類的訓練數據集
- 28. mahout分類器訓練數據的預處理
- 29. 如何使用視頻數據集訓練分類器
- 30. 尋找開源文本分類實現