1
A
回答
5
常見的選擇是監督文檔分類的袋子文字(或袋克朗克)功能,最好與tf-idf權重。
流行的算法包括樸素貝葉斯和(線性)SVM。
對於這種方法,您需要標註培訓數據,即註釋了相關主題的文檔。
參見例如Introduction to Information Retrieval,第13-15章。
相關問題
- 1. 算法來確定網格兩個數字是否爲相鄰
- 2. 查找與主題相關的所有文本段落
- 3. 關於與迴文相關的算法
- 4. 確定數據是否與R有關
- 5. 獲取與主div(包含所有文本)相關的選定文本範圍
- 6. 有關正則表達式算法的問題(不一定與預期相關)
- 7. scalacheck非確定性方法是否有問題?
- 8. 如何確定尺寸是否相關?
- 9. 期限相關性算法
- 10. 確定NSManagedObject相關屬性對象是否存在的最佳方法
- 11. 計算文本文件中的一致性和相關性
- 12. 是否有可用於測試Unicode相關算法的測試?
- 13. 確定所有軟件包相關性的最小R版本
- 14. 是否有Java方法來確定是否單擊JButton?
- 15. 是否有Linq操作來確定集合中是否有一組屬性具有相同值的項目?
- 16. 有關位相關主題的測驗
- 17. 主題:主題相關drawable?
- 18. 是否有與分區或永久性相關的壞塊?
- 19. 如何決定(以編程方式)網頁是否與特定主題有關?
- 20. 確定兩個類中的所有屬性是否相等
- 21. opencv Sobel算子是否計算相關性?
- 22. 找到兩個文本主體的「相關性」有哪些好方法?
- 23. 確定兩個方法是否具有相同的基本定義
- 24. 確定文本寬度的算法
- 25. 有沒有一種方法來確定一個文檔是否是一個文本句子文件?
- 26. 與計算器相關的問題
- 27. 算法來確定正確的除數
- 28. iOS:確定相冊中的照片是否來自相機
- 29. 如何有效地確定兩個表是否相關?
- 30. 確定文本正文中最相關的關鍵字