1
Q
信息檢索系統
A
回答
2
主要區別在於,在二元獨立模型中,不知道一個單詞有多重要,並且所有單詞都被視爲相同。但是使用TF-IDF加權詞將給予在一個文檔中使用得更多,文檔頻率更少的詞更好的分數。
2
你是對的。 Binary Independence Model假設是文檔是二元向量。也就是說,只記錄文件中是否存在術語。另一方面,根據Vector Space Model,文檔由術語權重向量表示,並且TF-IDF僅僅是表示術語權重的一種方式。
相關問題
- 1. Jacob - 檢索系統還原信息(Java)
- 2. 檢索系統和操作系統信息
- 3. 檢索聯繫信息
- 4. 信息系統
- 5. Laravel系統信息
- 6. 從ActiveMQ中檢索統計信息
- 7. 任何方式通過鉻擴展檢索系統信息?
- 8. 檢索系統信息的文檔化方法
- 9. 使用Java檢索遠程系統信息
- 10. 如何在java中檢索有用的系統信息?
- 11. 爲什麼檢索系統信息返回異常的零點?
- 12. 檢索信息
- 13. 麻煩檢索聯繫人信息
- 14. 捕獲系統信息
- 15. 系統信息與DOS
- 16. Sys系統::信息 - 問題
- 17. 信息系統設計
- 18. 查找系統信息
- 19. Visual Basic系統信息
- 20. 創建信息系統圖
- 21. 在線信息系統
- 22. 批量系統信息?
- 23. 檢索DLL信息
- 24. ADHoc信息檢索
- 25. Hadoop文件系統統計信息(FileSystem.Statistics)
- 26. Python收集系統統計信息
- 27. 檢索手機信息塔信息
- 28. Git將本地系統信息庫推送到本地系統信息庫(Windows)
- 29. 如何檢測系統信息,如操作系統或設備類型
- 30. 檢索系統日誌C#
你是對的...... tf-idf是ad-hoc ......概率分析確定了爲什麼像tf-idf這樣的函數應該能夠很好地工作...... – Debasis