Q

信息檢索系統

information-retrieval

2017-02-02 202 views 1 likes

1

文件TF-IDF排名與排名的二元獨立模型有什麼區別？我無法區分它們。信息檢索系統

我認爲二進制獨立模型的實際實現導致了TF-IDF。如果我錯了，請幫助我。

2017-02-02 Shivanisrivarshini

+0

你是對的...... tf-idf是ad-hoc ......概率分析確定了爲什麼像tf-idf這樣的函數應該能夠很好地工作...... – Debasis

A

回答

2

主要區別在於，在二元獨立模型中，不知道一個單詞有多重要，並且所有單詞都被視爲相同。但是使用TF-IDF加權詞將給予在一個文檔中使用得更多，文檔頻率更少的詞更好的分數。

2017-02-04 10:20:49 Alikbar

2

你是對的。 Binary Independence Model假設是文檔是二元向量。也就是說，只記錄文件中是否存在術語。另一方面，根據Vector Space Model，文檔由術語權重向量表示，並且TF-IDF僅僅是表示術語權重的一種方式。

2017-02-02 22:27:36

相關問題

11. 爲什麼檢索系統信息返回異常的零點？
12. 檢索信息
13. 麻煩檢索聯繫人信息
14. 捕獲系統信息
15. 系統信息與DOS
16. Sys系統::信息 - 問題
17. 信息系統設計
18. 查找系統信息
19. Visual Basic系統信息
20. 創建信息系統圖
21. 在線信息系統
22. 批量系統信息？
23. 檢索DLL信息
24. ADHoc信息檢索
25. Hadoop文件系統統計信息（FileSystem.Statistics）
26. Python收集系統統計信息
27. 檢索手機信息塔信息
28. Git將本地系統信息庫推送到本地系統信息庫（Windows）
29. 如何檢測系統信息，如操作系統或設備類型
30. 檢索系統日誌C＃