我想結合lucene得分與PageRank,我試圖修改DefaulySimilarity來添加我已經擁有的PageRank(在與相應的URL的數組中),但問題是我不知道如何獲取文檔字段存儲文檔的URL。術語Doc只能返回docID。或者我還有一個想法是修改TopScoreDocCollector,它有一個名爲collect(int docid)的方法,也給了一個docid,但我仍然不知道如何獲取存儲的字段。任何人都知道如何通過文檔ID獲取文檔的存儲區域?或者瞭解如何將lucene與PageRank結合起來?非常感謝你。如何通過lucene中的文檔ID獲取文檔的存儲字段?
2
A
回答
2
要通過內部Lucene ID獲取Lucene中存儲字段的值,請使用IndexReader.document(int n)。如果您擁有自己的UID索引,則需要按該術語進行搜索,獲取Lucene ID,然後調用IndexReader.document(int n)。
您是否試圖計算飛行中的PageRank?如果你是,那對我來說似乎很瘋狂。通常,PageRank是一個運行的批處理過程,爲每個文檔分配的靜態PageRank得分在索引時間內作爲提升添加。
相關問題
- 1. SOLR模式 - 存儲文檔Id字段。在Lucene索引文件
- 2. 獲取文檔ID在Lucene的
- 3. 如何在Lucene 6中獲取文檔的字段規範?
- 4. 通過mongoengine從文檔獲取字段
- 5. 如何在Lucene中獲取文檔術語矢量的文檔ID
- 6. Lucene:通過文檔ID篩選查詢
- 7. 通過多個ID獲取文檔
- 8. 如何獲取文檔的_version字段?
- 9. 通過Lucene中的數值字段查找文檔
- 10. CouchDB Map函數 - 如何通過文檔ID獲取其他文檔的數據
- 11. couchdb如何通過地圖功能中的id獲取文檔
- 12. 如何通過lucene文檔迭代和更新文檔?
- 13. 通過查詢未分析文本字段刪除Lucene文檔
- 14. 如何讀取不存儲在Lucene的文檔,但索引
- 15. 獲取文檔ID
- 16. Dom文檔 - 提取文檔ID&保存
- 17. 如何在elasticsearch rails中通過ID獲取文檔
- 18. 如何通過uuid獲取文檔
- 19. 如何通過ipworks獲取文檔
- 20. 獲取未保存文檔的URL或文檔ID
- 21. 在Lucene文檔中添加字段
- 22. 如何在CustomScoreProvider中獲取文檔ID?
- 23. Lucene:如何獲得文檔的分數
- 24. 獲取Lucene的n個最新文檔
- 25. 如何在Lucene中存儲多個不同類型的文檔
- 26. 如何通過文檔ID下載文檔
- 27. Umbraco 7 + Razor:如何通過ID獲取文檔/節點?
- 28. 如何按字段ID分割文檔?
- 29. 如何通過ID刪除BongoDB文檔?
- 30. 如何通過解析文檔ID