我知道lucene創建索引並存儲所有數據。任何一個人都可以告訴我數據如何存儲在平面文件中?或者他們使用什麼樣的算法將數據存儲在後端,以便他們可以快速檢索數據?lucene中如何存儲數據
12
A
回答
4
你可以閱讀這本書http://nlp.stanford.edu/IR-book/瞭解信息檢索系統中使用
4
你可以找到所有在file formats部分解釋了數據結構,算法和模型。
8
不知道這是你所要求的。但更一般的答案是他們使用/實現了一個Inverted Index。關於Lucene如何存儲它的具體細節,你可以在file formats(如米蘭說的)中找到。
但一般的想法是,他們存儲倒轉索引數據結構和其他輔助數據結構,以幫助快速回答查詢。例如,它爲每個文檔和每個詞的IDF存儲一個規範向量(inverse document frequency)。 Lucene也存儲實際的文檔字段,但是這在反轉索引之外。
相關問題
- 1. Lucene作爲數據存儲
- 2. Lucene如何緩存數據?
- 3. 如何在Lucene中訪問存儲的提交數據
- 4. Lucene存儲的數據類型
- 5. 如何將樹數據存儲在Lucene/Solr/Elasticsearch索引或NoSQL數據庫中?
- 6. 如何與Lucene存儲值對
- 7. Lucene:如何存儲文件內容?
- 8. 如何查詢整數,浮動在lucene和如何存儲(NumericComparator)?
- 9. 將用戶數據存儲在lucene中或查詢rdbms?
- 10. 在lucene中存儲非索引二進制數據
- 11. 在數據庫中存儲lucene索引時異常
- 12. 在數據庫或Lucene索引文件中存儲字段
- 13. 存儲在數據庫中的lucene索引使用java中的數據對象
- 14. Python:如何在Google App Engine數據存儲中存儲數組
- 15. 如何將數據存儲爲本地存儲中的數組?
- 16. 如何存儲MongoDB數據
- 17. Bukkit如何存儲數據
- 18. redis如何存儲數據
- 19. 如何存儲Json數據
- 20. HDR數據如何存儲?
- 21. MySQL如何存儲數據
- 22. 如何將數據存儲在存儲器或寄存器中
- 23. 如何將數據存儲到數據存儲 - AppEngine
- 24. Solr的存儲和索引字段如何存儲在內部(在Lucene中)
- 25. 數據如何存儲/我們如何獲取存儲在unordered_map存儲桶中的數據11
- 26. 如何在項目中存儲數據
- 27. 如何在MVC4中存儲大數據
- 28. 如何將數據存儲在xml中?
- 29. 如何將數據存儲在jquery中
- 30. 如何在Suave userstate中存儲數據?
這是一本很好的入門級書籍,但它與這個問題有點不相關,仍然是一個很好的參考。 – linjunhalida 2013-10-21 12:53:51
另外還有一本很棒的信息檢索書,它現在提供免費內容:https://ciir.cs.umass.edu/irbook/ – realjin 2016-12-26 01:35:19