如何設置參數 - setRAMBufferSizeMB?取決於機器的RAM大小?或需要被索引的數據的大小?還是其他參數?有人可能會建議一種方法來決定setRAMBufferSizeMB的值。配置Lucene索引寫入器,控制段形成(setRAMBufferSizeMB)
0
A
回答
0
所以,我們對這個參數在Lucene的的javadoc:
確定可用於緩衝加入 文件和刪除它們被刷新到該目錄之前的RAM容量。 通常,爲了加快索引性能,最好使用RAM 而不是文檔計數,並使用與您的 一樣大的RAM緩衝區。設置此項時,只要緩衝區 文檔和刪除使用了這麼多的RAM,寫入器就會刷新。
最大內存限制是由JVM可用的內存決定的。然而,IndexWriter會話會消耗比給定的RAM限制大得多的內存量,因爲當將內存駐留文檔刷新到目錄時,此限制僅僅是 指示符。 沖洗可能會同時發生,而其他線程將 文檔添加到作者。爲了應用程序的穩定性,JVM中可用的內存應該明顯大於用於索引的RAM緩衝區 。
默認情況下,Lucene使用16 Mb作爲這個參數(這對我來說是指示,你不應該有那麼大的參數纔能有很好的索引速度)。我建議你通過設置它來調整這個參數,讓我們說500 Mb並檢查你的系統表現如何。如果你會崩潰,你可以嘗試一些像200 Mb等較小的值,直到你的系統穩定。
是的,正如它在javadoc中說的那樣,這個參數取決於JVM堆,但對於Python來說,我認爲它可以沒有任何限制地分配內存。
相關問題
- 1. 同時寫入Lucene索引
- 2. lucene索引匹配
- 3. 設置lucene字段的索引屬性?
- 4. Lucene索引複製
- 5. 索引字段的Lucene 4.2分析器
- 6. Lucene多值字段索引
- 7. 寫入後優化lucene索引是否是強制性的?
- 8. Sitecore 6.6 - 設置Lucene索引
- 9. 笨負載的captcha控制器插入索引控制器
- 10. Lucene索引字段不可搜索
- 11. Lucene自動索引器
- 12. NoMethodError在控制器#索引
- 13. 搜索Lucene索引
- 14. 搜索Lucene索引
- 15. Lucene索引搜索
- 16. 如何使lucene索引字段不區分大小寫
- 17. Apache lucene索引
- 18. Zend Lucene索引
- 19. Lucene索引
- 20. Jackrabbit Lucene索引
- 21. Lucene索引MAXFieldLength
- 22. Lucene索引
- 23. 顯示Lucene/Elasticsearch索引的字段
- 24. Lucene索引段文件沒有找到
- 25. 從lucene索引獲取字段標記
- 26. Lucene的通配符施加到索引字段
- 27. Xamarin形成控制庫引用錯誤
- 28. Lucene:通配符缺少索引
- 29. 從Lucene索引中提取搭配詞
- 30. 線程安全寫入Lucene索引文件