什麼是分割現有的Lucene索引分爲兩半,即每個分割應該包含一半的文檔總數的原指數分裂Lucene索引分爲兩半
1
A
回答
3
拆分現有的索引(不重建索引的所有文件)最簡單的方法是:
- 製作現有指數的另一個副本(即CP -r myindex mycopy)
- 打開的第一個索引和刪除一半的文檔(範圍爲0〜maxDoc/2)
- 打開第二索引,並刪除其他半(範圍maxDoc/2到maxDoc)
- 優化兩個指數
這可能不是最有效的方法,但它只需很少的編碼就可以完成。
1
一個相當穩健的機制就是用最好的方式以文件的校驗和爲模數,索引的數量來決定它將進入哪個索引。
1
最近的Lucene版本有一個專門的工具來執行此操作(在contrib/misc下有IndexSplitter
和MultiPassIndexSplitter
)。
相關問題
- 1. 分裂陣列分爲兩個部分
- 2. Python列表索引分裂和操縱
- 3. Subtring和子字符串索引分裂成兩個整數
- 4. 分析器用於創建Lucene索引
- 5. 如何在lucene中劃分索引?
- 6. 索引字段的Lucene 4.2分析器
- 7. 分裂爲preg_split
- 8. xml分成兩半
- 9. 分裂時跳過一半的內容@
- 10. Unix的分裂1個欄爲兩列
- 11. 俄羅斯劇情分裂爲兩個
- 12. 按多個索引編號的分區Lucene索引
- 13. 拆分Lucene索引文件而不重新索引
- 14. 將屏幕分爲兩部分,並將imageview放在一半的兩半上
- 15. Python:分裂和分裂
- 16. 分裂VTK POLYDATA兩個POLYDATA
- 17. 分裂兩個雙,C#
- 18. 分裂時,有兩個詞
- 19. Postgres的 - 分裂TSTZRANGE兩列
- 20. 分裂週期分爲月部分
- 21. Lucene搜索評分問題
- 22. 將Android屏幕分成兩半等分
- 23. 當分區有本地二級索引時是否發生分區分裂?
- 24. 將表格分成兩半
- 25. 分裂根據charatcer數據字段分爲兩個算
- 26. Lucene Grails可搜索的插件構建索引的部分表
- 27. Lucene的分析器進行索引和搜索
- 28. Lucene前綴通過標準分析器搜索索引數據
- 29. 分裂
- 30. 分裂
只是爲了清楚起見:您想分割索引*而不重新索引文檔,對吧? – 2010-05-19 13:48:08
是的,你是對的!我不想重新閱讀索引,並再次使用IndexWriter來構建兩個索引。相反,這樣做的一些自動方式尋求 – Akhil 2010-05-19 13:57:08
你能提供一些這方面的商業理由嗎?最簡單的方法是讀取並循環訪問IndexReader類。 – Mikos 2010-05-20 03:45:28