2011-11-04 38 views
1

我們的指數一天比較快地上漲2000-3000個文件。 我們每晚都在進行優化。如何優化索引上的大指數

問題是,Solr在優化時需要雙倍的磁盤空間。實際上,索引大小爲44GB,適用於100GB的分區 - 在接下來的幾個月內。

問題是,50%的磁盤空間在一天中的90%未使用,只在優化期間需要。下一件事:我們不得不在分區期刊上增加更多空間 - 這與存儲部門的人員(因爲我們有不止一個索引...)經常是一個痛苦的討論。

所以問題是:是否有一種方法來優化索引而不會阻塞磁盤上額外的100%索引大小?

我知道,多核心的分佈式搜索是一種選擇 - 但這只是一個「回退」解決方案,因爲我們需要基本上改變應用程序。

謝謝!

回答

3

在Lucene的引擎蓋下連續進行合併。請閱讀可在solrconfig.xml中設置的Merge Factor。如果你調整了這個設置,你可能不需要進行優化。

-1

您可以嘗試通過傳遞maxSegment參數進行部分優化。 這會將索引減少到指定的數字。 我建議你分批做(例如,如果有50個部分首先減少到30,然後到15等)。 以下是網址:

host:port/solr/CORE_NAME/update?optimize=true&maxSegments=(Enter the number of segments you want to reduce to. Ignore the parentheses)&waitFlush=false 
+0

這並沒有提供問題的答案。一旦你有足夠的[聲譽](https://stackoverflow.com/help/whats-reputation),你將可以[對任何帖子發表評論](https://stackoverflow.com/help/privileges/comment);相反,[提供不需要提問者澄清的答案](https://meta.stackexchange.com/questions/214173/why-do-i-need-50-reputation-to-comment-what-c​​an- I-DO-代替)。 - [來自評論](/ review/low-quality-posts/18085538) – kometen

+0

它的確回答了這個問題的這個部分:「是否有一種方法來優化索引而不會阻塞磁盤上額外的100%索引大小?」 – ak1234