5
我這個星期有一個問題與Solr的指標:http://lucene.472066.n3.nabble.com/corrupted-index-in-slave-td4054769.html,SolrCloud VS Solr的主從複製
今天,這個錯誤開始,幾乎每一個要求不斷地發生,我創建了一個JIRA問題becaue我認爲這是一個錯誤https://issues.apache.org/jira/browse/SOLR-4707
正如你可以看到,最終它是由於Solr主從複製失敗,現在我不知道是否應該考慮遷移到SolrCloud,因爲Solr主從複製似乎不符合我們的要求:
- 指數尺寸:約20萬份文件,〜9GB
- 〜1200更新/分鐘
- 〜10000個查詢/分鐘(分佈在2奴隸)MoreLikeThis,RealTimeGet,TermVectorComponent,SearchHandler
我要感謝你如果有人可以幫助我來回答這些問題:
- 難道是可取的遷移到SolrCloud?它會對複製性能產生影響嗎?
- 在這種情況下,會有更好的表現嗎?在每臺服務器上維護索引的副本,還是使用分片服務器?
- 您會爲了確保高可用性而建議多少個分片和副本?
親切的問候,
維克多
如果你能稍等一會,Solr 5將在明年內推出,並且它有一系列積極的變化,進一步支持SolrCloud。 IMO 4.x對SolrCloud的支持需要大量的進一步維護,所以如果您可以等待,我會等待。還決定如何碎片爛。 – Xinzz
感謝這篇文章http:// searchhub,我解決了這個問題。org/2013/08/23/understanding-transaction-logs-softcommit-and-commit-in-sorlcloud /在閱讀它之後,我可以理解,根據我們的要求,軟提交時間被錯誤地配置(索引繁重,查詢繁重),我們有太多的軟提交,但我們並不需要實時提供數據。因此,正如文章所建議的那樣,我試圖將軟提交間隔設置得相當長,但是在我的情況下15秒鐘很難實現一個小的值。 – vruizext
此外,通過發送包含多個項目的「批量」更新消息來優化索引過程,而不是爲每個要索引的項目發送一個請求,並選擇更好的策略來緩存查詢結果,這有助於減少solr服務器的負載並提高所提供服務的整體質量 – vruizext