2017-06-06 106 views
0

Got Solr 6.4.2在SolrCloud上運行,以及對索引性能的一些懷疑。SolrCloud DIH性能

我使用MSSql作爲MSSQL的數據源和最新的JDBC驅動程序。

當Solr的開始作爲獨立的我DataImport運行在31250個文檔/ s的 當Solr的啓動爲SolrCloud(2個副本)我DataImport運行在10000個文檔/ s的

是否有這對有影響的任何配置參數這個?

回答

0

預計SolrCloud中的索引將比獨立Solr中的索引慢(它也必須索引到副本中,所以還有額外的網絡流量和延遲,還有其他一些SolrCloud也必須這樣做),但你可以做一些事情,以確保它儘可能快:

  1. 你可以分割索引。索引到幾個碎片應該更快(測試差異數字,在某些時候它會太多,所以不要發瘋)
  2. 將您的文檔發送到碎片領導。索引首先在領導者處完成,因此如果您向領導者發送文檔,您將節省一些網絡流量。當然,如果你正在使用DIH,你幾乎無法控制。除非您自定義您的DIH設置並擁有多個處理程序,否則每個人只會索引分片的文檔,並且您會在分片節點上調用每個分析程序。