2015-06-22 96 views
1

我打算將Solr從單個實例選項升級到雲選項。目前我有5個內核,每個內核都配置了數據導入處理程序。我已經部署了web應用程序以及tomcat文件夾中的solr.war,這將根據我的項目需求定期觸發全部導入delta32導入。Solrcloud和數據導入處理程序

現在,我打算爲這個應用程序創建2個碎片,將我的5個核心數據的一半保留在每個碎片中。我不明白DIH如何在SolrCloud中工作?

  • 如果我從兩個碎片開始完全索引,那好嗎?
  • 或者我只需要從一個碎片做完全索引?

結構將類似於下面 enter image description here

+0

你能說清楚5核心數據分成兩個碎片是什麼意思嗎?你是否意味着你要根據某些條件將數據「路由」到任一碎片? – jay

+0

那就是我的想法,但我不知道是否有可能實現。你可以請建議,如果有任何代理? – Javadroider

回答

0

這一切都取決於你如何創建Solr的雲:採用複合ID或暗示的路由。使用複合標識路由將負責將文檔分散到所有可用的分片中。您可以從任何solr雲節點啓動導入。最後,雲環境將包含遍佈所有分片的導入文檔索引。 如果使用隱式路由,您可以控制每個文檔索引的保留位置。 您不必使用DIH。或者,您可以編寫一個小型應用程序,使用solr客戶端來填充索引,從而爲您提供更多控制。

+0

感謝您的回覆。我沒有自由離開DIH。如果我從一臺機器啓動DIH,那麼我將與HA發生問題。即使從一臺機器啓動DIH,如何確保實現HA? – Javadroider

+0

「HA」是什麼意思?高可用性?你是否說你想在有流量的情況下導入數據?你需要提供更多的反饋。 –

+0

是的。你說得對。 HA - >高可用性。我希望導入與詢問一起並行發生。這就是我在單個實例中所做的。 – Javadroider

0

經過大量的谷歌搜索和閱讀後,我終於決定實施DIH如下。如果您覺得這個架構會有問題,請讓我知道您的意見。

enter image description here

相關問題