我們有一個產品(我們稱之爲「PROD1」),我們要「整合」與其他產品(姑且稱之爲「Prod2的」),在「整合」意味着,PROD1 + Prod2的會「prod3」。 我們還有一些計劃將更多「產品」添加到prod3中。關於Solr的拆分問題
到目前爲止這麼好。
我們使用Solr的用於在這兩個產品的用戶提供搜索和索引都可能是非常,非常大,收到了很多電話/秒。如果我們把所有東西放在一臺服務器上,吞吐量就會成爲一個垃圾。
所以,我們想使用分片(我相信這是正確的術語,對不起,如果我錯了),但是,我有一些關於它的問題:
是否有可能分裂由「單產品指數 - 每臺機器」或類似的指數?如果是的話,你如何建議我這樣做?
如果(問題1 == true)那麼讓我們假設prod1索引將是machine1,prod2索引machine2可以在machine1和2中同時搜索結果和分數,偏移量等,以「簡單」和正確的方式?
我讀一些有關複製的因素,但我認爲我不明白它的權利。它的目的究竟是什麼?
我不確定在這裏是否使用了正確的術語,因此,也許有人可以澄清究竟是核心,碎片等等。這種「簡單」的懷疑在我的團隊中產生了很多誤解。
現在,這是問題。也許我會稍後再編輯它並添加更多內容。
在此先感謝。
謝謝,它闡明瞭我的想法很多關於solr/solrcloud的概念。 – caarlos0
最後一個問題:讓我們假設我有4臺具有相同數據的服務器,其中一臺我實際上執行搜索查詢?另外,我必須在搜索之前每次檢查它的時間?你的建議是什麼? – caarlos0
如果您有四臺服務器具有相同的數據,只需隨機選擇一臺服務器(或更好),請使用負載平衡器。負載平衡器將移除停止的節點,並定期重試它們以查看它是否回來。我們在apache中使用mod_jk和tomcat,並在後端節點上使用solr。 – MatsLindh