我不確定這是否是適合此問題的正確論壇,但如果我能指出正確的方向,那將會很棒。我們一直在使用MySql和Solr的組合來滿足我們所有公司的全文和查詢需求。但是,隨着我們的客戶數量和數據量的增長,MySql的數據量並沒有被證明是存儲/查詢的正確選擇。數據流/爬行體系結構設計
我一直在尋找Solr Cloud,它看起來非常令人印象深刻,但不確定是否應該放棄我們的存儲系統。所以,我一直在探索DataStax,但商業選擇是沒有問題的。因此,我們考慮使用hbase存儲數據,同時將數據索引到Solr雲中,但出於許多原因,這種設計似乎並不令人信服(也可以看出Lilly的基本原理)。
會是建議只是用戶Solr的雲計算與多個複製或HBase的,Solr的似乎是不錯的選擇
多少應變會保留兩個Solr的碎片和HBase的節點在同一臺機器
上- 是否有計算需要什麼樣的機器配置來存儲500-1000萬條記錄。其中大多數是社交數據(Twitter/Facebook /博客等)以及多少碎片。
問候,
AYUSH
謝謝,我考慮過Oracle,我的主要要求是全文搜索能力處理大量的數據。 –