1
我正在開發一個項目,我們正在嘗試爲blogg數據引入搜索框架。我們正在努力估計超過300 GB的大型數據集的lucene/Solr性能。lucene/Solr性能和硬件要求
我也不確定我們的性能需求是否可以使用單個服務器設置來滿足,或者我們需要去複製或分散的解決方案。
誰能提供對硬件的估計和如果使用Lucene是一個可行的解決方案
我正在開發一個項目,我們正在嘗試爲blogg數據引入搜索框架。我們正在努力估計超過300 GB的大型數據集的lucene/Solr性能。lucene/Solr性能和硬件要求
我也不確定我們的性能需求是否可以使用單個服務器設置來滿足,或者我們需要去複製或分散的解決方案。
誰能提供對硬件的估計和如果使用Lucene是一個可行的解決方案
沒有明確可以在不在數據(或者說,至少簡單的基準)適當的外觀被說。索引和搜索性能(應單獨考慮)也會根據您的配置而有很大差異。
但是,this article應該給你一個Lucene索引速度的整體印象 - 在一臺現代化的機器上,可以在13分鐘內索引21GB的維基百科文章。
更好的指標是找到實際可索引文本內容的大小。 300 GB純文本的要求將與300 GB的.doc文件大不相同。另外,我建議你對較小的數據集(比如10%的數據)進行測試,以獲得關於性能和資源需求的一些想法。 –