2011-11-14 37 views
1

我正在開發一個項目,我們正在嘗試爲blogg數據引入搜索框架。我們正在努力估計超過300 GB的大型數據集的lucene/Solr性能。lucene/Solr性能和硬件要求

我也不確定我們的性能需求是否可以使用單個服務器設置來滿足,或者我們需要去複製或分散的解決方案。

誰能提供對硬件的估計和如果使用Lucene是一個可行的解決方案

+0

更好的指標是找到實際可索引文本內容的大小。 300 GB純文本的要求將與300 GB的.doc文件大不相同。另外,我建議你對較小的數據集(比如10%的數據)進行測試,以獲得關於性能和資源需求的一些想法。 –

回答

2

沒有明確可以在不在數據(或者說,至少簡單的基準)適當的外觀被說。索引和搜索性能(應單獨考慮)也會根據您的配置而有很大差異。

但是,this article應該給你一個Lucene索引速度的整體印象 - 在一臺現代化的機器上,可以在13分鐘內索引21GB的維基百科文章。