2011-04-11 34 views
0

我知道有一些半相似的問題,但在這種情況下,我正在構建一個脫機索引,直到構建完成。我從零開始構建了兩個核心,一個擁有大約30萬條記錄,包含大量的引用信息和大塊全文(這是文檔索引),另一個核心有大約660萬條記錄,全文(這是頁面索引)。在離線Solr/Lucene索引上多久調用一次commit?

鑑於此索引正在脫機構建,唯一真正的性能問題是構建速度。沒有人應該查詢這些數據。

如果我停止添加物品50秒,自動提交顯然會觸發?我不這樣做。我一次添加十個,每隔幾秒添加一次。

那麼,我應該更頻繁地提交嗎?我覺得這個運行時間越長得到的速度越慢,至少在我的6k文檔的索引測試案例中。

沒有人在搜索這個索引時,有多少人會建議我提交?

應該說我正在使用Solr 3.1和SolrNet。

+0

出於興趣,我運行了大約6k個文檔的索引測試用例,在每500個之後提交。它似乎運行得更快,雖然只有5%,所以它可能是其他因素。 – 2011-04-12 11:08:06

回答

0

雖然它的承諾是花費你的時間,但你可能要考慮查看其他調整而不是提交頻率。

它是索引核心還搜索,或索引結束後它在別的地方複製?如果後者是這種情況,那麼關閉高速緩存可能會對性能產生非常顯着的影響(solr rebuilds caches every time you commit)。

0

您還可以使用Solr的autoCommit或commitWith功能進行研究。

相關問題