2011-09-13 32 views
3

我們正在重構我們的Lucene主機(Lucene.NET 2.9.2),並且正在實現Lucene NRT(Near Realtime)。Lucene NRT:何時提交?

將更改提交到磁盤的最佳時間/閾值是多少?有沒有金科玉律?如果是內部ramdisk存放一定數量的數據,我該如何獲得大小?

一旦發生了一次提交,我們更新了數據庫,所以我不是那種對電源故障的恐懼(一旦進程再次開始,它會重新索引那些沒有提交的文檔)。

+0

我剛剛實現了在我們的系統中聽起來像相同的方案。當我有超過1000個未提交的文檔時,我決定做一次提交。我認爲這個數字真的取決於你將添加多少文檔/秒。我也不確定是否可以在與添加文檔不同的線程上運行提交。 – goalie7960

+0

那麼你有多快才能達到1000個文檔?這些文檔平均有多大?我們的文檔大約200kb。 – Gidon

+2

我們的文檔不是那麼大。也許幾個kb每個。當系統滿負荷運行時,我們可以在大約5分鐘左右的時間內獲得1000個文檔。 – goalie7960

回答

1

我剛剛實現了在我們的系統中聽起來像相同的方案。當我有超過1000個未提交的文檔時,我決定做一次提交。我認爲這個數字真的取決於你將添加多少文檔/秒。我也不確定是否可以在與添加文檔不同的線程上運行提交。