2014-04-01 90 views

回答

2

像往常一樣,沒有簡單的答案。

最大的變化是在v4.0中Lucene引入了提供自定義編解碼器/發佈格式的功能。邁克爾·麥坎德利斯(Lucene的作者之一),explains the difference between 3.X and 4.0

默認情況下,Lucene的使用StandardCodec,其作爲當前穩定分支(3.X)寫入和讀取的 幾乎相同的格式。給定項的 的詳細信息以詞典文件的形式存儲,而文檔和發生該詞的位置則存儲在單獨的文件中。

也就是說,有不同的編解碼器,他們每個人都專注於不同的事情。

This presentation涵蓋了一些發佈格式,並有一些洞察哪種格式針對哪種情況進行了調整。如果你打算留在StandardCodec,我想你不會選擇重新索引。