2013-05-15 45 views
1

我打算使用Lucene來索引一個非常大的文本文檔。我知道倒排索引是如何工作的。Lucene是否將實際文檔存儲在其索引中?

問題:Lucene是否將實際的源文檔存儲在索引中(除了術語之外)?因此,如果我搜索一個術語,並希望包含該術語的所有文檔,文檔是否來自Lucene,或者Lucene是否僅返回指針(例如指向匹配文檔的文件路徑)?

回答

2

這取決於你。 Lucene將文檔表示爲字段集合,並且可以配置每個字段是否存儲。通常,在處理大文檔時,您將存儲標題字段,但不存儲正文字段,並且您將添加可用於檢索實際文檔的標識符字段(未編入索引)。

相關問題