2011-05-25 95 views
0

我使用Lucene搜索HTML文檔。我遇到的問題是增加索引文件的大​​小,我有300-400MB大小的HTML文件,但索引運行到了.98Gb。我看到的原因是因爲我們有規範。就像我們爲四個不同的領域索引相同的內容,我認爲這是問題(我們使用相同的內容,一個區分大小寫和其他方式,一個區域用特殊字符和其他方式敏感)。減少Lucene索引的內存大小

有沒有辦法縮小索引的大小?保持相同的要求?有沒有不同的方式,我們索引相同和不同的搜索支持所有?

回答

1

我假設你的問題是,你正在存儲這些領域,而不是索引他們。所以解決方案是:不要存儲它們。

+0

啊,這是我的問題。這是一個巨大的變化,大小超過200MB ..謝謝噸Xodarap,我應該想通了..但.. – remo 2011-05-25 17:55:39