2009-06-23 68 views
5

我一直在使用nutch一段時間,最近我知道關於這個度假勝地。Zend_Search_Lucene的性能和瓶頸?

它的性能如何?它支持的文件大小限制是多少?

此外,如何刪除或更新索引,而不是每次有修改重新索引?

回答

8

Zend_Search_Lucene是Apache Lucene格式的純PHP實現。目前(從ZF 1.6開始)支持的Lucene索引格式版本是1.4 - 2.3。有關Lucene的更多信息,請訪問http://lucene.apache.org/java/docs/

就索引大小限制而言,32位平臺的索引大小受限制爲2GB,據我所知,不限於64位平臺。

性能在很大程度上取決於您如何構建索引。請務必檢查manual that deals with performance的部分。

此外,Luke(Lucene索引的診斷工具)在性能優化和故障排除方面非常方便。

P.S.關於更新,Lucene索引文件格式不支持文檔更新。應該刪除文件並重新添加到索引以有效更新它們。對於Java實現也是如此。

+0

感謝您的評論。 但nutch可以合併新的和舊的索引到另一個,爲什麼不能Lucene?Nutch是基於Lucene的。 順便說一句,是由nutch直接可用Zend_Search_Lucene生成的索引文件? – omg 2009-06-23 18:07:53