2012-03-09 46 views
0

我有一個巨大的XML文件,大小約2GB,包含簡歷。這個文件中有成千上萬的簡歷,正確標記。現在我正在使用XPATH來查詢它。那麼建議使用Lucene而不是XPATH?爲此,建議使用Lucene嗎?

回答

1

像所有其他技術相關的,這取決於。

什麼Lucene的給你,你沒有使用XPath得到的是一個全文引擎除其他事項外排名和能力,短語查詢,支持電力,通配符查詢等。根據您的使用

- 我想說,在全文搜索引擎是有道理的。這並不是說,香草Lucene是最好的方式去(例如有其他的選擇建立在Lucene上)。

3

取決於您的要求。如果您需要全文搜索和全面搜索引擎的所有其他強大功能,Lucene就是要走的路。我會推薦Solr,它建立在lucene之上,並提供更好的API和抽象。

1

2GB似乎是相當少的,我會構建自己的倒排索引(最小的一個:))然而,使用Lucene/Solr雖然沒有問題。前進。它會幫助你一旦你的記錄開始翻倍。然而,在這種規模(2GB)甚至更大的情況下,許多現實生活中的東西正在使用像關鍵字這樣的SQL進行數據庫全文搜索。

+0

非常感謝:)。 – John 2012-03-09 08:21:45