2010-05-27 48 views
0

我發現很多開源XML數據庫(TPOX,Timber,DBXML),但他們正在使用XPath和XQuery,我需要一個爲「關鍵字在XML文檔上搜索」而開發的系統。有沒有開源的XML文檔關鍵字搜索系統?

+0

你不需要xml數據庫來做關鍵字搜索..你只需要正則表達式。 – 2010-05-27 18:27:18

回答

1

許多XML數據庫提供關於它們中的XML文檔的關鍵字索引。您不僅限於XPath表達式。您可以在數據庫中的所有文檔中執行關鍵字搜索。

通常,您可以在XQuery中表達關鍵字查詢(並處理查詢結果)。請參閱exists-db的示例:http://exist.sourceforge.net/kwic.html

支持僅限於特定元素的關鍵字,或者您可以在整個文檔中執行關鍵字。見XQuery的全文規格爲所有選項:http://www.w3.org/TR/xpath-full-text-10/

BaseX是支持全文(即關鍵字搜索)規範的另一個開源XML數據庫:http://www.inf.uni-konstanz.de/dbis/basex/

如果你想不開源的全文檢索儘管您可能想要查看舊的XQengine - http://xqengine.sourceforge.net/ - 或者像其他人說的那樣,只需使用Lucene並以此方式索引文檔中的所有文本即可。

+0

謝謝,我的問題已答覆。有關更多信息,我希望您看一下以下系統(XRANK是對http://www.cs.cornell.edu/~cbotev/XRank上的XML文檔進行排名關鍵字搜索.pdf)和(XSeek是一個使用關鍵字的語義XML搜索引擎http://xseek.asu.edu/xseekdemo.pdf)。 – houssam11350 2010-05-29 14:34:41

+0

感謝您的鏈接! – ksclarke 2010-06-04 14:03:17

1

我不確定什麼是「關鍵字搜索」,但您可以設置一個搜索引擎,例如lucene/solr來爲您的數據建立索引,然後在其中搜索。