我發現很多開源XML數據庫(TPOX,Timber,DBXML),但他們正在使用XPath和XQuery,我需要一個爲「關鍵字在XML文檔上搜索」而開發的系統。有沒有開源的XML文檔關鍵字搜索系統?
回答
許多XML數據庫提供關於它們中的XML文檔的關鍵字索引。您不僅限於XPath表達式。您可以在數據庫中的所有文檔中執行關鍵字搜索。
通常,您可以在XQuery中表達關鍵字查詢(並處理查詢結果)。請參閱exists-db的示例:http://exist.sourceforge.net/kwic.html
支持僅限於特定元素的關鍵字,或者您可以在整個文檔中執行關鍵字。見XQuery的全文規格爲所有選項:http://www.w3.org/TR/xpath-full-text-10/
BaseX是支持全文(即關鍵字搜索)規範的另一個開源XML數據庫:http://www.inf.uni-konstanz.de/dbis/basex/
如果你想不開源的全文檢索儘管您可能想要查看舊的XQengine - http://xqengine.sourceforge.net/ - 或者像其他人說的那樣,只需使用Lucene並以此方式索引文檔中的所有文本即可。
謝謝,我的問題已答覆。有關更多信息,我希望您看一下以下系統(XRANK是對http://www.cs.cornell.edu/~cbotev/XRank上的XML文檔進行排名關鍵字搜索.pdf)和(XSeek是一個使用關鍵字的語義XML搜索引擎http://xseek.asu.edu/xseekdemo.pdf)。 – houssam11350 2010-05-29 14:34:41
感謝您的鏈接! – ksclarke 2010-06-04 14:03:17
我不確定什麼是「關鍵字搜索」,但您可以設置一個搜索引擎,例如lucene/solr來爲您的數據建立索引,然後在其中搜索。
- 1. Tweepy API搜索沒有關鍵字
- 2. Lucene的搜索沒有找到關鍵字索引字段
- 3. 在文件系統上搜索文檔
- 4. 有沒有開源的雲文件系統?
- 5. Solr在搜索關鍵字後打開文檔
- 6. 使用關鍵字搜索文本,沒有grep,sed,awk等
- 7. 有序MySql的關鍵字搜索
- 8. 搜索XML文檔
- 9. 搜索XML文檔
- 10. Lucene:查詢或篩選「擁有」文檔的關係搜索?
- 11. Azure搜索沒有返回文檔ID
- 12. mysql搜索。要求所有關鍵字
- 13. 搜索XML文檔的字符串
- 14. PHP,熱門搜索關鍵字排名系統
- 15. 如何在所有公開LinkedIn數據中搜索關鍵字?
- 16. 關鍵字搜索
- 17. 關鍵字搜索
- 18. 關鍵字搜索
- 19. 搜索關鍵字
- 20. SQLAlchemy關係沒有外鍵
- 21. Javascript onpage搜索所有關鍵字搜索
- 22. 搜索另一個表中的所有關鍵字的文本
- 23. Python的搜索關鍵字開頭,並在其下方有內容的文件
- 24. 只搜索關鍵字但沒有更多
- 25. 搜索關鍵字並檢索全文
- 26. 在XML文檔中搜索
- 27. MySQL全文搜索使用短字作爲關鍵字返回沒有結果
- 28. 搜索具有不同關鍵字的文件
- 29. 帶有單個關鍵字權重的文本搜索
- 30. 帶有多個關鍵字的laravel全文搜索
你不需要xml數據庫來做關鍵字搜索..你只需要正則表達式。 – 2010-05-27 18:27:18