我有一個巨大的XML文件,大小約2GB,包含簡歷。這個文件中有成千上萬的簡歷,正確標記。現在我正在使用XPATH來查詢它。那麼建議使用Lucene而不是XPATH?爲此,建議使用Lucene嗎?
0
A
回答
1
像所有其他技術相關的,這取決於。
什麼Lucene的給你,你沒有使用XPath得到的是一個全文引擎除其他事項外排名和能力,短語查詢,支持電力,通配符查詢等。根據您的使用
- 我想說,在全文搜索引擎是有道理的。這並不是說,香草Lucene是最好的方式去(例如有其他的選擇建立在Lucene上)。
3
取決於您的要求。如果您需要全文搜索和全面搜索引擎的所有其他強大功能,Lucene就是要走的路。我會推薦Solr,它建立在lucene之上,並提供更好的API和抽象。
1
2GB似乎是相當少的,我會構建自己的倒排索引(最小的一個:))然而,使用Lucene/Solr雖然沒有問題。前進。它會幫助你一旦你的記錄開始翻倍。然而,在這種規模(2GB)甚至更大的情況下,許多現實生活中的東西正在使用像關鍵字這樣的SQL進行數據庫全文搜索。
相關問題
- 1. 建議只使用沒有數據庫的Lucene索引嗎?
- 2. 使用Lucene的提示/建議
- 3. 使用Lucene SpellChecker的有條件建議
- 4. 建議使用DoctrineMigrationsBundle嗎?
- 5. 建議使用Java解析此XML
- 6. 使用MongoDB時建議使用Memcache嗎?
- 7. 你可以使用Lucene作爲OODB嗎?
- 8. 建議使用node.js構建論壇嗎?
- 9. 您爲此建議使用哪種版本控制軟件包
- 10. 關於使用Lucene的體系結構的建議?
- 11. 建議使用Lucene或Solr的蜘蛛工具?
- 12. Lucene附近的單詞建議
- 13. 需要Lucene查詢優化建議
- 14. 建議使用GAE類型嗎?
- 15. 建議在mongodb中使用Hibernate嗎?
- 16. 有關jQuery使用css3的建議嗎?
- 17. 建議使用Wild Card SSL證書嗎?
- 18. 建議使用CSS框架嗎?
- 19. 最好是使用lucene KeywordAnalyzer爲自動建議文本框索引文本?
- 20. 建議使用GCE作爲網絡服務器嗎?
- 21. 建議使用Redis或Memcached作爲FILES的緩存嗎?
- 22. 將convertin CSV的ETL Pentaho建議(或SQL建議)轉換爲此表格格式
- 23. 不建議使用CMS構建Web應用程序嗎?
- 24. 建議使用片段構建所有應用程序嗎?
- 25. 我可以爲此使用DependencyProperty嗎?
- 26. 我可以爲此使用Regex嗎?
- 27. 我應該爲此使用BlazeDS嗎?
- 28. 如何使用此建議的intelliJ命令禁用雙緩衝?
- 29. 我應該爲此創建索引嗎?
- 30. 我可以爲此創建模板嗎?
非常感謝:)。 – John 2012-03-09 08:21:45