我們有存儲在eXist-db XML數據庫中的XML文件,需要對其進行索引並存儲在Solr中。該文檔沒有提到eXist很多。如果這裏有人知道,請幫忙。非常感激!Solr和eXist-db集成
回答
您可以使用Solr的URLDataSource使用REST訪問存在,但分貝。 因此,您不要將數據推送到Solr,而是使用Solr的DataImportHandler從eXist讀取數據並將其模擬爲XPathEntityProcessor。
如何獲得使用存在XML資源: http://exist-db.org/exist/devguide_rest.xml
感謝您的回答。 REST接口可以工作,但是我們無法讓XPathEntityProcessor在嵌套時生成多個文檔。我們有父XPathEntityProcessor在eXist-DB集合上工作。子XPathEntityProcessor在單個XML文件上工作。 – 2012-04-30 04:08:07
如果你不能得到任何可用的實體處理器來處理你的數據,也許你應該考慮[編寫你自己的](http://wiki.apache.org/solr/DataImportHandler#EntityProcessor),通過擴展[EntityProcessorBase](http ://lucene.apache.org/solr/api/org/apache/solr/handler/dataimport/EntityProcessorBase.html)並覆蓋nextRow()方法。 – 2012-05-04 07:41:25
或者,在你的情況下,通過擴展[XPathEntityProcessor](http://lucene.apache.org/solr/api/org/apache/solr/handler/dataimport/XPathEntityProcessor.html)更好。 – 2012-05-04 07:50:02
我們已經做了類似的事情,但不是來自eXist DB。你有幾個選項,您可以:
- 變換是從您的數據庫輸出到XML format that SOLR likes的XML使用XSTL
- 編寫一個腳本來輸出CSV(或JSON)從你的數據庫和進口消費到SOLR
- 假設有一個JDBC驅動程序eXist中DB,使用SOLR data import handler
- 1. 集成MONGODB和SOLR
- 2. Solr 6和Nutch 2.3.1集成
- 3. Apache Nutch和Solr集成
- 4. 方法集成solr和mysql
- 5. Zookeeper Solr集成
- 6. 的Solr/Carrot2集成
- 7. MongoDB與Solr集成
- 8. Ubuntu - Django Solr和Haystack集成錯誤
- 9. Django的集成SOLR和Nutch的
- 10. 將grobid與tika和solr集成
- 11. Rails + Apache solr分類集成
- 12. 將Solr與Mediawiki集成
- 13. Apache Cassandra與Apache Solr集成
- 14. 將wordnet與solr集成
- 15. solr on hadoop的集成
- 16. Lucene.NET/SOLR與ASPDOTNETSTOREFRONT(ASPDNSF)集成
- 17. 將solr與mySql集成
- 18. 使用PHP集成Solr
- 19. 蒂卡Solr的集成
- 20. 錯誤在Xquery更新(eXistdb)
- 21. 問題與existdb(PHP API)WSDL
- 22. 使用solr和集成nutch和solr時出現錯誤(HTTP ERROR 500)
- 23. 無法將Solr與Nutch集成
- 24. Solr 5與Maven的集成測試
- 25. Solr-Tika集成索引文件
- 26. 集成solr與彈簧應用程序
- 27. Nutch 1.2 Solr 3.6集成問題
- 28. 如何將MongoDB與Solr集成?
- 29. 將nutch 1.11與solr 6.0.1雲集成
- 30. nutch 1.2 solr 3.1集成問題
幾乎相同的問題,只是要求在XML和相關技術組網絡上LinkedIn:http://www.linkedin.com/groupAnswers?viewQuestionAndAnswers=&discussionID = 100978256&GID = 71299。如果這不能回答您的問題,我歡迎您加入現存的郵件列表併發送更詳細的描述。更多的eXist-db用戶已經存在 - 比這裏更開放,所以這是你最好的選擇。 – joewiz 2012-03-26 20:49:57