使用bin/nutch solrindex
命令有很多文檔和示例,但bin/nutch elasticindex
命令缺少覆蓋範圍。我正努力將Nutch 2.2.1與Elasticsearch 0.90.2結合起來。我嘗試使用this plugin將Elasticsearch僞裝爲Solr實例,但任何bin/crawl
作業都會因內部服務器錯誤而崩潰。我正在尋找的是bin/crawl
的一個例子,它被修改爲使用Elasticsearch或者bin/nutch elasticindex
命令的詳細描述(nutch wiki沒有它的頁面)。我是否可以簡單地用elasticindex
自由地替換短語solrindex
的每一處出現?bin/nutch elasticindex的文檔
0
A
回答
0
我修改了bin/crawl
以刪除bin/nutch solrdedup
命令,並用elasticindex
替換了所有提到的solrindex
。
0
我不認爲有可能使Nutch 2.2.x與Elasticsearch一起工作。但是我沒有看到2.2.x與1.8的附加優勢。唯一的事情是,Nutch 2.2.x使用Gora將抓取的頁面保存在您選擇的數據庫中。由於您使用Elasticsearch爲結果編制索引,我假設您不需要數據庫。 我用Elasticsearch 0.90.11製作了Nutch 1.8,你可以在我的GitHub賬戶上找到這個包: https://github.com/andreivisan/NutchElasticsearch
相關問題
- 1. 將文檔上傳到Google文檔的文檔中
- 2. DocBook文檔中的文檔起點
- 3. 將文檔替換爲iframe的文檔
- 4. 沒有嵌套文檔的文檔數
- 5. javascript中的文檔vs文檔
- 6. 創建文檔時的文檔名稱
- 7. 文檔與文檔之間的區別
- 8. Colorbox打開文檔外部的文檔
- 9. 保存歸檔的文檔文件夾
- 10. 結合Google文檔文檔
- 11. 子文檔返回文檔
- 12. catcomplete的文檔
- 13. IF_EX_IDOC_CREATION_CHECK的文檔
- 14. SKTMapsObject的文檔
- 15. java.util.concurrent.locks.ReentrantReadWriteLock的文檔
- 16. vboxapi的文檔?
- 17. webkit的文檔
- 18. 的xml文檔
- 19. mp3transform的文檔
- 20. Proguard的文檔
- 21. 的Clojure:文檔
- 22. nuget.config的文檔?
- 23. tboot的文檔?
- 24. express.js的文檔
- 25. com.android.nfc_extras的文檔?
- 26. PyQt的文檔
- 27. Socket.io的文檔?
- 28. @UiHandler的文檔
- 29. 比較文檔中的文檔條款矩陣R中的文檔
- 30. 從文檔複製MIME文檔到文檔