2013-07-08 42 views
0

使用bin/nutch solrindex命令有很多文檔和示例,但bin/nutch elasticindex命令缺少覆蓋範圍。我正努力將Nutch 2.2.1與Elasticsearch 0.90.2結合起來。我嘗試使用this plugin將Elasticsearch僞裝爲Solr實例,但任何bin/crawl作業都會因內部服務器錯誤而崩潰。我正在尋找的是bin/crawl的一個例子,它被修改爲使用Elasticsearch或者bin/nutch elasticindex命令的詳細描述(nutch wiki沒有它的頁面)。我是否可以簡單地用elasticindex自由地替換短語solrindex的每一處出現?bin/nutch elasticindex的文檔

回答

0

我修改了bin/crawl以刪除bin/nutch solrdedup命令,並用elasticindex替換了所有提到的solrindex

0

我不認爲有可能使Nutch 2.2.x與Elasticsearch一起工作。但是我沒有看到2.2.x與1.8的附加優勢。唯一的事情是,Nutch 2.2.x使用Gora將抓取的頁面保存在您選擇的數據庫中。由於您使用Elasticsearch爲結果編制索引,我假設您不需要數據庫。 我用Elasticsearch 0.90.11製作了Nutch 1.8,你可以在我的GitHub賬戶上找到這個包: https://github.com/andreivisan/NutchElasticsearch