工作,我有2個內核,核1和酷睿2,我試圖實現與多內核下面的東西。
1)如何刪除core1中的所有條目(僅core1)。
一般來說,當我僅有一個核心時,我正在使用以下命令刪除所有文檔。
的Java -ddata = ARGS -Dcommit =真正的罐子post.jar 「:」
多核
2)使用的Nutch,如何索引網頁文件只在酷睿2。 (不在core1中)
工作,我有2個內核,核1和酷睿2,我試圖實現與多內核下面的東西。
1)如何刪除core1中的所有條目(僅core1)。
一般來說,當我僅有一個核心時,我正在使用以下命令刪除所有文檔。
的Java -ddata = ARGS -Dcommit =真正的罐子post.jar 「:」
多核
2)使用的Nutch,如何索引網頁文件只在酷睿2。 (不在core1中)
每個內核都有一個單獨的Url(請參閱下面的示例)。只需分別引用每個核心進行刪除和索引操作即可。
http://localhost:8983/solr/core1
http://localhost:8983/solr/core2
1)爲刪除我建議使用可通過捲曲被執行,指定用於核心-1 url中Delete by ID or Query選項。
2)對於使用Nutch對core2進行索引,只需在索引步驟中爲core2使用適當的url。
問題1: 由於某種原因,我的捲曲命令給我錯誤。 我糾正它,現在它工作正常。
curl localhost:8983/solr/core1/update/?commit=true -H "Content-Type: text/xml" -d "<delete><query>*:*</query></delete>
問題2: 索引數據使用Nutch的不同的內核,我用下面的命令,它爲我工作。因此想到與你分享。
bin/nutch crawl urls -solr http://localhost:8983/solr/core1/ -depth 3 -topN 5
bin/nutch crawl urls -solr http://localhost:8983/solr/core2/ -depth 3 -topN 5
由於某種原因,我的curl命令給我錯誤。我糾正它,現在它工作正常問題1. curl http:// localhost:8983/solr/core1/update /?commit = true -H「Content-Type:text/xml」-d「 *: * 「 –
2013-03-14 08:42:09
感謝Paige爲您的答案。 – 2013-03-14 08:50:59