2013-05-15 154 views
6

我看到人們在網絡上發佈關於此主題的人使用的Nutch和Solr版本的不同組合。 哪些是Nutch和Solr的最新穩定(非測試版)和兼容版本,我可以在不構建資源並進行配置的情況下下載和安裝?Nutch和Solr的最新兼容版本

回答

4

您可以使用Nutch 2.1或Nutch 1.6。如果你想使用HBase,必須使用Nutch 2.x.因爲nutch 1.6不支持Hbase。我使用nutch 2.1,HBase 0.90.x或0.94.5和Solr 4.3.0。

兩個Solr版本(Solr 3.x和Solr 4.x)之間有重大變化。您必須根據您的要求選擇其中之一。例如:Solr4支持cloud更好。

2

你在使用什麼操作系統?

在Windows中,Nutch 1.2是我設法使用的最新版本。

在Linux中,Nutch 1.6與SOLR的配合良好。

這與SOLR 3.5(由於其他依賴項)相結合,但沒有理由不與SOLR 3.6或4.3一起使用。

Nutch tutorial

+0

我正在使用Ubuntu Server 12.04 LTS。 我剛剛嘗試過SOLR 4.3.0和Nutch 1.6。 兩者都在工作(在Tomcat和Nutch中運行的Solr成功爬過一個小站點)。 當我嘗試運行Nutch solrindex命令來整合它們並使用solr爲爬網的網站建立索引時,我得到了java.io.IOException作業失敗!錯誤。沒有進一步的細節在solr或nutch日誌。 我想知道這是否可能是由於兩個版本之間的不兼容造成的...... – MarioCannistra

+0

Tomcat版本是7 – MarioCannistra

+0

hadoop.log文件通常有更多的細節。你能發佈錯誤的堆棧跟蹤嗎?如果沒有更多詳細信息,請嘗試更改conf/log4j.properties,並將調試級別從INFO更改爲DEBUG – nimeshjm

2

我實現Nutch的1.6和Solr 3.6.2到生產系統今年早些時候一家大型金融公司。他們一起工作得很好。

+0

您是否使用Tomcat或Jetty for Solr? – MarioCannistra

+0

我已經使用了兩者,並且在兩種情況下都是通過Apache進行代理的。 – Claude

+0

嗨克勞德。你有沒有試過用HBase將Nutch 2.2.1加入生產系統? – sunskin

3

下面是基於什麼的Nutch的創作者在其網站上宣佈here Nutch的和Solr的一些建議的兼容版本:

+-------+--------+ 
| Nutch | Solr | 
+-------+--------+ 
| 2.3.1 | 4.10.3 | 
| 2.3 | 4.8.1 | 
+-------+--------+ 

隨意添加更多的版本。我用來生成這個表的工具可以在here找到。

0

我使用 -

  • 的Apache Nutch的2.3.1
  • 的Solr 5.2.1
  • HBase的0.94.14

而且這些組合是工作的罰款!

相關問題