2013-07-08 55 views
1

我想使用Apache Nutch 2.2.1進行網頁抓取。它只有src文件。我將如何運行這個。有沒有任何教程可用於此。我想要結果作爲Json。 Apache 1.6在我的系統中完美工作。運行apache Nutch 2.2.1

請有人可以幫助我嗎?

+0

你打算如何存儲你的nutch數據 - gora,mysql或hbase? – sunskin

+0

我打算使用hbase – jackyesind

+0

您使用過哪個版本的hbase? – sunskin

回答

2

你可能想要關注這個鏈接http://nlp.solutions.asia/?p=362但那是Nutch 2.2而不是2.2.1。您可以查看該鏈接,瞭解如何開始使用src文件。希望這可以幫助!