2016-08-04 31 views
0

我必須從網絡上抓取一些數據並執行一些分析。對於爬網,我決定使用Apache Nutch 2.3.1並進行分析,我決定使用Apache Spark。現在我該如何整合Nutch和solr。根據Nutch website,我已經知道它可以支持spark 1.4.1。有人可以確認我的設計desicion是正確的,第二我沒有找到這兩個整合的教程。可以soneone指導我該如何使用Apache Spark和Apache Nutch

回答