目前我正在使用Mahout RowSimilarity Job進行一些文檔相似性分析。這可以通過從控制檯運行命令'mahout rowsimilarity ...'輕鬆完成。不過我注意到這個Job也支持在Spark引擎上運行。我想知道如何在Spark Engine上運行此作業。如何在Spark引擎上運行Mahout作業?
1
A
回答
1
你可以在Spark中使用MLhib替代mahout。 MLlib中的所有庫都以分佈式模式進行處理(Hadoop中的Map-reduce)。
在Mahout 0.10使用火花提供工作執行。
的更多細節鏈接 http://mahout.apache.org/users/sparkbindings/play-with-shell.html
步驟與象夫設置火花。
1頁轉到你解開Spark和類型sbin目錄/ start-all.sh在本地啓動星火
2打開瀏覽器,它指向http://localhost:8080/檢查是否星火成功啓動的目錄。在頁面頂部的火花主的網址複製(它開始與火花://)
3定義以下環境變量: 出口MAHOUT_HOME = [你簽出亨利馬烏到哪個目錄] 出口SPARK_HOME = [目錄是你解開星火] 出口MASTER = [星火主的URL]
4最後,切換到該目錄是你解開象夫和類型斌/ Mahout的火花外殼,你應該看到的外殼開始,並得到提示mahout>。檢查常見問題以進一步排除故障
0
請訪問link。它使用新的mahout 0.10,並使用火花服務器。
相關問題
- 1. 如何在特定節點上運行Spark作業
- 2. 在Hadoop上運行Mahout作業:得到ClassNotFoundException
- 3. 在Google應用引擎上部署mahout
- 4. Spark/Hadoop作業沒有運行在parralel
- 5. 如何在Mesos上運行Spark Spark shell?
- 6. NoClassDefFoundError當運行mahout spark-items相似性
- 7. 如何配置Hive在Google Dataproc上使用Spark執行引擎?
- 8. 在EMR上運行mahout RecommenderJob
- 9. Apache Mahout作爲推薦引擎
- 10. 如何在UNIX上運行maven作業
- 11. 如何在DataProc上運行Spark時對新作業進行排隊
- 12. 在集羣上部署Mahout作業
- 13. 如何在集羣上運行spark工作遠程瞭解如何在集羣上運行spark工作
- 14. Weka vs Mahout推薦引擎
- 15. spark-jobserver和mllib問題運行作業
- 16. 在Mesos羣集上運行多個Spark作業
- 17. 在DSE 4.8 Spark羣集上運行Python作業時出錯。
- 18. 僅在主設備上運行的Spark作業
- 19. 在應用引擎上運行BigQuery加載作業會陷入掛起狀態
- 20. 如何在網絡上運行Apache Spark作業後獲得輸出
- 21. Mahout推薦引擎:正在分發
- 22. 如何獲得Apache Spark作業的DAG而不運行它?
- 23. 在Google應用引擎上運行hadoop?
- 24. SparkPi程序繼續在Yarn/Spark/Google計算引擎下運行
- 25. 如何在Docker上運行Spark?
- 26. Mesos上的Spark - 運行多個Streaming作業
- 27. 如何在Spark集羣上運行Spring引導應用程序
- 28. 我可以在Oozie中運行py spark作爲shell作業嗎?
- 29. 運行quickfix引擎
- 30. 在Hadoop集羣上運行Mahout