2016-11-24 33 views
0

我開發了一個web應用程序,用戶可以選擇機器學習框架/迭代次數/其他一些調整參數。我如何通過向用戶傳遞所有輸入和顯示響應來從用戶界面調用Spark作業。根據框架(dl4j/spark mllib/H2o),用戶可以上傳輸入的csv或者可以從Cassandra讀取數據。Spark從web應用程序學習設計模型

  1. 如何從用戶界面調用SPARK作業?
  2. 如何將結果顯示給用戶?

請幫忙。

回答

1

你可以看看這個github repository.

在這個正在做什麼,只要一個GET請求到達,它從卡桑德拉取出數據,然後收集數據,並拋出回爲響應。

你可以做的是,只要你收到一個POST請求,你可以從請求參數,並相應地使用這些參數進行操作和收集:在您的情況

所以結果在主設備上,然後將其作爲響應返回給用戶。

P.S:在Master上收集有點棘手,大量的數據會導致OOM。你可以做的就是將結果保存在hadoop上,並將URL發送回結果或類似的東西。

欲瞭解更多信息看看這個博客與此相關的github上: https://blog.knoldus.com/2016/10/12/cassandra-with-spark/

+0

我是新來SPRAK和AKKA。我已經下載了該項目並在本地機器上成功執行了它。我可以在紗線上運行相同的應用程序嗎?我可以在生產中使用它嗎? – lalithark

+0

這不是生產級別的代碼!你可以根據你的用例來改變它! –

+0

如果我想在紗線模式下運行代碼,我應該做的所有更改是什麼?我不能在紗線模式下使用AKKA休息嗎? – lalithark