2015-11-24 36 views
1

我們有非常複雜的管道,我們需要編寫和安排。我看到Hadoop生態系統爲此提供了Oozie。當我在Mesos或Standalone上運行Spark並且沒有Hadoop集羣時,基於Spark的作業有哪些選擇?什麼是oozie等同於Spark?

回答

0

與使用Hadoop,它是很容易的事情連鎖星火。所以編寫一個Spark Scala腳本可能就足夠了。我的第一個建議是綁定。

如果你想保持它像SQL一樣,你可以試試SparkSQL。

如果你有一個非常複雜的流程,那麼值得看一下Google數據流https://github.com/GoogleCloudPlatform/DataflowJavaSDK

0

Oozie可以用於紗線的情況下, 對於spark沒有內置的調度程序可用,因此您可以自由選擇任何在集羣模式下工作的調度程序。

對於Mesos我覺得Chronos的將是正確的選擇,更多信息的Chronos

相關問題