2017-02-27 115 views
0

基本上我需要做的是將CTBNCToolkit與Apache Spark集成,因此該工具箱可以利用Apache Spark的併發和集羣功能。將任意Java機器學習與Apache Spark集成

總的來說,我想知道的是有由Apache Spark開發者接觸到任何Java/Scala庫的方式,機器學習庫可以在星火的併發管理上運行集成任何方式?

所以我們的目標是讓獨立機器學習庫更加快速併發。

回答

0

不,這是不可能的。

所以你想要的是任何算法在Spark上運行。但是,爲了平行工作,Spark使用RDDDataset。所以爲了同時運行你的任務,算法將不得不使用這些類。

你可以嘗試的唯一事情就是編寫你自己的Spark程序,它使用任何其他庫。但我不確定你的情況是否可行。但是,Spark ML對你來說還不夠嗎?

+0

感謝您的回覆。 「不過,Spark ML對你來說不夠嗎?」其實我看不到Spark ML提供任何CTBNC算法。連續時間貝葉斯網絡分類器 – ehsun7b