0
基本上我需要做的是將CTBNCToolkit與Apache Spark集成,因此該工具箱可以利用Apache Spark的併發和集羣功能。將任意Java機器學習與Apache Spark集成
總的來說,我想知道的是有由Apache Spark開發者接觸到任何Java/Scala庫的方式,機器學習庫可以在星火的併發管理上運行集成任何方式?
所以我們的目標是讓獨立機器學習庫更加快速併發。
基本上我需要做的是將CTBNCToolkit與Apache Spark集成,因此該工具箱可以利用Apache Spark的併發和集羣功能。將任意Java機器學習與Apache Spark集成
總的來說,我想知道的是有由Apache Spark開發者接觸到任何Java/Scala庫的方式,機器學習庫可以在星火的併發管理上運行集成任何方式?
所以我們的目標是讓獨立機器學習庫更加快速併發。
不,這是不可能的。
所以你想要的是任何算法在Spark上運行。但是,爲了平行工作,Spark使用RDD
或Dataset
。所以爲了同時運行你的任務,算法將不得不使用這些類。
你可以嘗試的唯一事情就是編寫你自己的Spark程序,它使用任何其他庫。但我不確定你的情況是否可行。但是,Spark ML對你來說還不夠嗎?
感謝您的回覆。 「不過,Spark ML對你來說不夠嗎?」其實我看不到Spark ML提供任何CTBNC算法。連續時間貝葉斯網絡分類器 – ehsun7b