我非常新的火花並且有特定的與工作流相關的問題。雖然這不是一個真正的編碼相關問題,但它更多的是一個與火花功能相關的問題,我認爲這是適當的。如果你認爲這個問題不適合SO,請隨時將我重定向到正確的網站。將火花數據加載到Mongo/Memcached中以供Webservice使用
所以在這裏: 1.我打算使用Spark的滑動窗口功能消耗一系列請求並計算推薦模型。一旦模型計算完成,Web服務是否可以直接從RDD查詢和使用這些數據?如果有的話,任何人都可以指出我如何實現這一目標的示例代碼?
- 如果不是,我想將數據存儲在memcached中,因爲我存儲的數據當前不是太大,主要用於內存中迭代計算和流式處理支持我使用Spark的目的,那麼是否有可能將RDD數據加載到memcached中?我在問,因爲我只能找到Spark的Mongo連接器,找不到Memcached連接器。
任何幫助和特別是特定的代碼示例/鏈接將不勝感激。
在此先感謝。
亞,所以如果我在坐在HDFS上的火花簇上運行我猜測mongo-hadoop連接器是爲我走的路。 @DeanWampler謝謝你的解釋,它真的幫助。雅我不介意把它們亂編亂寫,因爲RDD中的每個實體代表一個單獨的實體,所以應該沒問題。只要所有元素都寫入數據庫,我就可以使用它。 – anonuser0428 2015-04-05 18:59:15