2017-03-09 66 views
-2

我有一個POJO值的RDD。我需要遍歷RDD的值。但由於數據量巨大,我不想使用收集。在不使用collect的情況下在apache spark中迭代RDD

是否有任何替代方法來迭代RDD值而不使用collect。

+2

什麼是你想實現什麼?什麼是最終目標?大多數RDD操作以某種方式「迭代」RDD。最基本的是'map',它爲每個元素應用一個函數,並返回一個帶有變換元素的新RDD。 – puhlen

+0

如果您嘗試將POJO的RDD保存在持久性存儲中,那麼您也可以使用'map'功能。在這種情況下,您不必收集所有數據。但是,如果你能告訴你想要達到的目標會更好。 – himanshuIIITian

回答

相關問題