阿帕奇星火:地圖比較VS flatMap VS mapPartitions VS mapPartitionsWithIndex阿帕奇星火:地圖比較VS flatMap VS mapPartitions VS mapPartitionsWithIndex
建議,歡迎來提高我們的知識。
阿帕奇星火:地圖比較VS flatMap VS mapPartitions VS mapPartitionsWithIndex阿帕奇星火:地圖比較VS flatMap VS mapPartitions VS mapPartitionsWithIndex
建議,歡迎來提高我們的知識。
map(func) 它是做什麼的?通過提供的功能傳遞RDD的每個元素;即FUNC
flatMap(FUNC) 「相似的映射,但每個輸入項可以被映射到0以上輸出項(所以FUNC應返回SEQ而不是一個單一的項目)。」
mapPartitions(FUNC) 考慮mapPartitions性能優化工具來映射。在本地計算機上運行示例與在羣集上運行相比,它不會有太大幫助。它與地圖相同,但適用於Spark RDD分區。請記住,RDD中的第一個D是「分佈式」 - 彈性分佈式數據集。換句話說,你可以說它是分佈式的。
mapPartitionsWithIndex(FUNC) 類似於mapPartitions,而且還提供了與一個Int值以指示所述分區的索引位置的函數。