0
A
回答
1
RDDs只能按鍵進行排序。非鍵/值數據無法排序。
但是,如果您確實在RDD中有一些排序的鍵/值數據,則收集將保留該順序。請注意,雖然collectAsMap()不會保留訂單。
map()返回非鍵/值數據,所以返回的RDD沒有排序。 flatMap()也是一樣。
怎麼樣mapToPair()和flatMapToPair。如果這些工作的RDD包含鍵/值數據,則沒有理由認爲輸出RDD的鍵是相同的,因此不能假定該順序被保留。我無法想象,在密鑰不變的情況下,這些方法已經實施以保持秩序。
mapValues()和flatMapValues()確實保留了輸入RDD的關鍵,因此可能會保留順序,但您必須自己調查。
至於zipWithIndex,根據這個:How Can I Obtain an Element Position in Spark's RDD?的RDD的排序是zipWithIndex作用於不保留
相關問題
- 1. 在鍵值對的RDD上應用ZipWithIndex
- 2. 排序由數組和保持秩序
- 3. SQL秩和分區
- 4. zipWithIndex與初始值RDD
- 5. 在返回RDD的函數上做flatmap
- 6. 如何保持秩序
- 7. GridBagLayout不保持秩序
- 8. 無法在RDD上應用flatMap
- 9. FlatMap功能CoGrouped RDD
- 10. 分組維持秩序
- 11. 分組維持秩序
- 12. 保持陣列的獨特價值,維持秩序,保持各
- 13. SQL:收益維持秩序值
- 14. 做foreachRDD保持秩序閱讀一個分區的卡夫卡話題?
- 15. 在Scala Akka期貨中,map和flatMap有什麼區別?
- 16. 重新分配(1)始終維持秩序嗎?
- 17. RDD分區
- 18. RxJava2 map/flatMap with flatMapIterable
- 19. LINQ聯盟 - 字符串保持秩序
- 20. 矢量差異,同時保持秩序
- 21. 保持跟蹤收集和新零件的舊部分
- 22. 在pyspark中收集帶有緩衝區的RDD
- 23. 模擬獨特的功能,保持秩序和重複的(MATLAB)
- 24. 斯卡拉集合分組,同時維持秩序
- 25. 保持收集訂購
- 26. zipWithIndex上MapPartitionsRDD
- 27. 多RDD與分區?
- 28. RDD分區邏輯
- 29. 收集日誌和分析,同時保持用戶匿名?
- 30. Spark map和flatMap結果類型
我不認爲RDD的元素不斷訂購。除此之外,也許,如果你做了一個排序。 – philantrovert