有什麼方法可以獲取DataFrame的當前分區數? 我檢查了DataFrame javadoc(spark 1.6),並沒有找到一個方法,或者我只是錯過了它? (對於JavaRDD,有一個getNumPartitions()方法)。獲取DataFrame的當前分區數
22
A
回答
43
您需要在DataFrame的基礎RDD上調用getNumPartitions()
,例如df.rdd.getNumPartitions()
。
3
轉換爲RDD然後拿到分區長度
DF.rdd.partitions.length
1
val df = Seq(
("A", 1), ("B", 2), ("A", 3), ("C", 1)
).toDF("k", "v")
df.rdd.getNumPartitions
+0
請仔細閱讀本[如何對答案】(http://stackoverflow.com/help/如何回答)提供高質量的答案。 – thewaywewere
相關問題
- 1. Hive相當於從當前分區日期獲取數據
- 2. Spark Dataframe的分區數
- 3. Oracle獲取當前和以前組(分區)的平均值
- 4. 獲取ICU的當前區域設置
- 5. Php:獲取當前區域的時間
- 6. PHP的獲取當前區域
- 7. Dask DataFrame Groupby分區
- 8. Spark-SQl DataFrame分區
- 9. SparkSQL PostgresQL Dataframe分區
- 10. Emacsclient獲取當前緩衝區?
- 11. 獲取當前國家/地區名稱
- 12. 獲取Olson時區當前偏移量
- 13. 提升:從機器獲取與當前時區當前LOCAL_DATE_TIME
- 14. 獲取ul的當前活動分類
- 15. 獲取當前分支的遠程
- 16. 獲取分頁的當前URL
- 17. 獲取UITableView的當前固定部分
- 18. WordPress的:獲取當前子分類
- 19. 獲取當前系統設置的分數分隔符
- 20. VBA:如何從過濾的數據中獲取當前區域?
- 21. 如何獲取當前日期和數字格式的時區
- 22. 如何區分當前數據和以前的數據?
- 23. 如何從當前時間獲取獲取時區?
- 24. 使用chrono :: time_point獲取當前的小時數和分鐘數
- 25. Spark DataFrame UDF分區列
- 26. Apache Spark DataFrame無RDD分區
- 27. 如何獲取當地時區的當前日期和時間?
- 28. Roslyn:獲取當前項目/獲取當前選中的文檔
- 29. 獲取包含當前行的部分的數量
- 30. PHP:使用時區獲取當前區域設置
喔是.. :)感謝 – kecso