我有一個非常大的數據框,有8000列和50000行。 我想把它的統計信息寫入excel文件。 我想我們可以用describe()
的方法。但如何以良好的格式編寫出色的表現。謝謝如何寫火花sql數據框到excel文件的摘要
1
A
回答
2
describe
的返回類型是一個pyspark數據框。拿到describe
數據幀到Excel可讀的格式,最簡單的方法是將其轉換爲大熊貓數據幀,然後寫大熊貓據幀作爲一個CSV文件,如下
import pandas
df.describe().toPandas().to_csv('fileOutput.csv')
如果你希望它爲Excel格式,你可以嘗試下面
import pandas
df.describe().toPandas().to_excel('fileOutput.xls', sheet_name = 'Sheet1', index = False)
注意,上述要求xlwt包被安裝(PIP在命令行安裝xlwt)
相關問題
- 1. 如何寫火花數據框到Postgres數據庫
- 2. 火花數據框被寫入分區
- 3. 火花:如何從火花外殼運行火花文件
- 4. 如何添加火花數據框中的火花數據框的列(使用Pyspark)?
- 5. 如何將表註冊爲火花表到數據框
- 6. 過濾條件如何在火花數據框中工作?
- 7. 保存數據幀中的火花SQL
- 8. 無法將火花數據幀寫入json文件
- 9. 如何獲取火花數據框中記錄的輸入文件名?
- 10. 火花寫入結果[數組[不限]]到文件
- 11. 用scala寫火花sql中的UDF
- 12. 如何將數據寫入Excel文件?
- 13. 如何將火花數據幀保存爲excel格式?
- 14. 火花數據框中groupping不計空
- 15. 加入數據框火花java
- 16. 火花2到火花1.6
- 17. 如何從Excel文件加載數據到sql數據庫?
- 18. 火花SQL
- 19. 要火花還是不火花?
- 20. 如何將非數據框參數傳遞給udf火花
- 21. 如何在火花中操縱我的數據框?
- 22. 如何將記錄插入火花的數據框
- 23. 如何平鋪火花數據框中的結構?
- 24. 如何寫火花自定義數據源基於FileFormat
- 25. 將數據從火花寫入Vertica如何工作?
- 26. 火花數據集:如何從一列
- 27. 如何獲得火花數據幀
- 28. 爲什麼無法將地板文件加載到火花數據框?
- 29. 更新數據框中,如果不相等火花數據幀
- 30. Apache的火花數據幀
Excel可以打開的CSV(逗號分隔值)文件作爲一個普通的電子表格。所以最簡單的事情就是將任何輸出打印爲以逗號分隔的值,然後用Excel打開它。 –
確實如此,但最好先將它轉換爲熊貓數據框,這樣您就不必擔心部分文件了 – David