我在我的hadoop集羣上有一個parquet文件,我想要捕獲列名和它們的數據類型並將它寫在textfile.how中,以使用pyspark獲取列名稱及其數據類型的parquet文件。如何使用pyspark獲取parquet文件的列名及其數據類型?
4
A
回答
8
你可以簡單地讀取該文件,並使用schema
訪問各個fields
:
sqlContext.read.parquet(path_to_parquet_file).schema.fields
2
使用dataframe.printSchema() - 打印出樹格式的模式。
df.printSchema() 根 | - 年齡:整數(可爲空=真) | - 名稱:字符串(可爲空=真)
您可以重定向程序的輸出並將其捕獲到文本文件中。
相關問題
- 1. 主鍵,其數據類型及其列名的SQL查詢?
- 2. 如何使用inputStream獲取文件名和文件類型?
- 3. 如何獲取目錄和文件名及其子文件夾
- 4. 如何獲取文件類型名稱?
- 5. 從列名稱獲取數據類型
- 6. 如何使用C#從XSD文件中提取屬性及其名稱和數據類型
- 7. 如何獲取PostgreSQL中表的列名和數據類型?
- 8. Pyspark:如何使用其他數據框
- 9. 如何使用JavaScript獲取kendo網格列的數據類型?
- 10. 如何使用PL-SQL獲取Oracle中的列數據類型
- 11. 如何更改pyspark數據幀列數據類型?
- 12. 如何獲取Parquet文件中的記錄數
- 13. pyspark - 從數據框中獲取數組類型的值
- 14. 從數據庫獲取表名,其中包含特定的數據類型列
- 15. 如何獲取GEOMETRY數據類型列中的條目類型
- 16. 如何在oracle中獲取所有表名及其列名?
- 17. Pyspark:更改嵌套列數據類型
- 18. 如何在Spark中更有效地加載Parquet文件(pySpark v1.2.0)
- 19. 如何在pyspark中並行寫入多個parquet文件?
- 20. 如何使用pyspark讀取orc文件
- 21. 如何獲取文件夾內容以及其他自定義類型?
- 22. 如何使用JavaScript在JSON中獲取類別及其相關數據
- 23. 如何從匿名類中獲取不同類型的數據
- 24. 如何從數據庫中使用c#獲取單列數據(以及如何將其添加到列表中)
- 25. 續集:如何獲取數據集列的數據類型
- 26. 按類型獲取文件而不使用文件擴展名
- 27. 如何使用pyspark獲取數據幀中的不同行?
- 28. 查詢以獲取松鼠的所有列名稱及其類型
- 29. 如何獲取數據庫中表名及其列名,其名稱中包含特定關鍵字
- 30. 如何獲取pyspark數據框中具有最大值的列的名稱