如何爲數據框創建實體拼塊創建功能?爲數據框創建實現拼花地板的功能
的數據幀,以鑲文件創建的語法是一樣的東西 - (pyspark)
df.write.mode( '覆蓋')實木複合地板( 「file_name.parquet」)
創建功能。對於這一點,我想以這樣的方式
def parquet_create(df_name,file_name):
df_name.write.mode('overwrite').parquet(file_name+".parquet")
return
但是,當我與parquet_create運行( 「ABC」, 「EEE」)......它失敗
AttributeError: 'str' object has no attribute 'write'
因此,我初始化了一個空的數據框到上面,有沒有更簡潔的方法來實現?
def parquet_create(df_name,file_name):
df_name = sqlContext.read.json("my_empty_file.parquet")
df_name = df_name.write.mode('overwrite').parquet(file_name+".parquet")
return
如何做到這一點,如果數據幀initalized出功能?
看起來你傳遞的是一個數據框的名稱,而不是對象本身 – bendl
是的,我想通過數據幀的名稱,並使用上述功能,只要我想創建一個實木複合地板 – Viv
從一個已經存在,還是一個你會在以後做?在我看來,你不需要創建一個空的parquet文件,並且如果你已經有一個填充的數據框,沒有理由不僅僅傳遞數據幀對象本身 – bendl