我有其中有一些多線觀察一個數據幀:如何處理火花多行的行?
+--------------------+----------------+
| col1| col2|
+--------------------+----------------+
|something1 |somethingelse1 |
|something2 |somethingelse2 |
|something3 |somethingelse3 |
|something4 |somethingelse4 |
|multiline
row | somethings|
|something |somethingall |
我要的是在csv
格式(或txt
)這個數據幀進行保存。使用以下內容:
df
.write
.format("csv")
.save("s3://../adf/")
但是,當我檢查文件時,它將觀察結果分離爲多行。我想要的是具有'多行'觀察值的行在txt/csv文件中是同一行。我試圖將其保存爲txt文件:
df
.as[(String,String)]
.rdd
.saveAsTextFile("s3://../adf")
但是觀察到相同的輸出。
我可以想象,一種方法是用其他東西替換\n
,並且在加載後執行反轉功能後。但是有沒有一種方法可以在不對數據進行任何形式的轉換的情況下以預期的方式進行保存?