我的數據幀輸出保存爲文本文件後刪除列名是如下,
DF.show(2)
從火花數據幀,而把它作爲文本文件
+--------------+
|col1|col2|col3|
+--------------+
| 10| 20| 30|
| 11| 21| 31|
+--------------+
- DF.rdd.saveAsTextFile(「路徑」)
Row(col1=u'10', col2=u'20', col3=u'30')
Row(col1=u'11', col2=u'21', col3=u'31')
數據幀有數百萬行和20列,我怎樣才能將其保存爲文本文件如下,即沒有列名和Python統一碼
10|20|30
11|21|31
在創建初始RDD我用下面的代碼去除統一碼,但仍然得到統一碼,
data = sc.textFile("file.txt")
trans = data.map(lambda x: x.encode("ascii", "ignore").split("|"))
提前感謝!
謝謝@PeterK,這是爲這個例子DF工作,但我的實際DF包含數百萬行和20列,,,我怎麼能爲真正的DF做到這一點? – user491
對不起,我能夠運行此爲我的實際DF,而最初嘗試時,我面臨的問題 - SyntaxError:非ASCII字符'\ xe2'在文件中,這[鏈接](http://stackoverflow.com/questions/ 21639275/python-syntaxerror-non-ascii-character-xe2-in-file)幫助我 – user491
@ hadoop491如果您不想指定所有可以嘗試的列: .map(lambda x:'|'.join(地圖(STR,X))) –