我有一個尺寸爲100*512
的csv文件,我想在spark
中進一步處理它。該文件的問題是它不包含標題,例如column names
。我需要這些列名稱作爲machine learning
的進一步ETL。我在另一個文件(文本文件)中有列名。我必須將這些列名稱作爲標題放在上面提到的csv文件中。 例如將標題添加到csv文件
CSV文件: -
AB 1 23 SF 23 HJH
HS 6 89 IU 98 ADF
GH 7 78 PI 54 NGJ
JH 5 22 KJ 78 JDK
列標題文件: -
一,二,三,四,五,六
我想要的輸出是這樣的: -
一二三四五六
AB 1 23 SF 23個HJH
HS 6 89 IU 98 ADF
GH 7 78 54 PI NGJ
JH 5 22千焦耳78 JDK
請提出一些方法,以列頭添加到該CSV文件。(無取代csv文件的行。 我試過將它轉換成熊貓數據框,但無法獲得預期的輸出。
只需在將csv數據提供給文件之前編寫包含標題的行。你有什麼嘗試? –
你是什麼意思_without替換csv文件_的行? –