我知道dataframes應該是不可變的,而且我知道嘗試改變它們並不是一個好主意。但是,我收到的文件有4列的無用標題(整個文件有50列以上)。所以,我試圖做的只是擺脫最頂端的行,因爲它拋出一切。Scala - 刪除Spark DataFrame的第一行
我已經嘗試了一些不同的解決方案(主要在這裏找到),如使用.filter()和地圖替換,但沒有得到任何工作
這裏的數據是如何看起來一個例子:?
H | 300 | 23098234 | N
D | 399 | 54598755 | Y | 09983 | 09823 | 02983 | ... | 0987098
D | 654 | 65465465 | Y | 09983 | 09823 | 02983 | ... | 0987098
D | 198 | 02982093 | Y | 09983 | 09823 | 02983 | ... | 0987098
任何想法
的可能的複製[如何跳過從星火CSV文件頭?](HTTP:/ /stackoverflow.com/questions/27854919/how-to-skip-header-from-csv-files-in-spark) – zero323