使用分割函數省略的空字段 - Spark Scala

我是新的與Spark和Scala的世界進行交互。使用分割函數省略的空字段 - Spark Scala

我有下列數據的文件：

1.1|AGDT970HH|02|2011|N||||| 
110000000000|0.00|0.00|0.00|1485976093.32| 
110100000000|0.00|0.00|0.00|248871036.86| 
110200000000|0.00|0.00|0.00|229610905.15| 
110201000000|0.00|0.00|0.00|256660759.36| 
110202000000|0.00|0.00|0.00|234105514.15| 
110203000000|0.00|0.00|0.00|-261155368.36| 
110300000000|0.00|0.00|0.00|280990.61|

始終該文件的第一行將相比於其它行有不同的佈局。

出於這個原因，我想給它不同的治療，所以我試圖讓第一行的值（包括空的）：

val fileToRead = sc.textFile("FileName") 
val firstRow = fileToRead.first.split("\\|")

但創建我FIRSTROW場時它不包含空值：

它只保存包含值的值。

有誰知道如何保留這些空值？

來源

2017-06-20 Erik Barajas

你可以得到它 val firstRow = fileToRead.first.split("\\|", -1)

來源

2017-06-20 17:26:23

使用分割函數省略的空字段 - Spark Scala

回答

相關問題