0
我想創建一個行[RDD]斯卡拉-java.lang.ArrayIndexOutOfBoundsException:1
val RowRDD =sc.textFile("InputFile.csv").map(x=>x.split(" ")).map(p=>Row(p(1),p(2)))
InputFile.csv是
spark 5 1
hadoop 7 1
flink 10 1
然而,當我運行我的應用程序中,錯誤說
java.lang.ArrayIndexOutOfBoundsException: 1
很明顯'InputFile.csv'有3行,爲什麼會出現錯誤?
難道會有一個空行導致錯誤?但是,請記住,在Spark中,您可以輕鬆地讀取CSV(可指定自定義列分隔符,因爲它似乎與您的情況相關)。更多在這裏:https://spark.apache.org/docs/2.1.1/sql-programming-guide.html#data-sources CSV閱讀器的選項在這裏:https://spark.apache.org/docs /2.1.1/api/scala/index.html#[email protected](paths:String*):org.apache.spark.sql.DataFrame – stefanobaghino
@stefanobaghino是的,一個空行可能是這個問題。我試圖照顧空線並取得成功。 –