文件分隔符我有特殊的分隔符的文本文件:特殊字符作爲火花
35¡1682¡231¡20.00000000¡50.00000000¡0.00000000¡0.00000000¡304.1100¡333.110000
¡I¡1¡0¡10¡SHORT NAME
1105682¡0¡100000.00000000¡100000.00000000¡1105682¡D¡D
我想基於當前¡
特殊的分隔符火花此文件分割。 請建議解決方法。這個命令的 產出比來作爲
val input_header = sc.textFile(path).first()
當我在讀這RDD文件,並顯示它的內容。它顯示分隔符爲?
正確讀取你的文件你檢查你的文件的UTF編碼? –
你應該很可能檢查這個:https://stackoverflow.com/questions/43200978/spark-read-wholetextfiles-with-non-utf-8-encoding –