我不想使用databricks API,因爲我們遇到了幾個問題。將數據框保存爲文本文件而不使用數據框API
我想如果我們使用的DF轉換爲RDD和RDD在Java 1.7到文本文件,星火1.6.2
我希望我的數據幀,以保存爲一個文本文件,我知道下面的代碼工作Java的1.8
df.rdd.map(row => row.mkString("\t")).coalesce(1).saveAsTextFile("outputDirRdd")
但我嘗試把同樣的上面的代碼與Java 1.7我無法得到正確的語法與下面的代碼擊中。
df.toJavaRDD().map(new Function<???,???>() {
public ??? call(?? input) throws Exception {
?????
}
}).coalesce(1).saveAsTextFile("/s/filelocation");
我不知道上面的代碼是否正確。
請幫我從這裏,在此先感謝。
感謝您的更新人士Himanshu的創建。我已經嘗試過,但我得到的任務沒有序列化的錯誤,爲此,我實現了可序列化的接口,仍然得到相同的問題引起:org.apache.spark.SparkException:任務不可序列化 – BadBoy777
你能提供錯誤堆棧跟蹤? – himanshuIIITian
沒關係。序列化問題是固定的,當我創建一個單獨的類而不是匿名類。謝謝:) – BadBoy777