2017-04-11 80 views
0

我想將spark數據框保存到excel中。如何將火花數據幀保存爲excel格式?

我已經通過在每個節點中保存csv文件並使用DataBricks spark-CSV將其附加到服務器中來完成csv。

我不知道如何去做excel。有人請提出建議和想法。

+4

爲什麼你需要輸出一個Excel文件? Spark用於大數據處理。如果你打算使用Excel打開你的輸出文件,它不再是大數據。因此,您可以將csv文件轉換爲不帶Spark的Excel文件。單個節點上的Apache POI應該足夠了。 –

回答

0

可以在星火使用數據源的HadoopOffice庫: https://github.com/zuinnote/hadoopoffice

但是,如果數據量存儲非常大,那麼它沒有那麼多的意義,因爲Excel本身有問題需要處理大數據文件。