2016-06-18 66 views
-3

我想知道是什麼類型的文件用於阿帕奇星火,例如(CSV,TXT等)來承載數據什麼類型的

+0

順便說一下,Hadoop標籤並不是真的必要,因爲Spark可以在沒有HDFS和YARN的情況下工作 –

回答

0

fileStream可以接受任何類型的文件作爲用於Apache的火花流媒體文件只要您可以提供可將其轉換爲記錄的輸入格式類即可。有用的輸入應該是可分解的,並且不需要閱讀整個文件就可以輕鬆解析,但只要您能夠接受性能損失就不一定要有。