2016-12-16 29 views

回答

1

您可以將多個文件添加到sc.textFile。您不應該在地圖操作中使用scmap函數將分發給不同的執行者,並且sc居住在驅動程序中。因此它會拋出一個Nullpointer異常。

a.txt contents:

a.txt:line1 
a.txt:line2 

b.txt contents:

b.txt:line1 
b.txt:line2 

星火允許你在相同的操作添加更多的文件:

scala> sc.textFile("a.txt,b.txt").collect() 
res1: Array[String] = Array(a.txt:line1, a.txt:line2, b.txt:line1, b.txt:line2) 

希望這有助於和有樂趣星火!

+0

sc.textFile(「a.txt,b.txt」)。collect()該語法按順序讀取文件,我需要以並行方式執行 –

+0

它將並行執行。如果你打開Spark UI,你會看到創建了兩個任務。當您添加更多文件時,任務數量會增加。 –

+0

謝謝,我會盡快更新 –