嗨我想從文本文件中使用spark讀取特定的行。如何從sparkContext讀取特定行
SparkConf conf = new SparkConf().setAppName(appName).setMaster(master);
sc = new JavaSparkContext(conf);
JavaRDD<String> lines = sc.textFile("data.txt");
String firstLine = lines.first();
它可以使用.first()命令來獲取data.text文檔的第一行。我如何訪問文檔的第N行?我需要Java解決方案。
如果你使用DataFrames進行獲取路線,我認爲你需要'lines.take(n).apply(n-1)' –
謝謝,我以某種方式解決了這個問題。假設「'n'th」是基於零的:)。 'lines'應該是'JavaRDD',所以'take'會返回一個Java'List',因此'get'而不是'apply'。 –