我有以下的減速類節省JSON數據在HDFS Hadoop中
public static class TokenCounterReducer extends Reducer<Text, Text, Text, Text> {
public void reduce(Text key, Iterable<Text> values, Context context)
throws IOException, InterruptedException {
JSONObject jsn = new JSONObject();
for (Text value : values) {
String[] vals = value.toString().split("\t");
String[] targetNodes = vals[0].toString().split(",",-1);
jsn.put("source",vals[1]);
jsn.put("target",targetNodes);
}
// context.write(key, new Text(sum));
}
}
去通的例子(免責聲明:新手在這裏),我可以看到,一般的輸出類型似乎像一個鍵/值存儲。
但是如果我在輸出中沒有任何鍵,會怎麼樣?或者如果我想如果我的輸出是以其他格式(我的情況下是json)呢?
反正從上面的代碼: 我想寫對象到HDFS json
?
這在Hadoop流中非常瑣碎..但是我如何在Hadoop java中做到這一點?
嗨@Charles我是新來的Hadoop一旦我們存儲在HDFS我們如何檢索數據,如果我們不應用任何鍵值概念JSON數據文件。 – u449355