我已經創建了jar,它運行mapReduce並在某個目錄下生成輸出。 我需要從我的java代碼中的輸出目錄中讀取輸出數據中的數據,這些數據不是在hadooop環境中運行的,也不需要將其複製到本地目錄中。 我正在使用ProcessBuilder來運行Jar.can任何一個幫助我.. ??如何從hadoop獲取輸出數據?
1
A
回答
1
您可以編寫以下代碼來讀取MR驅動程序代碼中作業的輸出。
job.waitForCompletion(true);
FileSystem fs = FileSystem.get(conf);
Path[] outputFiles = FileUtil.stat2Paths(fs.listStatus(output,new OutputFilesFilter()));
for (Path file : outputFiles) {
InputStream is = fs.open(file);
BufferedReader reader = new BufferedReader(new InputStreamReader(is));
---
---
}
1
使用HDFS API讀取HDFS數據時出現什麼問題?
public static void main(String[] args) throws IOException {
// TODO Auto-generated method stub
Configuration conf = new Configuration();
conf.addResource(new Path("/hadoop/projects/hadoop-1.0.4/conf/core-site.xml"));
conf.addResource(new Path("/hadoop/projects/hadoop-1.0.4/conf/hdfs-site.xml"));
FileSystem fs = FileSystem.get(conf);
FSDataInputStream inputStream = fs.open(new Path("/mapout/input.txt"));
System.out.println(inputStream.readLine());
}
您的程序可能已經用完了您的hadoop集羣,但hadoop守護程序必須正在運行。
相關問題
- 1. Hadoop 0.2:如何從TextOutputFormat讀取輸出?
- 2. 如何從流式Hadoop作業獲取壓縮(文本)輸出
- 3. Hadoop如何獲取未存儲在HDFS上的輸入數據?
- 4. 如何從Python Beaglebone使用Python獲取數據輸出
- 5. 如何從數據庫表中獲取xml輸出
- 6. 如何從directshow濾波器輸出引腳獲取數據?
- 7. hadoop mongodb連接器讀取數據,但輸出爲mysql數據
- 8. 如何從hadoop的臨時文件中獲取數據?
- 9. 嘗試從Hdfs輸出讀取hadoop
- 10. 如何將數據從Hadoop導出到MySQL /任何數據庫?
- 11. 如何從CreateProcessWithLogonW獲取標準輸出?
- 12. 如何從usemin任務獲取輸出?
- 13. 如何從R腳本獲取輸出
- 14. 如何從eval()獲取console.log輸出?
- 15. execv如何從管道獲取輸出?
- 16. 如何從NBoilerPipe獲取HTML輸出?
- 17. 如何從Rails Runner獲取輸出?
- 18. 如何從mysql插入獲取輸出?
- 19. 如何從javascript/jQuery獲取html輸出?
- 20. 如何從DataGrid獲取HTML輸出?
- 21. 如何從oprofile輸出獲取callstack?
- 22. 如何從json數據的輸出中獲取特定的數據?
- 23. 如何從php://輸入數據獲取數據?
- 24. 爲Hadoop/PIG輸出數據分配ID
- 25. 如何從powershell函數獲取輸出到例如txt的輸出文件中?
- 26. 如何從java 8中的js函數獲取數組輸出?
- 27. 如何在Hadoop中獲取計數器
- 28. 獲取從輸出參數C#
- 29. 從數字開始獲取rownums輸出
- 30. 獲取從JavaScript函數輸出在C++