Q
HDFS文件比較
3
A
回答
11
提供了用Hadoop沒有diff
命令,但你可以在你的shell與diff
命令實際使用重定向:
diff <(hadoop fs -cat /path/to/file) <(hadoop fs -cat /path/to/file2)
如果你只是想知道,如果兩個文件是相同的或並非沒有照顧到知道差異,我會建議另一種基於校驗和的方法:你可以得到兩個文件的校驗和然後比較它們。我認爲Hadoop不需要生成校驗和,因爲它們已經存儲了,所以它應該很快,但我可能是錯的。我不認爲這有一個命令行選項,但你可以用Java API輕鬆做到這一點,並創建一個小應用程序:
FileSystem fs = FileSystem.get(conf);
chksum1 = fs.getFileChecksum(new Path("/path/to/file"));
chksum2 = fs.getFileChecksum(new Path("/path/to/file2"));
return chksum1 == chksum2;
3
好,最簡單的答案很可能是:
diff <(hadoop fs -cat file1) <(hadoop fs -cat file2)
它只是將你的本地計算機上運行。如果這太慢了,那麼是的,你必須對Hive和MapReduce做些什麼,但這有點棘手,並且不會與diff的按序比較完全匹配。
相關問題
- 1. 2 Hdfs文件比較
- 2. hdfs中的兩個文件比較
- 3. 如何將hdfs文件與unix文件進行比較?
- 4. 我們如何比較的一致性LOCALFILE和HDFS文件
- 5. 文件比較
- 6. 文件比較
- 7. 文件比較
- 8. 比較文件.class Bejond比較4
- 9. 文件夾/文件比較
- 10. 多文件比較
- 11. xml文件比較
- 12. Powershell比較文件
- 13. Unix文件比較
- 14. 比較文件名
- 15. Jmeter文件比較
- 16. xml文件比較
- 17. C文件比較
- 18. 比較xml文件
- 19. linux文件比較
- 20. 比較.properties文件
- 21. xml文件比較
- 22. perl文件比較
- 23. 比較WSDL文件
- 24. 比較csv文件
- 25. Powershell文件比較
- 26. XML文件比較
- 27. SSIS比較文本文件
- 28. 文本文件比較
- 29. 比較XML文件和文本文件
- 30. DUnit比較兩個文本文件並顯示比較
你使用的是什麼版本的hadoop?你在使用CDH發行版嗎? –