2012-12-07 26 views

回答

6

那麼,最後我發現我可以指定一個目錄作爲輸入路徑,Hadoop將處理該目錄中的所有文件。

另外在我的情況下,我有包含輸入文件的子目錄。 Hadoop將不會橫向傳遞目錄,並會默認引發錯誤。一個常見的技巧是使用通配符像

python count.py hdfs://master-host/directory/*/*.txt > result 
相關問題