2017-02-18 42 views

回答

1

如果您正在使用Hadoop流,那麼你就可以在本地測試你的腳本是這樣的:

cat *.csv | map.py | sort -k1,1 | reducer.py 

從映射數據傳遞到減速機在Hadoop的數據流,簡單地寫"<key>\t<value>"到stdout

+0

這就是我所解決的。但是使用sort -n – Shehryar