我已經在我的ubuntu上安裝了hadoop,並運行示例代碼來測試。其中一個常見示例是https://github.com/tomwhite/hadoop-book/tree/master/ch02/src/main/pythonpython mapreduce示例在hadoop中的最大/最小溫度
我測試了此代碼w /給出示例文件(https://github.com/tomwhite/hadoop-book/blob/master/input/ncdc/sample.txt)。但是,當我根據數據文件修改映射器代碼時,減速器從0%變爲33%,然後回到0%。任何人都可以幫助解釋爲什麼發生這種情況,或者我應該如何修改代碼我的數據是這樣的:
STN---,WBAN , YEARMODA, TEMP, , DEWP, , SLP , , STP , , VISIB, , WDSP, , MXSPD, GUST, MAX , MIN ,PRCP ,SNDP , FRSHTT,
690190,13910, 20120101, 42.9,18, 29.4,18, 1033.3,18, 968.7,18, 10.0,18, 8.7,18, 15.0, 999.9, 52.5*, 31.6*, 0.00I,999.9, 000000,
你的日誌說什麼? – Tariq
它的像/user/hadoop/../_logs --->/_logs/history有兩個文件,一個是.jar和conf.xml。 – farey