0
我使用Hadoop-Hive來分析apache日誌到statis訪問功能。我寫了一個名爲GetCity的UDF將remote_ip轉換爲城市名稱,但是當我運行「select log_pre;」時選擇GetCity(remote_ip),「它非常慢,甚至在數據超過1000個項目時失敗。 我試圖設置mapred.reduce.tasks = 10,但jobtracker顯示的地圖總數爲1都是一樣的。選擇時如何設置更多地圖?我的Hive-UDF有什麼問題?如何設置配置單元的地圖編號?
謝謝!