我運行的Apache豬0.11.2用Hadoop 2.2.0。獲取錯誤apche的豬在紗線行走時「org.apache.hadoop.ipc.Client - 重試連接到服務器:tasktracker3/10.201.2.169:50000」
,我在豬運行的大多數簡單的工作完全正常工作。
然而,每當我試圖在大數據集使用GROUP BY,或LIMIT運營商,我得到這些連接錯誤:
2013年12月18日11:21:28,400 [ main] INFO org.apache.hadoop.ipc.Client - 重試連接到服務器:tasktracker2/10.201.2.145:54957。 已嘗試0次(s);重試策略是 RetryUpToMaximumCountWithFixedSleep(maxRetries = 3,休眠時間= 1秒) 2013年12月18日11:21:29402 [主要] INFO org.apache.hadoop.ipc.Client - 重試連接到服務器:tasktracker2/10.201。 2.145:54957。已經 嘗試過1次;重試策略是 RetryUpToMaximumCountWithFixedSleep(maxRetries = 3,休眠時間= 1秒) 2013年12月18日11:21:30403 [主要] INFO org.apache.hadoop.ipc.Client - 重試連接到服務器:tasktracker2/10.201。 2.145:54957。已經 嘗試過2次; RetryUpToMaximumCountWithFixedSleep(maxRetries = 3,sleepTime = 1 SECONDS) 2013-12-18 11:21:30,507 [main] INFO org.apache.hadoop.mapred.ClientServiceDelegate - 應用程序狀態爲 已完成。 FinalApplicationStatus =成功。重定向到作業 歷史記錄服務器2013-12-18 11:21:31,703 [main] INFO org.apache.hadoop.ipc.Client - 重試連接到服務器: tasktracker1/10.201.2.20:49528。已經嘗試0次(s);重試策略 是RetryUpToMaximumCountWithFixedSleep(maxRetries = 3,休眠時間= 1 秒),2013年12月18日11:21:32704 [主要] INFO org.apache.hadoop.ipc.Client - 重試連接到服務器: tasktracker1/10.201 .2.20:49528。已經嘗試過1次;重試策略 是RetryUpToMaximumCountWithFixedSleep(maxRetries = 3,休眠時間= 1 秒),2013年12月18日11:21:33705 [主要] INFO org.apache.hadoop.ipc.Client - 重試連接到服務器: tasktracker1/10.201 .2.20:49528。已經嘗試過2次(s);重試策略 是RetryUpToToMaximumCountWithFixedSleep(maxRetries = 3,sleepTime = 1 SECONDS)2013-12-18 11:21:33,809 [main] INFO org.apache.hadoop.mapred.ClientServiceDelegate - 應用程序狀態爲 已完成。 FinalApplicationStatus =成功。重定向到工作 歷史服務器2013年12月18日11:21:34890 [主] INFO org.apache.hadoop.ipc.Client - 重試連接到服務器: tasktracker3/10.201.2.169:50000。已經嘗試0次(s);重試策略 是RetryUpToMaximumCountWithFixedSleep(maxRetries = 3,休眠時間= 1 秒),2013年12月18日11:21:35891 [主要] INFO org.apache.hadoop.ipc.Client - 重試連接到服務器: tasktracker3/10.201 .2.169:50000。已經嘗試過1次;重試策略 是RetryUpToMaximumCountWithFixedSleep(maxRetries = 3,休眠時間= 1 秒),2013年12月18日11:21:36893 [主要] INFO org.apache.hadoop.ipc.Client - 重試連接到服務器: tasktracker3/10.201 .2.169:50000。已經嘗試過2次(s);重試策略 是RetryUpToToMaximumCountWithFixedSleep(maxRetries = 3,sleepTime = 1 SECONDS)2013-12-18 11:21:36,996 [main] INFO org.apache.hadoop.mapred。ClientServiceDelegate - 應用程序狀態爲 已完成。 FinalApplicationStatus =成功。重定向到工作 歷史服務器2013年12月18日11:21:37152 [主] INFO org.apache.hadoop.mapred.ClientServiceDelegate - 應用程序狀態 完成。 FinalApplicationStatus =成功。重定向到工作 歷史服務器
奇怪的是,這些錯誤保持約分鐘出現了之後,他們就會停止,並在底部正確的輸出顯示出來。
所以,Hadoop是運行良好,並計算適當的輸出。問題在於這些連接錯誤一直在彈出。並導致腳本的執行時間增加。我已經注意到
的一件事是,每當出現這種錯誤,作業創造和作業期間多個JAR文件。但是,在彈出這些消息幾分鐘後,終於出現正確的輸出。
我有5個節點集羣1個名稱節點和數據管理部4。所有的守護進程都運行良好。
任何建議如何擺脫這些消息的?