2013-04-21 75 views
1

我試圖在Eclipse上運行字數統計示例。通常當我們點擊eclipse中的「在hadoop上運行」選項時,我們會得到一個新窗口,要求選擇服務器位置。但是,現在它直接運行程序,而不要求我從下面的列表中選擇現有的服務器。Hadoop WordCount示例 - 在Hadoop(Eclipse)上運行選項不提示選擇Hadoop服務器在窗口上運行

我想因爲這個我收到以下異常:

FileInputFormat.setInputPaths(conf, "/home/hduser1/gutenbergIP/pg4300.txt"); 

到:

FileInputFormat.setInputPaths(conf, "hdfs://localhost:54310/home/hduser1/gutenbergIP/pg4300.txt"); 

如果,如果我更改從線

13/04/21 08:46:31 ERROR security.UserGroupInformation: PriviledgedActionException as:hduser1 cause:org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file:/home/hduser1/gutenbergIP/pg4300.txt 
Exception in thread "main" org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file:/home/hduser1/gutenbergIP/pg4300.txt 

我的代碼工作我明確指定了正在工作的完整網址的文件名。我想要一些幫助。我如何讓我的親戚網址工作,而不是提供完整的網址(必須將此作爲學校作業提交)。

回答

0

添加以下兩行代碼中的:

config.addResource(new Path("/HADOOP_HOME/conf/core-site.xml")); 
config.addResource(new Path("/HADOOP_HOME/conf/hdfs-site.xml")); 

如果不指定該客戶會考慮當地的FS,不包含在指定的路徑,因此拋出這個錯誤。

+0

謝謝@Tariq,它像一個魅力工作! – 2013-04-21 17:27:30