我下載了「Mahout in Action」第09章最新版本的示例。我可以成功運行幾個示例,但對於三個文件,NewsKMeansClustering.java,ReutersToSparseVectors.java和NewsFuzzyKMeansClusteing.java。這些運行三個程序提供了類似的錯誤消息:運行Mahout示例的錯誤
2011年8月3日下午2時03分54秒org.apache.hadoop.metrics.jvm.JvmMetrics初始化 信息:與初始化JVM度量processName = JobTracker的,的sessionId =
2011年8月3日下午2時03分54秒org.apache.hadoop.mapred.JobClient configureCommandLineOptions 警告:使用GenericOptionsParser解析參數。應用程序應該爲
實現相同的工具。2011年8月3日下午2:03:54 org.apache.hadoop.mapred.JobClient configureCommandLineOptions 警告:沒有作業jar文件集。用戶類可能找不到。請參閱JobConf(Class)或 JobConf#setJar(String)。
異常線程 「main」 org.apache.hadoop.mapreduce.lib.input.InvalidInputException:輸入路徑不存在:文件:/首頁/用戶1/workspaceMahout1 /推薦/ inputDir
在org.apache .hadoop.mapreduce.lib.input.FileInputFormat.listStatus(FileInputFormat.java:224)
在org.apache.hadoop.mapreduce.lib.input.SequenceFileInputFormat.listStatus(SequenceFileInputFormat.java:55)
at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits(FileInputFormat.java:241)
在org.apache.hadoop.mapred.JobClient.writeNewSplits(JobClient.java:885) 在org.apache.hadoop.mapred.JobClient.submitJobInternal(JobClient.java:779) 在org.apache.hadoop。 mapreduce.Job.submit(Job.java:432) 在org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:447)
在org.apache.mahout.vectorizer.DocumentProcessor.tokenizeDocuments(DocumentProcessor的.java:93) 在mia.clustering.ch09.NewsKMeansClustering.main(NewsKMeansClustering.java:54)
對於上述消息,我不太UND這兩個警告意味着什麼?而且,它看起來應該已經創建了「輸入路徑」,我該如何創建這種類型的輸入?謝謝。
肖恩,謝謝你的迴應。我將這些示例導入到Eclipse中,並使用「Run as application」運行這些程序。我想我需要設置輸入,但我不知道該怎麼做。你想給我一個例子嗎?謝謝。 – user873766
這應該在書中。 -Dmapred.input.dir是輸入標誌。你已經設置好了。這只是不存在。 –
目前,在「workspaceMahout1/recommender」目錄下,我只能找到「pom.xml」,「src」和「target」。我找不到像「inputDir」這樣的東西。我查了這本書,似乎在命令行中使用了「Dmapred.input.dir」。 (第83頁)。但我無法弄清楚這與我的情況有何關係?你能給我更多的細節嗎?謝謝。 – user873766