2011-06-15 31 views
1

我學習使用Apache Mahout中,並運行它的例子之一後收到以下消息:當我嘗試在Apache Mahout中運行示例時,此錯誤告訴我們什麼?

Exception in thread "main" org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: file:/home/user1/workspace/LDAAnalysis/output/data 

事實上,*/output/data目錄被發現在此創建運行後。我不明白這個錯誤信息告訴我們什麼?

+0

我想你必須提供比這更多的信息?它通常意味着您指定的輸入目錄不正確。特別是我猜測它需要成爲HDFS路徑。 – 2011-06-16 08:15:32

+0

肖恩,謝謝你的回覆。我對Hadoop不熟悉,並且正在嘗試使用單節點學習Mahout。根據你的說法,我仍然需要在Hadoop中設置路徑,即使是在一個普通的Linux機器上。我的理解是否正確? – 2011-06-16 14:09:20

回答

1

第一個大問題是「什麼樣的」?有些將在當地工作,有些則不會。我認爲這是LDA相關的,但會說非常有幫助。或者打印更多的堆棧跟蹤。

這不僅僅是正確書寫路徑的問題。你必須建立正確的目的地。從您的評論我不確定您是否設置了Hadoop或者HDFS是否正在運行或您已經輸入了哪些內容。

+0

感謝您的回覆。我嘗試運行的java文件與examples/src/main/java/orga/apache/mahout/clustering/syntheticcontrol/dirichlet/job.java完全一樣。我沒有在我的linux機器上安裝hadoop。 hadoop是運行mahout所必需的。我運行displayDirichlet.java,它工作得很好。 – 2011-06-16 19:26:05

+0

命令行如何?輸入是問題,但不清楚你的輸入是什麼。 – 2011-06-16 20:41:31

+0

我也懷疑輸入數據沒有正確的格式。我正在努力使其中一個。在我看來,Mahout文檔在這方面不是很清楚。你能給我任何建議嗎?或者是否有任何公開可用的數據集,它與Mahout兼容,並且可以下載?我只是想測試。 – 2011-06-17 18:42:51

相關問題