當我嘗試在Apache Mahout中運行示例時，此錯誤告訴我們什麼？

我學習使用Apache Mahout中，並運行它的例子之一後收到以下消息：當我嘗試在Apache Mahout中運行示例時，此錯誤告訴我們什麼？

Exception in thread "main" org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: file:/home/user1/workspace/LDAAnalysis/output/data

事實上，*/output/data目錄被發現在此創建運行後。我不明白這個錯誤信息告訴我們什麼？

來源

2011-06-15 bit-question

我想你必須提供比這更多的信息？它通常意味着您指定的輸入目錄不正確。特別是我猜測它需要成爲HDFS路徑。 – 2011-06-16 08:15:32

肖恩，謝謝你的回覆。我對Hadoop不熟悉，並且正在嘗試使用單節點學習Mahout。根據你的說法，我仍然需要在Hadoop中設置路徑，即使是在一個普通的Linux機器上。我的理解是否正確？ – 2011-06-16 14:09:20

第一個大問題是「什麼樣的」？有些將在當地工作，有些則不會。我認爲這是LDA相關的，但會說非常有幫助。或者打印更多的堆棧跟蹤。

這不僅僅是正確書寫路徑的問題。你必須建立正確的目的地。從您的評論我不確定您是否設置了Hadoop或者HDFS是否正在運行或您已經輸入了哪些內容。

來源

2011-06-16 14:43:11

感謝您的回覆。我嘗試運行的java文件與examples/src/main/java/orga/apache/mahout/clustering/syntheticcontrol/dirichlet/job.java完全一樣。我沒有在我的linux機器上安裝hadoop。 hadoop是運行mahout所必需的。我運行displayDirichlet.java，它工作得很好。 – 2011-06-16 19:26:05

命令行如何？輸入是問題，但不清楚你的輸入是什麼。 – 2011-06-16 20:41:31

我也懷疑輸入數據沒有正確的格式。我正在努力使其中一個。在我看來，Mahout文檔在這方面不是很清楚。你能給我任何建議嗎？或者是否有任何公開可用的數據集，它與Mahout兼容，並且可以下載？我只是想測試。 – 2011-06-17 18:42:51

當我嘗試在Apache Mahout中運行示例時，此錯誤告訴我們什麼？

回答

相關問題