當Mahout預計類型爲DataModel
時,我的問題是將數據從Amazon S3提供給Mahout。來自hdfs或S3的Mahout DataModel流
我想運行一個應用程序亨利馬烏基本上只是做簡單的建議
new PearsonCorrelationSimilarity(DataModel);
我可以做,只要它的工作,因爲我用常規的文件,我可以使用像從亞馬遜S3閱讀的東西這樣的:
FileSystem fs = FileSystem.get(URI.create("s3n://mybucket"), conf);
FSDataInputStream userPreferencesFile = fs.open(new Path("path/to/my/file"));
但我給了我是一個流,什麼PearsonCorrelationSimilarity(DataModel)
預計是亨利馬烏dataModel
,這是應該進行備份與文件。
- 我可以在本地fs上進行推薦工作。
- 我可以讀取hdfs或S3。
- 我不知道如何將hdfs流轉換成可以輸入到dataModel中的東西。
我認爲這背後有一些非常簡單的東西,我無法看到,因爲我對Java沒有經驗。
謝謝。我可能已經表達了這個問題不是那麼確切。我確實知道dataModel需要被指定,例如personCorrelationSimilarity期望FileDataModel。對我來說,根本問題是我無法弄清楚如何將FileDataModel從hdfs輸入流中提取出來。正如我所說,我可以使它與本地文件系統一起工作,在那裏我可以打開一個實際的文件。特別感謝文檔鏈接 - 我儘可能地避免了這種情況。 – svj
不客氣。我更新了關於hdfs的文章,希望能更準確地解決問題。 –