我想在Windows上運行的應用程序中使用Mahout。我想使用k-means從lucene索引構建集羣。因爲Hadoop會對Windows環境中未知的程序(例如chmod)進行命令行調用,所以只要我必須創建序列文件(從lucene索引創建向量),我就會得到一個Hadoop異常。在Cygwin中運行不是一種選擇,因爲我希望能夠從eclipse運行App。如何在Windows環境中使用Mahout?
所以我的問題是
我想在Windows上運行的應用程序中使用Mahout。我想使用k-means從lucene索引構建集羣。因爲Hadoop會對Windows環境中未知的程序(例如chmod)進行命令行調用,所以只要我必須創建序列文件(從lucene索引創建向量),我就會得到一個Hadoop異常。在Cygwin中運行不是一種選擇,因爲我希望能夠從eclipse運行App。如何在Windows環境中使用Mahout?
所以我的問題是
在Windows環境下運行Hadoop的唯一方法是安裝Cygwin。欲瞭解更多信息,請參閱本博客文章:
http://hayesdavis.net/2008/06/14/running-hadoop-on-windows/
Cygwin的將提供所有的命令行實用程序(如文件模式),其Hadoop的依賴。如果需要,您仍然可以從Eclipse內部運行Hadoop作業。
您是否知道SequenceFile
API?看看這裏:http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/io/SequenceFile.html 你可以嘗試自己寫/讀數據。
我想你可以在Windowns中以獨立模式運行eclipse中的Mahout。但你會出現幾個短暫的障礙。你應該嘗試你多遠。
在我看來,你不應該堅持從日食中運行mahout。 ;-)
您可以使用虛擬機來運行Hadoop環境。 至於我,最好的解決方案是使用http://hortonworks.com/項目。 一切都很好。
借調,這是更多關於Hadoop的問題,並且不能在Windows上運行Hadoop。 – 2010-05-02 06:41:23
HDInsight是Windows Azure的Hadoop實現。如果您想在本地計算機上使用它,而不是在雲中使用它,請嘗試使用HDInsight仿真器,您可以使用Web Platform Installer進行安裝。 – user888734 2014-02-17 13:28:32
您可能想更新您的答案,因爲現在可以在Windows中使用Hadop(https://wiki.apache.org/hadoop/Hadoop2OnWindows)。我很樂意回答,但我仍然在尋找一種方法來使用Mahout :) – fxm 2014-07-31 14:21:46