2010-04-29 52 views
5

我想在Windows上運行的應用程序中使用Mahout。我想使用k-means從lucene索引構建集羣。因爲Hadoop會對Windows環境中未知的程序(例如chmod)進行命令行調用,所以只要我必須創建序列文件(從lucene索引創建向量),我就會得到一個Hadoop異常。在Cygwin中運行不是一種選擇,因爲我希望能夠從eclipse運行App。如何在Windows環境中使用Mahout?

所以我的問題是

  • 有沒有辦法避免必須創建序列文件來從lucene索引中檢索我的向量?
  • 或者有沒有辦法在Windows環境中創建序列文件?
  • 回答

    4

    在Windows環境下運行Hadoop的唯一方法是安裝Cygwin。欲瞭解更多信息,請參閱本博客文章:

    http://hayesdavis.net/2008/06/14/running-hadoop-on-windows/

    Cygwin的將提供所有的命令行實用程序(如文件模式),其Hadoop的依賴。如果需要,您仍然可以從Eclipse內部運行Hadoop作業。

    +0

    借調,這是更多關於Hadoop的問題,並且不能在Windows上運行Hadoop。 – 2010-05-02 06:41:23

    +0

    HDInsight是Windows Azure的Hadoop實現。如果您想在本地計算機上使用它,而不是在雲中使用它,請嘗試使用HDInsight仿真器,您可以使用Web Platform Installer進行安裝。 – user888734 2014-02-17 13:28:32

    +0

    您可能想更新您的答案,因爲現在可以在Windows中使用Hadop(https://wiki.apache.org/hadoop/Hadoop2OnWindows)。我很樂意回答,但我仍然在尋找一種方法來使用Mahout :) – fxm 2014-07-31 14:21:46

    0

    您可以使用虛擬機來運行Hadoop環境。 至於我,最好的解決方案是使用http://hortonworks.com/項目。 一切都很好。

    相關問題