2010-07-22 28 views
5

我是一名PHP開發人員。現在就讓我們來解決這個問題。但Hadoop - 和Mahout尤其是 - 激起了我的興趣。我準備好深入Java以使用它們。需要多少Java纔能有效地使用Hadoop和Mahout?

那麼從人們的經驗知道,我需要多少Java才能夠有效地使用它們?從我所看到的,編程映射器/縮減器並不佔用太多。但是對於Mahout,當我查看文檔時,我一點也不確定我在看什麼。

另外,從我的PHP應用程序獲取數據以通過Hadoop和Mahout在Java中進行處理有多難?我無法想象它會那麼困難,但我沒有足夠的經驗來說。

回答

7

從PHP到Java的數據使用Mahout和Hadoop進行分析應該不是那麼困難。

更容易的是在批處理模式下使用Mahout和Hadoop脫機進行處理,並將數據產品存儲在文件系統或數據庫中。然後,PHP可以像讀取日誌一樣簡單地讀取這些數據產品。

對於實時使用,Mahout的推薦部分支持各種Web服務接口,使得從PHP訪問非常容易。打到Mahout的模型評估部分需要更多的編程。

+0

泰德,你是否介意指出我在文檔中提到這些Web服務接口的地方?我不確定我自己已經遇到過這種情況。 在此期間,謝謝你的回答! – 2010-07-22 21:40:54

+0

沒關係。我想我在Taste文檔中找到了它。然而,對於像我這樣的noob,你是否會介意在如何集成PHP以與Mahout一起在實時應用程序中使用PHP?我非常感謝它。 – 2010-07-22 21:43:05

+0

很抱歉,回答緩慢......但PHP很容易通過PHP的Web服務調用與Mahout的Taste組件集成。另一種方法是使用Quercus從Java環境運行PHP並直接調用Apache Mahout組件。 – 2010-09-12 08:28:15

1

Java的初學者級別就足夠了。你總是可以在特殊需求的基礎上深入挖掘。

1

我只是做了同樣的事情,而且我已經做了多年Java相關的任何事情。我所做的是以下幾點:

  1. 開始了與簡單的Hadoop流的例子
  2. 盡我自己的分析與PHP流
  3. 入門豬
  4. 開始嘗試使用PHP內豬
  5. 流試驗

沒有任何Java!

0

對於實時建議,您還可以在java servlet類中實例化一個mahout實例,然後將這個導出作爲一個戰爭在tomcat服務器上提供。

相關問題