2010-03-24 72 views
5

對於hadoop應用程序開發,PHP框架是不是很流行?如果是這樣,爲什麼?否則,請爲特定框架指出文獻/文檔/教程? (Symfony的東西太棒了!)Hadoop應用程序開發和PHP

回答

6

基本上Hadoop讓你運行你發送你自己的java類到集羣中,以便在適當的時候在適當的服務器上運行。 Hadoop的所有非JVM語言API基本上都涉及到運行預先存在的Java類,所以沒有什麼可能。

另外,hadoop並不是真正的互動框架。它更適合在合理的時間批量處理大量數據。大拇指的規則是,如果你在一個步驟中小於15MB的子工作進程,你不應該打擾hadoop。設置工作和洗牌數據和結果的開銷只會讓你失望。

沒有什麼能阻止你爲PHP創建自己的hadoop API,這同樣也適用於Python。但是,PHP並不真正受到大規模數據處理的人羣的歡迎。

+0

謝謝,弗拉德! 不過,爲什麼PHP不支持hadoop社區的原因尚不清楚。 例如,有一個Ruby應用程序,開放源代碼,trendingtopics.org,展示了在應用程序中使用hadoop 沒有什麼等同於任何人完成的任務,這一點! 很高興知道背後是否有更多重要原因。 – Arvind 2010-03-25 00:38:20

+2

以及trendingtopics.org實際上沒有將Ruby用於hadoop目的。 Ruby僅用作數據庫的前端。數據庫由hadoop作業填充。 hadoop作業是由蜂巢和python組合編寫的。這是代碼http://github.com/datawrangling/trendingtopics/tree/master/lib/scripts/。當我提到python綁定時,這正是我想到的應用程序。 – Vlad 2010-03-25 00:50:35