我很想知道使用PHP或Ruby可以完成什麼級別的hadoop編程。我發現了一些關於hadoop streaming api的文章,這些文章可能會被PHP,Ruby破解。Hadoop支持php,ruby
我的問題
你可以寫PHP,Ruby中的map-reduce作業可與其他Hadoop的Java的地圖,減少從事的工作?
API級別編程在hadoop中,非Java語言缺少什麼?也就是說現在只能用java來完成,而不是其他語言呢?
感謝
我很想知道使用PHP或Ruby可以完成什麼級別的hadoop編程。我發現了一些關於hadoop streaming api的文章,這些文章可能會被PHP,Ruby破解。Hadoop支持php,ruby
我的問題
你可以寫PHP,Ruby中的map-reduce作業可與其他Hadoop的Java的地圖,減少從事的工作?
API級別編程在hadoop中,非Java語言缺少什麼?也就是說現在只能用java來完成,而不是其他語言呢?
感謝
就我個人而言,我也來自Ruby/Python背景,最初嘗試使用流來完成任務。最終,我決定給Java API一個機會,結果證明它不算太壞:)
簡而言之 - hadoop除了映射器和縮減器之外還有一些其他插件:combiners,輸入/輸出格式比較器。這些plagins只能用java編寫。
因此,這意味着通過流式傳輸使用hadoop可以套用一些簡單的案例,但會嚴重降低您的靈活性。
因爲使用不同的機制將記錄傳遞給映射器和簡化器,所以流式處理也稍慢。
謝謝大衛&薩爾的答案 – realnumber 2012-03-26 16:37:19