2012-10-10 59 views
2

我公司目前已經在Hadoop中實現,谷歌的框架構建決策樹(也稱爲PLANET)。它從一個頂點開始,並且在樹完全構建之前添加越來越多的地圖縮減作業。然而,一個主要的問題是大量的地圖/縮減作業一個接一個地運行,因此始終創造新作業的成本非常高。Apache Hama適合構建決策樹嗎?

我看到很多倍的Apache哈馬適合於迭代算法等的曲線圖。有人可以用哈馬建立一個新的圖表,或者你只需​​要輸入圖表並對其進行一些計算?將我的項目轉移到哈馬很容易嗎?由於

+3

您好,我從哈馬球隊的時候,我會幫助你建立這樣的事情,因爲它可以爲我們的機器學習模塊一套好的西裝。你會介意到hama-dev郵件列表並再次提出你的問題嗎? (http://hama.apache.org/mail-lists.html)。圖表模塊並不適合我的觀點。 –

+1

但爲了讓它不那麼令人興奮,是的,哈馬可以做到這一點非常有效。我在我的路線圖上有這個,但是我無法深入瞭解它。 –

+0

我多次看到你的帖子托馬斯,其實我從你身上學到了哈馬:P。我像你說的那樣發送到列表中 – jojoba

回答

2

哈馬確實能夠構建使用這顆行星論文中描述,在比MapReduce的一個更有效的方式的算法的決策樹。

哈馬不需要圖形作爲輸入,你可以看看哈馬ML(學習機)模塊,通常與原始特徵從HDFS交易視爲直接輸入。

對於哈馬我創建了一個new issue in the Apache Jira跟蹤該算法的進步。

+0

請不要添加「謝謝」作爲答案。相反,投票答案,你覺得有幫助。 – JBCP

+0

@JBCP你是警察的答案嗎?我不能upvote我自己的答案,你應該更新你的機器人:p –

+1

這並沒有提供一個問題的答案。要批評或要求作者澄清,請在其帖子下方留言。 – showdev