我公司目前已經在Hadoop中實現,谷歌的框架構建決策樹(也稱爲PLANET)。它從一個頂點開始,並且在樹完全構建之前添加越來越多的地圖縮減作業。然而,一個主要的問題是大量的地圖/縮減作業一個接一個地運行,因此始終創造新作業的成本非常高。Apache Hama適合構建決策樹嗎?
我看到很多倍的Apache哈馬適合於迭代算法等的曲線圖。有人可以用哈馬建立一個新的圖表,或者你只需要輸入圖表並對其進行一些計算?將我的項目轉移到哈馬很容易嗎?由於
我公司目前已經在Hadoop中實現,谷歌的框架構建決策樹(也稱爲PLANET)。它從一個頂點開始,並且在樹完全構建之前添加越來越多的地圖縮減作業。然而,一個主要的問題是大量的地圖/縮減作業一個接一個地運行,因此始終創造新作業的成本非常高。Apache Hama適合構建決策樹嗎?
我看到很多倍的Apache哈馬適合於迭代算法等的曲線圖。有人可以用哈馬建立一個新的圖表,或者你只需要輸入圖表並對其進行一些計算?將我的項目轉移到哈馬很容易嗎?由於
哈馬確實能夠構建使用這顆行星論文中描述,在比MapReduce的一個更有效的方式的算法的決策樹。
哈馬不需要圖形作爲輸入,你可以看看哈馬ML(學習機)模塊,通常與原始特徵從HDFS交易視爲直接輸入。
對於哈馬我創建了一個new issue in the Apache Jira跟蹤該算法的進步。
您好,我從哈馬球隊的時候,我會幫助你建立這樣的事情,因爲它可以爲我們的機器學習模塊一套好的西裝。你會介意到hama-dev郵件列表並再次提出你的問題嗎? (http://hama.apache.org/mail-lists.html)。圖表模塊並不適合我的觀點。 –
但爲了讓它不那麼令人興奮,是的,哈馬可以做到這一點非常有效。我在我的路線圖上有這個,但是我無法深入瞭解它。 –
我多次看到你的帖子托馬斯,其實我從你身上學到了哈馬:P。我像你說的那樣發送到列表中 – jojoba