2012-01-27 99 views
16

你知道一個好的梯度增強樹機器學習庫嗎?梯度增強樹庫

優選:

  • 具有良好的算法諸如AdaBoost,TreeBoost,AnyBoost,LogitBoost等
  • 具有可配置的弱分類器能夠分類和預測(迴歸)
  • 與所有的
  • 種類允許的信號:數字,類別或自由文本
  • C/C++或Python
  • 打開ource

到目前爲止,我發現http://www.multiboost.org/home看起來不錯。但我想知道是否還有其他圖書館?

回答

0

我個人更喜歡使用python subprocess模塊​​運行weka(這是java)。然而,我的同事經常使用:

  • orange - 推薦給我作爲Python的最佳機器學習工具包。
  • opencv - 這是C++,但有python綁定。該庫最初是爲計算機視覺開發的,但實現了許多ML算法(包括boosting)。
+0

的Weka看起來不錯,謝謝。 Orange似乎不支持梯度增強樹(afaik僅支持一棵樹)。 OpenCV支持增強樹,但似乎很專注於計算機視覺(我們需要它更多的文本分析,所以我不知道它是否可用)。謝謝! – 2012-02-01 14:01:19

3

這些不neccessarily滿足自己的喜好,但也有:

  • Treenet一個商業化和傑羅姆弗裏德曼最初實現的擴展。不開源,但我們發現它工作得很好
  • R gbm package特別針對梯度提升樹。
+0

R gbm看起來不錯。我們會嘗試。謝謝。 – 2012-02-04 10:46:16

14

如果您正在尋找python版本,scikit-learn的最新版本會提供用於分類和迴歸的梯度提升迴歸樹(docs)。

這是一個類似的r GBM包 - GBM是(最小二乘)迴歸哪來更快scikit學習的實現更快的測試時間,當你的功能數量> 1000

2

我會建議xgboost (問題提出時並不存在),這是一個開源的R/python包。

這是目前存在的最快速的梯度推進樹方法中,允許迴歸/分類,支持稀疏矩陣...