0

我想配置一個提升的決策樹,但不知道如何去做,我知道每個參數的含義,但不是我必須分配給它的最佳值。如何配置增強樹模型

  • 這裏是參數:

每棵樹葉片的最大數目:我把(60100200300)

每葉節點樣本的最小數目:我把(10, 30)

學習率:我把(0,1)

構建樹木

:我把(2000,5000,6000)

隨機數種子:我把(4)

的問題是如何知道,如果你把正確的價值觀或者如果你沒有過度使用模型?

+0

使用交叉驗證。 –

+0

問題不在於如何不過度配合,而是要了解每一個參數,而不是隨機放置數值。這是我的問題:( –

+0

閱讀官方文檔,你會得到一個有關參數的想法,以及如何選擇最佳參數值而不會過度擬合 https://msdn.microsoft.com/en-us/library/azure /dn906025.aspx –

回答

0

如果您使用的是參數的多個值(比如你把每棵樹的葉子爲60,100,200的最大數量,300)在一個特定的算法(不僅僅是提振決策樹算法,但所有的算法在Azure機器學習),你必須考慮使用Tune Model Hyperparameters模塊。

該模塊重申了您的機器學習實驗。它會給你調整的參數,然後顯示其相應的度量/結果。

只需用Tune Model Hyperparameters模塊取代您的火車模型模塊。

enter image description here

的「調諧」參數是這樣的(I指定的5次/調諧模型超參數模塊上迭代)

enter image description here

在上面的示例屏幕截圖,如果着眼於獲得樣本回歸模型的最高準確度/確定係數,您可以使用第四行顯示的參數。

希望你可以複製你的結局。 :)