2017-07-10 87 views
0

在Azure ML中,我有一個使用增強型決策樹迴歸的預測迴歸模型,它相當準確。確定決策樹迴歸使用的關鍵列/特徵

輸入數據集有超過450列,並且該模型在預測測試數據集方面做得很好,沒有過度擬合。

要報告結果,我需要知道該模型主要用於進行預測的特徵/列,但在查看訓練的模型數據時,我無法輕鬆找到這些信息。

我如何識別這些信息?我很高興將結果數據集導入到R中,以幫助您找到這一點,但我只需要指出開始工作的方向。

+0

您需要R中的模型對象,而不僅僅是結果數據框。我是否正確理解您正在爲您的模型使用某種天藍色ml庫,而不是R包? – JanLauGe

+0

即時通訊在Azure ML Studio在線工具集中進行所有處理。 –

回答

0

大多數情況下,在使用Microsoft Azure機器學習時,在查看主要用於製作預測,它可在模塊的輸出中找到。

但在使用決策樹作爲你的算法,你的火車模型模塊的輸出將被構建的「樹木」的算法,它看起來像這樣:

enter image description here

要知道在使用決策樹算法時對預測產生影響的功能,您可以使用排列功能重要性模塊。看看下面的樣本實驗:

enter image description here

排列的特徵重要性的參數是隨機種子公制測量性能(在這種情況下,迴歸 - 係數測定的)

左輸入排列特徵重要性您的訓練模型右側輸入您的測試數據

排列的特徵重要性的輸出是這樣的:

enter image description here

您可以添加執行[R腳本提取的特點,並從排列的特徵重要性模塊成績