2017-04-08 75 views
0

在隨機森林方法中,對於每棵樹,我們隨機選擇一組固定大小的變量(特徵)。但是一旦這個集合被凍結了那棵特定的樹,該樹的行爲是否像一個常規的決策樹算法?在隨機森林中的樹中的每個節點上隨機選擇變量

我假設隨機森林只不過是產生一堆經典的「決策樹」,並將他們的選票投向最終的分類。但在許多地方,我所讀過的任何描述似乎都表明了這一點;對於森林內的給定決策樹,即使在每個節點處,我們也會隨機選擇變量。是這樣嗎?

這是否意味着在樹中的每個節點上,我們從該樹固定的變量集中隨機選擇m個變量?還是從訓練數據集的全局變量集?然後從選定的一組變量中選擇1個啓發式變量(例如,哪個變量使信息增益最大化) - 這是一個正確的陳述嗎?

回答

0

「在隨機森林方法中,對於每棵樹,我們隨機選擇一組固定大小的變量(特徵),但是一旦該特定樹被凍結,該樹的行爲是否像常規決策樹算法」

沒有

「我假設隨機森林不過是生成大量的經典的‘決策樹’,並採取他們的選票對最終的分類,但在任何說明我看過很多地方似乎暗示。對於森林內的給定決策樹,即使在每個節點上,我們都會隨機選擇變量,是這樣嗎?「

「這是否意味着,在樹中的每個節點,我們隨機選擇一個固定的那棵樹變量設置的M變量?

這是稍顯混亂,這是假設還有另一個更大的子集保留給那棵可以選擇m的樹嗎?如果不是這個假設,我認爲這基本上是問樹是否隨着每個節點的隨機選擇的特徵而生長,答案是否爲

在隨機森林中,每個節點的特徵隨機化發生,所以如果有ar總共100個預測變量,對於樹中的每個節點,隨機選擇10個子集(比如說)並評估最佳分組。請注意,在樹的整個生長過程中,每個節點中的樹數保持不變。

希望這會有所幫助。