2015-06-26 60 views
0

MATLAB特徵選擇算法reliefF的輸出是RANKED和WEIGHTS。MATLAB ReliefF輸出

http://in.mathworks.com/help/stats/relieff.html

如何在兩個輸出有關嗎?

+0

閱讀文檔時,究竟有什麼不清楚的地方? –

+0

從文檔,'排名= 重量= 0.1399 0.1226 0.3590 0.3754 第四預測器是最重要的,並且所述第二預測值是最重要的。 '級別和權重如何相關? – Sumit

回答

2

從文檔:

排名是按屬性重要性排序在X列的索引,這意味着排名(1)是最重要的預測指數。 WEIGHT是屬性權重,範圍從-1到1,分配給重要屬性的大正值權重。

所以relieff不只是給你一個預測指標最重要的清單,它還給你一個權重列表,讓你知道預測指標的重要性。例如,WEIGHT(4)是第四個預測變量的權重。 WEIGHT(RANKED)將按排名(從最高到最低)返回有序的權重列表。

您會注意到,在這種情況下,預測變量的權重值實際上相對接近。這可能表明,雖然對於這組特定的數據,第四個預測變量似乎排在第一位,第四個和第三個預測變量都很重要,並給出了排名可能改變的不同數據集。

例如,fisheriris數據集包含150個四個預測變量的測量值。如果我們把他們的只有三分之二,我們可以得到不同的結果:

load fisheriris 
[ranked,weight] = relieff(meas(1:100,:),species(1:100),10) 

這給我們:

ranked = 3 4 2 1 weight = 0.1574 0.2265 0.5431 0.4981 

上有relieff引用in the documentation三個學年論文。如果你真的想了解它正在做什麼的細節,你應該嘗試抓住這些。