2013-05-16 61 views
0

決策樹通常必須爲每個觀察(實例)確定結果類(例如,陽光,雨,...)。任何確定實例類的方法?

我想知道是否有任何數據挖掘算法可以根據確定類的屬性對實例進行分組。

下面是一個例子:

day, outlook, temp, humidity, windy, play 
1, sunny, 85, 85, false, no 
2, sunny, 80, 90, true, no 
3, overcast, 80, 90, true, no 
3, rainy, 80, 90, true, no 

在這種情況下,我可以爲實例使用的遊戲或Outlook作爲一個結果類。

我的問題是,如果有任何算法或方法在那裏會說,例如outlook是一個屬性,我可以用作結果類。

+0

我不知道我是否有正確的答案。你想要做的是檢測那些暗示實例屬於特定類的屬性? 這是一個非常簡單和天真的例子,但我希望它可以幫助,給予的屬性:「溼地板」,「帶着雨傘的人」;他們可能與班級「雨」非常相關。 Regards, – miguelmalvarez

+0

我重新說明了我的問題並添加了一個示例。 –

+0

你可以嘗試Weka,我認爲它有一個工具來做功能排名..它會告訴你所有的實例最區別的功能..是你在找什麼? –

回答

0

顯然,連續屬性不起作用。

但除此之外,任何離散屬性都可以工作。

問題是,你在做什麼要做,電腦程序如何知道

你必須告訴它哪個是你的輸出,哪個是你的輸入。

某些程序當然會應用啓發法,即如果一個屬性被命名爲「class」或使用特殊的「class」類型,它將自動被選爲輸出,而其餘的則作爲輸入。