2012-12-26 36 views

回答

1

真實數據集可能包含許多屬性。在該數據集上應用任何數據挖掘過程(例如查找集羣,生成分類模型...)可能需要很長時間。

取而代之,我們可以選擇一些屬性(尺寸),稱爲the most discriminative attributes。這些屬性幾乎可以用較少數量的屬性來描述數據集,這將加快對數據執行的任何過程。

屬性選擇選項卡包含許多用於選擇這些屬性的不同方法。其中之一是CFS Feature Set Evaluation該過濾器爲您提供與類別標籤具有較高相關性的屬性,這使得它們具有區別性屬性。

相關問題