2016-01-16 60 views
-2

我已將〜40000個羣聚類爲79個羣集。每個點都是18個特徵的向量。我想要「推導出」每個羣集的特徵 - 羣集的突出特徵/特徵。是否有機器學習算法來推導這一點?如何派生羣集屬性

+1

您能否指出您使用的是哪種技術? – raulk

+1

此外,交叉驗證社區也可以提供幫助。 – raulk

+1

*什麼*特點。這是不明確的。例如,大小和平均值是不重要的「特徵」,您不需要「派生」算法。 –

回答

2

如果您確信羣集對您的特定需求有意義,您可以將其視爲分類問題。

一種選擇是應用特徵選擇算法來排列特徵。您可以使用遞歸特徵消除來識別可預測羣集標籤的功能子集。

解釋羣集的另一個好的選擇可能是建立一個決策樹。通過決策樹,您可以查看哪些功能用於最好地區分類(您的案例中的集羣)。你也可以使用隨機森林這樣的合奏並要求特徵重要性分數。

+0

非常感謝戴夫和所有提問的人。我正在考慮獲取質心參數(特徵權重)並將其用作(可能原樣)作爲集羣的表示。我會考慮(並消化)大衛的評論。回答他人的問題:我認爲,我使用的是什麼技術並不重要。我的編碼實踐跨越R,Python和最近的Scala。目前,我所需要的只是想法......我可以嘗試一下我的數據,看看有什麼效果。 – user1717931