2012-09-14 21 views
1

我有一個數據集,其中包含表示分數和特徵(兩種計數的定性和定量混合)的變量。我想根據每個分數來聚類特徵(而不是個體觀察)。所以,我想要形成基於score_1的類似性狀(trait_1到trait_15),然後重複評分2和3.下面的數據結構示例。針對單一結果變量的集羣變量 - ClustOfVar

我在想我可以使用ClustOfVar包形成這些集羣,我會理解如果我只是試圖將所有變量集羣到類似組中。但是,我不知道如何根據其他變量之一對它們進行聚類。

如果有人有建議,我會很感激。提前致謝。

Score_1 Score_2 Score_3 Trait_1 Trait_2 Trait_3 … Trait_15 

N1
N2
N3
...
n100000

回答

0

你可能想看看子空間聚類算法。

他們通常允許重疊集羣,所以你可能會得到相當多的集羣。

您只對特質進行聚類,然後檢查找到的聚類是否與第二階段中的已知分數相對應。

+0

感謝您的建議 - 任何特定的軟件包或功能,你會推薦? –

+0

我不使用'R'。我喜歡高效的算法,R在社區中很受歡迎,它試圖通過矩陣乘法來解決所有問題。 –