我正在處理一些聚類分析結果。我正在嘗試爲我正在進行的每個羣集分析創建羣集成員表。如何創建組成員的表格或數據框(從長格式數據中按組分組)?
例如:
test_data <- data.frame(
Cluster = sample(1:5,100,replace=T),
Item = sample(LETTERS[1:20],5, replace=F))
head(test_data)
Cluster Item
1 2 R
2 5 F
3 1 T
4 5 Q
5 3 B
6 3 J
我想產生這樣的:
Cluster_1 Cluster_2 Cluster_3 Cluster_4 Cluster_5
T R C P L
K O J M Q
I H B N F
D G E
S A
我第一次嘗試spread
,但並沒有與這些數據進行工作
spread(test_data, item,group)
錯誤:行重複標識符
spread(test_data, group,item)
錯誤:重複標識符行
然後我試圖:
test_frame <- split.data.frame(test_data,test_data$group)
但是,這會導致數據幀的列表,以及每個組的數據幀。我沒有能夠成功地將它變成我想要的東西。
我試過unnest
和unlist
,但由於每個組的成員元素數量不同,這些功能會給出錯誤。
引入NA就沒問題。
有沒有一種簡單的方法可以實現我忽略的功能?
簡潔並做好工作 - 謝謝! – JLC