0
我有一個顯示兩個真正大集羣的PCA,我不知道如何確定每個集羣中的哪些樣本。從PCA獲取集羣r
如果有幫助,進出口使用prcomp生成PCA:
pca1 <- autoplot(prcomp(df), label = TRUE, label.size = 2)
我的方法是嘗試集羣中使用K均值的PCA輸出,2組獲得集羣:
pca <- prcomp(df, scale.=TRUE)
clust <- kmeans(pca$x[,1:2], centers=2)$cluster
然後我可以做一個美麗的情節,但我仍然失去了每個集羣中的哪些樣本。作爲參考,在這裏,如果我繪製的k均值輸出的情節產生:
正如你可以在第一PCA圖看,標籤從字面上說,每個點是樣品。我的理想輸出將是一個雙列txt文件,其中一列中的樣本名稱以及它所屬的組在另一列中。
所有這一切,如果有更好的辦法,請讓我知道。
在此先感謝。
這是我的數據塊:
a b c b e
Sample_1013 312011 624559 625898 534309 220415
Sample_1046 474774 949458 951145 843049 366136
Sample_104 645363 1290450 1292520 919474 272200
Sample_1057 267319 534685 535294 690574 422645
Sample_106 414065 830571 834527 657354 234130
Sample_107 299289 602483 603756 566256 262153