我有一個尺寸爲401 * 5677的數據集。在這個矩陣的列中有列是相同的但列名不同。 現在,我想只保留一列以上的列,這些列不止一次重複,並且還爲刪除的列獲取索引j。刪除矩陣中的重複列
讓我們作爲一個例子矩陣使用,以下內容:
B=matrix(c(1,4,0,2,56,7,1,4,0,33,2,5), nrow=3)
colnames(B)<-c("a","b","c","d")
我做什麼,到目前爲止(在我的實矩陣G)是:
corrG<-cor(G)
Gtest=G
for (i in 1:nrow(corrG)){
for (j in 1:ncol(corrG)){
if (i<j && corrG[i,j]==1){
Gtest[,j]=NA
}
}
}
Gfinal<-Gtest[,complete.cases(t(Gtest))]
我的代碼返回一個矩陣,仍包含(!)一些重複的列。 有什麼幫助嗎?
@ Nishanth - 這是很好的方法與'數據Frames'工作? – 2017-07-24 15:33:29