我想請你幫忙解決我的數據框問題。它是一個有許多階段的向量,每個階段我們都有變量名稱。可以說根據值的出現頻率分配權重
vec<-data.frame(phase1= c("var1","var2","var3","var4","var5","var6"),
phase2= c("var1","var3","var4","var2","var6","var5"),
phase3= c("var4","var3","var2","var1","var6","var5"))
vec
phase1 phase2 phase3
1 var1 var1 var4
2 var2 var3 var3
3 var3 var4 var2
4 var4 var2 var1
5 var5 var6 var6
6 var6 var5 var5
現在,可以說我們對前3行感興趣,因此其中一個變量的權重爲1/3,否則爲零。我的功能將理想地輸出某物那樣:
phase1 phase2 phase3
var1 0.33 0.33 0
var2 0.33 0 0.33
var3 0.33 0.33 0.33
var4 0 0.33 0.33
var5 0 0 0
var6 0 0 0
該函數應該也是第4,5或所有6行(即權重會改變然後)是適用的。 問候, 亞歷