我有一個數據幀dfu
,對於每個id
成立(ID屬於一個team
,team
有許多ids
)其中屬性prop1
,prop2
等的一束是基於觀察到的百分比樣品在過去的一些研究中 - 這被用作未來研究的參考表。現在有來自新實驗的數據給出了一組新的ids
。我需要通過使用dfu
中的參考數據來查找其中prop1
,prop2
等以每個team
爲基準觀察到的百分比樣本。這可以通過在dfi
計算每id
出現的次數來完成,然後採取由team
.-不是所有的ID在dfu
分組可以存在和不存在於dfu
在dfi
可以存在一個或多個ID的加權平均。 dfu
中不存在的ID可能會從加權平均值中排除,因爲每個屬性值都不存在。申請分佈新的採樣集
dfu <- data.frame(id=1:6, team=c('A',"B","C","A","A","C"), prop1=c(0.8,0.9,0.6,0.5,0.8,0.9), prop2=c(0.2,0.3,.3,.2,.2,.3))
> dfu
id team prop1 prop2
1 A 0.8 0.2
2 B 0.9 0.3
3 C 0.6 0.3
4 A 0.5 0.2
5 A 0.8 0.2
6 C 0.9 0.3
>
> dfi <- data.frame(id=c(2 , 3 , 2 , 1 , 4 , 3 , 7))
> dfi
id
2
3
2
1
4
3
7
輸出格式如下所示。例如,組A
的prop1
的值將是(0.8*1 + 0.5*1)/2 = 0.65
。
team prop1 prop2
A
B
C
更喜歡base R方法,其他方法歡迎。列數可能很多。
相關的問題在這裏 - http://stackoverflow.com/q/42105259/3206440,可這是一個更具體的例子。 – user3206440
我懷疑你的set.seed(100)不符合數據。 – DJJ