我必須根據特定條件從數據框中選擇一堆數據。數據幀看上去大致是這樣的:如何有條件地選擇與多種因素相匹配的data.frame的所有元素
F1 F2 D1 D2
1 A1 B1 1 0
2 A1 B1 1 1
3 A1 B1 0 0
4 A1 B2 1 0
5 A1 B2 0 0
6 A2 B2 1 0
7 A2 B2 1 1
的Fx
的因素,並且是Dx
數據值。我需要做的是以下幾點:
- 查找具有與特定模式匹配的數據值的行。
- 對於每個與該模式相匹配的行,查找具有相同的因素
- 對於每一個獨特的要素組合中的所有行,塗抹一些操作上有一個組合
舉例而言,所有的行,
factors <- unique(data[D1==1 & D2 == 1, c("F1","F2")])
會給我第1步,大部分的2
而且隨着
data[data$F1 %in% factors$F1 & data$F2 %in% factors%F2,]
我越來越接近解決方案,但使用上面的示例數據,這將選擇所有行。但不應選擇第4行和第5行,因爲它們不是完全匹配的。我如何添加某種條件,要求在同一行中發生%的匹配?
我覺得這應該是一種常見的操作,因此R可能有一個聰明的方法來做到這一點。
任何想法????謝謝。
瞭解'plyr'軟件包 - 這將使您的大部分分析變得非常簡單。 – Andrie
謝謝,我會研究它。 – Jochen