我想在每個Id級別出現第一個「C」之前計算「I」的出現次數。我已經試過這段代碼,但可以計算列中出現的所有「I」。 代碼我試過在特定字母之前計算字母表的出現
library(plyr)
Impres = ddply(df, .(Id), summarize, No_of_I_before_First_C = length(which(Character == "I")))
的樣本數據
Id Character
1 I
1 I
1 C
1 I
2 I
2 C
輸出應該是這樣的
Id Count_Of_I_before_First_C
1 2
2 1
這將是相當大的數據集 – Bulat
慢@Bulat我只是跟隨'的問題agregate'標籤(即沒有包)。我知道'dplyr'和'data.table'都有更高效的方法 – Sotos