2016-10-28 53 views
-3

final dataset我有一個附加的數據集。通過id刪除最後n行0,然後通過R刪除最後n個元素

我想刪除
二進制的ID的所有尾0,然後通過ID選擇尾3 。 (注意:僅用於Id 2 2
w5和w6)。它將會像最終的數據集一樣。

有沒有任何有效的方法來做到這一點?

+1

請格式化你的問題 – rawr

+0

我不知道你問 – useR

+0

這是好,但你所說的「選擇尾3的ID」是什麼意思?我看到的Final和Original數據集之間的唯一區別是Final最後刪除了所有尾部零。 – useR

回答

0

這樣的事情呢?

ID = c(rep(1, 8), rep(2, 4), rep(3, 8)) 
week = c(2:9, 5:8, 13:20) 
binary = c(0, 1, 1, 1, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 0) 

dataset = data.frame(ID, week, binary) 

> dataset 
    ID week binary 
1 1 2  0 
2 1 3  1 
3 1 4  1 
4 1 5  1 
5 1 6  1 
6 1 7  0 
7 1 8  0 
8 1 9  0 
9 2 5  1 
10 2 6  1 
11 2 7  0 
12 2 8  0 
13 3 13  1 
14 3 14  1 
15 3 15  1 
16 3 16  0 
17 3 17  0 
18 3 18  1 
19 3 19  0 
20 3 20  0 

解決方案:

# Split dataset by ID 
byGroupDf = split(dataset, ID) 

# For each grouped dataset, take only rows up till the last row where ID not equal to 0 
byGroupFinal = lapply(byGroupDf, function(x) tail(x[1:max(which(x$binary != 0)),], 3)) 

# Combine the grouped datasets 
FinalDf = do.call(rbind, byGroupFinal) 

> FinalDf 
    ID week binary 
1.3 1 4  1 
1.4 1 5  1 
1.5 1 6  1 
2.9 2 5  1 
2.10 2 6  1 
3.16 3 16  0 
3.17 3 17  0 
3.18 3 18  1 
+1

我附上了一個正確的最終數據集。 byGroupFinal = lapply(byGroupDf,function(x)tail(x [1:max(which(x $ binary!= 0)),],3))。只需要在你的代碼中添加尾部3就可以得到我想要的。謝謝 – MLM

+0

@MLM編輯我的答案。這是你想要的嗎? – useR