2017-02-24 48 views
5

我試圖爲每組增加一列。所以如果有價值,那麼我們會根據它之前的價值來增加它,否則我們就放棄它。按組遞增

因此,例如,它會從df到dfb。

df <- data.frame(group = c("A", "A", "B", "B", "B", "C", "C", "C", "D", "D"), 
       num = c(1, NA, NA, 8, NA, 5, NA, NA, 10, NA)) 
dfb <- data.frame(group = c("A", "A", "B", "B", "B", "C", "C", "C", "D", "D"), 
       num = c(1, 2, NA, 8, 9, 5, 6, 7, 10, 11)) 
> df 

    group num 
1  A 1 
2  A NA 
3  B NA 
4  B 8 
5  B NA 
6  C 5 
7  C NA 
8  C NA 
9  D 10 
10  D NA 

> dfb 
    group num 
1  A 1 
2  A 2 
3  B NA 
4  B 8 
5  B 9 
6  C 5 
7  C 6 
8  C 7 
9  D 10 
10  D 11 

我最好的嘗試是這一點,但

dfc <- df %>% 
    mutate(num = ifelse(is.na(num),lag(num) + 1, num)) 

刪除我剛纔的問題,因爲以前不好界定我的問題,它沒有工作。 感謝您的幫助!

+0

目前尚不清楚爲什麼你刪除前面的問題,因爲我在刪除一個解決方案與新的範例工程,以及 – akrun

回答

5

我們可以做

df %>% 
group_by(grp1= cumsum(!is.na(num)), group) %>% 
mutate(num = if(n() > 1) num[1L] + row_number()-1 else num) %>% 
ungroup() %>% 
select(-grp1) 
# A tibble: 10 × 2 
# group num 
# <fctr> <dbl> 
#1  A  1 
#2  A  2 
#3  B NA 
#4  B  8 
#5  B  9 
#6  C  5 
#7  C  6 
#8  C  7 
#9  D 10 
#10  D 11 

或用data.table

library(data.table) 
setDT(df)[, num := if(.N >1) num[1L] + seq_len(.N)-1 
      else num,.(grp1=cumsum(!is.na(num)), group)] 
1

你需要的一切都爲循環:)歡呼一個基本的!

df <- data.frame(group = c("A", "A", "B", "B", "B", "C", "C", "C", "D", "D"), 
       num = c(1, NA, NA, 8, NA, 5, NA, NA, 10, NA)) 
df.new <- df 

for(i in 2:dim(df.new)[1]){ 

    if(!is.na(df[i - 1, 'num'])){ 

    df.new[i, 'num'] <- df[i - 1, "num"] + 1 

    } 
+0

它可以在一個循環中完成,但一般循環是緩慢的,但更重要的是這種計算是一部分一條更大的管道。儘管謝謝你的幫助! – tonyk