2017-07-05 33 views
3

我得到了一個關於「下標越界」的問題,我想要的是得到每個觀察的第一個和最後一個月,我有三個連續的「1」或「真」 。我想創建2個新的專欄,分別是第一個月和最後一個月的「開始」和「結束」。 在我的第一個觀察的例子中:開始等於avril並且等於juin 在5個觀察中:開始等於fevrier並且等於avril 在9個觀察中:開始等於janvier並且結束等於mars 。 ..條件和行和列與雙循環

我試着這樣做:

nom <- letters[1:5] 
pseudo <- paste(name, 21:25, sep = "") 
janvier <- c(0, 1, 1, 1, 0) 
fevrier <- c(1, 1, 1, 1, 1) 
mars <- c(0, 0, 0, 1, 1) 
avril <- c(1, 1, 1, 0, 1) 
mai <- c(1, 0, 1, 1, 1) 
juin <- c(1, 1, 0, 1, 0) 

df <- data.frame(nom =nom, pseudo = pseudo, janvier = janvier, 
       fevrier = fevrier, mars = mars, avril = avril, 
       mai = mai, juin = juin) 

dfm <- as.matrix(df[, -c(1, 2)]) 

my_matrix <- matrix(nrow = 10, ncol = 6) 


for(i in 1:dim(dfm)[1]){ 
    for(j in 1:dim(dfm)[2]){ 
    if(dfm[i, j] + dfm[i, j+1] + dfm[i, j+2] == 3){ 
     my_matrix[i, j] <- "periode_ok" 
     my_matrix[i, j+1] <- "periode_ok" 
     my_matrix[i, j+2] <- "periode_ok" 
    } 
    } 
} 

的輸出中應該是這樣的:

begin <- c("avril", "no info", "no info", 
      "janvier", "fevrier", "avril", "no info", 
      "no info", "janvier", "fevrier") 
end <- c("juin", "no info", "no info", "mars", 
     "avril", "juin", "no info", "no info", 
     "mars", "avril") 

output <- data.frame(nom =nom, pseudo = pseudo, janvier = janvier, 
       fevrier = fevrier, mars = mars, avril = avril, 
       mai = mai, juin = juin, begin = begin,end = end) 

任何幫助將apreciated

+1

'爲(j在1:(暗(DFM)[2] -2))'使用此。 – Masoud

+1

'pseudo'應該是長度爲5,因爲所有其他變量是。 – Masoud

+0

https://stackoverflow.com/questions/25316565/return-column-index-of-first-set-of-consecutive-values-in-data-frame-row-in-r – Masoud

回答

5

首先,構建像1:dim(dfm)[1]是很危險的,因爲如果dim(dfm)[1]是零,你會得到完全有效的載體1:0循環將嘗試解決一個向量的元素零,或者在這種情況下,矩陣。這是非法的,會引發錯誤。推薦的解決方案是使用seq_len(...)。 其次,我用nrowncol而不是dim(dfm)[.]。 現在爲你得到的錯誤。您正在設法解決j + 1j + 2列,因此當j達到ncol(dfm)時,您已退出債券。下面的代碼刪除了循環限制的最後兩個元素。

n <- ncol(dfm) 
for(i in seq_len(nrow(dfm))){ 
    for(j in seq_len(n)[-c(n - 1, n)]){ 
    if(dfm[i, j] + dfm[i, j+1] + dfm[i, j+2] == 3){ 
     my_matrix[i, j] <- "periode_ok" 
     my_matrix[i, j+1] <- "periode_ok" 
     my_matrix[i, j+2] <- "periode_ok" 
    } 
    } 
} 

my_matrix 
3

當然還有這個矢量化的解決方案,但如果你想糾正你的for循環需要限制jdfm零下2尺寸爲您提前檢查兩列。根據您提供的內容,這將對您有所幫助;但是,目前尚不清楚如何從5行的df得到10行(重複兩次)。

 my_matrix <- matrix("no info", nrow = 5, ncol = 2) 
     colnames(my_matrix) <- c("begin", "end") 


     for(i in 1:dim(dfm)[1]){ 
     for(j in 1:(dim(dfm)[2]-2)){ 
      if(dfm[i, j] + dfm[i, j+1] + dfm[i, j+2] == 3){ 
      my_matrix[i, 1] <- colnames(dfm)[j] 
      my_matrix[i, 2] <- colnames(dfm)[j+2] 
      break 
      } 
     } 
     } 


output <- cbind(df, my_matrix) 

然後結果將是:

output 

# nom pseudo janvier fevrier mars avril mai juin begin  end 
# 1 a name21  0  1 0  1 1 1 avril juin 
# 2 b name22  1  1 0  1 0 1 no info no info 
# 3 c name23  1  1 0  1 1 0 no info no info 
# 4 d name24  1  1 1  0 1 1 janvier mars 
# 5 e name25  0  1 1  1 1 0 fevrier avril