2017-01-12 90 views
3

我的問題包括拆分一個路徑,獲取所有子路徑直到下一個「$」出現(一種累積子路徑)併爲它們中的每一個生成一個新變量。獲取子字符串並使用循環將其存儲在變量中

這樣一步一步,我得到所需的輸出:

data<-data.frame(path=c("A/A/$/B/$/A/$","B/C/$","B/C/$/C/$/A/B/$"),stringsAsFactors=FALSE) 
library(stringr) 
data$tr<-str_count(data$path,"\\$") 
data$tr_1<-substr(sapply(strsplit(data$path, "\\$"), `[[`, 1),1,nchar(sapply(strsplit(data$path, "\\$"), `[[`, 1))-1) 
data$tr_2<-ifelse(is.na(sapply(strsplit(data$path, "\\$"), `[`, 2))==TRUE, 
        "", 
        paste0(data$tr_1,substr(sapply(strsplit(data$path, "\\$"), `[`, 2),1,nchar(sapply(strsplit(data$path, "\\$"), `[`, 2))-1))) 
data$tr_3<-ifelse(is.na(sapply(strsplit(data$path, "\\$"), `[`, 3))==TRUE, 
        "", 
        paste0(data$tr_2,substr(sapply(strsplit(data$path, "\\$"), `[`, 3),1,nchar(sapply(strsplit(data$path, "\\$"), `[`, 3))-1))) 

Doing it manually:

試圖做同樣在根據Creating new named variable in dataframe using loop and naming convention一個循環,輸出失敗。

data<-data[,-c(4,5)] 
for (i in 2:max(data$tr)) { 
    data[[paste0("tr_",i)]]<-ifelse(is.na(sapply(strsplit(data$path, "\\$"), `[`, i))==TRUE, 
        "", 
        paste0(data$tr_i-1,substr(sapply(strsplit(data$path, "\\$"), `[`, i),1,nchar(sapply(strsplit(data$path, "\\$"), `[`, i))-1))) 
} 

Doing it in a loop:

有遞歸做的另一種方式? (每個新變量使用前一個)。
在此先感謝!

回答

1

我應該這樣做:

data<-data.frame(path=c("A/A/$/B/$/A/$","B/C/$","B/C/$/C/$/A/B/$"),stringsAsFactors=FALSE) 

#split strings 
tmp <- strsplit(data$path, "/$", fixed = TRUE) #thanks to David 
data$tr <- lengths(tmp) 

#paste them together cumulatively 
tmp <- lapply(tmp, Reduce, f = paste0, accumulate = TRUE) 

#create data.frame 
tmp <- lapply(tmp, `length<-`, max(lengths(tmp))) 
tmp <- setNames(as.data.frame(do.call(rbind, tmp), stringsAsFactors = FALSE), 
       paste0("tr_", seq_len(max(data$tr)))) 

data <- cbind(data, tmp) 
#    path tr tr_1 tr_2  tr_3 
#1 A/A/$/B/$/A/$ 3 A/A A/A/B A/A/B/A 
#2   B/C/$ 1 B/C <NA>  <NA> 
#3 B/C/$/C/$/A/B/$ 3 B/C B/C/C B/C/C/A/B 

如果你一定要,你可以在另一個lapply循環替換空字符串NA值。

+0

非常感謝羅蘭。有用! –

相關問題