我有以下數據集刪除重複
df <- data.frame(
path = c("a,b,a",
"(direct)/(none), (direct)/(none), google/cpc, google/cpc",
"f,d",
"a,c"
)
)
,我要刪除的重複,使我的輸出將是
path
1: a, b
2: (direct)/(none), google/cpc
3: f, d
4: a, c
我試過,但它不工作第二行
setDT(df)
df$path <- sapply(strsplit(as.character(df$path), split=","), function(x) {
paste(unique(x), collapse = ', ')
})
你很好。嘗試使用'split =「,\\ s *」'刪除不需要的空格。另外,如果你打算使用'data.table',使用正確的語法來避免拷貝:'df [,path:= sapply(strsplit(as.character(df $ path),split =「,\\ s *」) ,函數(x){paste(unique(x),collapse =',')})]'。 – nicola
這是真棒@尼古拉,請考慮寫下你的答案,然後我可以接受它。 – MFR
很高興幫助。我寫了一個答案。 – nicola