我在格式的數據幀:刪除相鄰的重複r中
site_domain <- c('ebay.com','facebook.com','facebook.com','ebay.com','ebay.com','auto.com','ebay.com','facebook.com','auto.com','ebay.com','facebook.com','facebook.com','ebay.com','facebook.com','auto.com','auto.com')
id <- c(1, 1, 1,2,2,3,3,3,3,4,4,4,5,5,5,5)
file0 <- as.data.frame(cbind(site_domain,id))
我做了一組由「ID」來獲得數據:
library(dplyr)
xx <- as.data.frame(file0 %>%
group_by(id) %>%
summarise(pages=paste(site_domain, collapse='_')))
的數據是這樣的:
1 ebay.com_facebook.com_facebook.com
2 ebay.com_ebay.com
3 auto.com_ebay.com_facebook.com_auto.com
4 ebay.com_facebook.com_facebook.com
5 ebay.com_facebook.com_auto.com_auto.com
但是我想刪除重複相鄰,所以我要出去放像:
1 ebay.com_facebook.com
2 ebay.com
3 auto.com_ebay.com_facebook.com_auto.com
4 ebay.com_facebook.com
5 ebay.com_facebook.com_auto.com
我該如何做到這一點。
這看起來不錯,但是我在第三行看到:輸出應該是'auto.com_ebay.com_facebook.com_auto.com',但是這種方法給出:'aut o.com_ebay.com_facebook.com' ..任何幫助我們如何修改這個。 – PSraj
是的,它可能我會用新方法 – OdeToMyFiddle