的第一個字符我在R.多個R數據幀比較字符串檢索是一致
df1<-as.data.frame(cbind(Site=c(1,2,3,4,5),Nucs=c("ACTG","ACT","GTAC","GTC","GACT")))
df2<-as.data.frame(cbind(Site=c(1,2,3,4,5),Nucs=c("AC","ATC","GTCA","GC","GAC")))
我試圖確定以下數據幀什麼最長的字符串,它是之間是一致的兩個Nucs列。 到目前爲止,我已經試過這樣:
x1 <- strsplit(as.character(df1$Nucs),"")
x2 <- strsplit(as.character(df2$Nucs),"")
x <- Map(intersect, x1, x2)
sapply(x, paste0, collapse="")
這使我有以下幾點:
[1] "AC" "ACT" "GTAC" "GC" "GAC"
這不完全是我想是因爲在網站3的情況下,我有GTAC和GTCA所以我只需要字符串中前兩個字符一致的字符,即GT。
有沒有人有任何想法,我該如何去做這件事?