I want to compare two string vectors as follows:
Test1<-c("Everything is normal","It is all sunny","Its raining cats and dogs","Mild")
Test2<-c("Everything is normal","It is thundering","Its raining cats and dogs","Cloudy")
Filtered<-data.frame(Test1,Test2)
預期輸出:如何比較兩個字符串之間匹配的語句數向量
Number the same: 2
Number present in Test1 and not in Test2: 2
Number present in Test2 and not in Test1: 2
我也想看看這串是不同的,因此,其他預期的輸出應如下(也是原始數據幀的一部分)
Same<-c("Everything is normal","Its raining cats and dogs")
OnlyInA<-c("It is all sunny")
OnlyInB<-c("It is thundering","Cloudy")
我曾嘗試:
Filtered$Same<-intersect(Filtered$A,Filtered$B)
Filtered$InAButNotB<-setdiff(Filtered$A,Filtered$B)
但是當我嘗試最後一行我得到的誤差更換有127行,數據有400個(如果我使用一個較長的數據集)。
我想這是因爲我只返回有差異的行,所以列不匹配。我如何NA
哪些行與setdiff沒有區別,以便我可以將它保留在原始數據框中?
函數包是什麼函數過濾?我沒有看到它在基地R. –
道歉的錯字。我已編輯它 –
在您的已過濾數據框中,您是否將缺失值設置爲不等長向量的NA值? –