2016-04-26 88 views
0

我正在通過並清理具有位置條目的數據集,比如:「Sarasota Florida6h」我不確定爲什麼,但所有字符串都有3或2個字符開始與多家結束:刪除第一個數字後的字符/數字在字符串中R

[413] "Los Angeles11h"          "Pittsburgh PA1h"         
[415] "London UK18h"          "Mumbai India19h"         
[417] "Orange County CA1h"         "Columbus OH2d"          
[419] "4d"             "Sarasota Florida6h"         
[421] "Toronto9m"           "Adelaide Australia7h"        
[423] "Wayland MA4h"          "Scottsdale AZ USA1h"         
[425] "Sydney Australia6d"         "Connecticut USA31m"         
[427] "United States5m"          "Boulder Colorado12h"        
[429] "Berlin Germany7h"         " India Chaibasa1h" 

我需要一個腳本一個數字後刪除所有字母清理這些了: 我已經試過以下,但很明顯,有什麼東西錯在這裏。

follow_dat$loc <- sapply(strsplit(follow_dat$Location, "\\[0-9]"), `[[`, 2) 

您的協助感謝。 馬裏

+0

[419]呢? – Sotos

回答

1

使用正則表達式 例如,你可以清除它們這樣:

gsub("[0-9]..*","",follow_dat$Location) 

這是什麼表情在說是「後你乾淨的一切找了一些在所有follow_dat $位置沒有什麼‘’」

+0

謝謝,這個作品很棒! – maric

+0

很高興幫助,如果我設法幫助,請給它打個盹;) –

1

如果在你的字符串沒有其他的數字(如你的例子說明),那麼我們可以用gsub

gsub('[0-9]+[a-z]', '',follow_dat$Location) 
+0

跟着我到每一個問題:p –

+0

謝謝,也試過這個。兩者都很好。非常感謝 – maric

+0

嗨,我試過但沒有足夠的觀點。當我做的時候會回來! – maric

相關問題