2011-08-05 88 views
16

我試圖替換data.frame中的字符。我對這個R:用gsub替換字符,如何創建一個函數?

> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg")) 
> df 
     var1 
1 aabbcdefg 
2 aabbcdefg 
> df$var1 <- gsub("a", "h", df$var1) 
> df$var1 <- gsub("b", "i", df$var1) 
> df$var1 <- gsub("c", "j", df$var1) 
> df$var1 <- gsub("d", "k", df$var1) 
> df$var1 <- gsub("e", "l", df$var1) 
> df$var1 <- gsub("f", "m", df$var1) 
> df 
     var1 
1 hhiijklmg 
2 hhiijklmg 
> 

一個解決方案,但我想避免使用多個調用gsub,這將是更加美好,從而製造功能做一次呢?任何想法繼續?

回答

20

您可以創建fromto載體:

from <- c('a','b','c','d','e','f') 
to <- c('h','i','j','k','l','m') 

,然後vectorialize的gsub功能:

gsub2 <- function(pattern, replacement, x, ...) { 
for(i in 1:length(pattern)) 
x <- gsub(pattern[i], replacement[i], x, ...) 
x 
} 

其中給出:

> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg")) 
> df$var1 <- gsub2(from, to, df$var1) 
> df 
     var1 
1 hhiijklmg 
2 hhiijklmg 
+1

@jrara我該如何修改代碼纔能有條件地進行替換?在下面的例子中,我只想縮短Mech,Oper和Eng,並且我不想把它們全部替換掉​​(例如Mech in Mechanical,或者Oper in Operations),下面是例子:從< - (「Mech」,「Oper」,「Eng」)到< - (「Mechanical」,「Operations」,「Engineer」)data.frame(var1 = c(「Mech」,「Mechanical Engineer」 ,「操作」,「操作」))' – vatodorov

+0

應該是標準功能,太棒了! –

31

你想chartr

df$var1 <- chartr("abcdef", "hijklm", df$var1) 
df 
#  var1 
# 1 hhiijklmg 
# 2 hhiijklmg 
9

如果你不想使用CHARTR因爲替代可能不止一個字符,那麼另一個選擇是從gsubfn包中使用gsubfn(我知道這是不是GSUB,但對GSUB擴張)。這裏有一個例子:

> library(gsubfn) 
> tmp <- list(a='apple',b='banana',c='cherry') 
> gsubfn('.', tmp, 'a.b.c.d') 
[1] "apple.banana.cherry.d" 

替換也可以是一個函數,將採取匹配並返回該匹配的替換值。

相關問題