2017-06-30 20 views
-3

我有拼寫錯誤的單詞的特徵向量:如何創建和使用查表

wordswrong <- c("veh", "crrts", "ornges") 
wordscorrect <- c("vehicle", "carrots", "oranges") 

這裏有一個數據幀:

words <- data.frame(terms = c("crrts oranges", 
+        "car is a veh", 
+        "orngs bannas peas")) 

我如何去通過每一個字的話$條款基於我的兩個向量更新?

+0

嘗試'用於(ⅰ在seq_along(wordswrong))字$術語< - GSUB(wordswrong [I],wordscorrect [I],字$術語)'或'庫(qdap);單詞$ terms < - mgsub(wordswrong,wordscorrect,words $ terms)' – akrun

+0

Thanks @akrun!我確信我有一次看到有人在df $ wrongwords < - lut(lookuptable)的行上使用查找表的代碼。這聽起來很熟悉嗎?或者,這可能是列表的錯誤背景?或者,也許因爲每個單元格不是一個確切的查找我不能走這條路線 –

+1

哦,掛起,mgsub看起來完美!歡呼的小費 –

回答

1

我們可以使用mgsubqdap

library(qdap) 
words$terms <- mgsub(wordswrong, wordscorrect, words$terms)