我正在研究一個涉及清理大學專業數據清單的項目。我發現很多拼寫錯誤,所以我正在使用函數gsub()
來替換拼寫錯誤的拼寫錯誤。例如,說'biolgy'拼寫錯誤的專業稱爲主要名單。我如何讓R檢測拼寫錯誤並將其替換爲正確的拼寫?我試過gsub('biol', 'Biology', Major)
,但是它只替換了'biolgy'中的前四個字母。如果我做gsub('biolgy', 'Biology', Major)
,它僅適用於這種情況,但這並不能檢測到其他形式的「生物學」拼寫錯誤。在R中,如何用另一個字符串替換包含特定模式的字符串?
謝謝!
感謝您的回覆,我剛剛與agrep一起玩過。我發現它只是返回一個整數(我猜對應於更改的字符串的數量),但它實際上是否執行更改?例如,假設我有動物= c(「老鼠」,「狗」,「貓」)。如果我想用「奶酪」代替鼠標,那麼我可以使用agrep(「mou」,「奶酪」,動物)嗎?當我這樣做時它返回一個整數(0)。謝謝!! – Alan 2011-03-14 18:57:36
'agrep'返回矢量指數,所以你可以很容易地使用下標來指定一個值:'動物[agrep(「mou」,動物)] < - 「奶酪」' – aL3xa 2011-03-14 19:10:04
非常感謝你:) – Alan 2011-03-14 19:19:07