尋找一些關於如何用R向量字符向量列表中的直撇子替換捲曲撇號的指導。使用gsub用R中的直撇符來替換字符向量中的直撇號
我替換捲曲撇號的原因 - 稍後在腳本中,我檢查每個列表項,看看它是否在字典中找到(使用qdapDictionary)以確保它是一個真正的單詞而不是垃圾。字典使用直撇子,所以帶有撇號的單詞被「拒絕」。
我目前的代碼示例如下。在我的測試列表中,項目#6包含一個捲曲撇號,項目#2有一個簡單的撇號。
實施例:
list_TestWords <- as.list(c("this", "isn't", "ideal", "but", "we", "can’t", "fix", "it"))
func_ReplaceTypographicApostrophes <- function(x) {
gsub("’", "'", x, ignore.case = TRUE)
}
list_TestWords_Fixed <- lapply(list_TestWords, func_ReplaceTypographicApostrophes)
結果:沒有變化。第6項仍然使用捲曲撇號。見下面的輸出。
list_TestWords_Fixed
[[1]]
[1] "this"
[[2]]
[1] "isn't"
[[3]]
[1] "ideal"
[[4]]
[1] "but"
[[5]]
[1] "we"
[[6]]
[1] "can’t"
[[7]]
[1] "fix"
[[8]]
[1] "it"
任何幫助你可以提供將是最感謝!
嘗試'GSUB(「」」, 」'「,X,固定= TRUE)' –
感謝您的建議,Wiktor的。沒有工作,但會歡迎其他建議! – SarahWeaver
附加:'gsub(「(* UCP)'」,「'」,x,perl = TRUE)''或者'gsub(「'」,「'」,x,perl = TRUE)''。請注意,可以安全地刪除'ignore.case = TRUE'。 –