1
我有一個億行的數據集,其中約10個具有某種Unicode替換字符。該特定字符的文本表示是「< U + FFFD>」(刪除空格),但也有其他字符。r - 從字符串中刪除Unicode替換字符
我想刪除角色,但我無法想出辦法做到這一點。
str <- "торгово производственн��я компания"
gsub("<U+FFFD>", "", str)
"торгово производственн��я компания"
如果我需要提供任何其他信息,請讓我知道。另外我會非常感謝這裏發生了什麼的解釋(就像爲什麼一個普通的gsub不起作用,爲什麼它會這樣顯示)
嘗試'GSUB( 「\ uFFFD」, 「」,STR,固定= TRUE)' –
@WiktorStribiżew謝謝你,完美的工作 – Alexvonrass