2014-07-23 360 views
0

刪除瘋狂字符我在格式一長串像這樣:在R /閃亮

group1 » group2 » group3 

在R,I可以使用gsub('»', '-', x)其中x是結構類似於上面的載體。

但是,當我嘗試利用這個功能加載到一個閃亮的應用程序時,我遇到了錯誤。我試過多種方式使用gsub,chartr和其他一些。

另外,使用[[:punct:]]時,不會捕獲Â字符。

有什麼建議嗎?

+0

你想要什麼字符*保留*,字母數字? – rawr

+0

有時使用冒號和分號。所以,字母數字加上幾個特殊字符 – maloneypatr

+0

你嘗試過'gsub(「[^ A-Za-z0-9]」,「 - 」,x)'? –

回答

0

group1 » group2 » group3UTF-8編碼的字符串,因此如果ř應用是編碼來自UTF-8讀取轉換的字符串,以拉丁1作爲Read or Set the Declared Encodings for a Character VectorRead text as UTF-8 encoding解釋這將是最好的。

»是UTF-8編碼right-pointing double angle quotation mark由此2個字節用十六進制值C2 BB與代碼頁Windows-1252ISO 8859-1(Latin-1的)解釋並顯示的(錯誤的)。

gsub("\\xC2?\\xBB", "-", x)可用於在UTF-8編碼字符串或單字節編碼字符串(拉丁語1或Windows 1252)中找到所有正確的指示字符並用連字符替換它們中的每一個。