中國文字我嘗試打開一個包含R.(傳統)中國人物出於某種原因,一個UTF-8編碼的.csv文件,R有時顯示的信息是中國字,有時爲Unicode字符。顯示UTF-8編碼中的R
例如:
data <-read.csv("mydata.csv", encoding="UTF-8")
data
會產生Unicode字符,而:
data <-read.csv("mydata.csv", encoding="UTF-8")
data[,1]
將實際顯示中國文字。
如果我把它變成一個矩陣,它也將顯示中國的字符,但如果我嘗試看看數據(命令視圖(數據)或修復(數據)),它採用的是unicode一次。
我要求的意見,從誰使用的是Mac(我使用電腦,Windows 7)的人,他們中的一些在整個中國得到了字,另一些則沒有。我嘗試將原始數據保存爲表格,並將其讀入R,結果相同。我嘗試在RStudio,Revolution R和RGui中運行腳本。我試圖調整語言環境(例如中文),但是R沒有讓我改變它,否則結果是亂碼而不是unicode字符。
我的當前區域是:
「LC_COLLATE = French_Switzerland.1252; LC_CTYPE = French_Switzerland.1252; LC_MONETARY = French_Switzerland.1252; LC_NUMERIC = C; LC_TIME = French_Switzerland.1252」
任何幫助讓R始終顯示中文字符將不勝感激...
恩,這看起來像一個bug。對於那些感興趣的人來說,這個代碼很容易重現:'x = c('中華民族'); x; data.frame(x)'。不要試圖將該代碼粘貼到R編輯器中,只需將其粘貼到控制檯中或不起作用。 – nograpes
看到我的答案在http://stackoverflow.com/questions/22876746/how-to-read-data-in-utf-8-format-in-r – Sathish