我有一個.csv文件,其中包含以下數據:無法讀取的unicode的.csv成R
"Ա","Բ"
1,10
2,20
,使顯示的列名像他們在文件中我無法讀入R上。
d <- read.csv("./Data/1.csv", fileEncoding="UTF-8")
head(d)
產生如下:
> d <- read.csv("./Data/1.csv", fileEncoding="UTF-8")
Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote, :
invalid input found on input connection './Data/1.csv'
2: In read.table(file = file, header = header, sep = sep, quote = quote, :
incomplete final line found by readTableHeader on './Data/1.csv'
> head(d)
[1] X.
<0 rows> (or 0-length row.names)
同時,未經指定fileEncoding做同樣會產生這樣的:
> d <- read.csv("./Data/1.csv")
> head(d)
Ô. Ô²
1 1 10
2 2 20
當我運行 「文件」 工具來找出編碼它說它是UTF-8:
Data\1.csv: UTF-8 Unicode text, with CRLF line terminators
我正在使用RStudio,Windows 7,R版本2.15.2,32位。
在此先感謝。
在Linux上完全適用於R 2.15.3。 (第二個警告可能只是在文件的最後一行缺少「輸入」) – Spacedman
我可以複製該問題。我從來沒有使用這些參數,但是使用'encoding'代替'read.csv(...,encoding =「UTF-8」)'讀入文件,但是頭文件不是以字母顯示,而是以' XUFEFF..U.0531。改爲X.U.0532.'。 – eddi
觀察:'> a =「Ա」; > a; [1]「Ա」'工作正常,但這不:'data.frame(a); #a #1 ' – eddi