2013-08-07 70 views
2

我試圖讀取由Sql Server Management Studio生成的csv文件,並將其編碼爲UTF-8(我選擇該選項保存時)到R版本3.0.1(x64)至read.csv2()。我不能R正確顯示特殊字符。R中的字符編碼

如果我設置fileEncoding="UTF-8-BOM"導入停在我有一個line的那一行。但是,在Notepad++中打開文件時,ÿ會以UTF-8編碼正確顯示。我試過沒有設置fileEncoding,但是然後特殊字符顯示不正確(當然)。

的CSV flie可以在這裏找到: https://www.dropbox.com/s/7y47i826ikq8ahi/Data.csv

我如何讀取csv文件,並顯示在正確的編碼的文本?

謝謝!

回答

2

我找到了答案我的自我。問題在於從UTF-8到系統區域設置(R中的默認編碼)通過fileEncoding轉換。當我使用RStudio時,我只是將默認編碼更改爲UTF-8,並從read.csv中刪除了fileEncoding="UTF-8-BOM"。然後,讀取整個csv文件,RStudio正確顯示所有字符。

0

對於那些仍然陷於這個問題。我的腳本能夠通過在腳本的頂部添加一行代碼來識別「umlaute」(ä,ö,ü或ß),該行改變了字符編碼的默認選項options(encoding = "UTF-8")(在我的情況下,在RStudio direclty中設置選項沒有'不會影響編碼!)。