2016-07-07 45 views
0

是否有方法從文本文件中讀取文本並將Latin-4(ISO/IEC 8859-4)或Latin-6(ISO/IEC 8859-10)字符轉換爲相應的HTML代碼(反之亦然) R和RStudio中的,例如ą&261;如何將國際(立陶宛)字符翻譯爲R中的相應HTML代碼?

我特別感興趣的是對這些符號進行編碼解碼:這是我的最愛。 我正打算使用正則表達式完成此任務,但第一個問題是,我RStudio甚至不讀符號正確:

c("Ąą Čč Ęę Ėė Įį Šš Ųų Ūū Žž") 

結果是:

[1] "Aa Cc Ee Ee Ii Uu Uu ˇ˛" 

回答

1

好,最好R包來讀取非ASCII語言環境的東西是Hadley Wickham的readr

您可以從here安裝它並檢查它是否支持Latin-6