0
是否有方法從文本文件中讀取文本並將Latin-4(ISO/IEC 8859-4)或Latin-6(ISO/IEC 8859-10)字符轉換爲相應的HTML代碼(反之亦然) R和RStudio中的,例如ą
至&261;
?如何將國際(立陶宛)字符翻譯爲R中的相應HTML代碼?
我特別感興趣的是對這些符號進行編碼解碼:這是我的最愛。 我正打算使用正則表達式完成此任務,但第一個問題是,我RStudio甚至不讀符號正確:
c("Ąą Čč Ęę Ėė Įį Šš Ųų Ūū Žž")
結果是:
[1] "Aa Cc Ee Ee Ii Uu Uu ˇ˛"