0
我試圖用函數read.table標準()函數,但未能導入電子表格的表音符號(IPA),這裏是我的代碼:如何R中
youphon = read.table("youdef.txt",header=FALSE,fileEncoding="UTF-8",sep="\t",quote="",comment.char="",stringsAsFactors=FALSE)
Warning messages:
1: In read.table("youdef.txt", header = FALSE, fileEncoding = "UTF-8", :
invalid input found on input connection 'youdef.txt'
2: In read.table("youdef.txt", header = FALSE, fileEncoding = "UTF-8", :
incomplete final line found by readTableHeader on 'youdef.txt'
當R遇到
一個奇異的符號,如ə,θ,æ,它會停止導入數據
您是否嘗試過設置'encoding'參數?你的語言環境是什麼?這個文件是什麼樣的? –
你的文件實際上是UTF-8嗎?如果您將其從Windows上的Excel保存爲「unicode文本」,則它將被格式化爲「UCS-2 little endian」,而不是UTF-8。如果這是你的問題,解決方案是將UCS-2文件轉換爲「沒有BOM的UTF-8」(Notepad ++可以爲你做到這一點),然後使用'read.delim(「my_utf8_without_bom_file.csv」,encoding = 「UTF-8」)'。在R窗口中,IPA符號將顯示在數據幀中,並標記爲''等括號內的代碼點,但在使用適當字體繪製時通常會顯示正確。 – drammock
謝謝你的幫助。我使用notepad ++,我確定fileEncoding參數是正確的,我在Windows 8 64位上使用Rstudio。我的表中有一條記錄(行)看起來像這樣,每個屬性由Tab分隔:美麗\t ['bjuːtɪfʊl; -f(ə)l] \t adj。美麗的出色地出色的迷人的迷人地\t埃內斯托愛上了諾麗娜,她年輕漂亮,但很可憐。 – user3236757