2014-01-26 38 views
0

我試圖用函數read.table標準()函數,但未能導入電子表格的表音符號(IPA),這裏是我的代碼:如何R中

youphon = read.table("youdef.txt",header=FALSE,fileEncoding="UTF-8",sep="\t",quote="",comment.char="",stringsAsFactors=FALSE) 

Warning messages: 
1: In read.table("youdef.txt", header = FALSE, fileEncoding = "UTF-8", : 
invalid input found on input connection 'youdef.txt' 
2: In read.table("youdef.txt", header = FALSE, fileEncoding = "UTF-8", : 
incomplete final line found by readTableHeader on 'youdef.txt' 
當R遇到

一個奇異的符號,如ə,θ,æ,它會停止導入數據

+0

您是否嘗試過設置'encoding'參數?你的語言環境是什麼?這個文件是什麼樣的? –

+0

你的文件實際上是UTF-8嗎?如果您將其從Windows上的Excel保存爲「unicode文本」,則它將被格式化爲「UCS-2 little endian」,而不是UTF-8。如果這是你的問題,解決方案是將UCS-2文件轉換爲「沒有BOM的UTF-8」(Notepad ++可以爲你做到這一點),然後使用'read.delim(「my_utf8_without_bom_file.csv」,encoding = 「UTF-8」)'。在R窗口中,IPA符號將顯示在數據幀中,並標記爲''等括號內的代碼點,但在使用適當字體繪製時通常會顯示正確。 – drammock

+0

謝謝你的幫助。我使用notepad ++,我確定fileEncoding參數是正確的,我在Windows 8 64位上使用Rstudio。我的表中有一條記錄(行)看起來像這樣,每個屬性由Tab分隔:美麗\t ['bjuːtɪfʊl; -f(ə)l] \t adj。美麗的出色地出色的迷人的迷人地\t埃內斯托愛上了諾麗娜,她年輕漂亮,但很可憐。 – user3236757

回答

0

我已經第一次將excel表格保存爲unicode,但我沒有放任何方括號。我將IPA裸露在Excel文件中。

然後我打開unicode的TXT文件,並重新保存爲UTF8,

然後用蒂恩-R打開它:我請與蒂恩-R的錯誤,因爲它表明我到底是什麼R將讀取或沒有。 一旦滿意:用R打開Tinn-R文件。