2012-11-25 51 views
0

字符串我有一個數據集看起來像下面這樣:導入數據集,其中的一些列具有包含空格的

ID   Message  
    1    . 
    2    . 
    3  Click_screen 
    4  Blank screen 
    5    . 
    6    . 
    7    . 

實際數據集有48列和50,000行。

導入此數據集與read.table()是有問題的,因爲字符串「空白屏幕」,其中有兩個子字符串之間的空間。如果有任何的方式來規避讀該問題,而不是改變原始數據集在Excel

Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : 
    line 4 did not have 48 elements 

我在想:例如,我得到了像一個錯誤信息。

編輯:我想補充,我試圖設置填充爲TRUE,而我得到了下面的錯誤消息:

Error in read.table(file.choose(), header = T, fill = T) : 
    duplicate 'row.names' are not allowed 
+0

你嘗試閱讀選項填充=真? – agstudy

+0

它給了我以下錯誤信息: 錯誤在read.table(file.choose(),header = T,fill = T): 重複'row.names'不允許 – Alex

+0

嘗試無標題,hedaer = F – agstudy

回答

1

如果該文件是空格分隔的(與製表符相反),您可能需要read.fwf以及一個字段寬度向量。 如果文件以製表符分隔,則可能需要read.table(sep ='\ t',...)。

+0

sep =「\ t」與agstudy的fill = TRUE建議結合使用。謝謝! – Alex

1

這取決於當地的分離,但嘗試這個

read.table(fileName,fill=TRUE,header=FALSE,sep =';') 
相關問題