2017-06-22 42 views
0
company name person Salary Of Person 
ITC  Jacob 10000 
TCS  Ash 20000 
Google  Jim 40000 
GS  Mark 50000 

由於「公司名稱」的間距,R將「company」識別爲獨立的列,「name」識別爲單獨的列。我應該編碼什麼,以免發生這個問題。 PS:這只是我文件的一小部分。導入帶有列標題間距的.txt文件R

+0

但是「公司」和「名稱」實際上是兩個單獨的列嗎?如果確實存在問題,您的問題的答案可能是修復您的源CSV數據。 –

+0

不,@TimBiegeleisen。 「人」是給予人名的專欄,即Jacob,Ash。如何解決源CSV數據?我對R是全新的。我擁有的數據大約是每個文件40 MB。 –

+1

您需要獲得'公司名稱'周圍的引用......這是'read.csv'能夠知道將其視爲一個柱。 –

回答

0

解決問題的最佳解決方案是修復源數據,以便列名引用。然後,你可以閱讀使用類似以下內容:

read.csv(file, header = TRUE, sep = "", quote = "\"") 

對於一個快速的解決方法,你可以嘗試讀取CSV文件,而不頭:

df <- read.csv(file, header = FALSE, sep = "", quote = "\"") 

然後,你可以通過手動指定的列名:

names(df) <- c("company name", "person", "Salary Of Person") 

此變通辦法假定您的其餘數據行爲良好,即您在其他任何地方沒有多於一個的每列條目。如果你這樣做,那麼你唯一的選擇就是引用/逃避一切。

+0

這一列非常感謝你@Tim Biegeleisen –