0
company name person Salary Of Person
ITC Jacob 10000
TCS Ash 20000
Google Jim 40000
GS Mark 50000
由於「公司名稱」的間距,R將「company」識別爲獨立的列,「name」識別爲單獨的列。我應該編碼什麼,以免發生這個問題。 PS:這只是我文件的一小部分。導入帶有列標題間距的.txt文件R
company name person Salary Of Person
ITC Jacob 10000
TCS Ash 20000
Google Jim 40000
GS Mark 50000
由於「公司名稱」的間距,R將「company」識別爲獨立的列,「name」識別爲單獨的列。我應該編碼什麼,以免發生這個問題。 PS:這只是我文件的一小部分。導入帶有列標題間距的.txt文件R
解決問題的最佳解決方案是修復源數據,以便列名引用。然後,你可以閱讀使用類似以下內容:
read.csv(file, header = TRUE, sep = "", quote = "\"")
對於一個快速的解決方法,你可以嘗試讀取CSV文件,而不頭:
df <- read.csv(file, header = FALSE, sep = "", quote = "\"")
然後,你可以通過手動指定的列名:
names(df) <- c("company name", "person", "Salary Of Person")
此變通辦法假定您的其餘數據行爲良好,即您在其他任何地方沒有多於一個的每列條目。如果你這樣做,那麼你唯一的選擇就是引用/逃避一切。
這一列非常感謝你@Tim Biegeleisen –
但是「公司」和「名稱」實際上是兩個單獨的列嗎?如果確實存在問題,您的問題的答案可能是修復您的源CSV數據。 –
不,@TimBiegeleisen。 「人」是給予人名的專欄,即Jacob,Ash。如何解決源CSV數據?我對R是全新的。我擁有的數據大約是每個文件40 MB。 –
您需要獲得'公司名稱'周圍的引用......這是'read.csv'能夠知道將其視爲一個柱。 –