我一直在試圖加載一個csv到R進行一些處理,但我在嘗試讀取數據本身時遇到一個奇怪的問題。爲read.csv輸出()
該CSV不必須任何標頭和我使用下面的簡單的代碼來讀取數據
newClick <- read.csv("test.csv", header = F)
而下面是示例數據集:
10000011791441224671,V_Display,exit
10000011951441812316,V_Display,exit
10000013211441319797,V_Display,exit
1000001331441725509,V_Display,exit
10000013681418242863,C_GoogleNonBrand,V_Display,V_Display,V_Display,V_Display,_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,exit
10000014031441295393,V_Display,exit
輸出該數據的存在預期的數據框6 obs。的18個變量。
然而,這是棘手的部分。如果我在數據集中添加另一行,如
10000011791441224671,V_Display,exit
10000011951441812316,V_Display,exit
1000000191441228436,V_Display,exit
10000013211441319797,V_Display,exit
1000001331441725509,V_Display,exit
10000013681418242863,C_GoogleNonBrand,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,exit
10000014031441295393,V_Display,exit
輸出爲3個變量的奇怪12個obs。經過仔細分析,我意識到整個倒數第二行被分成了六行,每行三列,每一行都很奇怪。
對此有何看法?
從'?read.table':'數據列的數量是通過查看第一個輸入的第一行 確定的(或者如果輸入的行少於五行的話),或者從' col.names',如果它被指定並且 更長'。 – nicola
@Nicola謝謝 一旦你獲得了基本的權利,它很容易做出其餘的圖片。 – hbabbar