我知道很多帖子已經回答了類似我的問題,但我試圖找出它2天現在,似乎我沒有看到這裏的圖片。 ..r導入csv跳過第一行和最後一行
我得到這個CSV文件看起來像這樣:
Werteformat: wertabh. (Q)
Werte:
01.01.76 00:00 0,363
02.01.76 00:00 0,464
...
31.12.10 00:00 1,03
01.01.11 00:00 Lücke
我想創建一個與數據的時間表,但我不能正確導入CSV。
我已經試過這至今:
data<-read.csv2(file,
header = FALSE,
sep = ";",
quote="\"",
dec=",",
col.names=c("Datum", "Abfluss"),
skip=2,
nrows=length(strs)-2,
colClasses=c("date","numeric"))`
但後來我得到
"Fehler in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
scan() erwartete 'a real', bekam 'L�cke'"
,所以我刪除colClasses和它的作品,我擺脫了所有不需要的行。但是:一切都有因素。所以我用as.numeric
Abfluss1<-as.numeric(data$Abfluss)
知道我可以用Abfluss 1計算,但數值比原來的CSV完全不同......
Abfluss1
[1] 99 163 250 354 398 773 927 844 796 772 1010 1468 1091 955 962 933 881 844 803 772 773 803 1006 969 834 779 755
[28] 743 739
哪兒我去錯了?我真的很感激一些有用的提示。 順便說一句,我工作中的文件可以在這裏下載: http://ehyd.gv.at/#
只需點擊這些藍色十歲上下的一個三角形和下載「Q-Tagesmittel」
使用'stringsAsFactors = FALSE'如果你不想因素,並轉換爲數值正確地做'as.numeric(as.character (yourfacto r))' – eddi
在讀取文件時設置'na.strings =「Lücke」'。 – Roland
我現在已經包括了兩行('na。strings'和'stringsAsFactors'),如上所示,現在數據$ Abfluss是一個字符。當用as.numeric(as.character(你的因子))轉換爲數字時,'我只爲每一行獲得NAs ... – HairyFloh