我有許多.csv文件,它們都包含放在同一個目錄中的相同字段,但每個文件中的值都是針對特定日期的。但是,.csv文件中的數據不包含日期 - 只有文件名包含日期。根據R中的文件名創建一個新字段
我目前閱讀和使用下面的代碼合併不同的.csv文件:
group <- list.files(pattern="[.]csv")
fun <- function(x) {
df <- read.csv(x , header = TRUE)
}
big_df <- ldply(group, fun)
的輸出,那麼看起來是這樣的:
print(big_df)
value_a value_b value_c
1 1 444 10
2 5 7364 9
3 32 573 14
4 7 253 16
和文件,這是閱讀從這樣的樣子:
print(group)
[1] "PSM_filter_report_04242015_1.csv" "PSM_filter_report_04242015_2.csv" "PSM_filter_report_04252015_1.csv"
[4] "PSM_filter_report_04272015_1.csv"
我想作爲一部分的過程s是使用substr(),或者一些可比較的函數,將文件名中的日期添加爲我創建的文件中的新字段。這樣一來,新的數據幀是這樣的:
big_df
value_a value_b value_c date
1 1 444 10 04242015
2 5 7364 9 04242015
3 32 573 14 04252015
4 7 253 16 04272015
只要日期被讀入作爲一個因素或字符(讓我不會失去前導零),我會使用as.Date()方便地轉換日期。