說我有四個文件的目錄:正則表達式過濾,然後確定最後日期
someText.abcd.xyz.10Sep16.csv
someText.xyz.10Sep16.csv
someText.abcd.xyz.23Oct16.csv
someText.xyz.23Oct16.csv
這是名稱的格式設置。我不能改變它們,格式將保持不變,除了日期會改變。所有名字都以someText
開頭。接下來,有四個字母的代碼(abcd
)或三個後面的代碼(xyz
)。如果文件名有四個字母的代碼,那麼它後面總是會有一個三個字母的代碼。最後有一個日期值。
我有兩個任務。首先,我需要篩選出具有「abcd」組件的文件。這將始終是名稱中的someText.
之後出現的四字符代碼。有沒有辦法糾正正則表達式來刪除這些值?
剩下的兩個文件:
someText.xyz.10Sep16.csv
someText.xyz.23Oct16.csv
我只需要與日後的文件。有沒有第二個正則表達式可以提取日期,找到最新的,然後只保留這個日期?我這樣做是爲了獲得文件設置爲四種:
myDir <- "\\\\myDir\\folder\\"
files <- list.files(path = myDir, pattern = "\\.csv$")
下面是與文件名的載體,如果有人想嘗試一下:
files <- c("someText.abcd.xyz.10Sep16.csv", "someText.xyz.10Sep16.csv", "someText.abcd.xyz.23Oct16.csv", "someText.xyz.23Oct16.csv")