這個答案避免subset
,處理缺少的觀察和使用as.POSIXct
日期/時間格式。儘管如此,其餘的代碼與Tyler Rinker的答案几乎相同。請注意,我必須指定內部as.POSIXct
日期/時間變量的名稱,而不是使用未格式化的變量Date_Time
的名稱。
my.data <- read.csv(text = '
Date_Time, state, city
10/05/2011 07:32:40, AK, aa
15/06/2011 13:26:02, AK, bb
19/07/2011 13:26:02, OH, cc
NA, OH, dd
20/05/2012 14:57:27, PA, ee
22/07/2012 14:57:27, AL, ff
20/03/2013 15:03:18, NY, gg
', header=TRUE, stringsAsFactors = FALSE, na.strings = 'NA', strip.white = TRUE)
my.data$my_Date_Time <- as.POSIXct(my.data$Date_Time, format = "%d/%m/%Y %H:%M:%S")
# Select May
my.data[format.Date(my.data$my_Date_Time, "%m")=="05" &
!is.na(my.data$my_Date_Time),]
# Date_Time state city my_Date_Time
# 1 10/05/2011 07:32:40 AK aa 2011-05-10 07:32:40
# 5 20/05/2012 14:57:27 PA ee 2012-05-20 14:57:27
# Select 2012
my.data[format.Date(my.data$my_Date_Time, "%Y")=="2012" &
!is.na(my.data$my_Date_Time),]
# Date_Time state city my_Date_Time
# 5 20/05/2012 14:57:27 PA ee 2012-05-20 14:57:27
# 6 22/07/2012 14:57:27 AL ff 2012-07-22 14:57:27
# Select May 2012
my.data[format.Date(my.data$my_Date_Time, "%m")=="05" &
format.Date(my.data$my_Date_Time, "%Y")=="2012" &
!is.na(my.data$my_Date_Time),]
# Date_Time state city my_Date_Time
# 5 20/05/2012 14:57:27 PA ee 2012-05-20 14:57:27
經過多次嘗試,我的代碼工作使用,2011年11月:子集(銷售,format.Date(日期,「%m」)==「11」&format.Date(日期,「%d」)==「11」)。我認爲問題在於我用來創建數據框的read.csv命令,但這是一個不同的問題。我可以認爲我最初的問題是令人滿意的。 – 2012-02-23 14:52:54