我有一個數據框,其中包含多年來每小時觀測的氣候數據,我在下面包含了一個虛擬數據框,這將有望說明我的QU。測試數據值是否存在於按POSIX日期分組的變量中
dateTime <- seq(as.POSIXct("2012-01-01"),
as.POSIXct("2012-12-31"),
by=(60*60))
WS <- sample(0:20,8761,rep=TRUE)
WD <- sample(0:390,8761,rep=TRUE)
Temp <- sample(0:40,8761,rep=TRUE)
df <- data.frame(dateTime,WS,WD,Temp)
df$WS[WS>15] <- NA
我需要按年度(或者在這個例子中,通過一個月)找到,如果DF $ WS擁有75%以上的當月有效數據。我的過濾標準是NA,因爲0仍然是有效的觀察結果。因爲它是觀測氣候數據,所以我有真正的NA。
我已經試過dplyr R group by date, and summarize the values
這些都沒有真正回答使用%>%功能由新列「月」,以文件管理器 Making a data frame of count of NA by variable for multiple data frames in a list,管道以及在這裏 Calculate the percentages of a column in a data frame - "grouped" by column審查的幾個問題,我題。
我的希望是把一些東西放在一個循環函數中,這個循環函數將會經過我所有的工作站和每個工作站的所有年份,以產生一個風玫瑰,如果這個標準符合那個年份/工作站的話。如果我需要澄清更多,請讓我知道。 乾杯
對於哪個變量'Temp'有效的數據? –
變量是$ WS – Dee