我有三列數據集:今年,市,值看起來像這樣:的R - 記住,是不是NA最新數據,除非只有NA可用
year = c(2010, 2013, 2010, 2013, 2013)
city = c("Berlin","Berlin", "Munich", "Munich", "Frankfurt")
value = c(1234, NA, NA, 6372, NA)
data <- data.frame(year, value1, value2)
year city value
1 2010 Berlin 1234
2 2013 Berlin NA
3 2010 Munich NA
4 2013 Munich 6372
5 2013 Frankfurt NA
我想知道如何子集這使我只保留可用,所以在最後我留下這樣的數據的最新數據:
year city value
1 2010 Berlin 1234
2 2013 Munich 6372
3 2013 Frankfurt NA
如果我子集上最高的一年中,我得到其中當年有ISN來港數據。如果我的子集是!is.na()
,那麼我將丟失所有隻有的行不適用。
我想特別做的是獲得具有數據的給定城市的最高年份,除非該城市僅有NAs,然後是NA的最高年份。我會怎麼做呢?
你到底想子集?從你的例子來看,你似乎不想爲最高年份設置子集,是否還有另一個變量不在此處顯示? –
啊,否:我想爲城市列設置子集:除了那個城市只有NAs,然後是NA最高的一年,這個城市數據的最高年份。 這是否使它更清晰? – LukasKawerau