每年公司數量可以說我有數據幀:使用dplyr或數據表
df <- data.frame(City = c("NY", "NY", "NY", "NY", "NY", "LA", "LA", "LA", "LA"),
YearFrom = c("2001", "2003", "2002", "2006", "2008", "2004", "2005", "2005", "2002"),
YearTo = c(NA, "2005", NA, NA, "2009", NA, "2008", NA, NA))
其中YearFrom是因爲當年例如公司成立,並且YearTo是被取消的年份。 如果YearTo是NA,那麼它仍然有效。
我想計算每年的公司數量。
表應該是這樣的
City |"Year" |"Count"
"NY" |2001 1
"NY" |2002 2
"NY" |2003 3
"NY" |2004 3
"NY" |2005 2
"NY" |2006 3
"NY" |2007 3
"NY" |2008 4
"NY" |2009 3
"LA" |2001 0
"LA" |2002 1
"LA" |2003 1
"LA" |2004 2
"LA" |2005 4
"LA" |2006 4
"LA" |2007 4
"LA" |2008 2
"LA" |2009 2
我想通過dplyr或數據表包來解決這個問題,但我無法弄清楚如何?
應該取消當年被包含或排除?它應該排除在 – lmo
之外。我認爲這是正確的方式。 – Mislav