2017-04-07 45 views
0

我使用的是來自俄勒岡州的競選捐款數據,我試圖製作一個圖表,顯示每位候選人隨時間推移而貢獻的累計捐款數額。這是我到目前爲止有:cumsum數據隨時間變化的因素

ggplot(aes(x = as.Date(contb_receipt_dt, "%d-%b-%y"), 
      y = cumsum(contb_receipt_amt)), 
      data = subset(oregon_data, 
         table(oregon_data$cand_nm)[oregon_data$cand_nm] > 1000       
          & as.Date(contb_receipt_dt, "%d-%b-%y") > as.Date("2015-01-01"))) 
+ geom_line(aes(color = cand_nm), bins = 5) 

這是什麼樣子:

failed graph

我想看到的是對每一個候選,在0開頭的行,慢慢地去與每個額外的貢獻。我該怎麼辦?

+0

這個數據打開數據?你有網址還是可以發佈一個小樣本? –

+0

我在這個URL上使用了俄勒岡州的數據:http://fec.gov/disclosurep/PDownload.do – Bryanzpope

回答

0

在發送到ggplot之前,我會使用dplyr來計算cumsum列。這應該讓你足夠的開車,但是你需要漂亮起來,並過濾數據,以得到你要找的結果:

WashingtonData <- read.csv("P00000001-WA.csv") 
WashingtonData <- WashingtonData %>% arrange(contb_receipt_dt) 

MyGraphData <- WashingtonData %>% group_by(cand_nm) %>% mutate(cumsum = cumsum(contb_receipt_amt)) 

g <- ggplot(data=MyGraphData, aes(y=cumsum, x=contb_receipt_dt, color=cand_nm)) + geom_line() 
g