我想繪製Y軸上的Date
和Y軸上的Revenue
。我有大約16000個客戶的數據,每週收入總計。該數據集看起來像下面的例子中數據集(除了我有大約100周,16000個客戶數據):在單個圖上繪製數千個觀測值
CustNum Date Revenue
1 2013-01-07 35
1 2013-01-14 23
1 2013-01-21 42
1 2013-01-28 65
2 2013-01-07 78
2 2013-01-14 48
2 2013-01-21 85
2 2013-01-28 34
我想用一條線繪製該數據在一個單一的情節上代表一個情節顧客。換句話說,情節將有超過16000行,每個客戶每週顯示Revenue
。
現在,我明白這個陰謀將是非常混亂的16000行,我想建議什麼可能是一個更好的方式來繪製這個數據,所以它不是混亂。
我嘗試下面的代碼沒有給我想要的結果:
p <- ggplot() + geom_line(data=res,aes(x=Date,y=Revenue,color=custnum))
這並沒有給我多條線路爲多個客戶。
所以我基本上有兩個問題:
什麼能代表此數據更好的辦法?
我們應該如何改進我的代碼以在單個圖上顯示16000行? (我不關心這個問題很多,如果我能得到另一種方式來表示這個數據)
任何幫助,這將非常感激。
你試圖用你的情節傳達什麼信息?顧客之間有一種普遍的傾向?或者另一方面,變化很大?決定要顯示什麼,然後選擇_how_來顯示它。 – 2014-11-04 00:03:05
在我繪製這些信息之後,我會試圖證明某些營銷活動會影響到所有客戶的子集,我將在同一個圖上進行子集展示。因此最終會顯示營銷活動的效果。 – Patthebug 2014-11-04 00:04:52
也許'geom_line(data = res,aes(x = Date,y = Revenue,group = CustNum),alpha = 0.2)'? – 2014-11-04 00:05:16