2013-04-29 69 views
0

這是非常相似,這裏的問題是:地塊前X類/ GGPLOT2

How to use ggplot to group and show top X categories?

除了在我來說,我沒有一個離散值去。我有關於用戶在用戶論壇上發佈消息的數據。類似:

Year, Month, Day, User, Message 

我得爲每一個消息的人貼出一個條目,我要繪製每年的前5名用戶發佈的全部消息的條款。在上一個問題中,有一個明確的價值清單,可以從中扣除。

在我的情況,我很好奇,如果我能在GGPLOT2容易做到這一點,或者如果我需要做的是這樣的:

  1. 將數據加載到一個數據幀
  2. 構造新的數據幀,其在相同的數據倒塌&總結了一年
  3. 從使用相同的方法與前面的問題

如果是這樣做的最佳途徑新幀

  • 情節,有什麼牛逼他「正確」的方式去做#2?新的數據幀可能應該是這樣的形式:

    Year, User, Total number of Messages 
    

    任何幫助表示讚賞。

  • +0

    **正確的**方法是使用任何無數的工具來聚合R(data.table,by,ave,plyr)中的數據,這樣可以讓您在一段時間內獲得正確的結果認爲可以接受.. – joran 2013-04-29 18:19:14

    +0

    啊,這就是我的想法:)它解釋了爲什麼我一直無法找到ggplot2解決方案!我找到了一個我認爲可行的答案,我會自己回答這個問題以供其他人找到。謝謝! – Dave 2013-04-29 18:31:47

    回答

    0

    基於Joran的評論,我發現這個plyr方法:

    ddply(posts, .(year, poster), summarise, freq=length(year)) 
    

    這給了我每年每用戶的帖子。從那裏我可以按照其他帖子的建議修剪它,以獲得每年的頂級X海報。