我試圖繪製已被某些日期範圍分類的數據。在熊貓中按日期進行分組以便繪製分類分佈
例如說我有以下數據框:
dates = pd.date_range(start=pd.datetime(2013, 6, 1), periods=50, freq='D')
df = pd.DataFrame(np.random.normal(10, 3, 50), columns=['x'], index=dates)
df[:3]
x
2013-06-01 9.819422
2013-06-02 3.659629
2013-06-03 14.862231
我想組3周的間隔日期,並繪製數據,這給了我,我要找的平均水平,
df.resample('3w', how='mean')
x
2013-06-02 11.424715
2013-06-23 9.443888
2013-07-14 8.572851
2013-08-04 9.873879
但我想保留所有的數據,以便我可以在seaborn
中使用箱圖或包含使用matplotlib
的標準錯誤。我完全停留在如何在沒有明確定義範圍的情況下實現這一點(這與我正在使用的實際數據框無法實現)。這似乎是必須有可以做到這一點的大熊貓所以輸出會是這樣的一個相當簡單的方法:
x week
2013-06-01 9.819422 1
2013-06-02 3.659629 1
2013-06-03 14.862231 1
哪裏week
爲代表的分級數據的分類變量。任何想法將不勝感激。
這非常適用於大多數情況下,但是,我真的希望能夠產生如我所提供的數據框一個例子,因爲我還希望能夠計算其他統計數據。 – johnchase
嘗試'tg = df.groupby(pd.TimeGrouper('3w'))'並使用'tg.'完成製表符以查看可用的方法。請注意'.get_group'以及所有其他可用的統計信息。 – Alexander