我有一個數據集類似於下面的文件重採樣與熊貓
2013-05-30 06:00:41 173.199.116.171
2013-05-30 06:05:41 61.245.172.14
2013-05-30 06:10:42 74.86.158.106
2013-05-30 06:20:42 61.245.172.14
我想重新取樣,20分鐘,得到一定20分鐘時隙中的命中次數(例如之間。(06.00.00 -06.20.00或06.40.00-07.00.00等)。我可以打印命中計數整個數據文件,如下所示。
ips = df.groupby('IP').size()
如何獲得各20個分鐘時間段命中計數?繼代碼只是打印'06:00:00'和'06:20:00之間的所有IP地址「。
個df_s = df['IP'].resample('20t', how='count')
print df['IP'].between_time('06:00:00', '06:20:00')
什麼是您的df_s樣子?我不認爲我可以用熊貓0.11複製它。我的6:00插槽包含三個匹配,而我的6:20插槽1.您是否嘗試設置'closed ='和'label ='關鍵字?默認的箱子定義可能與你所期望的不同。 –
@Rutger Kassies這個怎麼樣?但是我必須指定時間段?新= DataFrame(df ['IP']。between_time('06:00:00','06:20:00')) t = new.groupby('IP')。size() –