我有數據集看起來就像是:如何計算大熊貓每天的總和?
time raccoons_bought x y
22443 1984-01-01 00:00:01 1 55.776462 37.593956
2143 1984-01-01 00:00:01 4 55.757121 37.378225
9664 1984-01-01 00:00:33 3 55.773702 37.599220
33092 1984-01-01 00:01:39 3 55.757121 37.378225
16697 1984-01-01 00:02:32 2 55.678549 37.583023
我需要計算多少浣熊每 一天買了那麼我做什麼: 化妝時間指數
df = df.set_index(['time'])
排序數據集由它
df.groupby(df.index.date).count()
但之前我將排序我需要刪除x和y列的平均座標
如果我不刪除數據集將看起來像:
raccoons_bought x y
1984-01-01 5497 5497 5497
1984-01-02 5443 5443 5443
1984-01-03 5488 5488 5488
1984-01-04 5453 5453 5453
1984-01-05 5536 5536 5536
1984-01-06 5634 5634 5634
1984-01-07 5468 5468 5468
如果我刪除它,數據集將顯得精緻:
raccoons_bought
1984-01-01 5497
1984-01-02 5443
1984-01-03 5488
1984-01-04 5453
1984-01-05 5536
1984-01-06 5634
1984-01-07 5468
所以我的問題是如何計算每raccoons_bought並保存座標不變,因爲我想在地圖上繪製這個座標並找到誰買了浣熊
如果按日期組,在(X,Y)寬鬆的座標信息對每個時間。你期望的輸出是什麼? –
我希望每天購買浣熊的總數和購買浣熊的公司的座標 – Anton
是的,但請注意第一個表格中的前兩個條目是如何來自同一日期但具有不同座標的。在你的輸出表中,按日期排序(而不是h:m:s),你如何期望在(x,y)中表示這種差異? –