3
我一直在與大熊貓一起分析時間序列數據,並一直堅持將它們整合到數據透視表中。我有一個CSV作爲數據:大熊貓數據透視表與平均時間
gov start end
a 2015-12-08T16:05:00.980+03 2015-12-08T16:14:31.765+03
a 2015-12-08T16:07:53.356+03 2015-12-08T16:34:43.413+03
b 2015-12-08T16:08:43.371+03 2015-12-08T16:54:32.257+03
b 2015-12-08T15:56:12.006+03 2015-12-08T17:35:04.499+03
我有一組簡單的數據,具有start
和end
時間,並從工作了兩者之間的時間差:
piv_t_subset = pd.read_csv('time_test.csv', parse_dates=['start','end'])
piv_t_subset['time_diff'] = piv_t_subset['end'] - piv_t_subset['start']
我可以計算時間的獨立平均值爲:
t = piv_t_subset['time_diff'].mean()
print t
0 days 00:18:53.703286
我想創建一個數據透視表與這次信息,但是當我嘗試:
pd.pivot_table(piv_t_subset,index=["gov"],values=['time_diff'],aggfunc=[np.mean])
我得到的錯誤:
DataError: No numeric types to aggregate
我需要做更多的預處理從timeseries
將它轉換爲float
?
完美!恥辱它不直接支持,但這工作得很好! – DGraham