2015-10-15 83 views
0

您好,我有以下數據框。我想知道是否有系統的方法來檢查每分鐘的最小值。特別是給予以下:Python:每分鐘查找最小時間戳數據幀

df 
ID TIME   VAL 
0 3/10/2014 8:02 6 
1 3/10/2014 8:02 6.5 
2 3/10/2014 8:04 7 
3 3/10/2014 8:05 6.5 
4 3/10/2014 8:05 6 
5 3/10/2014 8:05 5.5 
6 3/10/2014 8:06 5 
7 3/10/2014 8:06 4.5 
8 3/10/2014 8:08 4 
9 3/10/2014 8:08 4.5 
10 3/10/2014 8:09 5 
11 3/10/2014 8:09 5.5 
12 3/10/2014 8:09 6 
13 3/10/2014 8:10 6.5 
14 3/10/2014 8:10 7 

我想有取最小值val每分鐘

ID TIME   VAL MINIMUM 
0 3/10/2014 8:02 6 6 
1 3/10/2014 8:02 6.5 6 
2 3/10/2014 8:04 7 7 
3 3/10/2014 8:05 6.5 5.5 
4 3/10/2014 8:05 6 5.5 
5 3/10/2014 8:05 5.5 5.5 
6 3/10/2014 8:06 5 4.5 
7 3/10/2014 8:06 4.5 4.5 
8 3/10/2014 8:08 4 4 
9 3/10/2014 8:08 4.5 4 
10 3/10/2014 8:09 5 5 
11 3/10/2014 8:09 5.5 5 
12 3/10/2014 8:09 6 5 
13 3/10/2014 8:10 6.5 6.5 
14 3/10/2014 8:10 7 6.5 
+0

你如何計算'val' – Elipzer

+0

它來自數據庫我有 – emax

+0

時間只是一個字符串? –

回答

0
grouped = df.groupby((df["TIME"].dt.hour, df["TIME"].dt.minute)) 
minimums = grouped.agg(numpy.min) 

然後你會需要弄清楚如何應用列表中的列minimum作爲一個新列的最小值到你的數據框......我將離開這個作爲你的練習

+0

謝謝。然而,如果我這樣做,它會起作用:'groupped = df.groupby(df [「TIME」]。dt.hour)'它會在每個小時發現最小值,但如果我做了'grouped = df.groupby(df [「TIME」 ] .dt.hour,df [「TIME」]。dt.minute)'我有以下錯誤:'TypeError:'Series'對象是可變的,因此它們不能被散列' – emax

+0

whoops需要將參數放入一個元組......那應該沒問題 –

相關問題