2016-09-09 23 views
-2

我有一個.csv文件(mydb.csv),下面的條目(+1百萬行)。該表的第7行包含日期。日期多次重複,因爲此數據集包含每小時記錄。如何將存儲在.csv文件中的每小時觀測值平均到日常觀測值中?

QTEwOA==,81881,-7.610773,-72.681333,220,A108,2016-06-11,08,21.4,95,994.3,3.3,0,0,, 
QTEwOA==,81881,-7.610773,-72.681333,220,A108,2016-06-11,09,21.3,95,994.1,1.2,0,0,, 
QTEwOA==,81881,-7.610773,-72.681333,220,A108,2016-06-11,10,21.2,94,994.5,2.1,0,0,, 
QTEwOA==,81881,-7.610773,-72.681333,220,A108,2016-06-11,11,20.9,94,994.7,1.3,0,0,, 
QTEwOA==,81881,-7.610773,-72.681333,220,A108,2016-06-11,12,20.9,93,995.6,1.7,0,0,0.0,0.0 

我需要計算每個記錄的觀察日的平均值。

我可以在python中完成它,還是應該將我的.csv文件轉換爲sqlite文件進行查詢?

+1

使用['pandas'](http://pandas.pydata.org)。 – MattDMo

回答

0

您可以使用python中的pandas庫來快速完成它。它看起來像這樣:

import pandas as pd 
df = pd.read_csv("initial.csv") 
avgd_df = df.groupby('date').mean() 
avgd_df.to_csv("averaged.csv") 
相關問題