1
我有一個數據集,格式如下。python pandas覆蓋時間戳
420,426,2013-04-28T23:59:21,7,20
421,427,2013-04-28T23:59:21,13,12
422,428,2013-04-28T23:59:22,10,16
423,510,2013-04-28T23:59:22,0,1
424,511,2013-04-28T23:59:22,9,0
425,1,2013-04-29T00:04:21,19,5
426,2,2013-04-29T00:04:21,25,1
427,3,2013-04-29T00:04:22,14,7
428,4,2013-04-29T00:04:22,18,2
我使用熊貓,我們正與一個巨大的數據集工作。我想要將數據分成5分鐘的時間間隔。我正在使用以下代碼來獲取組。
有沒有辦法以有效的方式將原始數據集中的時間戳替換爲新組的時間戳?例如, ;在這個例子中,我們希望前五個實例加蓋相同的時間戳,這是適當組的時間戳。
import pandas as pd
from datetime import timedelta
from pandas.tseries.resample import TimeGrouper
file_name = os.path.join("..", "..", "Dataset", "all_rawdata.csv")
dataset=pd.read_csv(file_name,dtype{"ID":np.int32,"station":np.int32,"time":str,"slots":np.int32,"available":np.int32})
dataset['time'] =pd.to_datetime(dataset['time'])
dataset.set_index(dataset.time, inplace=True)
data1 = dataset.groupby(TimeGrouper('5Min'))
你可以張貼一些示例輸出?目前還不清楚你想要什麼,但聽起來你只需要每個5分鐘數據組中的前5個實例。是對的嗎? –