做了一些搜索,但沒有得到所需的結果,它是按日期分組數據和計算頻率。我能夠做到這一點與聚合,但我不知道如何創建一個新的列與結果,謝謝。pandas groupby和聚合到新列
數據文件:
Domain Dates
twitter.com 2016-08-08
google.com 2016-08-09
apple.com 2016-08-09
linkedin.com 2016-08-09
microsoft.com 2016-08-09
slack.com 2016-08-12
instagram.com 2016-08-12
ibm.com 2016-08-12
代碼
import pandas as pd
import matplotlib.pyplot as plt
import datetime
import numpy as np
df = pd.read_csv('domains.tsv', sep='\t')
df = df.groupby([pd.to_datetime(df.Dates).dt.date]).agg({'Dates':'size'})
print(df)
產生
Dates
Dates
2016-08-08 1
2016-08-09 4
2016-08-12 3
理想情況下,我想數列是 '計數',然後我會救一個新的csv。
你到底在找什麼?你在問如何重新命名一個專欄? –
@ juanpa.arrivillaga我沒有意識到有兩列都是'日期',我認爲它只是輸出的迴應,因爲列沒有名稱 – sn4ke