TL; DR如何編寫長熊貓聚合?
怎麼寫,涉及像groupby()
,unstack()
或apply()
以及許多操作長聚合?
例
說你有n_events = 10
不同事件DataFrame()
與n_sales = 1000
售票,像
,你想在多少事件至少n = [50, 100]
門票在出售積晚上:
然後我會去做
accumulation_of_sales = sales.groupby(['Time', 'Event']).size().unstack().fillna(0).cumsum()
events_with_n_sales = accumulation_of_sales.apply(lambda x: x.value_counts(), axis=1).fillna(0)
events_with_geq_n_sales = events_with_n_sales[events_with_n_sales.columns[::-1]].cumsum(axis=1)
events_with_geq_n_sales[n].plot()
這似乎很難讀,我和線條原則太長(見PEP)。所以,
- 這個特定的和類似的操作如何做得最好?
- 是否有一些教程/風格指南/ ...爲初學者?也許不是特別是熊貓,但類似的語言?
如果你想知道爲什麼我會想這樣做:我需要爲已讀出的隨機模型比較與整數實驗數據。所以這是隨着時間的推移可能產生的堆積直方圖。 – qiv