pandas-groupby

1熱度

2回答

我有一個兩級MultiIndex的DataFrame。第一級date是DatetimeIndex，第二級name只是一些字符串。數據有10分鐘的時間間隔。如何按日期對MultiIndex的第一級進行分組並計算每天的行數？我懷疑耦合到一個多指標的DatetimeIndex是給我的問題，因爲這樣做 data.groupby(pd.TimeGrouper(freq='D')).count() 給

2熱度

1回答

將函數應用於Pandas Group by

我目前正在使用Python中的面板數據，並試圖計算給定組（ID）內每個時間序列觀察值的滾動平均值。由於我的數據集的大小（成千上萬個具有多個時間段的組），因此.groupby和.apply（）函數花費的時間太長以至於無法計算（已經運行了一個多小時，而且還是一無所獲 - 整個數據集僅包含約300k個觀測值）。我希望最終遍歷多列，執行下列操作：計算在給定列中的每個時間步長的滾動平均值，每組ID 創

1熱度

1回答

如何刪除基於在熊貓數據幀兩個或兩個以上的子集標準重複

比方說，這是我的數據幀 df = pd.DataFrame({ 'bio' : ['1', '1', '1', '4'], 'center' : ['one', 'one', 'two', 'three'], 'outcome' : ['f','t','f','f'] }) 它看起來像這樣... bio center outcome 0 1 one f 1

3熱度

3回答

如何在熊貓中同時執行'n`行的總和？

給定一個數據幀 A 0 14 1 59 2 38 3 40 4 99 5 89 6 70 7 64 8 84 9 40 10 30 11 94 12 65 13 29 14 48 15 26 16 80 17 79 18 74 19 69 該數據幀具有20列。我想一次對n=5行進行分組並總結起來。所以，我的輸出應該是這樣的： A 0 250 1

1熱度

2回答

重命名該列的條目，然後重命名爲pandas中的groupby

假設我需要兩個名爲「country_to_country」和「country_area_mapping」的數據框，如下所示。 >>> country_to_country From To Volume 0 c1 c4 10 1 c2 c5 20 2 c3 c6 30 >>> country_area_mapping Country Area 0 c1 a1

2熱度

1回答

取最大值從多個分組數據大熊貓

我在一個循環中，給了我像下面 df.groupby(['grp1','grp2'])['mycol'].sum() 基本上我讓我的分組元素的總和GROUPBY輸出。 grp1 grp2 A 1 10 B 1 20 C 2 30 D 3 40 E 4 50 1 60 現在下一次迭代中我可以得到一個像下面 grp1 grp2 A 1 20 D 3 40 E

0熱度

1回答

將DataFrame.groupby函數的結果拆分爲2個或多個部分

我想將一個非常大的數據幀拆分爲更小的塊，但必須完成拆分操作，以便不拆分某些列的實例。我知道我可以使用group by來將值分組在一起，但是我怎樣才能在事後分割數據框？例如下面df： AID VID FID 1 A X 1 B Y 1 B Z 1 A W 1 A Y 2 C X 3 C Z 3 C W I組上的兩列AID，VID並用4組最終的DF

1熱度

1回答

迭代和修改熊貓數據幀或GROUPBY對象

我是新來的大熊貓，並正與形式的多指標數據集的工作（從GROUPBY製造）： Name Year Month Day DataA DataB SpeciesName SpeciesValue A B Name1 Value1 A B Name2 Value2 A B Nam

2熱度

2回答

問題與分組數據框大熊貓

首先，我的數據集如下所示我想要做的pickup_datetime小時是組我的專欄。我在here上發現了相關問題，但出於某種原因，解決方案似乎無法正常工作。我在下面列入了我的嘗試。我第一次開始了與此： df["dropoff_datetime"] = pd.to_datetime(df["dropoff_datetime"]) df["pickup_datetime"] = pd.to_dat

1熱度

3回答

熊貓GROUPBY和廣播結果原來的數據幀

我有以下形式的熊貓數據幀： bowler inning wickets Total_wickets matches balls 0 SL Malinga 1 69 143 44 4078 1 SL Malinga 2 74 143 54 4735 2 A Mishra 1 48 124 50 3908 3 A Mishra 2 76 124