pandas-groupby

    1熱度

    2回答

    我有一個兩級MultiIndex的DataFrame。第一級date是DatetimeIndex,第二級name只是一些字符串。數據有10分鐘的時間間隔。 如何按日期對MultiIndex的第一級進行分組並計算每天的行數? 我懷疑耦合到一個多指標的DatetimeIndex是給我的問題,因爲這樣做 data.groupby(pd.TimeGrouper(freq='D')).count() 給

    2熱度

    1回答

    我目前正在使用Python中的面板數據,並試圖計算給定組(ID)內每個時間序列觀察值的滾動平均值。 由於我的數據集的大小(成千上萬個具有多個時間段的組),因此.groupby和.apply()函數花費的時間太長以至於無法計算(已經運行了一個多小時,而且還是一無所獲 - 整個數據集僅包含約300k個觀測值)。 我希望最終遍歷多列,執行下列操作: 計算在給定列中的每個時間步長的滾動平均值,每組ID 創

    1熱度

    1回答

    比方說,這是我的數據幀 df = pd.DataFrame({ 'bio' : ['1', '1', '1', '4'], 'center' : ['one', 'one', 'two', 'three'], 'outcome' : ['f','t','f','f'] }) 它看起來像這樣... bio center outcome 0 1 one f 1

    3熱度

    3回答

    給定一個數據幀 A 0 14 1 59 2 38 3 40 4 99 5 89 6 70 7 64 8 84 9 40 10 30 11 94 12 65 13 29 14 48 15 26 16 80 17 79 18 74 19 69 該數據幀具有20列。我想一次對n=5行進行分組並總結起來。所以,我的輸出應該是這樣的: A 0 250 1

    1熱度

    2回答

    假設我需要兩個名爲「country_to_country」和「country_area_mapping」的數據框,如下所示。 >>> country_to_country From To Volume 0 c1 c4 10 1 c2 c5 20 2 c3 c6 30 >>> country_area_mapping Country Area 0 c1 a1

    2熱度

    1回答

    我在一個循環中,給了我像下面 df.groupby(['grp1','grp2'])['mycol'].sum() 基本上我讓我的分組元素的總和GROUPBY輸出。 grp1 grp2 A 1 10 B 1 20 C 2 30 D 3 40 E 4 50 1 60 現在下一次迭代中我可以得到一個像下面 grp1 grp2 A 1 20 D 3 40 E

    0熱度

    1回答

    我想將一個非常大的數據幀拆分爲更小的塊,但必須完成拆分操作,以便不拆分某些列的實例。我知道我可以使用group by來將值分組在一起,但是我怎樣才能在事後分割數據框? 例如下面df: AID VID FID 1 A X 1 B Y 1 B Z 1 A W 1 A Y 2 C X 3 C Z 3 C W I組上的兩列AID,VID並用4組最終的DF

    1熱度

    1回答

    我是新來的大熊貓,並正與形式的多指標數據集的工作(從GROUPBY製造): Name Year Month Day DataA DataB SpeciesName SpeciesValue A B Name1 Value1 A B Name2 Value2 A B Nam

    2熱度

    2回答

    首先,我的數據集如下所示 我想要做的pickup_datetime小時是組我的專欄。我在here上發現了相關問題,但出於某種原因,解決方案似乎無法正常工作。我在下面列入了我的嘗試。 我第一次開始了與此: df["dropoff_datetime"] = pd.to_datetime(df["dropoff_datetime"]) df["pickup_datetime"] = pd.to_dat

    1熱度

    3回答

    我有以下形式的熊貓數據幀: bowler inning wickets Total_wickets matches balls 0 SL Malinga 1 69 143 44 4078 1 SL Malinga 2 74 143 54 4735 2 A Mishra 1 48 124 50 3908 3 A Mishra 2 76 124