pandas-groupby

    0熱度

    1回答

    我有一個簡單的熊貓數據幀: A B 0 test fast 1 train slow 2 test fast 3 train slow 現在我刪除了行,其中列A ==測試 df2.drop(df2[df2['A'] == 'test'].index, inplace=True) 並獲得儘可能結果: A B 1 train slow 3 train slow 現在我運

    1熱度

    3回答

    in dataframe df如何在分組行後找到包含所有nan的列? In [97]: df Out[97]: a b group 0 NaN NaN a 1 0.0 NaN a 2 2.0 NaN a 3 1.0 7.0 b 4 1.0 3.0 b 5 7.0 4.0 b 6 2.0 6.0 c 7 9.0 6.0 c 8 3.0 0.0 c 9 9.0 0.0

    1熱度

    1回答

    這個鏈接非常接近我的想法。 Python pandas groupby aggregate on multiple columns 涵蓋這個問題的主要議題是: 1. Python | 2.熊貓DS | 3.分組By | 4.聚合函數| 5.效率 我現在的熊貓DS是 列名 - > Unique_Identifier |分類|產品|值 因此數據具有爲每個產品重複的標識符。我需要獲得每個標識符都有1行的

    2熱度

    1回答

    都有點吃力,以申請.nlargest()我groupedby數據只能由每個索引總收入顯示最大10 GROUPBY [0] Groupedby數據看起來是這樣的: 當我運行: grp_data.n_largest(10,'GrossRevenue_GBP') 似乎並沒有爲我工作,完整的代碼片段如下: tmean = lambda x :stats.trim_mean(x, 0.1) data

    1熱度

    1回答

    我正在使用數據框來嘗試查找平均值,並在嘗試將值計數轉換爲我的分組df的平均值時被卡住。代碼如下: df2 = df.groupby(['school', 'Race/Ethnicity']).size() school Race/Ethnicity school1 African American/Black 15 American Indian

    3熱度

    2回答

    我有這樣一個數據幀: file: | FIRST | LAST | ID | --------------------------- 0 "ABC" 12 35 1 "ABC" 14 35 2 "AB" 15 36 現在,我要的是: file: | FIRST | LAST | ID | --------------------------- 0

    2熱度

    2回答

    我創建一個數據幀 import pandas as pd df1 = pd.DataFrame({ "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portl

    0熱度

    2回答

    我想用熊貓做SUMIFS風格的計算。 Power Pivots DAX具有CALCULATE功能,可以很好地工作,但不會擴展到數百萬行。 作爲簡單的例子是使用數據幀來計算累積總計列: Index Customer Spend Date Cumulative Total 0 A 100 16/08/2017 280 1 A 50 15/08/2017 180 2 B 3

    -1熱度

    1回答

    我想每天做一隻熊貓羣(例如df.groupby(pd.Grouper(key='ts', freq='D'),其中ts是時間戳列),但我希望每天使用自定義時間開始和結束(例如,一天從9.00開始,而不是00.00)。 這可能嗎? 預先感謝您

    3熱度

    3回答

    我想添加兩個數據幀,我可以通過添加函數來實現。 現在我想根據初始數據框(df1,df2,df3)中是否存在相應的值來劃分每個結果數據幀的值。例如。 df1 = pd.DataFrame([[1,2],[3,4]], index =['A','B'], columns = ['C','D']) df2 = pd.DataFrame([[11,12], [13,14]], index = ['A',