pandas-groupby

0熱度

1回答

我有一個簡單的熊貓數據幀： A B 0 test fast 1 train slow 2 test fast 3 train slow 現在我刪除了行，其中列A ==測試 df2.drop(df2[df2['A'] == 'test'].index, inplace=True) 並獲得儘可能結果： A B 1 train slow 3 train slow 現在我運

1熱度

3回答

在數據框中找到包含所有nan的列

in dataframe df如何在分組行後找到包含所有nan的列？ In [97]: df Out[97]: a b group 0 NaN NaN a 1 0.0 NaN a 2 2.0 NaN a 3 1.0 7.0 b 4 1.0 3.0 b 5 7.0 4.0 b 6 2.0 6.0 c 7 9.0 6.0 c 8 3.0 0.0 c 9 9.0 0.0

1熱度

1回答

需要幫助的是特定的交叉表！ Python Pandas

2熱度

1回答

nlargest與多指標，多AGG列

都有點吃力，以申請.nlargest（）我groupedby數據只能由每個索引總收入顯示最大10 GROUPBY [0] Groupedby數據看起來是這樣的：當我運行： grp_data.n_largest(10,'GrossRevenue_GBP') 似乎並沒有爲我工作，完整的代碼片段如下： tmean = lambda x :stats.trim_mean(x, 0.1) data

1熱度

1回答

熊貓發現字符串發生的平均值

我正在使用數據框來嘗試查找平均值，並在嘗試將值計數轉換爲我的分組df的平均值時被卡住。代碼如下： df2 = df.groupby(['school', 'Race/Ethnicity']).size() school Race/Ethnicity school1 African American/Black 15 American Indian

3熱度

2回答

從數據框中刪除重複的行，但保持一個列列表 - Python的

我有這樣一個數據幀： file: | FIRST | LAST | ID | --------------------------- 0 "ABC" 12 35 1 "ABC" 14 35 2 "AB" 15 36 現在，我要的是： file: | FIRST | LAST | ID | --------------------------- 0

2熱度

2回答

變換由熊貓

我創建一個數據幀 import pandas as pd df1 = pd.DataFrame({ "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portl

0熱度

2回答

熊貓SUMIFS，行相關的過濾器

我想用熊貓做SUMIFS風格的計算。 Power Pivots DAX具有CALCULATE功能，可以很好地工作，但不會擴展到數百萬行。作爲簡單的例子是使用數據幀來計算累積總計列： Index Customer Spend Date Cumulative Total 0 A 100 16/08/2017 280 1 A 50 15/08/2017 180 2 B 3

-1熱度

1回答

如何使用熊貓中的自定義時間對每天的時間序列數據進行分組

我想每天做一隻熊貓羣（例如df.groupby(pd.Grouper(key='ts', freq='D')，其中ts是時間戳列），但我希望每天使用自定義時間開始和結束（例如，一天從9.00開始，而不是00.00）。這可能嗎？預先感謝您

3熱度

3回答

添加數據幀並根據可用性分割結果

我想添加兩個數據幀，我可以通過添加函數來實現。現在我想根據初始數據框（df1，df2，df3）中是否存在相應的值來劃分每個結果數據幀的值。例如。 df1 = pd.DataFrame([[1,2],[3,4]], index =['A','B'], columns = ['C','D']) df2 = pd.DataFrame([[11,12], [13,14]], index = ['A',