pandas-groupby

    0熱度

    1回答

    比方說,我的數據框看起來是這樣的: date,site,country_code,kind,ID,rank,votes,sessions,avg_score,count 2017-03-20,website1,US,0,84,226,0.0,15.0,3.370812,53.0 2017-03-21,website1,US,0,84,214,0.0,15.0,3.370812,53.0 20

    1熱度

    2回答

    假設我們有按分鐘指數時間序列如下: DF = Time (HH:MM) Value 01/01/2014 00:00 1 01/01/2014 00:01 2 01/01/2014 00:02 3 01/01/2014 00:03 4 ... 01/08/2014 00:00 5000 ... 我期待「組」數據集通過周,如下: DF2 = Week Val1 Val2 Val3

    0熱度

    2回答

    我有一個熊貓數據框,看起來像這樣: Area1 Area2 1 2 1 4 1 5 1 9 2 8 2 16 2 4 2 1 3 8 3 9 我如何轉換「區域2」列,使之成爲每個「區域1的值的列表「列 所以輸出我希望是: Area1 Area2 1 2, 4,

    1熱度

    2回答

    我正在爲我的編碼類在文檔字符串中列出的這個問題工作。我將不勝感激任何關於優化我的代碼的幫助,以及爲什麼儘管重置索引時仍然收到以下錯誤的任何解釋。 import pandas as pd def beds_top_ten(df, facility_id): ''' INPUT: DataFrame, int OUTPUT: date Write a pand

    1熱度

    1回答

    這是related to this question,但現在我需要找到存儲在'YYYY-MM-DD'中的日期之間的差異。本質上,count列中的值之間的差異是我們需要的,但是按每行之間的天數標準化。 我的數據幀是: date,site,country_code,kind,ID,rank,votes,sessions,avg_score,count 2017-03-20,website1,US,0

    0熱度

    1回答

    我有一個數據框,並應用了groupby方法。現在我有一個pandas.core.groupby.SeriesGroupBy,但我不能使用任何數據框方法。我怎樣才能將它轉換爲可用的數據框? type(survivor) pandas.core.groupby.SeriesGroupBy 應用.groups它看起來像這樣: {'C': Int64Index([ 1, 9, 19, 26, 30,

    1熱度

    4回答

    我想知道如何做就取決於另一列的值的列之和(0或1) id area PP a 0,95999998 0 a 0,44 1 b 1,6900001 0 c 2 0 d 5,8499999 0 e 0,66000003 1 我可以找到每個區域ID surface_id = df.groupby("id")["area"].sum() 但我也希望是ID中的區域,如果PP = 1得到的

    1熱度

    3回答

    我可以現在做熊貓以下,但我得到一個嚴峻的手指FutureWarning搖: grpd = df.groupby("rank").agg({ "mean": np.mean, "meian": np.median, "min": np.min, "max": np.max, "25th percentile": lambda x: np.percentile(x, 25),

    1熱度

    1回答

    我有一個簡單的初始數據框: ID, ATTRIBUTE 1, thing2 1, thing3 1, thing3 2, thing7 2, thing7 2, thing2 3, thing1 3, thing2 我有一個簡單GROUPBY對象,我想創建哪裏獲得屬性的模式(如果是多我打電話結果 'multithing'): mode = lambda x: x.mode()

    2熱度

    1回答

    我想agg和功能cummax和cumsum找到爲A相同值的列B滾動總和和滾動最大的df df = pd.DataFrame({'A': ['a', 'a', 'a', 'b', 'b', 'b', 'b'], 'B': [5, 2, 4, 7, 1, 11, 3]}) df_result = pd.DataFrame({'A': ['a', 'a', 'a', 'b', 'b', 'b', '