pandas-groupby

0熱度

1回答

比方說，我的數據框看起來是這樣的： date,site,country_code,kind,ID,rank,votes,sessions,avg_score,count 2017-03-20,website1,US,0,84,226,0.0,15.0,3.370812,53.0 2017-03-21,website1,US,0,84,214,0.0,15.0,3.370812,53.0 20

1熱度

2回答

在Python創建從時間序列截面數據幀

假設我們有按分鐘指數時間序列如下： DF = Time (HH:MM) Value 01/01/2014 00:00 1 01/01/2014 00:01 2 01/01/2014 00:02 3 01/01/2014 00:03 4 ... 01/08/2014 00:00 5000 ... 我期待「組」數據集通過周，如下： DF2 = Week Val1 Val2 Val3

0熱度

2回答

轉換值一列單行的Python

我有一個熊貓數據框，看起來像這樣： Area1 Area2 1 2 1 4 1 5 1 9 2 8 2 16 2 4 2 1 3 8 3 9 我如何轉換「區域2」列，使之成爲每個「區域1的值的列表「列所以輸出我希望是： Area1 Area2 1 2, 4,

1熱度

2回答

使用過濾器對大熊貓進行查詢和排序，導致未解決的錯誤

我正在爲我的編碼類在文檔字符串中列出的這個問題工作。我將不勝感激任何關於優化我的代碼的幫助，以及爲什麼儘管重置索引時仍然收到以下錯誤的任何解釋。 import pandas as pd def beds_top_ten(df, facility_id): ''' INPUT: DataFrame, int OUTPUT: date Write a pand

1熱度

1回答

熊貓數據框中的日期差異

這是related to this question，但現在我需要找到存儲在'YYYY-MM-DD'中的日期之間的差異。本質上，count列中的值之間的差異是我們需要的，但是按每行之間的天數標準化。我的數據幀是： date,site,country_code,kind,ID,rank,votes,sessions,avg_score,count 2017-03-20,website1,US,0

0熱度

1回答

將pandas.core.groupby.SeriesGroupBy轉換爲dataframe

我有一個數據框，並應用了groupby方法。現在我有一個pandas.core.groupby.SeriesGroupBy，但我不能使用任何數據框方法。我怎樣才能將它轉換爲可用的數據框？ type(survivor) pandas.core.groupby.SeriesGroupBy 應用.groups它看起來像這樣： {'C': Int64Index([ 1, 9, 19, 26, 30,

1熱度

4回答

的Python：熊貓總和超過一個條件

我想知道如何做就取決於另一列的值的列之和（0或1） id area PP a 0,95999998 0 a 0,44 1 b 1,6900001 0 c 2 0 d 5,8499999 0 e 0,66000003 1 我可以找到每個區域ID surface_id = df.groupby("id")["area"].sum() 但我也希望是ID中的區域，如果PP = 1得到的

1熱度

3回答

Pandas Groupby：如何使用兩個lambda函數？

我可以現在做熊貓以下，但我得到一個嚴峻的手指FutureWarning搖： grpd = df.groupby("rank").agg({ "mean": np.mean, "meian": np.median, "min": np.min, "max": np.max, "25th percentile": lambda x: np.percentile(x, 25),

1熱度

1回答

Python的大熊貓：重新編制DataFrameGroupBy對象到數據幀錯誤

我有一個簡單的初始數據框： ID, ATTRIBUTE 1, thing2 1, thing3 1, thing3 2, thing7 2, thing7 2, thing2 3, thing1 3, thing2 我有一個簡單GROUPBY對象，我想創建哪裏獲得屬性的模式（如果是多我打電話結果 'multithing'）： mode = lambda x: x.mode()

2熱度

1回答

在連續的行GROUPBY累計操作大熊貓

我想agg和功能cummax和cumsum找到爲A相同值的列B滾動總和和滾動最大的df df = pd.DataFrame({'A': ['a', 'a', 'a', 'b', 'b', 'b', 'b'], 'B': [5, 2, 4, 7, 1, 11, 3]}) df_result = pd.DataFrame({'A': ['a', 'a', 'a', 'b', 'b', 'b', '