pandas-groupby

    1熱度

    1回答

    我有一個數據框,我想計算一列的連續條目數並將計數記錄在單獨的變量中。這裏有一個例子: ID Class 1 A 1 A 2 A 1 B 1 B 1 B 2 B 1 C 1 C 2 A 2 A 2 A 我希望每個組ID數連續類的數量,所以輸出應該是這樣的: ID Class Counts 1 A

    0熱度

    1回答

    假設我有一個數據幀如下 In [6]: df.head() Out[6]: regiment company name preTestScore postTestScore 0 Nighthawks 1st Miller 4 25 1 Nighthawks 1st Jacobson 24 94 2 Nighthawks 2nd Ali 31

    0熱度

    2回答

    我想了解熊貓羣組,但我目前正在看到一些我不明白的行爲。基本上,我有一個數據集,看起來像(僅頭): userId movieId rating timestamp parsed_time 0 1 2 3.5 1112486027 2005-04-02 23:53:47 1 1 29 3.5 1112484676 2005-04-02 23:31:16 2 1 32 3.5 1112

    3熱度

    2回答

    我的假設數據幀是 df = pd.DataFrame({'col1':[91,91,91,91,92,92,92,92], 'col2':[91,92]*4,'value':[10]*8}) df col1 col2 value 0 91 91 10 1 91 92 10 2 91 91 10 3 91 92 10 4 92 91 10 5 92 92

    0熱度

    2回答

    得到的意思是我有一個純文本文件看起來像這樣: count=1 file_type=2007 app=smtp timestamp=2017-07-25 20:01:02.042000 count=2 file_type=jar app=http timestamp=2017-07-25 20:01:02.042000 count=4421 file_type=gzip app=http tim

    1熱度

    2回答

    我有一個熊貓據幀像這樣, dd = pd.DataFrame( {'name': ['abc','bcd','abc'], 'seconds': [75,77,90], }) 我需要秒列合併爲同名行一個列表。 我能for循環做到這一點使用, names= list(set(dd['name'])) counter=[] for a in names: counter.appe

    0熱度

    1回答

    我有以下的數據幀df: period remaining_et_months property_id beds 0 0 0 329 1 1 1 0 329 1 2 2 1 329 1 3 3 2 329 1 4 3 2 329 1 5 4 3 329 1 6 4 3 329

    1熱度

    1回答

    query.when數據框是一個空的df,當groupby引發運行時waring時,然後獲得另一個沒有列的空白數據框。如何保留列? df = pd.DataFrame(columns=["PlatformCategory","Platform","ResClassName","Amount"]) print df 結果: Empty DataFrame Columns: [Platform

    0熱度

    1回答

    我有一個數據框架結構從多年來的人口統計數據的CSV文件中派生而來。即,文件中的列是每月的時間間隔(1999-01,1999-02 ... 2016-12),並且行是世界上不同的人口中心(例如倫敦,多倫多,波士頓等): df = pd.DataFrame({'1999-01' : [100, 5000, 8000], '1999-02' : [200, 6000, 9000], '1999-03'

    1熱度

    1回答

    我有一個日期和「結果」分組一個熊貓數據幀: api_logs.groupby([api_logs.index.date, 'Outcome']).size() Outcome 2017-04-22 Success 7 2017-04-24 Failure 32 Success 59 2017-04-25 Failure 23 Success 9