pandas-groupby

    0熱度

    1回答

    好的,所以我寫了一個帶有pd.groupby數據幀的txt。現在我需要打開它。 我走到這一步是: f = open('C:/MDH.txt', 'r') reg = f.read() rege = np.asarray(reg) 但只是給了我一個長線與\ n,其中該行的原始數組中結束,但沒有劃定爲422472元。作爲一個例子的部分: array('4.498000000000000000e

    1熱度

    2回答

    熊貓新手,抱歉,如果解決方案很明顯。 我有一個數據幀(見下文)與不同的電影場景,對於電影中的場景 import pandas as pd data = [{'movie' : 'movie_X', 'scene' : '1', 'environment' : 'home'}, {'movie' : 'movie_X', 'scene' : '2', 'environment' : '

    1熱度

    1回答

    我想對多個數據框組應用操作,然後通過結果填充該組的所有值。讓我們的意思和np.cumsum作爲一個例子,下面的數據幀: df=pd.DataFrame({"a":[1,3,2,4],"b":[1,1,2,2]}) 它看起來像這樣 a b 0 1 1 1 3 1 2 2 2 3 4 2 現在我想按b數據框,然後取a平均在每個組,然後將np.cumsum應用於該方法,然後用(組相關)結

    1熱度

    1回答

    什麼可能是一種方法來比較多個groupby輸出。 我有不同dataframes多個GROUPBY輸出,像下面 >>> tmp1 account place balance type 0 A A1 10 B1 1 A A1 20 B1 2 A A1 30 B1 3 A A1 10 B4 4 A A1 20 B4 5 A A1 10 B5 6 A A1

    5熱度

    4回答

    所以,我正在學習熊貓,我有這個問題。 假設我有一個這樣的數據幀: A B C 1 x NaN 2 y NaN 3 x NaN 4 x NaN 5 y NaN 我試圖創建此:基於B相似 A B C 1 x [1,3,4] 2 y [2,5] 3 x [1,3,4] 4 x [1,3,4] 5 y [2,5] 。 我這樣做: teste = df.groupby(['B']

    1熱度

    1回答

    我有一個EAV表加載到熊貓數據框中。我用一組來計算每個實體每個字段的出現次數。我想比較價格和產品名稱的計數,提取計數不均的計數並提取它們進行處理(本例中爲a和c)。 當前計數也出現在標題的不同行上。任何幫助,將不勝感激。 Count Entity Attribute a ProductName 10 Price 11 b ProductName 2

    0熱度

    1回答

    我按年份對數據幀進行分組(它是列上多索引的一個級別),應用填充df的函數有11列(根據需要添加儘可能多的空列),然後返回填充的df。但是這會產生一個錯誤。 finalFormat = (penultimateFormatNot11Columns.groupby(level = 'Year', axis = 1) .apply(pad

    1熱度

    1回答

    我們假設我計算了一定時間內有多少人吃橘子(Orange)和蘋果(Apple)人(id)。我也知道他們是年輕人還是老年人(group)。熊貓數據幀將可能是這樣的: df = pd.DataFrame({'id' : ['1','2','3','7'], 'group' : ['Young', 'Young', 'Old', 'Old'], 'Apple' : [

    2熱度

    1回答

    我一直希望有人能夠幫助我解決一些相對簡單的問題,我一直在努力。最近,我用groupby在我df總結了不同的羣體,你可以看到如下: MSA.name ifr.industry 0 Abilene, TX Metro Area 90 1 Abilene, TX Metro Area P 2 Abilene, TX Metro Area 90 3 Abilene, TX M

    0熱度

    4回答

    我有以下數據框: df = pd.DataFrame({'series1':['A','A','A','A','B','B','B','C','C','C','C'], 'series2':[0,1,10,99,-9,9,0,10,20,10,10]}) series1 series2 0 A 0.0 1 A 1.0 2 A 10.0 3 A 9