pandas-groupby

0熱度

1回答

好的，所以我寫了一個帶有pd.groupby數據幀的txt。現在我需要打開它。我走到這一步是： f = open('C:/MDH.txt', 'r') reg = f.read() rege = np.asarray(reg) 但只是給了我一個長線與\ n，其中該行的原始數組中結束，但沒有劃定爲422472元。作爲一個例子的部分： array('4.498000000000000000e

1熱度

2回答

熊貓羣大熊貓字典

熊貓新手，抱歉，如果解決方案很明顯。我有一個數據幀（見下文）與不同的電影場景，對於電影中的場景 import pandas as pd data = [{'movie' : 'movie_X', 'scene' : '1', 'environment' : 'home'}, {'movie' : 'movie_X', 'scene' : '2', 'environment' : '

1熱度

1回答

在沒有彙總的情況下對組應用操作

我想對多個數據框組應用操作，然後通過結果填充該組的所有值。讓我們的意思和np.cumsum作爲一個例子，下面的數據幀： df=pd.DataFrame({"a":[1,3,2,4],"b":[1,1,2,2]}) 它看起來像這樣 a b 0 1 1 1 3 1 2 2 2 3 4 2 現在我想按b數據框，然後取a平均在每個組，然後將np.cumsum應用於該方法，然後用（組相關）結

1熱度

1回答

比較不同數據幀的groupby輸出

什麼可能是一種方法來比較多個groupby輸出。我有不同dataframes多個GROUPBY輸出，像下面 >>> tmp1 account place balance type 0 A A1 10 B1 1 A A1 20 B1 2 A A1 30 B1 3 A A1 10 B4 4 A A1 20 B4 5 A A1 10 B5 6 A A1

5熱度

4回答

熊貓更新列與陣列

所以，我正在學習熊貓，我有這個問題。假設我有一個這樣的數據幀： A B C 1 x NaN 2 y NaN 3 x NaN 4 x NaN 5 y NaN 我試圖創建此：基於B相似 A B C 1 x [1,3,4] 2 y [2,5] 3 x [1,3,4] 4 x [1,3,4] 5 y [2,5] 。我這樣做： teste = df.groupby(['B']

1熱度

1回答

如何比較每個組中Pandas中的一組後的計數？

我有一個EAV表加載到熊貓數據框中。我用一組來計算每個實體每個字段的出現次數。我想比較價格和產品名稱的計數，提取計數不均的計數並提取它們進行處理（本例中爲a和c）。當前計數也出現在標題的不同行上。任何幫助，將不勝感激。 Count Entity Attribute a ProductName 10 Price 11 b ProductName 2

0熱度

1回答

ValueError：無法從重複軸進行重新索引 - 沒有重複的軸值

我按年份對數據幀進行分組（它是列上多索引的一個級別），應用填充df的函數有11列（根據需要添加儘可能多的空列），然後返回填充的df。但是這會產生一個錯誤。 finalFormat = (penultimateFormatNot11Columns.groupby(level = 'Year', axis = 1) .apply(pad

1熱度

1回答

與熊貓數據框中的組含義差異？

我們假設我計算了一定時間內有多少人吃橘子（Orange）和蘋果（Apple）人（id）。我也知道他們是年輕人還是老年人（group）。熊貓數據幀將可能是這樣的： df = pd.DataFrame({'id' : ['1','2','3','7'], 'group' : ['Young', 'Young', 'Old', 'Old'], 'Apple' : [

2熱度

1回答

格式化熊貓groupby（）進行合併

我一直希望有人能夠幫助我解決一些相對簡單的問題，我一直在努力。最近，我用groupby在我df總結了不同的羣體，你可以看到如下： MSA.name ifr.industry 0 Abilene, TX Metro Area 90 1 Abilene, TX Metro Area P 2 Abilene, TX Metro Area 90 3 Abilene, TX M

0熱度

4回答

熊貓：第一轉換值組np.nan

我有以下數據框： df = pd.DataFrame({'series1':['A','A','A','A','B','B','B','C','C','C','C'], 'series2':[0,1,10,99,-9,9,0,10,20,10,10]}) series1 series2 0 A 0.0 1 A 1.0 2 A 10.0 3 A 9