apply

    2熱度

    1回答

    我目前正在使用Python中的面板數據,並試圖計算給定組(ID)內每個時間序列觀察值的滾動平均值。 由於我的數據集的大小(成千上萬個具有多個時間段的組),因此.groupby和.apply()函數花費的時間太長以至於無法計算(已經運行了一個多小時,而且還是一無所獲 - 整個數據集僅包含約300k個觀測值)。 我希望最終遍歷多列,執行下列操作: 計算在給定列中的每個時間步長的滾動平均值,每組ID 創

    0熱度

    3回答

    我有一個數據框,我試圖做一些情景分析。它看起來像這樣: Revenue Item_1 Item_2 Item_3 552 200 220 45 1500 400 300 200 2300 600 400 300 我想生成的東西,其中1項是由一些固定的量增加或減少(即1團結)是這樣的:我目前在做 Revenue Item_1 Item_2 Item_3 552

    3熱度

    2回答

    我的數據集是類似於下面: df <- data.frame( A = c(-1, 2, 3), B = c(1, 1, -1)) df # A B # 1 -1 1 # 2 2 1 # 3 3 -1 我試圖得到以下的結果,其中值當兩個A和B是正不停: A B 1 NA NA 2 2 1 3 NA NA 我試過df2 <- apply(df, 1:2, fu

    0熱度

    1回答

    下面是一個簡單的數據框: import numpy as np dd=pd.DataFrame(np.arange(35).reshape(7,5), columns=list('xyzwv')) dd['w']=list('AABBBCC') ,那就是: 現在我嘗試下面的代碼 def func(x): print(x) return x dd.groupby('w

    1熱度

    1回答

    我有以下的自定義函數,我想申請成爲一個滾動的基礎上: AvgTotCorr = function(R, weights){ options(scipen = 999) cv = cov(R) VARs = diag(cv) cr = cor(R) # double summation in numerator (including multipl

    1熱度

    1回答

    我想用spark來產生combn()函數的輸出,用於一個相對較大的輸入列表(200 ish)和變化的值m( 2-5),但是我遇到了麻煩,包括spark_apply()。 我目前的做法(based on this)的兆瓦: names_df <- data.frame(name = c("Alice", "Bob", "Cat"), types = c("Human", "Huma

    1熱度

    1回答

    我可能會考慮太辛苦,或不夠努力。無法確定哪個。我正在使用包(BBMM)爲使用x,y座標和時滯的野生動物構建運動模型(如BBMM中的函數brownian.bridge()所要求的那樣)。 我的問題是該功能一次只適用於一個人。我有由一個ID(CollarSerialNumber)指定20+個體的數據幀(羊)如下所示: 羊 CollarSerialNumber EASTING NORTHING Tim

    1熱度

    1回答

    也許我在過度工程這個,但我建立一個功能,根據列輸入數自動解析日期列。 數據: CreatedDate LastModifiedDate 2015-11-20T19:46:11.000Z 2015-11-20T19:46:11.000Z 2015-11-21T02:54:54.000Z 2015-12-01T18:48:07.000Z 2015-11-21T14:36:32.000Z 2

    0熱度

    1回答

    有誰知道是否有可能用像apply函數更快的東西替換Python中的雙循環? 例如,我有這樣的數據幀: df = pd.DataFrame() df["col_1"] = ["hello", "salut","hello", "bye", "bye","hi","hello", "hello"] df["col_2"] = ["dog", "dog", "dog", "cat", "cat",

    1熱度

    1回答

    我有一個DF使得 STATUS_ID STATUS_NM 0 1 A 1 2 B 2 3 C 3 4 D 我想執行行應用於一鍵搞定,值單獨列中的每行的值。最終的DF應該 STATUS 0 {STATUS_ID:1,STATUS_NM:A} 1 {STATUS_ID:2,STATUS_NM:B