apply

    1熱度

    1回答

    我在for循環和apply函數之間遇到了巨大的時間差。 我有一個數據幀(alldat),包含大約200k條記錄和73列我想檢查每列中NA的百分比是多少,並返回結果作爲一個新的DF供我檢查。 1)與for迴路功能: Nacheck = function(a){ a <- as.data.frame(a) vecNA <- rep(NA, dim(a)[2]) for (

    0熱度

    1回答

    我有以下數據框: df=pd.DataFrame(np.random.randint(1,3,27).reshape((9,3)),\ index= [['KH','KH','KH','KH','KH','KH','KH','KH','KH'],\ ['AOK','AOK','AOK','DOK','DOK','DOK','ROK','ROK','ROK'],\

    3熱度

    1回答

    嗨我試圖計算一個擴大窗口熊貓的迴歸貝塔斯。我有以下函數來計算的β def beta(row, col1, col2): return numpy.cov(row[col1],row[col2])/numpy.var(row[col1]) 而且我嘗試了以下得到擴大測試我的數據框df pandas.expanding_apply(df, beta, col1='col1', col2=

    1熱度

    1回答

    隨着序列的列表,例如列表製作一個數據幀, datList <- list(One = seq(1,5, length.out = 20), Two = seq(1,10, length.out = 20), Three = seq(5,50, length.out = 20)) 是否有可能使一個數據幀,以使序列被轉換成列。如, datDF <- data.fra

    3熱度

    1回答

    我想計算每兩個點之間的下列公式,我不知道如何應用在整個數據集上: Point x y z 1 4 3 8 2 8 5 4 3 5 4 7 4 2 7 4 D1,2 = sqrt((x2-x1)²+ (y2-y1)²+(z2-z1)²)

    1熱度

    1回答

    我有一個溫度的年度記錄。我需要選擇五行之前的特殊行(天),以平均五天爲單位,然後選取所選組的平均值。這裏是我的數據框和下面的代碼,我申請但沒有工作。 Day T.m 1 22 2 21 3 34 4 28 5 14 6 7 7 12 8 22 9 11 10 12 11 14 12 3 13 4 14 11 15 16 a <- c(

    0熱度

    3回答

    我試圖從大量模型仿真中生成預測值,而且我很難做到這一點。我懷疑我需要apply()系列的東西,但我無法弄清楚語法。也許我對apply()的知識很薄弱。或者,也許我的功能是錯誤的。有什麼建議麼? 假設我有以下六個模型模擬結果係數... coef <- data.frame(intercept=c(2,3,5,7,2,1), b1 = c(.2,.5,.6,.7,.9,.4),

    0熱度

    1回答

    我試圖編寫一個簡單的R函數來跨單個數據框的兩列對5個元素的子字符串進行採樣。字符串的長度對於每一行都是相等的,但是它們在列的下方是不同的。該函數在我指定行和列作用時起作用,但我無法獲取應用語句在每行和每列上處理。正如所寫,它只會根據第一個實例的長度抽取隨機樣本,因此如果第一個實例比其他任何字符串短,其他行的輸出有時少於5個元素。 例如DF: BP TF 1 CGTCTCTATTC

    3熱度

    1回答

    我在我的代碼段,看起來像這樣 var locationDefer = $.Deferred(); if (saSel.Company === -1) { database.getAllLocations().then(function (result) { var locations = JSON.parse(result.d); locationDefer.

    3熱度

    2回答

    問題:我想根據description列正確分類我的數據框的每一行。要做到這一點,我想根據常用單詞列表提取關鍵字。首先,我將重要的詞組分成單詞(即'食品店'變成'食品'和'商店')。然後,我檢查數據框中的任何行是否包含「Food」和「Store」兩個單詞。不幸的是,我製作的代碼太慢了。我如何優化它以處理500萬行數據? 樣本數據: 這裏是前30行我的數據框的: bank_report_id tran