split-apply-combine

    -1熱度

    1回答

    我正在執行拆分應用組合以查找每個成員的總數量。我需要的數據框應該有14列:MemberID, DSFS_0_1, DSFS_1_2, DSFS_2_3, DSFS_3_4, DSFS_4_5, DSFS_5_6, DSFS_6_7, DSFS_7_8, DSFS_8_9, DSFS_9_10, DSFS_10_11, DSFS_11_12, DrugCount。但是,我沒有得到第14個(DrugC

    1熱度

    2回答

    在以下數據中,我需要將'DATE'列中的日期更改爲CLOCKDATETIME小時小於'4:00'的前一日期(日期 - 1天)小時。我已經達到了可以獲得小於'4:00'小時的行並更改日期並將結果與​​輸入結合起來的點,但是我沒有得到期望的結果,對於輸入的29行數據我得到的最後結果是41行,其中行數保持不變。如何組合數據框並獲得所需的結果(行數應與輸入行保持一致)? 樣本數據以CSV格式: DATE,

    3熱度

    1回答

    我有一個數據幀與一個整數值,SESSION_ID,事件和TIME_STAMP看起來像這樣: In [41]: df = pd.DataFrame(data={'session_id': np.sort(np.random.choice(np.arange(3), 11)), 'event': np.random.choice(['A', 'B', 'C', 'D'], 11), 'time_sta

    1熱度

    2回答

    在一個數據框中,我嘗試將split-apply-combine與包含系列數據元素的列進行拆分。 (我已經搜查SO但沒有發現有關的數據幀中的一系列事情。) 數據幀: import pandas as pd from pandas import Series, DataFrame import numpy as np ex = {'account': [1, 1, 1, 2, 2],

    0熱度

    1回答

    我想處理清單列表。具體而言,我想通過分組變量(每個列表的第一個成員)提取每個列表的第三個成員的數據框,然後使用諸如mean(),median(),sd(),length()等幾個函數該組中的數據。輸出然後在數據幀返回,看起來像: Grp mean sd ... a 5.26 ... ... b 6.25 ... ... #fake data test<-list( #membe

    2熱度

    3回答

    我想要每個數最常用的字母。我嘗試了各種各樣的東西;不知道什麼是正確的方式。 import pandas as pd from pandas import DataFrame, Series original = DataFrame({ 'letter': {0: 'A', 1: 'A', 2: 'A', 3: 'B', 4: 'B'}, 'number': {0: '01

    0熱度

    2回答

    列我有以下數據 df <- structure(list(year = c(2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L,

    3熱度

    3回答

    算上嵌套data_frames行下面是一個愚蠢的例子數據幀: df <- data_frame(A = c(rep(1, 5), rep(2, 4)), B = 1:9) %>% group_by(A) %>% nest() ,看起來像這樣: > df # A tibble: 2 × 2 A data <dbl> <list> 1 1

    1熱度

    1回答

    我想計算一個CAGR值,定義爲(Ending/Beginning)^(1 /年數)-1。 我有一個df,有列「股票」,「日期」,「Annual.Growth.Rate」。要快速注意到:我正在嘗試使用滯後函數來做到這一點,但是,我無法在每隻股票的開頭更改遞歸公式。它會更有意義看輸入: structure(list(Stock = structure(c(1L, 1L, 1L, 1L, 1L, 1L,

    0熱度

    1回答

    我的數據集包含一個product類型的列和purchase數量的列。我希望能夠從每行的實際purchase中減去每個product類型的平均purchase數量。 我有一個數據集,看起來大致是這樣的 library(dplyr) set.seed(42) product <- paste("prod - " , sample(c("A", "B", "C", "D"), size = 15,