split-apply-combine

-1熱度

1回答

我正在執行拆分應用組合以查找每個成員的總數量。我需要的數據框應該有14列：MemberID, DSFS_0_1, DSFS_1_2, DSFS_2_3, DSFS_3_4, DSFS_4_5, DSFS_5_6, DSFS_6_7, DSFS_7_8, DSFS_8_9, DSFS_9_10, DSFS_10_11, DSFS_11_12, DrugCount。但是，我沒有得到第14個（DrugC

1熱度

2回答

pandas combine_first導致更多行數

在以下數據中，我需要將'DATE'列中的日期更改爲CLOCKDATETIME小時小於'4:00'的前一日期（日期 - 1天）小時。我已經達到了可以獲得小於'4:00'小時的行並更改日期並將結果與輸入結合起來的點，但是我沒有得到期望的結果，對於輸入的29行數據我得到的最後結果是41行，其中行數保持不變。如何組合數據框並獲得所需的結果（行數應與輸入行保持一致）？樣本數據以CSV格式： DATE,

3熱度

1回答

熊貓時間戳差值變換

我有一個數據幀與一個整數值，SESSION_ID，事件和TIME_STAMP看起來像這樣： In [41]: df = pd.DataFrame(data={'session_id': np.sort(np.random.choice(np.arange(3), 11)), 'event': np.random.choice(['A', 'B', 'C', 'D'], 11), 'time_sta

1熱度

2回答

Python Pandas在DataFrame中彙總系列數據

在一個數據框中，我嘗試將split-apply-combine與包含系列數據元素的列進行拆分。（我已經搜查SO但沒有發現有關的數據幀中的一系列事情。）數據幀： import pandas as pd from pandas import Series, DataFrame import numpy as np ex = {'account': [1, 1, 1, 2, 2],

0熱度

1回答

按組處理列表清單

我想處理清單列表。具體而言，我想通過分組變量（每個列表的第一個成員）提取每個列表的第三個成員的數據框，然後使用諸如mean（），median（），sd（），length（）等幾個函數該組中的數據。輸出然後在數據幀返回，看起來像： Grp mean sd ... a 5.26 ... ... b 6.25 ... ... #fake data test<-list( #membe

2熱度

3回答

獲取每列值的最常見列

我想要每個數最常用的字母。我嘗試了各種各樣的東西;不知道什麼是正確的方式。 import pandas as pd from pandas import DataFrame, Series original = DataFrame({ 'letter': {0: 'A', 1: 'A', 2: 'A', 3: 'B', 4: 'B'}, 'number': {0: '01

0熱度

2回答

操作上基於可變

列我有以下數據 df <- structure(list(year = c(2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L, 2015L,

3熱度

3回答

如何使用dplyr

算上嵌套data_frames行下面是一個愚蠢的例子數據幀： df <- data_frame(A = c(rep(1, 5), rep(2, 4)), B = 1:9) %>% group_by(A) %>% nest() ，看起來像這樣： > df # A tibble: 2 × 2 A data <dbl> <list> 1 1

1熱度

1回答

用R計算複合回報ID

我想計算一個CAGR值，定義爲（Ending/Beginning）^（1 /年數）-1。我有一個df，有列「股票」，「日期」，「Annual.Growth.Rate」。要快速注意到：我正在嘗試使用滯後函數來做到這一點，但是，我無法在每隻股票的開頭更改遞歸公式。它會更有意義看輸入： structure(list(Stock = structure(c(1L, 1L, 1L, 1L, 1L, 1L,

0熱度

1回答

R - 條件IF減號每行匹配條件

我的數據集包含一個product類型的列和purchase數量的列。我希望能夠從每行的實際purchase中減去每個product類型的平均purchase數量。我有一個數據集，看起來大致是這樣的 library(dplyr) set.seed(42) product <- paste("prod - " , sample(c("A", "B", "C", "D"), size = 15,