data.table

    1熱度

    2回答

    我有一個CSV表(作爲數據框)。我想通過其他列值修改特定的列值。 我準備了一個代碼,但它不起作用。 數據框包含1076行和156列。 的公式必須是這樣的: if (a[i,"0Q-state"] == "done") && (a[i,0Q-01] == NA)) a[i,0Q-01] = 0; else a[i,0Q-01] = a[i,0Q-01]; ,但我不知道我可以在r中做到這

    0熱度

    2回答

    我有樣本數據集,我想彙總user_id。每條記錄代表一個註冊。 > test user_id time plan 1 1 2017-06-23 20:00:00 monthly 2 2 2017-07-20 20:00:00 monthly 3 3 2017-06-03 20:00:00 monthly 4 1 2017-07-03 20:00:00 monthly

    1熱度

    1回答

    我試圖創建一個函數,其中我基於一列彙總數據表值,但我無法將參數傳遞給列名稱的toString()。下面的例子可以更好地表現出來: t1 <- data.table(P = c("a", "b", "c", "d", "a", "b"), Q = c("1","2","3","4","5","6")) t1[ ,toString(Q), by = P] # this works t1[ ,t

    1熱度

    1回答

    我有一個data.table,說像這樣: dt = data.table(param_1 = c(1,3,5), param_2 = c(2,4,6)) dt param_1 param_2 1: 1 2 2: 3 4 3: 5 6 和常向量,說這個人: s = c(1, 0.5) ,我想計算「矢量減去表」,即s - dt並期望 0 | -1.5 -2 |

    1熱度

    1回答

    我有數據,存儲爲data.table dt或data.frame df,具有多個觀察值,每個id - month組合。我想將行號存儲在一個變量中,我們稱之爲row。 我知道如何在dplyr中做到這一點,但想學習如何在(純)data.table中做到這一點。我認爲這是一個非常簡單的操作,但我似乎無法找到可行的解決方案。 Reprex: library(dplyr) library(data.tab

    5熱度

    2回答

    我有一個自行車軌跡的樣本數據集。我的目標是要弄清楚,平均的時間量,在訪問B站間的失誤 到目前爲止,我已經能夠簡單地訂購數據集: test[order(test$starttime, decreasing = FALSE),] ,並找到哪裏start_station和end_station相等B. which(test$start_station == 'B') which(test$end_

    0熱度

    1回答

    這是一個直接跟進到以前的類似問題,我問的提取列表的列表的特定子集:Extracting data from a list of lists into its own `data.frame` with `purrr` 因此,我將使用相同的樣本數據集: l <- list(structure(list(a = -1.54676469632688, b = "s", c = "T",

    1熱度

    1回答

    當所需插值點與可用數據相比稀疏時,線性插值的最有效方法是什麼?我有一個非常長的數據框,其中包含許多列,其中一列表示時間戳,其餘爲變量,對此我感興趣的是插入時間戳很少。例如,考慮兩個變量的情況: microbenchmark::microbenchmark(approx(1:2, 1:2, 1.5)$y) # Unit: microseconds # expr min lq mean med

    1熱度

    1回答

    我有一個偏斜分佈的數據集,我想用相同數量的觀測值分成兩個分箱 - 除了歪斜。 爲了澄清,我有大量的零和相對較少的> 0個觀察值。 如果我使用cut2將值分成10個包含零的分箱,我會得到以下結果。 library(data.table) library(Hmisc) DT<-data.table(x=rep(0,100), y=rep(0,100)) DT<-rbind(DT, data.t

    3熱度

    2回答

    我有一個樣本數據集,用於跟蹤不同車站的自行車軌跡。我的目標是找到間隔的自行車保持在與difftime()特定站,在這種情況下,站B. > test bikeid start_station starttime end_station endtime 1 1 A 2017-09-25 01:00:00 B 2017-09-25 01:30:00 2 1 B