data.table

    -2熱度

    2回答

    如何查找條目不是data.table的-1的列的平均值? 列的名稱存儲在一個變量中。另外如何將獲得的平均值分配爲條目爲-1的值。對於data.frame相應的代碼是: col = "col_1" mean_value = df[ df[,col]!=-1, col ] df[ df[,col]==-1, col ] = mean_value 樣本數據: dt <- setDT(data.f

    3熱度

    1回答

    如果我有以下data.table matchID characterID info 1111 4 abc 1111 12 def 1111 1 ghi 2222 8 jkl 2222 7 mno 2222 3 pwr 3333 9 abc 3333 2 ghi 33333 4 jkl 我想子集它來尋找特定characterIDs,但回報

    0熱度

    1回答

    我正在使用glm生成模型擬合。我的數據混合了整數變量和分類變量。分類變量採用代碼的形式,因此是數據中的整數類型。最初,當我嘗試生成模型時,我按原樣傳遞了整數格式的分類變量並獲取了模型。我正在查看p值來檢查一次是否顯着,並注意到一些我並不期望的變量是顯着的。 這是當意識到可能是整數表中的分類變量形式創建一些問題。所以就像代碼3可能比代碼1更重要(不確定這一點,如果有人可以確認這個這將是很好的)。在做

    -2熱度

    1回答

    考慮測試數據集 test = data.table("a"=c(NA,NA, 0, NA, NA), "b"=c(1,3,4,7,8), "c"=c(NA, 2,1,3,1), "group"=c(1,1,1,1,1)) a b c group 1: NA 1 NA 1 2: NA 3 2 1 3: 0 4 1 1 4: NA 7 3 1 5: 0 8 1 1 6: NA 9

    1熱度

    1回答

    我正在嘗試開發一個應用程序,允許用戶選擇在'by'section的data.table中使用哪些變量。 Supose的mtcars數據集被加載到應用程序,在用戶界面中會有一個選擇像: vector.vars <- c('am', 'gear', 'carb') selectInput("vars", "Select variables:", as.list(vector.vars), selec

    -1熱度

    1回答

    在數據框「days」中,我想將名爲'round.numbers'的函數應用於除名爲'id'的列之外的所有列。 根據該意見, days[,-'id'][, lapply(X = .SD, FUN = round.numbers)] 這工作順利 但是它創建一個新表,而不是替換原有的數據。 days[,-'id'] <- days[,-'id'][, lapply(X = .SD, FUN = roun

    1熱度

    1回答

    感興趣的數據生成圖表是mymeanDT DT <- data.table(yearmonth = as.yearmon(sample(seq(as.Date('2012/07/01'), as.Date('2016/02/28'),by="day"), 5000, replace = TRUE)), mydummy = as.factor(rbinom(5000, 1, .4)),

    0熱度

    1回答

    我正嘗試導入這種使用data.table的fread命令CSV "a";"b" 11092740;0 8978056137;0 的,但是當我使用它,我有錯的進口值: data<-fread(data.csv,sep=";") data a b 1: 5.480542e-317 0 2: 4.435749e-314 0 如何正確導入它們? 謝謝!

    3熱度

    1回答

    我已經使用dplyr代碼 group_by(dt, ID) %>% filter(any(colY == 1 & colX == 10)) 以下格式到子集像下面 ID colX colY 1111 3 1 1111 2 1 1111 6 0 1111 9 0 2222 10 1 2222 3 1 2222 5 0 2222 7 0 3333 8 1 3333

    0熱度

    1回答

    在嵌套data.table中使用data.tables的列表列時,很容易在該列上應用函數。例如: dt<- data.table(mtcars)[, list(dt.mtcars = list(.SD)), by = gear] 我們可以使用: dt[ ,list(length = nrow(dt.mtcars[[1]])), by = gear] dt[ ,list(length = n