data.table

    0熱度

    2回答

    在Excel中,我可以讓該組的列和計數,但IAM無法做到在R. 對於R中做我使用剪切功能有一些休息。 cut(elapsed, breaks=seq(min(elapsed),max(elapsed)+100,50), include.lowest=T) 這裏我附上了數據的png和所需的輸出。 但上面的代碼沒有給我需要的輸出。 這是我的數據 和我需要的輸出: 400 9 500 4 6

    -1熱度

    1回答

    我正在處理中等大小的數據集,並且我有興趣一次重新編碼多個變量。 有15個變量編碼爲三個等級的因子。 YES = 3,NO = 2,N/A = 1。 我想重新編碼所有15個變量作爲數字。 YES = 1,NO = 0,N/A = NA。 在更新我的軟件之前,此代碼工作。 my_data[, 9:23 := lapply(.SD, recode, "'YES'=1;'NO'=0;'N/A'=NA",

    1熱度

    1回答

    我有兩個不同提供者的數據集,記錄不同ID的學生成績。少數學生出現在兩個數據集中。 DT1 = data.table(id = 1:6, math = c(6.55, 7.39, 5.89, 9.70, 4.77, 5.30), engl = c(8.55, 8.83, 9.20, 9.10, 4.32, 8.17), hist = c(7.37, 3

    0熱度

    1回答

    我試圖將數據集的特定列與不同設備的日常數據樣本轉換爲按兩個鍵(小時和因子1)分組的時間序列列表 我的數據是這樣的 date hour factor1 volume wkday 1: 2015-10-01 AM 11011 530 Thursday 2: 2015-10-01 AM 11012 1535 Thursday 3: 2015-10-01 AM 11021 191 Th

    0熱度

    3回答

    我正在使用來自https://www.kaggle.com/c/titanic的泰坦尼克號數據集。 我想讓「0-4」,「1-5」,「2-6」,「3-7」等不同的年齡段,並找出存活百分比的年齡組最高。我的年齡組在整數區間內[0,80]。原始數據集中的「Age」列也包含NAs。 「Survived」列包含該人是否存活的信息(0 =否,1 =是)。 我試圖解決這個問題,但它沒有奏效。我會很感激任何幫助。

    2熱度

    2回答

    我有以下R data.table(儘管這也應該用data.frame進行縮放)。目標是將這個data.table重塑爲ggplot2中的散點圖。因此,我需要重塑這個data.table有一個「因素」一欄顏色分: > library(data.table) > dt ID x_A y_A x_B y_B

    1熱度

    1回答

    我有如下數據幀: user time ____ ____ 1 2017-09-01 00:01:01 1 2017-09-01 00:01:20 1 2017-09-01 00:03:01 1 2017-09-01 00:10:01 1 2017-09-01 00:11:01 2 2017-09-01 00:01:03 2 2017-09-01 00:01:08 2

    -4熱度

    1回答

    我正在使用lubridate來解析POSIXlt的時間戳。 user time ____ ____ 1 2017-09-01 00:01:01 1 2017-09-01 00:01:20 1 2017-09-01 00:03:01 library(lubridate) data[, time:=parse_date_time2(time,orders="YmdHMS",tz="N

    0熱度

    2回答

    我想使用內部連接來連接兩個data.table。可能找不到匹配,然後我想要一個空的data.table和正確的col名稱。 dt1 <- data.table(A = c(1,2), B = c(1,2)) dt2 <- data.table(A = c(3,4), D = c(3,4)) setkey(dt1, A) setkey(dt2, A) dt1[dt2, nomatch = 0

    0熱度

    3回答

    是否可以使用data.table在數據集上快速按組應用雙參數函數?在一百萬行的數據集上,我發現調用下面定義的簡單函數超過了11秒,這比我期望的要複雜得多。下面 自包含的代碼概括了什麼,我試圖做的要領: # generate data frame - 1 million rows library(data.table) set.seed(42) nn = 1e6 daf = data.fra