data.table

    1熱度

    1回答

    我有一個數據框,其中包含按位置包含不同區域的多個列。在另一列中,我有一個密度值。我想知道如何創建一個新表(理想情況下通過一個循環),每個區域乘以密度。我的數據幀的樣子: X Area1 Area2 Area3 Area4 Density A 10.1 12 20 25 0.04 B 4.2 7.3 30 35 0.05 C 5.3 9.6 10 15 0.07 D 0.2 0

    1熱度

    1回答

    我需要創建工作像下面這樣的標誌: 的標誌的值始終爲1時條件爲真 ID Date Condition Flag Amount 1 2015.04.01 False 0 0 1 2015.05.01 True 1 0 1 2015.06.01 True 1 0 的標誌的值始終爲1年以內的條件設置爲false ID Date Condition Flag Amount 1

    1熱度

    2回答

    我有一個數據表,其中數據在4個不同的級別(級別0,1,2和3)給出。我想要計算每個狀態的等級3中的供應如何在等級2中分配。 (我在表保持occ_code使得即使state_code和level是一樣的,它是一個唯一的記錄) 創建樣本表: library(data.table) state_code = c(rep(1,14)) level = c(0,1,2,3,3,2,3,1,2,3,3,3

    0熱度

    2回答

    我有一個有3列的數據表'df'。 ID,用餐,時間 每個ID有很多行。 library(data.table) id = c(1,1,2,2,3,3) meal = c(1,1,0,0,1,0) time = c(10,9,12,13,7,15) df <- data.table(id, meal, time) > df id meal time 1: 1 1 10 2:

    2熱度

    2回答

    我正在使用data.table軟件包來聚合也是分組列的列。但結果並非我所期望的。 my_data = data.table(contnt=c("america", "asia", "asia","europe", "europe", "europe"), num= 1:6) #my_data #contnt num #america 1 #asia 2 #asia 3 #euro

    1熱度

    1回答

    data.table與sf::st_union一起使用時會出現不正確的聚合,而dplyr似乎可以正確處理它。有人可以解釋爲什麼data.table產生這個結果嗎? library(data.table) library(sf) library(dplyr) nc <- st_read(system.file("shape/nc.shp",package="sf")) nc_DT <- as

    2熱度

    3回答

    如何連接和覆蓋數據似乎是一個常見請求,但我還沒有找到適用於整個數據集的優雅解決方案。 (注意:爲了簡化數據,我將只使用1和NAs作爲值和列的一小部分,但實際上我有幾百個具有不同值的列)。 我有一個數據表(d1)在某些列和行中有NA值。 library(data.table) d1 = fread( "r id v1 v2 v3 1 A 1 1 1 2 B 1 1 1 3 C 1 NA NA

    1熱度

    1回答

    我有一個相當大的數據框(70k×900),其中包含ID,日期和~900個代碼列。代碼缺失的地方,我想填補這些缺失的值。 規則是,對於每個包含未在以後的日期記錄的代碼的ID,它應該結轉。 我已經將我的數據框轉換爲寬格式(假設這是最簡單的方法來減少值)。 見例如DF: df <- as.data.frame(list( id = c('p1', 'p1', 'p1', 'p2', 'p2', 'p2'

    0熱度

    2回答

    有誰知道爲什麼會發生這種情況?即爲什麼Unicode字符在數據錶行中不能正確顯示,但在矢量(數據表列)中是否正確? >test.dt >fuel box seller.name >1: Gasoline Manual Michels S<U+00E0>rl > test.dt[,seller.name] >[1] "Michels Sàrl"

    1熱度

    2回答

    總和選擇性行我有一個數據幀如下 structure(list(code = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L), Month = structure(c(4L, 3L, 7L, 1L, 8L, 6L, 5L, 2L, 9L, 4L, 3L, 7L, 1L, 8L, 6L, 5L, 2