讓我們假設,我們提供了以下數據:部分和由data.table
library(data.table)
letters <- sample (LETTERS[1:6], 100, replace = TRUE)
quarks <- sample(c("up", "down", "charme", "strange", "top", "bottom"),
100, replace = TRUE)
measures<- sample(seq(1:6), 100, replace = TRUE)
df <- data.frame(letters, quarks, measures)
df <- data.table(df)
df <- df[,.(count = sum(measures)), by = list(letters, quarks)]
df
letters quarks count
---------------------------
1: A bottom 13
2: A charme 3
3: A down 14
4: A strange 8
5: A top 11
6: A up 14
7: B bottom 8
8: B charme 12
9: B down 3
基本上我們算我們有多少個觀察在每個夸克和每個字母的對應關係,通過分組由data.table
庫提供的[.,]
函數。
問題:我想伴隨一個新的列顯示每個字母的度量總數,以便每個夸克被標準化爲有多少個字母。特別地,這可以通過單獨獲得:
df[,.(count = sum(measures)), by = letters]
letters count
1: F 54
2: E 65
3: B 71
4: D 36
5: C 82
6: A 45
這樣,每個計數每個單個的夸克可以劃分和標準化爲我們一共有多少夸克都關聯到同一個字母。有沒有辦法實現這個仍然使用data.table
?
請在生成隨機示例數據集之前使用'set.seed'。 – Frank
哦,是的,當然,我的壞。然而,實際的數量在這裏並不重要。 – gented
只是讓我們更容易驗證我們是否獲得了正確的結果。 – Frank